早教吧作业答案频道 -->数学-->
在应用聚类分析和判别分析解决实际问题时应该注意哪些方面?急,希望能在明早之前得到答案,
题目详情
在应用聚类分析和判别分析解决实际问题时应该注意哪些方面?
急,希望能在明早之前得到答案,
急,希望能在明早之前得到答案,
▼优质解答
答案和解析
聚类要注意的问题
聚类结果主要受所选择的变量影响.如果去掉一些变量,或者增加一些变量,结果会很不同.
相比之下,聚类方法的选择则不那么重要了.因此,聚类之前一定要目标明确._
另外就分成多少类来说,也要有道理.只要你高兴,从分层聚类的计算机结果可以得到任何可能数量的类.但是,聚类的目的是要使各类距离尽可能的远,而类中点的距离尽可能的近,而且分类结果还要有令人信服的解释.这一点就不是数学可以解决的了.
判别分析要注意的问题
训练样本中必须有所有要判别的类型,分类必须清楚,不能有混杂.
要选择好可能由于判别的预测变量.这是最重要的一步.当然,在应用中,选择的余地不见得有多大.
要注意数据是否有不寻常的点或者模式存在.还要看预测变量中是否有些不适宜的;这可以用单变量方差分析(ANOVA)和相关分析来验证.
判别分析是为了正确地分类,但同时也要注意使用尽可能少的预测变量来达到这个目的.使用较少的变量意味着节省资源和易于对结果进行解释.
在计算中需要看关于各个类的有关变量的均值是否显著不同的检验结果(在SPSS选项中选择Wilks' Lambda,Rao's V,The Squared Mahalanobis Distance或The Sum of Unexplained Variations等检验的计算机输出),以确定是否分类结果是仅仅由于随机因素.
此外成员的权数(SPSS用prior probability,即"先验概率",和贝叶斯统计的先验概率有区别)需要考虑;一般来说,加权要按照各类观测值的多少,观测值少的就要按照比例多加权.
对于多个判别函数,要弄清各自的重要性.
注意训练样本的正确和错误分类率.研究被误分类的观测值,看是否可以找出原因.
聚类结果主要受所选择的变量影响.如果去掉一些变量,或者增加一些变量,结果会很不同.
相比之下,聚类方法的选择则不那么重要了.因此,聚类之前一定要目标明确._
另外就分成多少类来说,也要有道理.只要你高兴,从分层聚类的计算机结果可以得到任何可能数量的类.但是,聚类的目的是要使各类距离尽可能的远,而类中点的距离尽可能的近,而且分类结果还要有令人信服的解释.这一点就不是数学可以解决的了.
判别分析要注意的问题
训练样本中必须有所有要判别的类型,分类必须清楚,不能有混杂.
要选择好可能由于判别的预测变量.这是最重要的一步.当然,在应用中,选择的余地不见得有多大.
要注意数据是否有不寻常的点或者模式存在.还要看预测变量中是否有些不适宜的;这可以用单变量方差分析(ANOVA)和相关分析来验证.
判别分析是为了正确地分类,但同时也要注意使用尽可能少的预测变量来达到这个目的.使用较少的变量意味着节省资源和易于对结果进行解释.
在计算中需要看关于各个类的有关变量的均值是否显著不同的检验结果(在SPSS选项中选择Wilks' Lambda,Rao's V,The Squared Mahalanobis Distance或The Sum of Unexplained Variations等检验的计算机输出),以确定是否分类结果是仅仅由于随机因素.
此外成员的权数(SPSS用prior probability,即"先验概率",和贝叶斯统计的先验概率有区别)需要考虑;一般来说,加权要按照各类观测值的多少,观测值少的就要按照比例多加权.
对于多个判别函数,要弄清各自的重要性.
注意训练样本的正确和错误分类率.研究被误分类的观测值,看是否可以找出原因.
看了 在应用聚类分析和判别分析解决...的网友还看了以下:
导数可以解决哪些问题?还有为什么能解决这类问题,希望能举一个例导数的几何意义指的就是在曲线上点的切 2020-05-13 …
化学问题20%的硫酸溶液与40%的硫酸溶液混合所得的溶液的质量分数为多少?若为等体积混合呢?题目没 2020-05-15 …
你能提出用乘法解决的问题吗?并解答.这类问题,如果提出用乘加乘减解答的问题,正确吗? 2020-05-17 …
决策支持系统主要支持以下哪类决策问题?A.定性决策与结构化决策B.定量决策与半结构化决策C.半结 2020-05-23 …
读图,分析漫画“所剩无几”,回答下列问题.(1)这幅漫画“所剩无几”反映了当前人类所面临的问题.( 2020-06-10 …
c++解决二义性的方法解决类继承中产生的二义性的方法不包括A)使用作用域运算符限定访问的成员函数B) 2020-11-01 …
解决问题时需要思考:是否解决过与其类似的问题.小明从问题1解题思路中获得启发从而解决了问题2.问题1 2020-11-01 …
有关二叉排序树和结点的问题题目是这样的:由4个结点可以构造出多少种不同的二叉排序树?答案是14.我想 2020-11-03 …
已知高二年级的某6名学生,独立回答某类问题时答对的概率都是0.5,而将这6名同学平均分为甲、乙、丙3 2020-12-23 …
(2009•青岛)我们在解决数学问题时,经常采用“转化”(或“化归”)的思想方法,把待解决的问题,通 2021-01-02 …