早教吧 育儿知识 作业答案 考试题库 百科 知识分享

英语翻译根据原始数据样本中是否含有模式类别的信息,特征选择过程可分为有监督特征选择和无监督特征选择.有监督特征选择是指在给定模式类别的前提下,利用特征之间以及特征与类别之

题目详情
英语翻译
根据原始数据样本中是否含有模式类别的信息,特征选择过程可分为有监督特征选择和无监督特征选择.有监督特征选择是指在给定模式类别的前提下,利用特征之间以及特征与类别之间的关系对特征集进行选择的过程.无监督特征选择是指在原始数据集中,通过数据集中特征自身之间的关系进行特征选择.在本文阐述的用户特征的选择过程中,我们采用无监督特征选择的方法,依据一定的经验判断准则,选择一个合适的用户数据特征子集使之能够最好地覆盖数据的自然分类.目前常用的算法有基于遗传算法的特征选择方法[ 5] 、基于模式相似性判断的特征选择方法[ 6] 和信息增益的特征选择方法[ 7] ,这几种算法并没有考虑特征之间的相关性和特征属性对分类的影响.本文依据客户属性特征对终端偏好分类结果的影响和客户属性特征之间相关性分析两个方面提出了一种基于遗传算法和K-均值聚类的客户属性特征选择方法,该方法是基于无监督学习的特征选择算法.其基本思想是利用遗传算法选择初始的特征子集,对每一个特征子集利用K-均值聚类算法确定其最佳分类数,然后以DB Index 准则设定一个判断函数用于特征选择,最后从选择出来的特征子集中删除掉相关性较大的特征,减小特征的冗余性.
▼优质解答
答案和解析
According to the original data samples contain pattern categories of information, the feature selection process can be divided into supervised feature selection and unsupervised feature selection. Sup...