东北大学学报(自然科学版) ›› 2022, Vol. 43 ›› Issue (7): 921-929.DOI: 10.12068/j.issn.1005-3026.2022.07.002
李占山, 杨云凯, 张家晨
LI Zhan-shan, YANG Yun-kai,ZHANG Jia-chen
摘要: 互信息过滤式特征选择算法往往仅局限于互信息这一度量标准.为规避采取单一的互信息标准的局限性,在互信息的基础上引入基于距离度量的算法RReliefF,从而得出更好的过滤式准则.将RReliefF用于分类任务,度量特征与标签的相关性;应用最大互信息系数(maximal information coefficient,MIC)度量特征与特征之间的冗余性、特征与标签的相关性;最后,应用熵权法为MIC和RReliefF进行客观赋权,提出了基于熵权法的过滤式特征选择算法(filtering feature selection algorithm based on entropy weight method, FFSBEWM).在13个数据集上进行对比实验,结果表明,FFSBEWM所选择的特征子集的平均分类准确率和最高分类准确率均优于其他对比算法.
中图分类号: