摘要:
基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个临时的权重被分配给每一个样本以增强少样本类的影响,同时减少多样本类的影响,进而提高肿瘤分类的准确率.实验结果表明,所提方法能够提高少样本类的识别率,从而提高分类器的总体性能.
中图分类号:
姜琳颖, 余东海, 石鑫. 基于加权极限学习机的肿瘤基因表达谱数据分类[J]. 东北大学学报:自然科学版, 2017, 38(6): 798-803.
JIANG Lin-ying, YU Dong-hai, SHI Xin. Tumor Microarray Gene Expression Data Classification Based on Weighted Extreme Learning Machine[J]. Journal of Northeastern University Natural Science, 2017, 38(6): 798-803.