摘要: 对于工业过程数据中的离群点,一般采用稳健估计技术处理.针对Fast-MCD算法中初值随机给定,以及当样本数据较大时,人为给定分堆个数的缺点,提出了一种基于模糊聚类的改进稳健估计算法,即采用聚类中心及聚类个数分别作为Fast-MCD算法的初值及分堆个数选择依据,从而提高计算效率,并使样本数据较大时的分堆计算更合理.将本方法用于分析铝酸钠溶液的温度电导建模数据,实现了离群点的辨识,可以消除不规则数据对软测量建模的不合理影响.与Fast-MCD方法相比,它收敛速度快,计算效率高.
中图分类号:
王魏;赵立杰;柴天佑;. 基于改进Fast-MCD的稳健数据预处理方法[J]. 东北大学学报(自然科学版), 2011, 32(6): 761-764.
Wang, Wei (1); Zhao, Li-Jie (1); Chai, Tian-You (1) . An improved robust data preprocessing method based on Fast-MCD algorithm[J]. Journal of Northeastern University, 2011, 32(6): 761-764.