摘要: 以某钢铁企业的热轧带钢生产实际数据作为分析对象,基于改进的随机森林算法分析工艺参数与产品质量间的隐含关系,进行影响产品质量关键工艺参数的特征提取,建立热轧带钢产品缺陷预测模型.实验结果表明,对非平衡数据集进行平衡处理可以提高样本预测精度;采用CART与C4.5相结合的方法比单一方法可以进一步提升预测精度;同时根据特征的高相关与低相关特性,将互信息作为评价指标应用于特征选择,可以提升随机森林算法的分类效果.在以上三种改进策略下,热轧带钢缺陷的识别率得到明显提高.
中图分类号:
纪英俊, 勇晓玥, 刘英林, 刘士新. 基于随机森林的热轧带钢质量分析与预测方法[J]. 东北大学学报:自然科学版, 2019, 40(1): 11-15.
JI Ying-jun, YONG Xiao-yue, LIU Ying-lin, LIU Shi-xin. Random Forest Based Quality Analysis and Prediction Method for Hot-Rolled Strip[J]. Journal of Northeastern University Natural Science, 2019, 40(1): 11-15.