摘要: 以某钢铁企业的热轧带钢生产实际数据作为分析对象,基于改进的随机森林算法分析工艺参数与产品质量间的隐含关系,进行影响产品质量关键工艺参数的特征提取,建立热轧带钢产品缺陷预测模型.实验结果表明,对非平衡数据集进行平衡处理可以提高样本预测精度;采用CART与C4.5相结合的方法比单一方法可以进一步提升预测精度;同时根据特征的高相关与低相关特性,将互信息作为评价指标应用于特征选择,可以提升随机森林算法的分类效果.在以上三种改进策略下,热轧带钢缺陷的识别率得到明显提高.
                                                        
                            
                              
                             
                            
                            																								
								
																中图分类号: 
																 
								
								
																                            
                            
                                
                                    
                                
                                
                                    
                                        															纪英俊, 勇晓玥, 刘英林, 刘士新. 基于随机森林的热轧带钢质量分析与预测方法[J]. 东北大学学报:自然科学版, 2019, 40(1): 11-15.	
																																									     												                                                                                                        	                                                                                                                      JI Ying-jun, YONG Xiao-yue, LIU Ying-lin, LIU Shi-xin. Random Forest Based Quality Analysis and Prediction Method for Hot-Rolled Strip[J]. Journal of Northeastern University Natural Science, 2019, 40(1): 11-15.