弯辊控制是热轧板形控制的主要方法之一, 原理是通过向工作辊和支撑辊辊颈施加液压弯辊力, 使轧辊产生弯曲变形来改变辊缝凸度, 从而影响轧制过程中有载辊缝形状, 促使带钢变形沿宽度方向发生改变, 补偿由于其他轧制工艺因素变化带来的板形不良, 保证带钢出口板形精度[1].在实际生产中, 合适的弯辊力设定值不容易得到, 通常是根据带钢的温度、厚度、宽度、轧制力、材质、轧辊的热膨胀、轧辊磨损及平直度和凸度等影响因素进行综合计算.然而, 现有的基于传统数学方法的弯辊力设定模型结构非常复杂, 各影响因素具有非线性、强耦合、时变性的特点, 严重影响了弯辊力设定模型精度的进一步提高.因此, 探索新的弯辊力设定模型显得十分必要.近年来, 基于人工智能算法的模型逐渐应用于许多工程领域且实际效果良好[2].人工神经网络的特点在于其能够完成内部关系复杂的系统建模, 可以解决传统的非线性问题, 此外, 其自身还具有良好的鲁棒性和容错性, 所以本文探索建立基于人工神经网络的热连轧过程弯辊力预设定模型.
1 弯辊力预测模型的神经网络建模 1.1 人工神经网络原理简介人工神经网络是学者受生物神经网络感知世界的原理启发提出的一种数学模型[3], 它可以完成大量数据的并行处理, 通过不断修正不同神经元之间的权值和阈值来对输入数据进行建模, 从而解决实际问题.误差逆传播网络, 又称BP网络, 是最常用的神经网络, 其主要特点是信号前向传递和误差反向传递, 输入信号从输入层经隐含层到输出层依次向后传递, 当网络进行训练时, 如果实际输出值达不到期望输出值, 则误差信号从输出层经隐含层到输入层逆向传递来修正神经元间的连接权值和阈值, 直至输出结果达到设定要求.典型的三层BP网络示意图如图 1所示.
具体来说, 信号的前向传递, 即每个神经元的输出都由上一层神经元的输入决定, 具体公式为
隐含层第i个节点的输出[4]
(1) |
输出层第k个节点的输出[4]
(2) |
式中:f和φ分别为隐含层和输出层激活函数; M和q分别为隐含层和输出层输入向量维数; wij和wkj分别为输入层与隐含层的权值和隐含层和输出层的权值; θ和ak分别为隐含层和输出层阈值; xi为第i个节点的实际输入.
误差的反向传递, 即各神经元之间的连接权值和阈值根据误差梯度下降法从输出层经隐含层到输入层逐层调节, 使修改后的网络输出达到预期目标.每一个样本p的二次型误差函数为Ep[5]:
(3) |
系统对P个训练样本的总误差准则函数为[6]
(4) |
式中:Tkp和Okp分别为目标值和预测值.
当总误差函数达到目标值或达到期望要求时, 学习过程结束[7].
1.2 样本数据的收集与处理神经网络的样本依赖性强, 想要建立泛化能力强的网络, 样本数据的选择尤为重要.网络模型的逼近和推广能力与学习样本的典型性密切相关.如果样本集合的代表性差, 矛盾样本多, 存在冗余样本, 网络就难以达到预期效果[8].本文从某钢厂采集热轧不锈钢末机架在线数据, 根据拉依达准则去除其中的错误数据和噪音数据得到1444块钢的在线检测数据, 取其中76%(1110块)作为训练集, 用于调整网络的权值和阈值; 取其中的30%(334块)作为验证集, 一般情况下在训练集训练过程中, 验证集上的误差也同时被监控, 验证集误差会在训练过程中减少, 当网络开始过度拟合数据时, 验证集上的误差会增大, 当满足迭代停止条件时, 训练停止, 选取使验证集上达到最小误差所对应的权值和阈值作为最终神经网络的权值和阈值.
将训练样本正式输入神经网络时, 需要对数据进行归一化处理, 目的是消除因数据不同维度上数量级的差距引起的较大预测误差.数据归一化采用以下公式:
(5) |
式中:min(xi)为数据序列中的最小数值; max(xi)为数据序列中的最大数值; xi为第i个数据.
1.3 网络结构的设计输入层神经元为影响热轧板形弯辊力设定的主要因素, 本文中选取轧制过程中带钢入口温度T, 入口厚度H, 出口厚度h, 带钢宽度W, 轧制力FR, 轧制速度v, 工作辊横移量S, 带钢屈服强度σs和目标凸度C等9个参数为输入层神经元, 输出层神经元为弯辊力FB.中间隐含层神经元个数对整体神经网络模型的性能有着显著影响, 通常, 较多的隐含层神经元个数会使网络性能提高, 但也导致网络训练时间过长, 较少的神经元个数则会导致网络的泛化能力不足.目前, 国际上没有确定隐含层神经元个数的通用方法, 在实际应用过程中只能通过“试凑法”来确定, 本文对不同隐含层神经元个数网络性能进行大量测试, 最终确定的隐含层神经元个数为11个.测试效果如表 1所示.
神经网络训练过程中的参数设定也会对网络性能有很大影响, 这些参数包括学习算法、各层之间的传递函数、网络学习率等.本文中经过大量实验最终确定网络采用‘trainbr’学习算法, 输入层与隐含层传递函数确定为‘Logsig’函数, 隐含层与输出层传递函数确定为‘Purelin’函数, 网络学习率为0.1.
2 遗传算法优化神经网络遗传算法是模拟自然界遗传机制和生物进化论而形成的一种并行随机搜索最优化方法[9-10].虽然BP算法有较强的容错能力和自适应能力, 它的缺点也很明显, 如收敛速度慢、容易陷入局部极小点.为了避免这些缺点, 本文采用遗传算法对神经网络的初始权值和阈值进行优化, 经遗传算法优化后的BP网络可以更好地实现模型预测.优化过程主要包括遗传算法种群初始化, 确立算法适应度函数以及执行遗传因子操作.优化过程流程图如图 2所示.
种群规模决定算法的复杂程度, 种群规模太小容易产生病态基因, 种群规模太大容易导致算法不收敛.交叉概率和变异概率分别控制交叉因子和变异因子的使用频率, 只有二者协调配合才能保证算法在解空间的全局搜索而不陷于局部极小.经过大量实验, 最终确定在本文数据集条件下, 算法种群规模为40, 交叉概率和变异概率分别为0.7和0.05.
2.1 适应度函数表征种群个体适应度大小的函数称为适应度函数, 适应度较高的个体能够遗传到下一代种群.适应度函数的计算公式为
(6) |
式中:n为网络输出层神经元个数; y*为神经网络第i个神经元的期望输出;
选择操作意味着在群体中选择具有较强生命力的个体遗传到下一代, 本文采用基于适应度比例的选择策略, 个体i的选择概率pi为
(7) |
式中:Fi为个体i的适应度值; N为种群个体数.
2.3 交叉操作交叉操作也被称为重组操作, 是指两对染色体以某种方式相互交换.本文中染色体编码方式为实数编码, 所以交叉操作也采用实数交叉, 第k个染色体Ak和第l个染色体Al在j位置的交叉方法如下:
(8) |
(9) |
式中η为0~1之间随机数.
2.4 变异操作变异操作有利于增加种群的多样性, 防止算法陷入局部极小.选取第i个个体的第j个基因Aij进行变异, 变异操作方法如下:
(10) |
(11) |
式中:Amax和Amin分别为基因Aij的上下界; r1和r2为0~1之间随机数; G为当前迭代次数; Gmax为最大进化次数.
3 模型预测结果分析将从现场采集到的数据集输入遗传算法优化的神经网络进行弯辊力预测研究, 神经网络模型在训练过程中的性能变化曲线如图 3所示, 可以看出当网络迭代40次时, 误差缩小到0.009724.遗传算法优化过程的适应度曲线如图 4所示.图 5显示了本文提出的经遗传算法优化的GA-ANN模型与ANN模型分别在训练集和测试集上弯辊力预测效果的回归分析图, 可以看出, 无论在训练集还是测试集上, GA-ANN模型的弯辊力预测值和实际值拟合效果明显优于ANN模型.在训练集上, GA-ANN模型的最大误差为5.12%, 在测试集上的最大误差为4.52%, 而ANN模型在两个数据集上分别为6.07%和5.68%, 这充分证明遗传算法起到了优化神经网络的作用, 提高了弯辊力预测模型的精度.
图 6是GA-ANN模型和ANN模型在训练集和测试集上弯辊力的预测效果图, 从图中可以看出, 实际值与预测值契合度较好, 神经网络模型实现了热轧弯辊力的成功预测.为了更加全面准确地评价GA-ANN模型的整体性能, 以相关系数R, 平均绝对误差MAE, 平均绝对百分误差MAPE, 均方根误差RMSE作为模型评价的性能指标, 计算结果如表 2所示.图 7是GA-ANN模型与ANN模型上MAE, MAPE, RMSE三项误差对比图.图中清晰表明无论在训练集还是测试集上, 本文提出的GA-ANN模型的各项误差指标都明显小于未经遗传算法优化的ANN模型, 再次证明GA-ANN模型能够更加准确地实现热轧过程弯辊力的预报, 且模型的泛化能力高, 具有结构简单、易于推广的优点, 为热轧过程弯辊力的设定与优化研究提供了新的思路与方法.
本文提出一种基于遗传算法优化神经网络的热轧带钢弯辊力预报方法, 采用某热轧不锈钢生产线的末机架数据来训练并测试网络, 比较了采用智能算法优化的神经网络模型与单纯神经网络模型的性能.实验研究表明, GA-ANN模型可以更加准确预报弯辊力.此外, GA-ANN模型结构简单, 能够处理非线性、强耦合等复杂问题且推广能力强, 具有很大的应用潜力.本文的研究为热轧弯辊力的设定与优化提供了新的方法与思路, 对实际生产具有一定的指导意义.
[1] |
王国栋.
板形与板凸度控制[M]. 北京: 化学工业出版社, 2016: 181-182.
( Wang Guo-dong. Strip profile and flatness control[M]. Beijing: Chemical Industry Press, 2016: 181-182. ) |
[2] |
王国栋, 刘相华.
金属轧制过程人工智能优化[M]. 北京: 冶金工业出版社, 2000: 1-10.
( Wang Guo-dong, Liu Xiang-hua. Artificial intelligence optimization of metal rolling process[M]. Beijing: Metallurgy Industry Press, 2000: 1-10. ) |
[3] |
Haykin S.
Neural networks:a comprehensive foundation[M]. New York: Macmillan, 1994.
|
[4] |
Deng J, Gu D, Li X, et al.
Structural reliability analysis for implicit performance functions using artificial neural network[J]. Structural Safety, 2005, 27(1): 25–48.
DOI:10.1016/j.strusafe.2004.03.004 |
[5] |
Mukhpadhyay A, Iqbal A.
Prediction of mechanical properties of hot rolled, low-carbon steel strips using artificial neural network[J]. Materials and Manufacturing Processes, 2005, 20(5): 793–812.
DOI:10.1081/AMP-200055140 |
[6] |
Mukhopadhyay A, Iqbal A.
Comparison of ANN and MARS in prediction of property of steel strips[J]. Applied Soft Computing Technologies:The Challenge of Complexity, 2006, 34(8): 329–341.
|
[7] |
Shahani A, Setayeshi S, Nodamaie S, et al.
Prediction of influence parameters on the hot rolling process using finite element method and neural network[J]. Journal of Materials Processing Technology, 2009, 209(4): 1920–1935.
|
[8] |
周英, 卓金武, 卞月青.
大数据挖掘:系统方法与实例分析[M]. 北京: 机械工业出版社, 2017: 24-26.
( Zhou Ying, Zhuo Jin-wu, Bian Yue-qing. Big data mining: system approach and case analysis[M]. Beijing: China Machine Press, 2017: 24-26. ) |
[9] |
Holland J H.
Adaptation in natural and artificial systems:an introductory analysis with applications to biology, control and artificial intelligence[M]. Ann Arbor: University of Michigan Press, 1975: 1-2.
|
[10] |
Ma C, Zhao L, Mei X, et al.
Thermal error compensation of high-speed spindle system based on a modified BP neural network[J]. The International Journal of Advanced Manufacturing Technology, 2016, 89(9): 3071–3085.
|