高炉炼铁作为钢铁生产的主要上游环节, 其生产的铁水质量和产量直接决定着钢铁的产量和生产成本.目前, 对高炉炼铁的主要研究工作仍是保证高炉的稳定、顺行、高产, 具体来说分为对高炉的上部调剂研究和下部调剂研究.下部调剂主要根据富氧顶压、喷煤、风温等高炉参数来调节铁水质量, 这部分研究多集中在铁水温度、硅、磷、硫含量等的预报上[1-2].上部调剂主要是调整布料制度来控制炉料的分布, 以此来调节煤气流的分布和煤气的利用率.现今对高炉下部调剂研究较多, 而对上部调剂研究较少.
1 十字测温十字测温作为广泛使用的高炉炉顶温度监测装置, 可以反映高炉炉顶煤气流的分布[3].高炉操作人员根据煤气流的分布来调整布料制度, 使炉料合理分布.如图 1所示, 十字测温装置通常由4个测温臂、21个测温点组成, 用来测量炉喉主要点位置的温度.准确地监测十字测温温度, 估计炉内煤气流分布, 及时调整布料制度, 能够辅助高炉稳定顺行, 达到高产高效的效果.然而, 由于高炉中心带温度过高, 导致十字测温装置的传感器寿命较短, 特别是高炉中心的5个测温点传感器极易损坏.图 2为某高炉十字测温点6和15的热电偶传感器损坏现状.由于十字测温传感器更换周期较长, 更换不及时会严重影响高炉操作人员对高炉内部煤气流分布的判断, 导致无法及时地调整布料矩阵, 降低了高炉的生产效率.本文针对上述问题对十字测温装置靠近中心的5个测温点 (测温点5, 6, 16, 15, 17) 的温度进行估计, 保证在高炉中心温度点传感器有损坏时, 操作人员可以根据温度的估计值来判断炉内煤气流分布, 及时调整布料矩阵.
高炉是一个多变量、强耦合、大滞后的系统, 十字测温点温度受多种因素的影响, 准确的机理模型难以建立.本文基于数据驱动建模技术, 采用多输出支持向量回归 (M-SVR) 和随机权神经网络 (RVFLNs) 算法, 建立高炉十字测温中心5点温度的估计模型.
2 基于多元统计分析的建模输入变量选取影响高炉十字测温中心5点温度的因素很多, 主要包括十字测温其他温度点温度、顶温、雷达料线、顶压等30个变量.若30个变量同时作为输入变量则会造成信息冗余和模型计算量过大, 严重影响模型的计算效率和估计精度.本文选取5000组高炉实际生产数据利用多元统计分析对高炉采集到的实际数据进行因子分析和相关性分析[2, 4].对5个输出变量进行因子分析得到一个可以代表其他5个输出的主因子, 再将得到的主因子与其余30个变量进行相关性分析, 如表 1所示.
根据以上对输入变量的分析并结合工程实际, 选取相关性在0.5以上的9个因子作为输入变量:十字测温点3, 4, 8, 10, 19, 顶温东南、顶温西北、顶温西南、顶温西北.设9个输入变量为X1(t), …, X9(t), 设5个输出变量为Y1(t), …, Y5(t), 考虑到高炉炼铁过程的动态特性以及输入输出之间的时序和滞后关系, 将上一时刻的输入和输出数据也作为输入变量[5], 从而构成23输入5输出的估计模型.
3 十字测温中心温度估计建模算法 3.1 基于M-SVR的十字测温中心温度估计算法SVR是一种基于统计学习理论的机器学习方法, 由于其在小样本情况下仍具有较好的建模和泛化能力, 因而被广泛用于工业过程的数据驱动建模.M-SVR是SVR的发展和改进, 通过在超球空间重新定义ε不敏感损失函数, 将多个输出同时纳入风险评估, 最终采用迭代变权最小二乘求解对偶问题, 从而获得多输入多输出的估计模型[5-6].M-SVR基本算法如下:
仿照单输出支持向量机的方法构造目标函数, 求取w, b寻找最大分类面, 最小化目标函数:
(1) |
ε不敏感损失函数可扩展成多维形式, 用输出变量误差的L2范数代替原单维误差, 定义:
(2) |
式中:ui=‖ei‖=
(3) |
式中:eik=yi-ỹik=yi-φ(xi) wik-bik; uik=‖eik‖=
(4) |
式中:
RVFLNs由Pao于1992年在前馈神经网络强大的辨识能力基础上提出的[7].不同于传统的基于梯度下降的神经网络需要通过误差的反向传播迭代寻优, RVFLNs[8]可以保证逼近任意连续函数的前提下, 随机给定隐含层的权值w和阈值b, 通过正则化原则计算输出权值建立模型.RVFLNs算法如下:
给定N组数据样本 (xi, yi), xi=[xi1, xi2, …, xin]T∈Rn, yi=[yi1, yi2, …, yim]T∈Rm, L个隐含层节点, 激活函数为g (x)(本文选择Sigmoid函数), 依据Schmidt[9]指出的区间[-1, 1]内随机选取隐含层节点参数输入权向量wi和阈值bi, 得隐含层的输出矩阵为A=g( < w, x > +b).从而RVFLNs的输出为
(5) |
式中:i=1, 2, …, L; j=1, 2, …, N.
式 (5) 写成矩阵简化形式为
(6) |
式中: Y为期望输出; β为输出权值.RVFLNs训练过程就是得到合适的ŵi,
(7) |
如果在网络学习过程中, 隐含层节点数L和学习样本数N相同时, 输出矩阵A是方阵且可逆, 此时单隐层随机权神经网络可以以0误差逼近训练样本.然而, 通常情况下隐含层节点数会远远小于训练样本数, 即L
为了验证建立温度估计模型的有效性, 选取某炼铁厂2号高炉2014年9月实际生产数据进行验证.在正常生产情况下, 选取训练样本700组 (采样周期10s), 测试样本400组.根据以上对输入变量的分析, 选取顶温等9个变量作为输入变量.考虑到测量装置的随机噪声和数据量纲对模型的影响, 因此对数据进行离群点的剔除和归一化处理.同时, 为了验证M-SVR和RVFLNs在高炉十字测温建模效果的精度, 将其建模效果分别与常见线性回归建模方法偏最小二乘回归[10](PLS) 进行对比.PLS在建模过程中集成成主成分分析、典型相关分析和线性回归分析的特点, 特别适用于当输入输出变量个数较多, 且都存在较强的相关性的建模.
4.1 M-SVR模型估计效果根据以上描述的M-SVR算法, 需要对M-SVR的两个参数, 即伸缩变量σ和误差惩罚因子C进行设定.通常采取试凑法来选取两个参数, 本文通过遗传算法[11-12]对两个参数的选取进行优化, 经过遗传计算得到当伸缩变量σ=0.6, 误差惩罚因子C=0.5, 达到最佳估计效果.应用PLS与M-SVR进行比较, 图 3为M-SVR模型对测试样本的测试效果, 通过仿真结果明显可以看出, M-SVR模型具有良好的估计精度, 估计值与实际值已非常吻合, 同时可以看出, M-SVR的建模和泛化性能都明显优于线性建模方法PLS.
选择同样的训练样本和测试样本.通过多次实验, 确定当模型的隐含层节点个数选择为50时取得最好的建模效果.最终构成一个23-50-5的随机权神经网络结构,为了体现RVFLNs在十字测温温度估计的建模优势, 仍采用常用PLS模型进行对比.图 4为RVFLNs模型的测试效果.可以看出, RVFLNs模型也具有良好的估计效果, 模型估计值与实际值变化趋势一致且误差较小, 估计精度也明显优于PLS.
从以上仿真实验可以看出, M-SVR模型与RVFLNs模型都具有较好的估计能力和泛化性能, 均可用于十字测温的在线估计应用.以下将对M-SVR模型和RVFLNs模型的十字测温泛化能力进行统计比较.表 2给出了不同模型对十字测温中心5点温度 (T5, T6, T16, T15, T17) 估计的均方根误差 (RMSE) 比较, 其中N表示所需估计的样本点个数, yi是实际值, ỹi是模型的估计值.表 3给出了不同模型在十字测温中心5点温度估计误差的平均值和标准差.可以看出M-SVR模型和RVFLNs模型在建模精度方面相差不大, 都具有较好的建模效果.但从模型测试误差指标比较可以看出M-SVR模型在不同测温点的精度更高, 泛化能力更强.
以上分析是根据固定样本数量进行分析的, 为了得到更为一般的结论, 从训练样本规模变化的角度, 进一步比较两种算法建模和泛化能力.本文通过求取从输入样本数量100, 200, …, 2500, 输出样本数量为400的情况下, 从建模和测试误差平均值Δȳ; 角度比较两种方法的建模和泛化能力.从图 5可以看出,在不同训练样本下, M-SVR模型的建模误差整体要小于RVFLNs模型.从图 6可以看出, 当训练样本数充足时, M-SVR模型和RVFLNs模型的测试误差趋于下降, 但M-SVR模型测试误差要略小于RVFLNs模型, 说明在高炉十字测温温度估计中, M-SVR模型的估计效果相比于RVFLNs模型要好, 因此M-SVR更适合用于高炉十字测温温度估计.
以上比较说明M-SVR模型估计效果和泛化性能要优于RVFLNs模型.为此, 将M-SVR模型编制成软件用于工业实际, 以便于操作人员对炉顶温度进行观察.十字测温估计软件采用通用C/S (Client/Server) 结构, 以专用网络为传输环境, 服务器提供链接和数据交换服务, 数据库采用SQL 2012, 编程环境为.NET, 编程语言为C#, 界面编写为窗体形式, 编程工具使用Visual Studio 2010.图 7为工业现场的十字测温中心温度估计系统.应用表明, 该软件可根据实时数据对十字测温中心5点温度及其趋势进行精确估计, 帮助现场高炉操作人员对布料操作进行决策.
本文分别应用M-SVR和RVFLNs两种智能算法建立了高炉十字测温中心5点温度估计模型.与其他算法相比M-SVR具有运算速度快、精度高并且具有较好的泛化能力, RVFLNs具有运算速度快, 建模效果好, 估计精准等优势.并且本文将两种算法的建模和泛化能力进行了对比, 两种算法都具有较好的建模和泛化性能, 但整体而言当样本数量充足时, M-SVR的泛化性能优于RVFLNs.在工业现场的应用中基于M-SVR模型的软件估计准确, 能够很好地辅助高炉操作人员对炉顶温度进行观察.因此, M-SVR更适用于高炉十字测温温度的估计.
[1] | Jian L, Gao C H, Li L, et al. Application of least squares support vector machines to predict the silicon content in blast furnace hot metal[J]. ISIJ International, 2008, 48(11): 1659–1661. DOI:10.2355/isijinternational.48.1659 |
[2] | Yuan M, Zhou P. Intelligent multivariable modeling of blast furnace molten iron quality based on dynamic AGA-ANN and PCA[J]. Journal of Iron and Steel Research, International, 2015, 22(6): 487–495. DOI:10.1016/S1006-706X(15)30031-5 |
[3] | Zhao J, Liu Y, Zhang X P, et al. A MKL based on-line prediction for gasholder level in steel industry[J]. Control Engineering Practice, 2012, 20: 629–641. DOI:10.1016/j.conengprac.2012.03.003 |
[4] | Zhou P, Yuan M, Wang H, et al. Multivariable dynamic modeling for molten iron quality using online sequential random vector functional-link networks with self-feedback connections[J]. Information Sciences, 2015, 325(12): 237–255. |
[5] | Tuia D, Verrelst J, Alonso L, et al. Multioutput support vector regression for remote sensing biophysical parameter estimation[J]. IEEE Geoscience and Remote Sensing Letters, 2011, 8(4): 804–808. DOI:10.1109/LGRS.2011.2109934 |
[6] | Sanchez F, Cumplido D P, Arenas G, et al. SVM multiregression for non linear channel estimation in multiple-input multiple-output systems[J]. IEEE Transactions on Signal Processing, 2004, 52(8): 2298–2307. DOI:10.1109/TSP.2004.831028 |
[7] | Pao Y H, Takefuji Y. Functional-link net computing:theory, system architecture, and functionalities[J]. Computer, 1992, 25(5): 76–79. DOI:10.1109/2.144401 |
[8] | Han H G, Wang L D, Qiao J F. Hierarchical extreme learning machine for feedforward neural network[J]. Neurocomputing, 2014, 128(5): 128–135. |
[9] | Schmidt W F, Kraaijveld M, Duin R P W.Feedforward neural networks with random weights[C]//1992 Pattern Recognition Conference B:Pattern Recognition Methodology and Systems.Cydney, 1992:1-4. |
[10] | Martens H, Martens M. Modified Jack-knife estimation of parameter uncertainty in bilinear modelling by partial least squares regression[J]. Food Quality & Preference, 2000, 99(11): 5–16. |
[11] | Saracoglu I, Topaloglu S, Keskinturk T. A genetic algorithm approach for multi-product multi-period continuous review inventory models[J]. Expert Systems with Applications, 2014, 41(18): 8189–8202. DOI:10.1016/j.eswa.2014.07.003 |
[12] | Gao X X, Yang H X, Lin L, et al. Wind turbine layout optimization using multi-population genetic algorithm and a case study in Hong Kong offshore[J]. Journal of Wind Engineering and Industrial Aerodynamics, 2015, 139: 89–99. DOI:10.1016/j.jweia.2015.01.018 |