东北大学学报:自然科学版  2019, Vol. 40 Issue (7): 974-979  
0

引用本文 [复制中英文]

李嘉琳, 何巍华, 曲永志. PSO优化深度神经网络诊断齿轮早期点蚀故障[J]. 东北大学学报:自然科学版, 2019, 40(7): 974-979.
[复制中文]
LI Jia-lin, HE David, QU Yong-zhi. Diagnosis of Gear Early Pitting Faults Using PSO Optimized Deep Neural Network[J]. Journal of Northeastern University Nature Science, 2019, 40(7): 974-979. DOI: 10.12068/j.issn.1005-3026.2019.07.012.
[复制英文]

基金项目

国家自然科学基金资助项目(51505353, 51675089)

作者简介

李嘉琳(1993-), 男, 辽宁沈阳人, 东北大学博士研究生;
何巍华(1961-), 男, 美国芝加哥人, 东北大学教授, 博士生导师。

文章历史

收稿日期:2017-04-29
PSO优化深度神经网络诊断齿轮早期点蚀故障
李嘉琳 1, 何巍华 1,2, 曲永志 3     
1. 东北大学 机械工程与自动化学院, 辽宁 沈阳 110819;
2. 伊利诺伊大学芝加哥分校 机械及工业工程系, 伊利诺伊州 芝加哥 60607;
3. 武汉理工大学 机电工程学院, 湖北 武汉 430070
摘要:基于数据驱动方法诊断齿轮故障时一般会用傅里叶变换等进行特征提取, 特征提取方法的选取对诊断结果影响很大.提出应用深度神经网络来诊断齿轮早期点蚀故障, 直接以采集的振动信号作为网络输入, 可以避免特征提取环节产生误差.此外, 应用粒子群算法优化深度神经网络, 使训练过程更稳定、诊断率更高.在分析结果时应用主成分分析法对网络输出进行降维.用实验采集的数据训练并测试网络, 诊断正确率能达到90 %之上, 证明所提出的方法是合理、可用的.
关键词齿轮    早期点蚀    粒子群算法    深度神经网络    主成分分析    
Diagnosis of Gear Early Pitting Faults Using PSO Optimized Deep Neural Network
LI Jia-lin 1, HE David 1,2, QU Yong-zhi 3     
1. School of Mechanical Engineering & Automation, Northeastern University, Shenyang 110819, China;
2. Department of Mechanical & Industrial Engineering, University of Illinois at Chicago, Chicago 60607, USA;
3. School of Mechanical and Electronic Engineering, Wuhan University of Technology, Wuhan 430070, China
Corresponding author: HE David, E-mail:heweihua@me.neu.edu.cn
Abstract: When gear faults were diagnosed based on the data-driven method, feature extraction was generally performed by Fourier transform, etc. The feature extraction method used has a great influence on the diagnosis results. Therefore, deep neural network(DNN) was proposed to diagnose early gear pitting faults and the vibration signals are directly used as the network inputs to avoid errors caused by feature extraction. In addition, the particle swarm optimization(PSO) algorithm was applied to optimize the DNN for obtaining a more stable training process and better diagnosis results. Principal component analysis(PCA) algorithm was used to reduce the dimensions of the DNN outputs. The data collected from the experiment was used to train and test the DNN. The fault diagnostic accuracy can reach over 90 %, which proves that the proposed method is reasonably effective.
Key words: gear    early pitting    PSO algorithm    deep neural network(DNN)    principal component analysis(PCA)    

齿轮是现代机械设备中最常见的传动零件, 广泛应用于飞机、汽车、机床等现代机械设备, 所以对其的故障监测十分必要.齿轮的故障包括齿轮断齿、齿轮点蚀、齿面划痕、齿面磨损等, 其中齿轮点蚀故障大约占齿轮全部故障的31 % [1].

齿轮点蚀故障的诊断方法有很多, 可以先对时域信号进行处理, 之后根据经验分析是否发生故障.文献[2]分别应用了傅里叶变换(Fourier transform, FT)和小波变换(wave transform, WT)来处理振动信号, 并分析处理结果判断齿轮的状况.文献[3]应用了双频谱分析法处理振动信号, 并对比健康和故障齿轮的频谱差异.文献[4]通过信号的静态特征如均方差和峭度等区别齿轮状况, 并对信号进行了包络分析.文献[5]应用稀疏全变分模型实现振动信号冲击调整分离并进行包络分析诊断齿轮故障.以上方法均是信号处理后依靠经验人为判断是否发生故障.此外还有应用特征提取和智能算法来进行故障诊断的, 文献[6]分别应用了支持向量机(SVM)和人工神经网络(artificial neural network, ANN)来诊断轴承故障, 从时域信号中提取平均值、均方差和峭度等9个统计量作为ANN的输入, 并应用遗传算法(GA)优化ANN.文献[7]从时域信号提取了24个统计量并应用ANN来诊断齿轮-轴承的混合故障.文献[8]应用希尔伯特-黄变换提取6个特征参数作为自组织映射(self-organization mapping, SOM)神经网络的输入进行齿轮故障诊断.文献[9]结合混沌优化策略和人工蜂群搜索算法提出了引力搜索径向基神经网络诊断机车齿轮箱故障.文献[10]应用连续的WT处理声发射信号, 之后应用ANN来进行故障诊断.

由于特征提取困难, 本文提出应用深度神经网络(deep neural network, DNN)来诊断早期齿轮点蚀故障, 不进行特征提取操作, 直接将采集的振动信号做DNN的输入.

1 算法实现 1.1 DNN简介

DNN的正向传播主要依靠众多神经元的计算来完成, 其结构如图 1所示,工作过程可以用式(1), 式(2)来表示:

图 1 DNN结构 Fig.1 Structure of DNN
(1)
(2)

其中:xi表示第i个输入; wki表示与第i输入量相连的权值; uk表示所有输入的加权和; bk为神经元阈值; f(·)为激活函数; yk为神经网络的输出.

激活函数的种类有很多, 如sigmoid, tanh及ReLU.本文应用的是ReLU激活函数, 如式(5)所示.

(3)
(4)
(5)

式(6)为ReLU激活函数的导函数, 可以发现输入小于0的部分都会被置零, 这使得网络有较好的稀疏性.深度学习的目的就是从众多复杂、密集的特征中提取‘关键因子’, 所以要解开这些缠绕的复杂关系就要求网络有良好的稀疏特性, 而且还能有效避免梯度消失和梯度爆炸.

(6)

网络的输出层使用softmax函数作分类器, 式(7)为第i个神经的输出.

(7)

其中:i为所求神经元编号; j为输出层神经元数.

DNN的反向传播过程即为网络的误差反向传播及自我修正的过程, 式(8)为均方差误差函数, 式(9)为交叉熵误差函数:

(8)
(9)

其中: O为期望输出; Y为实际输出.

式(10)~式(12)比较了sigmoid为传递函数时, 交叉熵损失函数和均方差损失函数的反向传播效果, 可以发现交叉熵作为损失函数时, 网络修正更迅速.

(10)
(11)
(12)

为了避免过拟合情况出现, 反向修正过程中应用L2正则化提高网络的泛化能力, 式(13)~式(17)所示对误差函数进行修正.

(13)
(14)
(15)
(16)
(17)

其中:E0为原误差函数; E为修正后误差函数; η为神经网络的学习率;λ为正则系数; n训练样本量; w为权值向量; b为神经元阈值向量.

1.2 PSO算法

粒子群优化(particle swarm optimization, PSO)算法被广泛地应用在生活中的各个领域.其基本原理可以描述为:p维空间中, 存在着一个种群规模为n的粒子集.种群规模为粒子的个数, 即鸟群中鸟的个数.其中第i个粒子的速度和位置可以用vi=(vi1, vi2, …, vip)和xi=(xi1, xi2, …, xip)来表示, 每个粒子都存在一个适应度f, 适应度的大小相当于每个鸟与食物之间的距离, 根据粒子的适应度可以对群体的个体极值Pb和群体极值Gb进行更新, 之后可以利用个体极值和种群极值对粒子的速度和位置进行计算, 计算公式为

(18)
(19)

其中:i表示第i个粒子; j表示第j维空间; c1, c2为学习因子, c1为粒子的自身部分, 表示自身对寻优的认识和影响, c2为社会部分, 表示粒子受种群影响; t为迭代次数; ε1, ε2为均匀分布在0~1之间的随机数; wg为惯性权重, 表示受上次速度的影响.

1.3 PCA算法

主成分分析(principal component analysis, PCA)是一种常用的数据算法.当数据维度较高时, 用其降低数据维度以便进行数据分析, 常用于图片压缩、因子分析等.本文应用PCA处理DNN网络的输出, 更直观地反映出DNN的诊断效果.

应用映射矩阵Vn维特征向量x映射到k(kn)维空间内,如式(20)所示.映射矩阵V的求解见式(21), 式(22), 先求解矩阵Ψ, 再求解Ψ的协方差矩阵C, 最后求解协方差矩阵C的特征向量和特征值, 之后由前k个较大特征值对应的特征向量组成的矩阵即为映射矩阵V.

(20)
(21)
(22)

其中: x为特征向量;Y为降维矩阵;s为样本数; Ψ为特征矩阵中元素每列平均值后的新矩阵;CΨ的协方差矩阵.

2 实验设计及数据采集

实验齿轮箱如图 2所示, 由两个额定功率45 kW的西门子电机驱动, 电机1为驱动电机, 电机2为受载电机, 并配有润滑和冷却系统, 三向振动传感器安装在从动轮轴承座上, 可采集X, Y, Z三个方向的振动数据, 采样频率为10 240 Hz.齿轮相关参数见表 1.

图 2 齿轮箱实验台 Fig.2 Gearbox test rig
表 1 齿轮相关参数 Table 1 Gear parameters

图 3为6种不同程度齿轮点蚀故障, C1为一对健康齿轮组(没在图中显示); C2为从动轮的齿1齿面10 %点蚀; C3为从动轮的齿1齿面30 %点蚀; C4为从动轮的齿1齿面50 %点蚀; C5为从动轮的齿1齿面50 %点蚀+齿72齿面10 %点蚀; C6为从动轮的齿1齿面50 %点蚀+齿72齿面10 %点蚀+齿2齿面10 %点蚀; C7为从动轮的齿1齿面50 %点蚀+齿72齿面30 %点蚀+齿2齿面10 %点蚀.故障是用钻头在从动轮齿上人为制造的, 为了模拟齿轮早期点蚀情况, 人为制造的故障较小,且制造故障时仅拆除齿轮箱防护罩不对齿轮进行拆装, 这样可以避免发生装备误差.

图 3 6种齿轮点蚀故障 Fig.3 Six gear pitting faults (a)—C2;(b)—C3;(c)—C4;(d)—C5;(e)—C6;(f)—C7.

实验包含了7种不同类型的齿轮振动数据采集, 运行工况为转速100 r/min,转矩50 N·m, 采集了稳定运行后12 s内的振动数据, 每组齿轮进[CM(20]行5次实验.图 4为传感器采集的7组齿轮3个方向的振动信号, 不同齿轮类型的振动波形有明显的区别.对比图 4a, 4b, 4c可以发现X, Y轴方向的振动幅值相仿, Z轴的振动信号幅值最大.

图 4 齿轮箱3个方向振动信号 Fig.4 3-D vibration signals of the gearbox (a)—X轴; (b)—Y轴; (c)—Z轴.
3 DNN训练与测试

通过上一节可知Z轴的振动信号幅值最大, 所以用其训练DNN的效果会更好.7种齿轮类型, 每种进行5次数据采集, 共35组信号.其中驱动齿轮转速100 r/min, 则从动齿轮转速为55.6 r/min, 大约1 r/s.所以从动齿轮旋转一周传感器采集的数据点大概为10 240个.之后将每组信号进行分段, 为确保每段数据中都包含故障信息, 每段的数据点个数稍大于10 240, 本文选择截取后的每段包含11 000个数据点, 所以现有样本量为11 000×770.

3.1 DNN训练

每种齿轮类型分别进行了5次数据采集, 应用前4次采集的数据训练, 第5次采集数据测试.训练输入样本为11 000×616, 测试输入样本为11 000×154.DNN网络输入层神经元11 000个, 输出层神经元7个, 包含3个隐含层.DNN根据1.1节介绍的不断地迭代寻找最优网络参数.

图 5为有无PSO优化的DNN训练曲线, 观察图 5a中的局部放大图可知, 没有PSO优化的网络起始误差略小于6, 之后有一个将近20的误差波峰, 接着误差下降至2左右开始较平稳地下降.观察有PSO优化的DNN训练误差图 5b, 误差曲线就是从2开始下降的, 并没有像图 5a中开始出现较大的误差波动, 而且应用PSO优化的DNN训练所用步数明显较少.

图 5 网络训练误差曲线 Fig.5 Network training error curve (a)—DNN训练; (b)—PSO优化DNN训练.
3.2 DNN测试及结果讨论

训练好的DNN网络要用测试数据来测试其诊断效果.输出层应用了softmax分类器, 7个神经元对应7种齿轮状况, 所以根据输出向量判定齿轮状况方式为输出值最大的神经元对应的齿轮状况即为当前齿轮的状况, 表 2所示为7种故障类型测试准确率, 图 6为有无PSO优化的不同齿轮类型的误诊率.

表 2 7种齿轮故障诊断准确率 Table 2 Test accuracy of 7 gear faults
图 6 不同方法诊断7种齿轮类型误诊率 Fig.6 Misdiagnosis rate of different methods (a)—DNN; (b)—PSO优化DNN.

图 6中可以看出,误诊一般都发生在相近齿轮类型之间, 如图 6a中DNN诊断网络将部分C2误诊成C1和C3.结合表 2所示的齿轮类型的说明, 可以发现C2~C6六种齿轮的点蚀程度逐渐增加, 实验设定的点蚀程度较小而且相邻齿轮类型的故障情况十分相似, 所以就会出现相邻齿轮类型误诊的情况.总体来说, 要分辨的齿轮类型越相近、故障程度越小, 发生误诊的可能性就越大, 对比图 6a, 图 6b可以发现经过PSO优化DNN误诊的情况已经明显改善.

输出层采用softmax分类器, 输出值在0~1之间, 判定齿轮状况采用的是输出值最大神经元对应的故障类型.所以当输出值为0.5或0.99时齿轮类型判定结果相同, 但两种结果对应的网络判别效果有明显差别.为了更好地判断网络的诊断效果, 应用主成分分析法对输出矩阵进行降维, 提取前3个主成分绘制3维图, 如图 7所示.图中包含7种图案对应7种齿轮类型, 每种图案有22个点, 共154个点对应154组测试数据.相同图案的点越集中, 不同图案的点越分散表明网络判别效果越好, 还可以根据点的混杂情况判断不同齿轮类型间的误判情况.

图 7 主成分分析处理输出矩阵的结果 Fig.7 Results of PCA process output vectors (a)—DNN; (b)—PSO优化DNN.

对比图 7a图 7b可以发现, 有PSO优化的DNN网络诊断效果明显要好.图 7a中C2, C4, C5和C6混杂在一起, 之间肯定存在误判情况.而图 7b中仅C6的部分混杂在C5中, 误判率较低.

仅仅一次训练和测试并不能完全体现DNN网络的诊断效果, 图 8所示为三种方法连续训练20次的准确率曲线.其中PSO优化后的DNN网络诊断效果最好, 其次是DNN方法, 最差的是FFT-ANN方法.

图 8 20次训练的诊断准确率曲线 Fig.8 Diagnostic accuracy curves of 20 times′ training

全部样本要分成两部分, 一部分用于DNN训练, 剩余的用于测试, 训练和测试占总样本比例对诊断效果也有影响.图 9为训练数据占总样本量比例对DNN诊断准确率的影响, 可以发现,随着训练样本的增加, DNN的诊断准确率也随之增加, 其中有PSO优化的DNN网络效果明显要好.

图 9 训练样本量对诊断准确率的影响 Fig.9 Effect of training sample size on the diagnostic accuracy
4 结论

本文去掉特征提取环节, 直接应用实验采集的振动信号和DNN来诊断早期齿轮点蚀故障, 并应用PSO算法对DNN进行优化.结果表明:PSO优化DNN不仅能增加训练稳定性而且能提高诊断效果, 故障诊断率达到90 %之上.PSO-DNN的诊断效果和诊断稳定性要好于DNN, 传统的ANN诊断效果最差且多次诊断结果波动较大.训练样本占总样本比例越大, 训练后的网络诊断效果越好.

参考文献
[1]
李耀华, 王星州. 直升机齿轮箱故障诊断方法[J]. 机械科学与技术, 2018, 44(3): 192–197.
( Li Yao-hua, Wang Xing-zhou. A method for the fault diagnosis of helicopter gearbox[J]. Mechanical Science and Technology for Aerospace Engineering, 2018, 44(3): 192–197. )
[2]
Vernekar K, Kumar H, Gangadharan K V. Gear fault detection using vibration analysis and continuous wavelet transform[J]. Procedia Materials Science, 2014, 5(2): 1846–1852.
[3]
Liu Y B, Yan K G, Zhou Y B, et al.Bispectral analysis for diagnosis of gear pitting fault[C]// World Congress on Intelligent Control and Automation.New York: IEEE, 2008: 6847-6851.
[4]
Elasha F, Mba D, Ruizcarcel C. Pitting detection in worm gearboxes with vibration analysis[J]. Engineering Failure Analysis, 2014, 42: 366–376. DOI:10.1016/j.engfailanal.2014.04.028
[5]
陈伟, 王友仁, 孙灿飞, 等. 行星齿轮箱耦合调制振动信号分离与故障诊断[J]. 航空动力学报, 2018, 33(5): 1112–1120.
( Chen Wei, Wang You-ren, Sun Can-fei, et al. Coupled modulated vibration signal component separation and fault diagnosis of planetary gearbox[J]. Journal of Aerospace Power, 2018, 33(5): 1112–1120. )
[6]
Samanta B, Al-Balushi K R, Al-Araimi S A. Artificial neural networks and support vector machines with genetic algorithm for bearing fault detection[J]. Engineering Applications of Artificial Intelligence, 2003, 16(7/8): 657–665.
[7]
Dhamande L S, Chaudhari M B. Detection of combined gear-bearing fault in single stage spur gear box using artificial neural network[J]. Procedia Engineering, 2016, 144: 759–766. DOI:10.1016/j.proeng.2016.05.082
[8]
Cheng G, Cheng Y L, Shen L H, et al. Gear fault identification based on Hilbert-Huang transform and SOM neural network[J]. Measurement, 2013, 46(3): 1137–1146. DOI:10.1016/j.measurement.2012.10.026
[9]
卫晓娟, 丁旺才, 李宁洲, 等. 基于引力搜索RBF神经网络的机车齿轮箱故障诊断[J]. 铁道学报, 2016, 38(2): 19–26.
( Wei Xiao-juan, Ding Wang-cai, Li Ning-zhou, et al. Faulty diagnosis of locomotive gearbox based on gravitational search RBF neural network[J]. Journal of the China Railway Society, 2016, 38(2): 19–26. DOI:10.3969/j.issn.1001-8360.2016.02.003 )
[10]
Wu J D, Chan J J. Faulted gear identification of a rotating machinery based on wavelet transform and artificial neural network[J]. Expert Systems with Applications, 2009, 36(5): 8862–8875. DOI:10.1016/j.eswa.2008.11.020