东北大学学报:自然科学版   2015, Vol. 36 Issue (9): 1321-1326   PDF (512 KB)    
基于优化SVR模型的大跨度样本疲劳寿命预测
杨大炼1, 刘义伦1,2, 周 维1, 羿九火1     
(1.中南大学 机电工程学院, 湖南 长沙 410083; 2.中南大学 轻合金研究院, 湖南 长沙 410083)
摘要针对传统方法在大跨度、小样本情况下的疲劳寿命预测准确率不高的问题,研究基于优化SVR模型的寿命预测方法.根据大跨度样本的特点,提出有效的预处理方法、SVR模型的训练方法及参数优化准则.以LY12CZ(2A12)铝合金疲劳寿命预测为实例,分析了高斯核函数、多项式核函数及多层感知核函数对SVR模型训练误差的影响.结果表明高斯核函数更适用于SVR模型的训练,并通过细菌觅食算法对核参数γ及惩罚因子C进行优化选取,LY12CZ(2A12)铝合金疲劳寿命预测结果验证了该方法的有效性.
关键词大跨度;     支持向量回归;     疲劳;     寿命预测;     铝合金    
Fatigue Life Prediction of Large-Span Samples Based on the Optimized SVR Model
YANG Da-lian1, LIU Yi-lun1,2, ZHOU Wei1, YI Jiu-huo1     
(1.School of Mechanical and Electrical Engineering, Central South University, Changsha 410083, China; 2. Light Alloy Research Institute, Central South University, Changsha 410083, China. Corresponding author: LIU Yi-lun, E-mail: ylliu@csu.edu.cn)
Abstract:Aiming at the issue that the prediction accuracy of fatigue life is not high by the traditional methods with large-span and small samples, a new life prediction method based on the optimized SVR model was studied. Considering the traits of large-span samples, the effective sample pretreatment method, the training method for the SVR model and the criterion for parameter optimization were put forward. Taking the life prediction of LY12CZ (2A12) aluminum alloy for example, the effects of the kernel functions of Gauss, polynomial and multilayer perception on the training error of the SVR model were analyzed. The results showed that the Gaussian kernel function is more suitable for SVR model training and the kernel function parameter γ and the penalty factor C can be optimized by the bacterial foraging algorithm. Thus, the life prediction results verify the validity of this method.
Key words: large-span;     support vector regression (SVR);     fatigue;     life prediction;     aluminum alloy    

疲劳寿命预测是疲劳研究的关键内容之一.传统的疲劳寿命预测方法主要包括线性疲劳累积损伤理论、修正的线性疲劳累积损伤理论、名义应力法、局部应力-应变法,这些方法是建立在确定性理论或者概率统计的基础之上[1],需要大量而准确的样本数据,从而增加了试验的成本,限制了其应用范围.近年来,人工智能方法被逐渐应用到寿命预测中,如神经网络[2,3]、灰色理论[4,5],但神经网络预测一方面需要大量的样本,另一方面,算法容易陷入局部极小值;灰色理论虽然适合在小样本下工作,但对样本分布较为苛刻,且误差随预测步数累计,导致预测能力有限.支持向量机(support vector machine,SVM)是20世纪90年代发展起来的一种适合小样本数据下的机器学习方法[6],该方法以结构风险最小化为原则,以核函数为工作核心,对样本的适应性强,能够避免预测过程中的“欠学习”和“过学习”问题.Vapnik等[7]首先将支持向量机用于回归预测,提出了ε-SVM回归模型;Pham等[8]利用支持向量回归模型对机器性能退化评估和剩余使用寿命进行了预测,结果表明该方法可以作为一种可靠的预测工具;邹心遥等[9]将LSSVM应用于现代高可靠集成电路寿命预测,获得了较好的预测精度,但其样本数据分布跨度小.当样本的跨度较大(100~107),样本的离散程度较高时,如果样本的数量过少,样本所携带的有关总体的信息过少,难以有效还原总体的全部信息,因此,利用支持向量回归模型进行预测时,预测误差较大,目前,针对大跨度样本的预测还比较少.

本文以航空铝合金LY12CZ为试验对象,将支持向量回归模型应用到LY12CZ铝合金的疲劳寿命预测中,针对铝合金疲劳数据样本大跨度的特点,研究大跨度样本条件下的支持向量回归预测方法,提高其寿命预测的精度.

1 支持向量回归模型(SVR)

对于给定的训练样本集

,高维空间中的线性回归问题是寻找函数:

其中: w 为权值向量;b为偏置量;φ(x)为映射关系.根据结构风险最小化原理,该回归问题可以表示为如下凸二次优化问题[10,11]

式中,ξi为松弛因子,C为正则化参数.引入因子αi,由式(2)构造Lagrange函数:

根据KKT最优化条件,分别令,并化简可得如下线性方程组:

其中: I.

通过求解式(4),得到最优解α*b*,则所求的回归模型可以表示为

在实际应用过程中,由于从低维到高维的映射关系φ是未知的,无法获得具体的显示表达式,通过引入核函数K(xi,xj)=(xi)·(xj),可以在不知道具体φ的情况下,完成数据从低维向高维的映射,巧妙地避免了直接使用φ带来的不便.主要的核函数有:线性核函数、多项式核函数、径向基核函数、多层感知核函数、组合核函数等.故式(5)可写为

2 大跨度样本SVR预测方法 2.1 样本预处理

假设样本集:

为大跨度原始样本,则先令:

可得到新的样本集:

再对S′作归一化处理,得

则预处理后的样本集为

.

2.2 SVR训练与优化准则

SVR是基于结构风险最小化原理的,它是在经验风险最小化的同时满足置信区间的最小化.但事实上,这是在一定的惩罚因子C、核函数类型及核参数下的结构最小化,核函数是SVR的核心,不同的惩罚因子C、核函数类型及核参数直接影响到SVR模型的泛化能力.

假设有训练样本集:

.

随机选取其中一部分作为训练样本S1 ,训练结果为Y″1,将S″作为测试样本,令测试结果为Y″,则误差为

因此,以径向基核函数为例,SVR训练与参数优化的准则就是寻找优化的参数{C**},使得

3 实例分析 3.1 试验数据

试验数据来源于文献[12],试验材料为LY12CZ(2A12)铝合金,根据文献提供的S-N曲线(Kt=2),得到疲劳样本如表1所示.根据2.1节中式(7)~式(9),对表1中的疲劳试验样本数据进行预处理,得训练样本如表2所示.同时,为了检验SVR模型的有效性,选取一定数量的疲劳样本作为预测样本,如表3所示,并通过与表2相同的预处理方式,得到预测样本如表4所示.

表1 LY12CZ铝合金疲劳寿命数据 Table 1 Fatigue life data of LY12CZ aluminum alloy

表2 SVR训练样本 Table 2 Training samples for the SVR model

表3 LY12CZ铝合金寿命预测样本 Table 3 Predicting samples of LY12CZ aluminum alloy

表4 SVR预测样本 Table 4 Predicting samples for the SVR model
3.2 SVR模型参数的优化选取

根据3.1节提供的样本,从表1中选取 样本序号1,2,3,5,6,7组成训练样本,所有样本作为测试样本.图1~图3分别显示了不同核函数及其参数对SVR模型训练误差的影响.

图1 径向基核参数γ及惩罚因子C对训练误差的影响 Fig.1 Effect of radial basis kernel parameter γ and penalty factor C on the training error (a)—最大训练误差; (b)—平均训练误差; (c)—最小训练误差.

从图1~图3可以看出,不同的核函数对SVR模型训练误差的影响程度不一样,同时,核参数及惩罚因子对训练误差的影响很大.

1) 从图1a,图1b可以看出,对于径向基核函数来说,SVR模型对核参数γ表现得比惩罚因子C更为敏感.当γ较小时,C的大小对SVR模型训练的误差敏感性小;当γ取较大值时,小的C对SVR模型训练最大误差率有一定的敏感性,但随着C的增大,这种敏感程度越来越小.从图1c也可以看出,较大γ和较大C不利于模型训练的最小误差率.

2) 从图2a,图2b可以看出对于多项式核函数来说,其参数d对模型训练误差率敏感性较大,过小或者过大的d值都增大了最大误差率和平均误差率;较大的C可以降低SVR模型的训练误差率,但随着C的增大,其敏感性降低;而从图2c可以看出,大的C反而不利于模型的训练,但这种影响较小.

图2 多项式核参数d及惩罚因子C对训练误差的影响 Fig.2 Effect of polynomial kernel parameter d and penalty factor C on the training error (a)—最大训练误差; (b)—平均训练误差; (c)—最小训练误差.

图3 多层感知核参数β及惩罚因子C对训练误差的影响 Fig.3 Effect of multilayer perception kernel parameter β and penalty factor C on the training error (a)—最大训练误差; (b)—平均训练误差; (c)—最小训练误差.

3) 从图3a~图3c可以看出,如果选用多层感知核函数,其参数βC的影响表现为:当C<106时,SVR的训练误差率不受βC的大小的影响;当C>106时,小的β对误差率影响较大.

综合图1~图3可知,采用多项式核函数和多层感知核函数的训练误差率明显高于采用径向基核函数,这表明径向基核函数的泛化能力优于其他两种核函数.但由于最优参数难以选取,若采用人为指定,训练得到的SVR模型的泛化能力差,有效性难以保证,因此,本文选用径向基核函数,并根据式(11)采用细菌觅食算法对惩罚因子C及核参数γ进行优化选取[13,14],得到优化的参数为γ =0.91,C=108.7266.

3.3 LY12CZ铝合金寿命预测

基于3.1节的训练样本以及3.2节中的优化参数训练SVR回归模型,得到式(6)中的参数:

图4为LY12CZ铝合金寿命SVR回归图,从图上可以看出,SVR回归曲线跟真实寿命曲线几乎重合.利用训练好的SVR模型,对表4中的预测样本进行预测,并将预测数据换算成对应的LY12CZ铝合金的寿命数据.同时,为了更好地说明问题,还采用传统SVR模型进行对比,即将表1中的训练样本及表3中的预测样本未进行预处理,并将所有的样本作为训练样本及测试样本.表5为两种方法训练的SVR模型对训练样本的测试结果,表6为两种方法训练的SVR模型对预测样本的预测结果.

图4 LY12CZ铝合金寿命预测曲线 Fig.4 Life prediction curves of LY12CZ Al alloy

从表5及表6可以看出,与传统的样本处理方法和模型训练方法相比,本文提出的方法虽然稍微降低了对训练样本的测试精度(平均相对误差从0.001 033 8 % 上升到0.38686 % ),但大大提高了SVR模型对未知样本的预测精度(平均相对误差从52.728 % 降低到1.2082 % ),原因在于传统的方法出现了“过学习”,而导致预测模型的泛化能力下降,因此,本文提出的方法以微小的训练误差损失率为代价, 在相同样本的情况下,提高了SVR模型的泛化能力.同时表明,SVR模型的泛化能力不仅 跟核函数及其参数有很大的关系,同时样本的有 效性及训练方式对模型的预测能力也有很大的影响.

表5 LY12CZ铝合金SVR模型训练结果 Table 5 Training results of the SVR model of LY12CZ aluminum alloy
表6 LY12CZ铝合金SVR模型寿命预测结果 Table 6 Life prediction results of the SVR model of LY12CZ aluminum alloy
4 结论

1) 通过对比分析三种核函数及其参数对SVR模型训练误差的影响,可知高斯核函数比多项式核函数及多层感知核函数更适合用于SVR寿命预测模型的训练;

2) 通过对比分析两种预处理方式下的训练样本的训练结果,验证了本文提出的大跨度样本预处理方法的有效性;

3) 通过对比分析两种训练方式下的SVR模型的预测结果,验证了本文提出的训练方式能够提高SVR模型的泛化能力,能够更准确地对LY12CZ铝合金进行寿命预测.

参考文献
[1] 孙玉兰,王茂廷.基于灰色模型GM(1,1)的疲劳寿命预测[J].科学技术与工程, 2011,11(3):560-562.(Sun Yu-lan,Wang Mao-ting.Prediction for fatigue life based on grey model GM (1,1) [J].Science Technology and Engineering,2011,11(3):560-562.) (1)
[2] Silva A,Dias J L,Gaspar P L,et al.Statistical models applied to service life prediction of rendered facades [J].Automation in Construction, 2013,30(1):151-160 (1)
[3] Xiang K L,Xiang P Y,Wu Y P.Prediction of the fatigue life of natural rubber composites by artificial neural network approaches [J].Materials & Design,2014,57(1):180-185 (1)
[4] Ni C C.Prediction of fatigue crack growth of 2024-t351 by grey GM (1,1) model with rolling check [J].Advanced Materials Research,2013,690(1):1779-1783 (1)
[5] 崔建国,巩俊杰,董世良,等.基于灰色理论的飞机结构疲劳寿命预测[J].沈阳航空航天大学学报,2011,28(1):23-27.(Cui Jian-guo,Gong Jun-jie,Dong Shi-liang,et al.Fatigue life prediction of aeroplane structures based on grey theory [J].Journal of Shenyang Aerospace University,2011,28(1):23-27.) (1)
[6] Vapnik V N.The nature of statistical learning theory [M].Berlin:Springer-Verlag,1995:1-50. (1)
[7] Vapnik V,Golowich S E,Smola A.Support vector method for function approximation,regression estimation,and signal processing [J].Advances in Neural Information Processing Systems,1997,1(1):281-287 (1)
[8] Pham H T,Yang B S,Nguyen T T.Machine performance degradation assessment and remaining useful life prediction using proportional hazard model and support vector machine [J].Mechanical Systems and Signal Processing,2012,32(11):320-330 (1)
[9] 邹心遥,姚若河.LSSVM在指数寿命型小子样IC寿命预测的应用[J].科学技术与工程,2011,11(24):5946- 5949.(Zou Xin-yao,Yao Ruo-he.Application of LSSVM on lifetime prediction of IC with small sample from exponential distribution [J].Science Technology and Engineering,2011,11(24):5946-5949.) (1)
[10] Mahdevari S,Shahriar K,Yagiz S,et al.A support vector regression model for predicting tunnel boring machine penetration rates [J].International Journal of Rock Mechanics and Mining Sciences,2014,72(12):214-229 (1)
[11] Bagheripour P,Gholami A,Asoodeh M,et al.Support vector regression based determination of shear wave velocity [J].Journal of Petroleum Science and Engineering,2015,125(1):95-99 (1)
[12] 殷之平.结构疲劳与断裂[M].西安:西北工业大学出版社,2012:35-36.(Yin Zhi-ping.Structural fatigue and fracture [M].Xi’an:Northwestern Polytechnical University Press,2012:35-36.) (1)
[13] 杨大炼,李学军,蒋玲莉.一种细菌觅食算法的改进及其应用[J].计算机工程与应用,2012,48(13):31-34.(Yang Da-lian,Li Xue-jun,Jiang Ling-li.Improved algorithm of bacterium foraging and its application [J].Computer Engineering and Applications,2012,48(13):31-34.) (1)
[14] Yang D L,Li X J,Wang K,et al.Support vector machine optimization based on bacterial foraging algorithm and applied in fault diagnosis [J].Advanced Materials Research,2011,216(1):153-157. (1)