疲劳寿命预测是疲劳研究的关键内容之一.传统的疲劳寿命预测方法主要包括线性疲劳累积损伤理论、修正的线性疲劳累积损伤理论、名义应力法、局部应力-应变法,这些方法是建立在确定性理论或者概率统计的基础之上[1],需要大量而准确的样本数据,从而增加了试验的成本,限制了其应用范围.近年来,人工智能方法被逐渐应用到寿命预测中,如神经网络[2,3]、灰色理论[4,5],但神经网络预测一方面需要大量的样本,另一方面,算法容易陷入局部极小值;灰色理论虽然适合在小样本下工作,但对样本分布较为苛刻,且误差随预测步数累计,导致预测能力有限.支持向量机(support vector machine,SVM)是20世纪90年代发展起来的一种适合小样本数据下的机器学习方法[6],该方法以结构风险最小化为原则,以核函数为工作核心,对样本的适应性强,能够避免预测过程中的“欠学习”和“过学习”问题.Vapnik等[7]首先将支持向量机用于回归预测,提出了ε-SVM回归模型;Pham等[8]利用支持向量回归模型对机器性能退化评估和剩余使用寿命进行了预测,结果表明该方法可以作为一种可靠的预测工具;邹心遥等[9]将LSSVM应用于现代高可靠集成电路寿命预测,获得了较好的预测精度,但其样本数据分布跨度小.当样本的跨度较大(100~107),样本的离散程度较高时,如果样本的数量过少,样本所携带的有关总体的信息过少,难以有效还原总体的全部信息,因此,利用支持向量回归模型进行预测时,预测误差较大,目前,针对大跨度样本的预测还比较少.
本文以航空铝合金LY12CZ为试验对象,将支持向量回归模型应用到LY12CZ铝合金的疲劳寿命预测中,针对铝合金疲劳数据样本大跨度的特点,研究大跨度样本条件下的支持向量回归预测方法,提高其寿命预测的精度.
1 支持向量回归模型(SVR)对于给定的训练样本集
,高维空间中的线性回归问题是寻找函数:
其中: w 为权值向量;b为偏置量;φ(x)为映射关系.根据结构风险最小化原理,该回归问题可以表示为如下凸二次优化问题[10,11]: 式中,ξi为松弛因子,C为正则化参数.引入因子αi,由式(2)构造Lagrange函数:根据KKT最优化条件,分别令,并化简可得如下线性方程组:
其中: I.通过求解式(4),得到最优解α*及b*,则所求的回归模型可以表示为
在实际应用过程中,由于从低维到高维的映射关系φ是未知的,无法获得具体的显示表达式,通过引入核函数K(xi,xj)=(xi)·(xj),可以在不知道具体φ的情况下,完成数据从低维向高维的映射,巧妙地避免了直接使用φ带来的不便.主要的核函数有:线性核函数、多项式核函数、径向基核函数、多层感知核函数、组合核函数等.故式(5)可写为
2 大跨度样本SVR预测方法 2.1 样本预处理假设样本集:
为大跨度原始样本,则先令:
可得到新的样本集:
再对S′作归一化处理,得
则预处理后的样本集为.
2.2 SVR训练与优化准则SVR是基于结构风险最小化原理的,它是在经验风险最小化的同时满足置信区间的最小化.但事实上,这是在一定的惩罚因子C、核函数类型及核参数下的结构最小化,核函数是SVR的核心,不同的惩罚因子C、核函数类型及核参数直接影响到SVR模型的泛化能力.
假设有训练样本集:
.
随机选取其中一部分作为训练样本S″1 ,训练结果为Y″1,将S″作为测试样本,令测试结果为Y″,则误差为
因此,以径向基核函数为例,SVR训练与参数优化的准则就是寻找优化的参数{C*,γ*},使得
3 实例分析 3.1 试验数据试验数据来源于文献[12],试验材料为LY12CZ(2A12)铝合金,根据文献提供的S-N曲线(Kt=2),得到疲劳样本如表1所示.根据2.1节中式(7)~式(9),对表1中的疲劳试验样本数据进行预处理,得训练样本如表2所示.同时,为了检验SVR模型的有效性,选取一定数量的疲劳样本作为预测样本,如表3所示,并通过与表2相同的预处理方式,得到预测样本如表4所示.
根据3.1节提供的样本,从表1中选取 样本序号1,2,3,5,6,7组成训练样本,所有样本作为测试样本.图1~图3分别显示了不同核函数及其参数对SVR模型训练误差的影响.
(a)—最大训练误差; (b)—平均训练误差; (c)—最小训练误差. |
从图1~图3可以看出,不同的核函数对SVR模型训练误差的影响程度不一样,同时,核参数及惩罚因子对训练误差的影响很大.
1) 从图1a,图1b可以看出,对于径向基核函数来说,SVR模型对核参数γ表现得比惩罚因子C更为敏感.当γ较小时,C的大小对SVR模型训练的误差敏感性小;当γ取较大值时,小的C对SVR模型训练最大误差率有一定的敏感性,但随着C的增大,这种敏感程度越来越小.从图1c也可以看出,较大γ和较大C不利于模型训练的最小误差率.
2) 从图2a,图2b可以看出对于多项式核函数来说,其参数d对模型训练误差率敏感性较大,过小或者过大的d值都增大了最大误差率和平均误差率;较大的C可以降低SVR模型的训练误差率,但随着C的增大,其敏感性降低;而从图2c可以看出,大的C反而不利于模型的训练,但这种影响较小.
(a)—最大训练误差; (b)—平均训练误差; (c)—最小训练误差. |
(a)—最大训练误差; (b)—平均训练误差; (c)—最小训练误差. |
3) 从图3a~图3c可以看出,如果选用多层感知核函数,其参数β和C的影响表现为:当C<106时,SVR的训练误差率不受β和C的大小的影响;当C>106时,小的β对误差率影响较大.
综合图1~图3可知,采用多项式核函数和多层感知核函数的训练误差率明显高于采用径向基核函数,这表明径向基核函数的泛化能力优于其他两种核函数.但由于最优参数难以选取,若采用人为指定,训练得到的SVR模型的泛化能力差,有效性难以保证,因此,本文选用径向基核函数,并根据式(11)采用细菌觅食算法对惩罚因子C及核参数γ进行优化选取[13,14],得到优化的参数为γ =0.91,C=108.7266.
3.3 LY12CZ铝合金寿命预测基于3.1节的训练样本以及3.2节中的优化参数训练SVR回归模型,得到式(6)中的参数:
图4为LY12CZ铝合金寿命SVR回归图,从图上可以看出,SVR回归曲线跟真实寿命曲线几乎重合.利用训练好的SVR模型,对表4中的预测样本进行预测,并将预测数据换算成对应的LY12CZ铝合金的寿命数据.同时,为了更好地说明问题,还采用传统SVR模型进行对比,即将表1中的训练样本及表3中的预测样本未进行预处理,并将所有的样本作为训练样本及测试样本.表5为两种方法训练的SVR模型对训练样本的测试结果,表6为两种方法训练的SVR模型对预测样本的预测结果.
从表5及表6可以看出,与传统的样本处理方法和模型训练方法相比,本文提出的方法虽然稍微降低了对训练样本的测试精度(平均相对误差从0.001 033 8 % 上升到0.38686 % ),但大大提高了SVR模型对未知样本的预测精度(平均相对误差从52.728 % 降低到1.2082 % ),原因在于传统的方法出现了“过学习”,而导致预测模型的泛化能力下降,因此,本文提出的方法以微小的训练误差损失率为代价, 在相同样本的情况下,提高了SVR模型的泛化能力.同时表明,SVR模型的泛化能力不仅 跟核函数及其参数有很大的关系,同时样本的有 效性及训练方式对模型的预测能力也有很大的影响.
1) 通过对比分析三种核函数及其参数对SVR模型训练误差的影响,可知高斯核函数比多项式核函数及多层感知核函数更适合用于SVR寿命预测模型的训练;
2) 通过对比分析两种预处理方式下的训练样本的训练结果,验证了本文提出的大跨度样本预处理方法的有效性;
3) 通过对比分析两种训练方式下的SVR模型的预测结果,验证了本文提出的训练方式能够提高SVR模型的泛化能力,能够更准确地对LY12CZ铝合金进行寿命预测.
[1] | 孙玉兰,王茂廷.基于灰色模型GM(1,1)的疲劳寿命预测[J].科学技术与工程, 2011,11(3):560-562.(Sun Yu-lan,Wang Mao-ting.Prediction for fatigue life based on grey model GM (1,1) [J].Science Technology and Engineering,2011,11(3):560-562.) (1) |
[2] | Silva A,Dias J L,Gaspar P L,et al.Statistical models applied to service life prediction of rendered facades [J].Automation in Construction, 2013,30(1):151-160 (1) |
[3] | Xiang K L,Xiang P Y,Wu Y P.Prediction of the fatigue life of natural rubber composites by artificial neural network approaches [J].Materials & Design,2014,57(1):180-185 (1) |
[4] | Ni C C.Prediction of fatigue crack growth of 2024-t351 by grey GM (1,1) model with rolling check [J].Advanced Materials Research,2013,690(1):1779-1783 (1) |
[5] | 崔建国,巩俊杰,董世良,等.基于灰色理论的飞机结构疲劳寿命预测[J].沈阳航空航天大学学报,2011,28(1):23-27.(Cui Jian-guo,Gong Jun-jie,Dong Shi-liang,et al.Fatigue life prediction of aeroplane structures based on grey theory [J].Journal of Shenyang Aerospace University,2011,28(1):23-27.) (1) |
[6] | Vapnik V N.The nature of statistical learning theory [M].Berlin:Springer-Verlag,1995:1-50. (1) |
[7] | Vapnik V,Golowich S E,Smola A.Support vector method for function approximation,regression estimation,and signal processing [J].Advances in Neural Information Processing Systems,1997,1(1):281-287 (1) |
[8] | Pham H T,Yang B S,Nguyen T T.Machine performance degradation assessment and remaining useful life prediction using proportional hazard model and support vector machine [J].Mechanical Systems and Signal Processing,2012,32(11):320-330 (1) |
[9] | 邹心遥,姚若河.LSSVM在指数寿命型小子样IC寿命预测的应用[J].科学技术与工程,2011,11(24):5946- 5949.(Zou Xin-yao,Yao Ruo-he.Application of LSSVM on lifetime prediction of IC with small sample from exponential distribution [J].Science Technology and Engineering,2011,11(24):5946-5949.) (1) |
[10] | Mahdevari S,Shahriar K,Yagiz S,et al.A support vector regression model for predicting tunnel boring machine penetration rates [J].International Journal of Rock Mechanics and Mining Sciences,2014,72(12):214-229 (1) |
[11] | Bagheripour P,Gholami A,Asoodeh M,et al.Support vector regression based determination of shear wave velocity [J].Journal of Petroleum Science and Engineering,2015,125(1):95-99 (1) |
[12] | 殷之平.结构疲劳与断裂[M].西安:西北工业大学出版社,2012:35-36.(Yin Zhi-ping.Structural fatigue and fracture [M].Xi’an:Northwestern Polytechnical University Press,2012:35-36.) (1) |
[13] | 杨大炼,李学军,蒋玲莉.一种细菌觅食算法的改进及其应用[J].计算机工程与应用,2012,48(13):31-34.(Yang Da-lian,Li Xue-jun,Jiang Ling-li.Improved algorithm of bacterium foraging and its application [J].Computer Engineering and Applications,2012,48(13):31-34.) (1) |
[14] | Yang D L,Li X J,Wang K,et al.Support vector machine optimization based on bacterial foraging algorithm and applied in fault diagnosis [J].Advanced Materials Research,2011,216(1):153-157. (1) |