当前位置:首页 期刊杂志

旋转机械故障的拉普拉斯支持向量机诊断方法

时间:2024-07-28

郝腾飞 陈 果

南京航空航天大学,南京,211106

旋转机械故障的拉普拉斯支持向量机诊断方法

郝腾飞陈果

南京航空航天大学,南京,211106

摘要:在旋转机械故障智能诊断中,收集大量的样本比较容易,而要对所有的样本进行类别标记却较为困难。针对这一问题,提出了一种基于拉普拉斯支持向量机的旋转机械故障智能诊断方法。滚动轴承故障诊断实例表明,有标记样本的数量较少时,与仅使用有标记样本进行学习的支持向量机相比,基于拉普拉斯支持向量机的诊断方法利用大量的无标记样本进行辅助学习,可以显著提高故障诊断的正确率。

关键词:故障诊断;滚动轴承;支持向量机;半监督学习;流形学习

0引言

近年来,随着人工智能技术的发展,智能诊断成为旋转机械故障诊断研究的一个重要方向。旋转机械故障智能诊断在本质上是一个模式识别问题,支持向量机(supportvectormachines,SVM)作为一种推广性能优良的模式识别方法,目前已被广泛地应用于旋转机械故障智能诊断。文献[1]提出了一种基于SVM的航空发动机故障诊断方法。文献[2]研究了最小二乘SVM在滚动轴承故障诊断中的应用。文献[3]将集成学习方法AdaBoost和SVM相结合,利用多个单一SVM构造了SVM集成,并将其应用于滚动轴承故障诊断,获得了比单一SVM更高的故障诊断正确率。文献[4]与文献[5]对SVM在机械故障诊断中的应用进行了很好的综述。

以上研究充分展示了SVM在旋转机械故障智能诊断中的明显优势,然而SVM作为一种监督学习方法,要求所有的训练样本必须已知其类别标记。随着数据采集技术的发展,在旋转机械故障智能诊断中,收集大量的样本比较容易,而要对所有的样本进行类别标记却较为困难,因为对样本进行类别标记通常需要花费一定的人力和物力才能完成。以滚动轴承故障诊断为例,采用相应的传感器可以获得大量的滚动轴承样本,但对一个样本进行类别标记则需要该领域的专家采用一定的设备对样本进行认真分析以后才能完成。在旋转机械故障智能诊断中,如果仅使用少量的有标记样本,那么利用它们所训练出的诊断模型很难获得较高的诊断正确率;另一方面,如果仅使用少量“昂贵的”有标记样本而不利用大量“廉价的”无标记样本,则是对数据资源的极大浪费。因此,在旋转机械故障智能诊断中,当有标记样本的数量较少时,研究如何利用大量无标记的样本来辅助提高故障诊断的正确率是一个非常有意义的问题。

半监督学习[6-7]是一种可以同时利用有标记样本和无标记样本进行学习的方法,与仅利用有标记样本进行学习的监督学习方法相比,半监督学习方法可以利用无标记样本来辅助提高分类性能。流形学习[8]是近年来发展起来的一种新型降维方法,其可从髙维数据中恢复出数据内在的低维流形结构,从而实现维数约简,目前已有学者将其应用于机械故障特征提取[9-10]。拉普拉斯支持向量机[11-12](Laplaciansupportvectormachines,LapSVM)是一种将流形学习思想和支持向量机相结合的半监督分类方法,它将无标记样本的内在流形结构信息融入到分类器的设计中,在保持分类器光滑性的同时,亦保持数据的流形结构,从而可以有效地利用无标记样本来提高分类性能。

基于以上分析,本文提出了一种利用LapSVM进行旋转机械故障智能诊断的方法。首先,利用双螺旋仿真数据和双月形仿真数据直观地表明LapSVM的优势;然后,以滚动轴承故障诊断为例,研究了基于LapSVM的旋转机械故障诊断方法的优越性。

1拉普拉斯支持向量机

1.1基本原理

LapSVM是流形正则化[11]的一个具体实例,而流形正则化是在传统正则化算法框架的基础上提出的一个半监督学习框架。下面首先介绍正则化算法和流形正则化的框架,然后在此基础上介绍LapSVM的原理。

许多监督学习方法,例如支持向量机、正则化最小二乘等,均可解释为采用不同损失函数和正则化项的正则化算法。给定一组有标记的样本(xi, yi) (i=1,2,…,l)以及核函数K,则传统正则化算法的框架可以表示为

(1)

为利用生成数据的概率分布的几何结构来辅助有标记的样本进行学习,Belkin等[11]在传统正则化算法框架的基础上,通过引入一个额外的流形正则化项,提出了流形正则化。流形正则化是一个基于流形假设的半监督学习框架,其基本思想是,假设数据分布在外围空间的一个子流形上,然后利用大量无标记的数据估计出数据内在的流形结构,进而通过一个流形正则化项将数据的流形结构信息融入到分类器的设计之中,在保持分类器光滑性的同时,亦保持数据的流形结构。给定l个有标记的样本(xi, yi)和u个无标记的样本xj(j=l+1,l+2,…,l+u),则流形正则化的框架可以表示为

(2)

F=[f(x1)f(x2)…f(xl+u)]T

拉普拉斯支持向量机就是上述流形正则化的框架取特定损失函数时的一个具体例子。具体来说,在上述流形正则化的框架中,取损失函数为铰链损失函数,即令V(xi,yi,f)=(1-yif(xi))+=max(0,1-yif(xi)),yi∈{-1,1},则拉普拉斯支持向量机的学习问题可以表示为以下优化问题:

(3)

根据表示定理,上述优化问题的解可以表示为

(4)

(5)

其中,I为(l+u)×(l+u)的单位矩阵;L为(l+u)×(l+u)的拉普拉斯矩阵;K为(l+u)×(l+u)的核矩阵;J=[Il×l0]为l×(l+u)的矩阵;Il×l为l×l的单位矩阵;Y=diag(y1, y2, …, yl);β*可以通过求解以下二次规划问题得到:

(6)

0≤βi≤1/li=1, 2, …, l

1.2仿真实验

(a)SVM的分类面(b)LapSVM的分类面图1 SVM和LapSVM在双螺旋仿真数据上的分类面

(a)γI=0

(b)γI=0.0001

(c)γI=0.01图2 流形正则化参数γI对LapSVM的影响

为直观地展示LapSVM的优越性,本小节使用仿真数据研究LapSVM的特点。首先使用双螺旋仿真数据研究无标记的样本在LapSVM训练中的作用。双螺旋仿真数据如图1所示,图中的正方形和圆形表示两类样本,在每一类中随机选择一个样本赋予其类别标记(在图中用实心表示),剩下的样本作为无标记的样本(在图中用空心表示)。实验中,SVM仅使用两个有标记的样本进行训练,LapSVM同时使用两个有标记的样本和剩下的无标记样本进行训练。从图1a可以看出,有标记的样本太少,无法反映出数据的真实分布,在这种情况下,SVM训练得到的分类面对于两个有标记的样本来说虽然是最优的,但使用该分类面对原来的数据集进行分类将会造成很多的误分。从图1b可以看出,LapSVM的分类面将两类样本完美地划分开来,这是由于LapSVM在训练中不仅利用了有标记样本的类别信息,同时考虑了无标记样本的流形结构信息,因此最终得到了理想的分类面。该仿真实验直观地表明了LapSVM可以有效地利用无标记的样本来辅助提高分类性能。

接下来使用双月形仿真数据研究流形正则化参数γI对LapSVM的影响。双月形仿真数据如图2所示,图中符号的含义与双螺旋仿真数据相同。

使用图中仿真数据对LapSVM进行训练,图2所示为γI不同、其他参数保持不变的分类面。根据式(4)可知,γI=0时,LapSVM在训练中将忽略无标记样本的流形结构信息,此时LapSVM自动退化为普通的SVM,因此其分类面正好就是两个有标记样本连线的垂直平分线,如图2a所示。γI=0.0001时,LapSVM训练得到的分类面开始根据双月形数据的分布发生变化,但仍有部分样本发生误分,如图2b所示。γI=0.01时,LapSVM训练得到的分类面进一步根据双月形数据的分布发生变化,将两类样本正确地划分开来,如图2c所示。从该仿真实验可以直观地看出,流形正则化参数γI可用来衡量训练时考虑数据的流形结构信息的程度,该参数越大,构造分类面时将越多地考虑数据的流形结构信息。

2基于LapSVM的旋转机械故障诊断方法

上一节的仿真实验直观地表明,LapSVM可以有效地利用无标记的样本来辅助提高分类性能。基于此,本文提出了一种基于LapSVM的旋转机械故障智能诊断方法,其流程如图3所示。该诊断方法包括模型训练和故障诊断两个阶段。在模型训练阶段,首先使用相应的传感器采集能够反映诊断对象状态的振动信号;然后采用某种信号处理方法提取所采集信号的特征,由故障诊断专家选择一些样本进行认真分析后确定其类别标记,并将这些样本作为有标记样本,同时将其余的样本作为无标记样本;最后将有标记样本和无标记样本一起输入LapSVM进行训练得到诊断模型。在故障诊断阶段,首先采用和模型训练阶段相同的特征提取方法形成诊断向量,然后利用诊断模型进行故障诊断,最后根据诊断结果决定是继续监控还是进行相应维修。

图3 基于拉普拉斯支持向量机的旋转机械故障诊断流程

3故障诊断实例

滚动轴承是旋转机械中的一种重要支承部件,本节以滚动轴承故障诊断为例,研究基于LapSVM的旋转机械故障诊断方法的优越性。实验数据采用美国CaseWesternReserveUniversity电气工程实验室的滚动轴承试验台数据[13]。在该试验台中,试验轴承支承电机转轴,在其内圈、外圈和滚动体上分别用电火花技术加工了单点损伤,以模拟内圈故障、外圈故障和滚动体故障。滚动轴承的振动信号通过安装在轴承座上方的加速度传感器进行采集,采样频率为12kHz。滚动轴承在不同状态下的典型时域波形如图4所示。

(a)正常状态

(b)内圈故障

(c)滚动体故障

(d)外圈故障图4 滚动轴承原始振动信号的时域波形

3.1特征提取

特征提取是实现智能诊断的关键步骤之一。当滚动轴承发生局部损伤时,受载运行过程中产生的冲击会激起系统的高频固有振动,从而会导致不同频带的能量分布发生变化,因此可根据滚动轴承振动信号不同频带能量的分布来诊断滚动轴承的不同故障。为提取滚动轴承振动信号的能量特征,首先需要将滚动轴承的振动信号分解为一系列不同频率成分的信号。由Huang等[14]提出的经验模式分解(empiricalmodedecomposition,EMD)方法可以将一个信号自适应地分解为一系列本征模函数(intrinsicmodefunction,IMF)分量,这些分量分别包含了信号从高到低不同频率段的成分,因此计算每一个IMF分量的能量,然后将这些能量值组合起来就是滚动轴承振动信号在不同频率段的能量分布。

本文将IMF能量特征作为诊断输入的特征向量,其具体构造方法为[15]:首先采用EMD将滚动轴承的原始振动信号分解为一系列IMF分量。由于滚动轴承的故障信息主要在高频带,因此选择前4个IMF分量进行计算。然后分别计算这4个IMF分量的能量,并对这些能量值进行归一化。最后将这4个归一化后的能量值组成特征向量,并作为接下来智能诊断实验的输入。

根据上述方法计算图4中4个信号的IMF能量特征,由EMD分解得到的前4个IMF分量如图5所示,计算得到的IMF能量值如图6所示。从图6可以看出,由于滚动轴承发生故障时会激起系统的高频固有振动,因此与正常状态相比,滚动轴承存在内圈故障、滚动体故障和外圈故障时高频成分的能量显著增加,低频成分的能量相应减少;而且不同故障类型引起的能量变化程度不同,其中,外圈故障的能量变化最为明显,接下来依次是滚动体故障和内圈故障。从该组滚动轴承振动信号的IMF能量特征可以看出,上述特征提取方法可有效地用于提取滚动轴承故障的特征。

3.2智能诊断

(a)正常状态

(b)内圈故障

(c)滚动体故障

(d)外圈故障图5 由EMD分解得到的前4个IMF分量(由上到下分别为IFM1~IFM2)

图6 4种状态下的IMF能量特征

为研究无标记的样本在智能诊断中的作用,同时采用SVM和LapSVM进行智能诊断实验。SVM和LapSVM的核函数均选取高斯径向基核函数。SVM和LapSVM本身都是针对两类分类问题设计的,而滚动轴承故障诊断是一个多类分类问题。目前,通过两类分类方法来解决多类分类问题的方法主要有一对一、一对多和有向无环图等方法,本文采用一对多方法[16]来解决滚动轴承故障诊断问题。

实验中训练样本和测试样本的个数如表1所示。在训练样本中,对于滚动轴承每一种状态的样本,随机选取5%的样本赋予其类别标记(作为有标记样本),剩下的作为无标记样本。SVM仅使用少量的有标记样本进行训练,LapSVM同时使用少量的有标记样本和大量的无标记样本进行训练。训练完成以后,将得到的模型对测试样本进行测试,结果如表2所示。从表2可以看出,LapSVM的总诊断正确率比SVM提高了6.5%,这表明在有标记样本较少时,LapSVM可以有效地利用无标记样本来辅助提高诊断正确率。

表1 滚动轴承故障诊断训练/测试样本个数

表2 SVM和LapSVM的故障诊断正确率 %

为进一步研究增加有标记样本的数量对SVM和LapSVM诊断正确率的影响,在每一种状态的训练样本中分别随机选取10%、20%、30%、40%和50%的样本作为有标记样本进行故障诊断实验,结果如图7所示。从图7可以看出,随着有标记样本数量的增加,SVM和LapSVM的诊断正确率均不断提高,但在每一种情况下,LapSVM的诊断正确率仍然高于SVM,这表明随着有标记样本数量的增加,LapSVM仍然可以利用无标记的样本来进一步提高故障诊断的正确率。此外,从图7还可以看出,随着有标记样本数量的增加,LapSVM的诊断正确率和SVM的诊断正确率的差距逐渐缩小。这是因为当有标记样本增加到一定数量时,已经基本上可以反映出数据的真实分布,这时无标记样本的作用逐渐减小,因此SVM的诊断结果逐渐接近LapSVM的诊断结果。

图7 训练样本中有标记样本的比例对诊断正确率的影响

4结语

本文提出了一种基于拉普拉斯支持向量机的旋转机械故障智能诊断方法。该方法在智能诊断中可以有效地利用大量无标记的样本来辅助有标记的样本进行训练,即利用无标记的样本估计出数据的流形结构,在训练中不仅考虑有标记样本的类别信息,还考虑无标记样本的流形结构信息,从而在有标记样本数量较少的情况下,通过利用无标记样本进行辅助训练,获得比传统支持向量机更高的故障诊断正确率。滚动轴承故障诊断实例验证了所提方法的优越性。

参考文献:

[1]徐启华,师军. 基于支持向量机的航空发动机故障诊断[J]. 航空动力学报,2005,20(2):298-302.

XuQihua,ShiJun.Aero-engineFaultDiagnosisBasedonSupportVectorMachine[J].JournalofAerospacePower,2005,20(2):298-302.

[2]王太勇,何慧龙,王国峰,等. 基于经验模式分解和最小二乘支持矢量机的滚动轴承故障诊断[J]. 机械工程学报,2007,43(4):88-92.

WangTaiyong,HeHuilong,WangGuofeng,etal.RollingBearingsFaultDiagnosisBasedonEmpiricalModeDecompositionandLeastSquareSupportVectorMachine[J].ChineseJournalofMechanicalEngineering,2007,43(4):88-92.

[3]HuQiao,HeZhengjia,ZhangZhousuo,etal.FaultDiagnosisofRotatingMachineryBasedonImprovedWaveletPackageTransformandSVMsEnsemble[J].MechanicalSystemsandSignalProcessing,2007,21(2):688-705.

[4]袁胜发,褚福磊. 支持向量机及其在机械故障诊断中的应用[J]. 振动与冲击,2007,26(11):29-35.

YuanShengfa,ChuFulei.SupportVectorMachinesandItsApplicationinMachineFaultDiagnosis[J].JournalofVibrationandShock,2007,26(11):29-35.

[5]WidodoA,YangBS.SupportVectorMachineinMachineConditionMonitoringandFaultDiagnosis[J].MechanicalSystemsandSignalProcessing,2007,21(6):2560-2574.

[6]ChapelleO,SchölkopfB,ZienA.Semi-supervisedLearning[M].Cambridge,MA,USA:MITPress,2006.

[7]ZhuXiaojin,GoldbergAB.IntroductiontoSemi-supervisedLearning[M].SanRafael:Morgan&ClaypoolPublishers,2009.

[8]ZhangZhenyue,WangJing,ZhaHongyuan.AdaptiveManifoldLearning[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2012,34(2):253-265.

[9]蒋全胜,贾民平,胡建中,等. 基于拉普拉斯特征映射的故障模式识别方法[J]. 系统仿真学报,2008,20(20):5710-5713.

JiangQuansheng,JiaMinping,HuJianzhong,etal.MethodofFaultPatternRecognitionBasedonLaplacianEigenmaps[J].JournalofSystemSimulation,2008,20(20):5710-5713.

[10]LiBenwei,ZhangYun.SupervisedLocallyLinearEmbeddingProjection(SLLEP)forMachineryFaultDiagnosis[J].MechanicalSystemsandSignalProcessing,2011,25(8):3125-3134.

[11]BelkinM,NiyogiP,SindhwaniV.ManifoldRegularization:AGeometricFrameworkforLearningfromLabeledandUnlabeledExamples[J].JournalofMachineLearningResearch,2006,7(11):2399-2434.

[12]MelacciS,BelkinM.LaplacianSupportVectorMachinesTrainedinthePrimal[J].JournalofMachineLearningResearch,2011,12(3):1149-1184.

[13]TheCaseWesternReserveUniversityBearingDataCenter.BearingDataCenterFaultTestData[EB/OL]. [2012-03-01].http://www.eecs.cwru.edu/laboratory/bearing/.

[14]HuangNE,ShenZ,LongSR,etal.TheEmpiricalModeDecompositionandtheHilbertSpectrumforNonlinearandNon-stationaryTimeSeriesAnalysis[J].ProceedingsoftheRoyalSocietyofLondon.SeriesA:Mathematical,PhysicalandEngineeringSciences,1998,454(1971):903-995.

[15]YangYu,YuDejie,ChengJunsheng.ARollerBearingFaultDiagnosisMethodBasedonEMDEnergyEntropyandANN[J].JournalofSoundandVibration,2006,294(1/2):269-277.

[16]RifkinR,KlautauA.InDefenseofOne-vs-AllClassification[J].JournalofMachineLearningResearch,2004,5(1):101-141.

(编辑张洋)

FaultDiagnosisofRotatingMachineryBasedonLaplacianSupportVectorMachines

HaoTengfeiChenGuo

NanjingUniversityofAeronauticsandAstronautics,Nanjing,211106

Abstract:In the intelligent fault diagnosis of rotating machinery, collecting a large number of data was relatively easy, but giving all collected data a label was often difficult. Aiming at this situation, an intelligent fault diagnosis approach for rotating machinery was proposed based on Laplacian support vector machines(LapSVM). The diagnosis example of rolling bearings shows that when the number of labeled data is limited, compared with the SVM that uses only labeled data for learning, the fault diagnosis approach based on LapSVM can improve the accuracy of fault diagnosis significantly by using a large amount of unlabeled data together with labeled data for learning.

Key words:fault diagnosis;rolling bearing;support vector machine(SVM);semi-supervised learning;manifold learning

收稿日期:2014-06-05修回日期:2015-07-30

基金项目:国家自然科学基金资助项目(61179057)

中图分类号:TH17

DOI:10.3969/j.issn.1004-132X.2016.01.012

作者简介:郝腾飞,男,1983年生。南京航空航天大学民航学院博士研究生。主要研究方向为航空发动机状态监测与故障诊断。发表论文4篇。陈果,男,1972年生。南京航空航天大学民航学院教授、博士研究生导师。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!