当前位置:首页 期刊杂志

行星齿轮系故障特征多目标进化选择方法

时间:2024-07-28

黄海安,王友仁,孙灿飞,2,陈伟,王俊

(1. 南京航空航天大学 自动化学院,江苏 南京 210016; 2. 上海航空测控技术研究所,上海 201601)

0 引言

在行星齿轮箱故障诊断中,基于振动信号从时域、频域、时频域等方面提取反映运行状态的量化指标,可以有效地辨识齿轮箱的运行状态。然而随着故障模式的复杂度提高,提取的特征会呈现多元化,即提取的特征包含强相关特征、弱相关特征和冗余特征[1]。如何从高维、非线性的特征集中提取故障特征子集是模式识别的核心问题[2]。

旋转机械故障特征优选方法通常分为特征变换和特征选择两大类。基于特征变换的降维优选方法采用映射关系对特征进行空间变换,Li等[3]利用监督局部线性嵌入算法实现故障特征集的维数约简,Su等[4]利用扩展的监督局部切空间排列进行特征降维。然而基于特征变换的降维技术失去了原始特征的物理意义,无法表征系统的本质特性。基于特征选择的降维方法采用评估准则对特征进行直接子集选择,保留了原始特征含义,应用广泛[5]。传统的特征选择算法采用距离评估技术对特征重要性进行排序,缺点是无法彻底去除冗余特征,也没有考虑弱相关特征的组合性能。近年来多目标进化算法被引入到特征选择中来,2013年Bing提出基于进化多目标粒子群优化特征选择算法[6],采用分类准确率最高和特征个数最少2个目标函数同时优化选取Pareto前沿解,但其考虑的特征选择因素依然过少。

针对旋转机械故障特征优选方法存在特征选择考虑因素过少,可能选择不到高质量的特征子集问题,结合本文行星齿轮箱具体研究对象,提出一种基于遗传算法的多目标故障特征选择方法。定义3个目标准则:最小冗余准则、特征维数最少准则和分类准确率最高准则,建立多域故障特征优选数学模型,然后采用遗传算法(genetic algorithm,GA)[7]求解模型得到最优故障特征子集。通过实验验证了方法的有效性。

1 行星齿轮系故障特征优选数学模型

行星齿轮系故障特征优选的数学模型描述为:

目标函数:

minF(S)

(1)

F(S)=λ1f1(S)+λ2f2(S)+λ3f3(S)

(2)

(3)

设数据集为:

(4)

其中,特征向量xi=(xi1,xi2,…,xiM)为行向量,xiX,X为样本空间,i=1,2,…,N,N为样本个数,M为特征向量xi维数;为列向量,表示第j个特征的N个样本取值,j=1,2,…,M;xij是特征向量xi在第j个特征上的取值;y=(y1,y2,…,yN)T,yiy为特征向量xi的标签,y为标记向量;SN×K为数据集DN×(M+1)在特征选择中得到的一个候选子集,0

1) 冗余度最小:衡量所选择的故障特征子集中,各特征间冗余度。优化目标要求冗余度最少,计算公式为:

(5)

其中,xk和xk′分别是特征子集S中的第k维特征和第k′维特征,0

SU是对称不确定信息,计算公式为:

(6)

其中,H(x)是向量x的信息熵,I(x,y)是向量x与y的互信息,x=(x1,x2,…,xN),y=(y1,y2,…,yN)。

(7)

I(x,y)=H(x)+H(y)-H(x,y)

(8)

其中,H(x,y)是向量x与y的联合熵。

(9)

熵是衡量随机变量的不确定性指标,对称不确定性是互信息的扩展版本,取值为0~1,取0时表示X和Y变量完全独立,为1时表示其中的某一变量可以完全取代另一变量。

2) 所选择出的故障特征子集的维数最少:在保证故障分类性能情况下,优选的故障特征维数要最小,计算公式为:

f3(S)=|S|

(10)

其中,|S|表示该特征子集中总共的特征维数,0

3) 分类准确率最高:衡量分类性能, 最优分类准确率是100%,计算公式为:

(11)

其中,s是正确分类样本个数。0≤f4(S)≤1,本文优化目标是最小化,故实际计算时需要转化为-f4(S)。

2 基于遗传算法的多目标特征选择

遗传算法是Holland教授等人于20世纪70年代将优胜劣汰原理和遗传学的基因信息随机交换理论融合,研究开发出一种能模拟生物自然进化的高性能搜索算法。它与传统优化算法相比,在实际应用中具有群体搜索、并行运算、全局寻优和强鲁棒性等性能优点。本文选择GA算法作为行星齿轮箱故障特征优选数学模型求解算法,可以得到满意的特征子集。而在子集分类性能评价方面选择ELM的主要原因是其具有的快速性和较好的泛化能力。与传统的学习算法不同,ELM不仅可以达到最小的训练误差,还能获得最小的权值范数,根据Bartlett的理论,训练误差和权值范数越小,则网络的泛化性能越好。ELM最大的特点在于隐含层参数随机生成,这一举措极大地提升算法的速度,通过理论证明其泛化能力也保持在很高的水平上。

本文基于遗传算法的多目标特征选择算法步骤如下:

1) 编码方案

特征选择过程本质上是特征集中某几个特征选择,而其余特征丢弃的过程。因此本文采用二进制编码方案,采用0和1表示未选中和选中特征。设故障特征空间D中特征向量为x=(x1,x2,…,xM),则用一个长度为M的0和1字符串来表示一种特征组合设为G=(g1,g2,…,gM),其中gi=0 or 1,如果gi=0表示该特征丢弃,否则特征保留。

2) 初始化种群

设置种群规模、迭代次数,然后随机产生一个包含NP个个体的初始种群P。

3) 适应度函数计算

行星齿轮箱故障特征优选数学模型中定义了4个目标函数,为防止量纲不一致,均全部归一化处理。适应度函数为式(1),优化目标是最小化。同时在行星齿轮箱故障诊断中最重要的指标是分类准确率,故在加权和的权重分配上设置λ3,权重必须大于其余目标函数的权重,使得优化过程中会偏向于保留分类准确率高的子集。设置权重取值为λ1=0,λ2=0,λ3=0。

4) 选择、交叉与变异操作

本文的选择算子采用轮赌选择,交叉算子采用单点交叉,交叉概率为0.8,变异概率为0.05。一次特征选择过程为:对初始化所有种群中的个数进行二进制编码,对二进制编码后的决策变量与特征向量相乘,得到对应的特征子集,利用该特征子集进行3个目标函数值计算,归一化并且乘上相应权重后得到适应度值,从而可以计算得到所有个体的适应度值。去除适应度最高和最低的几个个体,其余个体参与轮赌选择,后续进行交叉和变异操作,更新种群。通过不断进行选择、交叉和变异操作,群体有望收敛于全局最优解,同时精英保留策略直接让群体中最好的个体进入到下一代群体,可以保证群体质量不会退化。

行星齿轮系故障特征进化优选算法实现步骤为:

1) 原始信号为加速度计采集的振动信号,对采样信号分别提取时域特征、频域特征、小波域特征和信息熵特征,构建原始高维故障特征集,并归一化处理;

2) 定义3个目标函数,设置每个目标函数加权和的权重值,定义适应度函数;

3) 设置ELM隐含层节点个数,具体操作为:对故障特征集采用10折交叉验证方法,分为训练集和测试集,比例为9∶1。采用循环迭代运算,在不同隐含层节点个数情况下,计算ELM算法分类准确率,区间为[10,200],间隔为10,迭代200次。迭代完成后可得隐含层节点变化对分类性能的影响曲线,从中可以取分类准确率最高对应的隐含层节点个数作为最佳隐含层节点个数,后续计算分类准确率均采用该节点个数计算。

4) 设置遗传算法的种群规模以及初始化种群,利用适应度函数值更新种群,最终得到最优特征子集。

3 实验与结果分析

3.1 实验说明

图1为行星齿轮传动系统试验台,其中行星齿轮箱与定轴齿轮箱均为两级结构,行星齿轮箱参数见表1。实验设置了1种正常模式和4种太阳轮故障模式:磨损、裂纹、切齿和断齿,如图2所示。在故障测试实验中,每种故障模式下分别设置9种变速变载工况情况:转速取1 200 r/min、2 400 r/min和3 600 r/min,负载取0 N·m、20 N·m和40 N·m。在齿轮箱箱盖上安装有3个加速度传感器,振动信号采样频率为10 kHz,每种工况下每一路振动信号连续采集时间为90 s。

图1 行星齿轮传动试验系统试验台

图2 太阳轮故障模拟件

齿轮齿数/个第一级第二级齿圈100100行星轮40(3)36(4)太阳轮2028

3.2 多域故障特征提取

将一路振动信号采样数据以10k点作为一个样本,5个模式的时域波形如图3所示。所展示信号的工况为:转速2 400r/min,负载20N·m。每种故障模式、9种工况下共有773个样本,故5种模式下总的故障样本数为3 865。对每个样本共提取39个特征:最大值F1、最小值F2、峰值F3、峰峰值F4、均值F5、平均幅值F6、方根幅值F7、方差F8、标准差F9、有效值F10、峭度F11、偏度F12、波形因子F13、波峰因子F14、脉冲因子F15、裕度因子F16、余隙因子F17、平均频率F18、重心频率F19、频率均方根F20、频率标准差F21、小波能量比F22~F29、小波能量熵F30、小波特征尺度熵F31~F38、小波奇异熵F39。样本空间大小为3 86539。

对39个特征指标进行归一化处理。对39个特征指标采用高维可视化分析技术:主成分分析(principal component analysis,PCA),提取前2维主成分,绘制散点图,结果如图4。

图4 特征空间散点图

从图3和图4可以看出,裂纹故障和磨损故障时域波形没有差别,断齿故障时域波形和其他模式信号差别较大,9种工况对应9种空间分布,裂纹故障和磨损故障数据非常接近,原因是其均为早期微弱故障。

3.3 实验结果分析

1) ELM隐含层节点数

首先将整个故障特征集输入到ELM算法中,通过循环迭代运算初步确定最佳隐含层节点个数。采用10折交叉验证和5次重复计算,结果如图5所示。通过实验验证,当隐含层个数为100后,再次增加个数,准确率增加幅度不超过0.5%,故选取100为最佳的隐含层节点个数。

图5 不同隐含层节点分类准确率

2) 故障特征优选结果

选择常用的联合互信息特征选择(joint mutual information,JMI)、拉普拉斯分值特征选择(laplacian score,LS)和最大相关最小冗余特征选择(maximum correlation and minimum redundancy,MRMR)进行对比,其中JMI是基于互信息理论计算特征与类标的相关度、对已选特征分类信息的补充量,以此来评价特征组合所持有的分类信息;LS是一种有效的无监督特征选择算法,它通过评估特征的局部保持能力来进行特征选择,属于局部特征选择算法;MRMR是一种基于互信息的全局贪婪选择算法,主要思想是从特征集中选择与目标类别有最大相关性且相互之间具有最小冗余度的m个特征,利用互信息衡量特征子集中特征与类别、特征与特征之间的相关度。

由于JMI、LS和MRMR属于过滤类特征选择算法,所选择出的特征与分类器无关,为了方便和本文算法进行比较,采用ELM对特征选择后得到的按照权重排序的特征,采用前向搜索方法确定最佳分类准确率。假设数据集经过JMI特征选择后,得到的特征按照权重由高到低顺序为[1;4;2;7;6;5;3;8;9],则前向搜索过程为:特征1,计算分类准确率;特征1和4,计算分类准确率;特征1、4和2,计算分类准确率,依次计算直到全部特征均计算完成,本实验特征集在3种特征选择算法下的结果如图6。

图6 分类准确率随特征个数变化曲线

从图6可以看出,3种算法分类准确率均随着子集个数增加,分类准确率增加,然而在特征个数增加到15个时,分类准确率没有提高,说明特征集中存在大量的冗余特征。

本文基于遗传算法的多目标特征选择算法种群规模为100,最大迭代次数为500。特征选择结果如表2所示。

表2 3种对比算法和本文算法结果

其中,序号表示对应的特征,例如5表示该特征是F5即均值。

表3 特征子集性能比较

从表3可以看出,本文所提特征选择方法不仅可以取得最少的特征维数,同时可以得到最高的分类性能,验证了方法的有效性。

4 结语

针对如何获得高效、低维的行星齿轮系故障特征集问题,提出基于遗传算法的多目标故障特征优选算法。建立了行星齿轮系故障特征优选数学模型,采用ELM评价分类准确率,可以得到分类准确率高、特征个数少的最优特征子集。通过实验测试可知,与传统的特征选择算法相比,本文优选算法提取的特征子集维数少,分类准确率由90%提升至95%,提高了故障诊断性能。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!