当前位置:首页 期刊杂志

基于熵特征与HMM的滚动轴承退化状态识别*

时间:2024-07-28

王志霞,郭 利

(陆军工程大学石家庄校区,石家庄 050003)

0 引言

滚动轴承是许多旋转机械的关键构件,也是容易受损失效的元件,轴承从故障发生到最终失效经历了一个不断退化的演化过程[1],准确识别轴承退化状态能够为其失效前的维护提供重要依据,对保证机械设备的安全运行具有重大意义。

退化特征提取是实现退化状态识别的前提和基础,科学有效的退化特征能够准确而稳定的表征设备性能退化程度[2],常用的轴承退化性能指标有均方值、峰值等,由于滚动轴承振动信号具有非线性非平稳特征,传统的建立在平稳基础上的量化指标在定量评估轴承退化性能上受到限制,近年来,基于非线性动力学参数信息熵的各种指标实现了对轴承退化性能更科学有效的定量评估,如度量信号规则程度和复杂性的近似熵、样本熵、模糊熵[3-4],度量信号频谱能量分布的能谱熵等[5], 2014年,郑近德[6]等提出了多尺度模糊熵并将其应用于轴承故障诊断上,与模糊熵等相比,多尺度模糊熵能从多个尺度挖据信号的复杂度特征,包含了更多时间序列模式信息,本文将多尺度模糊熵引入到轴承退化状态的表征上,同时鉴于单一特征指标在描述故障信息上的局限性[7],为从不同角度反应故障状态,将信号时频分解方法与熵理论结合提取信号的谱能量分布特征。时频分解方法是分析非线性、非平稳信号的有效手段,如小波分解、EMD分解、LCD分解等,但小波分解不具备自适应分解的能力,分解效果依赖于参数选取,而EMD、LCD等自适应时频分解方法存在模态混叠、端点效应等问题,并且上述时频分解方法对信号高频部分的分解精度均较低;变分模态分解(Variational Mode Decompsition, VMD)是Dragomiretskiy[8]于14年提出的信号自适应时频分解方法,克服了EMD、LMD方法存在的模态混叠等缺陷,并且具有较高的高频分辨率,能够实现信号高频模态的精细分解,因此,本文在信号VMD分解的基础上提出VMD能谱熵表征轴承退化中各模态能量的分布变化。

HMM是一种基于时间序列的统计模型,对动态时间序列具有很强的建模能力,近年来被国内外研究者引入到滚动轴承故障诊断、退化识别以及剩余寿命预测中,并取得了良好的效果[9-10]。本文以多尺度模糊熵和VMD能谱熵作为退化特征训练轴承不同退化状态下的HMM模型,利用建立的HMM模型库并根据最大对数似然概率原则对滚动轴承退化状态进行识别;其中,针对人为划分轴承退化阶段的主观性,采用GG聚类方法实现全寿命数据在时域阶段上的自适应划分。对NSFI/UCR智能维护中心滚动轴承全寿命加速疲劳试验数据的分析结果表明,与常用退化指标下的识别相比,所提方法得到了更高的正确识别率。

1 多尺度模糊熵及VMD能谱熵

1.1 多尺度模糊熵

模糊熵是对样本熵的改进,与其物理意义相似,表示相似向量在由m维增加至m+1维时继续保持相似性的条件概率,用以衡量一个时间序列在维度变化时出现新模式的概率,可以据此度量该时间序列的规则程度和复杂性。模糊熵具有样本熵的优点:只需要较短的数据就可以得到稳健的估计值;更好的相对一致性;较好的抗噪和抗干扰能力。此外,不同于样本熵以阶跃函数为基础定义向量的相似性,模糊熵采用的是指数函数e-(d/r)n,指数函数的连续性可以将相似性度量模糊化,保证了向量相似性不会发生突变,使时间序列的熵特征更为稳定可靠。模糊熵的具体计算过程如下:

(1)对给定的时间序列u(i)(1≤i≤N),按式(1)得到m维向量序列:

(1)

式中,uo(i) 为从第i个u值开始连续m个点的均值:

(2)

(3)

(4)

(4) 定义φm为:

(5)

(5) 类似的,继续对维数m+1重复上述(1)~(4),得到:

(6)

(6)最后得到时间序列u(i)(1≤i≤N)的模糊熵为:

FuzzyEn(m,n,r,N)=lnφm(n,r)-lnφm+1(n,r)

(7)

多尺度模糊熵首先通过不同的尺度因子对时间序列进行粗粒化处理,然后对粗粒向量进行模糊熵分析,从而挖据时间序列在不同尺度下的规则程度和复杂性。时间序列X={x1,x2,…,xN}的多尺度模糊熵的构造过程如下:

①利用尺度因子将原始时间序列X进行粗粒化处理,建立粗粒向量:

(8)

式中,τ是整数,称为尺度因子,[N/τ]表示长度不大于N/τ的最大正整数,原始序列X被分割为τ个长度分别为N/τ的粗粒序列yj(τ)。

②对每一个粗粒序列按照给定的m和r求其模糊熵,并将其刻画为尺度因子的函数,形成对时间序列的多尺度模糊熵分析。

1.2 VMD能谱熵

结合VMD分解方法提出VMD能谱熵,假设信号x(i)(i=1,2,...,N)经VMD分解得到K个IMFi(i=1,2,...,K)分量,每个IMFi的对应的频谱能量分别为Ei,则Ei分量对应的概率分布为:

(9)

定义VMD能谱熵为:

(10)

VMD能谱熵代表的是IMF模态分量的频谱能量在原始信号频谱中的分布,通过计算能谱熵衡量原始信号中各IMF分量信号的能量分布均匀程度,能谱熵的变化反应各IMF模态能量在整个信号能量中的分布变化。

2 HMM及其训练与评估

HMM是在Markov链的基础上建立的模型,包含了双重随机过程,其中一个是隐藏着的不可观测的Markov链过程,通过状态转移矩阵描述,另一个是隐藏状态与可观测序列之间的统计对应关系,通过输出概率矩阵描述,隐藏状态反映了可观测序列的潜在基本结构。HMM可记为λ=(N,M,A,B,π),一般简写为λ=(A,B,π),其中,N为HMM模型隐藏状态的数目,状态集合为S={s1,s2,…,sn};M为每个状态对应的观测值数目,观察符号集合为V={v1,v2,…,vn};A是状态转移概率矩阵,A=(aij)N×N,其中aij=P(qt+1=sj|qt=si)1≤i,j≤N,表示状态si到状态sj的转换概率;B为隐藏状态生成观测值的输出概率矩阵,也称观测值概率矩阵,B=(bjk)N×M,其中bjk=P(ot=vk|qt=sj)1≤j≤N,1≤k≤M,π为初始状态的概率分布,表示为π=(π1,π2,…,πN),其中πi=P(qi=si),1≤i≤N。

HMM模型训练采用Baum-Welch算法[8],即给定观察值序列O={o1,o2,…,oT}和初始条件,在现有模型λ上通过Baum-Welch算法重估参数得到新的模型λ′,并且P(O|λ)

3 轴承退化状态识别的实现

3.1 基于GG聚类的退化状态划分

在对滚动轴承退化状态识别时,需要对训练用的全寿命实验数据进行退化状态的划分,然后根据划分结果训练不同退化状态下的HMM模型,并进行测试。目前多数研究都是依据经验进行人为划分,具有主观性[11],本文采用聚类手段进行科学客观的划分。聚类方法通过无监督学习规则将一组指定的数据集划分为几组类似个体的子类,典型的聚类算法有模糊C均值(Fuzzy C-means, FCM)聚类、GK(Gustafaon-Kessel)聚类、GG(Gath-Geva)聚类等方法[12-13],FCM聚类、GK聚类只能形成类似于球体的聚类状态,适合具有相同形状和方向即各向同性的数据结构,不能反映非规则分布数据本身的集成状态;GG聚类通过引入模糊最大似然估计的距离测度,使聚类结果不受体积形状的限制,从而得到符合数据分布特性的聚类结果,因此本文采用GG聚类方法将轴承全寿命实验样本划分为若干退化阶段。

3.2 退化状态识别流程

利用GG聚类方法将轴承全寿命历史数据分为若干退化阶段,通过多尺度模糊熵以及VMD能谱熵建立各退化阶段下的HMM模型从而进行轴承退化识别的流程如图1所示,具体步骤如下:

(1)利用GG聚类方法将轴承全寿命实验数据划分为若干退化阶段,代表轴承不同退化状态,选取各退化状态下的训练样本集和待测样本集,计算其多尺度模糊熵与VMD能谱熵作为退化特征向量;

(2)各退化状态下每组训练样本的特征向量形成对应HMM模型的一个观测值序列,通过标量量化[14]后输入HMM模型,利用训练样本集的多观测值序列和Baum-Welch算法重估各退化模式下HMM的模型参数,建立HMM模型库;

(3)将待测样本的特征向量观测值序列输入模型库中的各HMM模型,通过前向后向算法计算每个模型输出的对数似然概率,输出概率最大模型为测试样本的匹配模型,其对应的退化状态即为识别结果。

图1 基于熵特征与HMM的退化识别方法流程图

4 实验验证

为验证本文所提方法的有效性,采用NSFI/UCR智能维护中心的滚动轴承全寿命加速疲劳试验数据进行退化状态识别分析。试验台示意图如图2所示,主轴上安装了4个ZA-2115型测试轴承,利用弹性装置对轴承施加一定的径向载荷,各轴承基座上安装一个PCB353B33型加速度传感器。试验中,电机驱动主轴以fr=2000r/min的转速持续运行,采样频率为20.48kHz,每隔10min采集一次信号,每组20480个采样点,试验结束后发现1号轴承因外圈局部故障失效,其在整个试验过程得到984组全寿命实验数据。

图2 滚动轴承加速疲劳试验平台

4.1 退化状态划分

由于983和984组样本数据不具备轴承故障信号的特征,可认为采集最后2组数据时轴承已经失效,因此将其作为无效数据剔除,将剩余1~982组样本作为有效的全寿命数据在时域上划分为4个退化阶段。以行业中常用的机械振动有效值(RMS)为退化状态划分标准[15],并将其进行归一化,通过GG聚类方法得到聚类结果如图3所示,1~532组样本的RMS值保持相对稳定,此时轴承为正常状态,533~701组样本的RMS小幅度高于正常值,说明轴承出现轻度退化,702~934组样本的RMS值偏离正常值较大,认为轴承在全寿命过程中处于中度退化状态,935~982组的RMS值快速上升,说明轴承急剧退化,称为重度退化状态。

图3 基于GG聚类的退化阶段划分

4.2 多尺度模糊熵和VMD能谱熵的参数选取

FuzzyEn(m,n,r,N)中,参数m、N分别为截取相似向量的窗口长度和时间序列长度,m的值越大越能细致地重构系统的动态发展过程,但m越大所需数据越长(约为10m~20m),综合考虑取m=2,时间序列长度N取为2048个点;相似容限参数r的经验取值为0.1~0.25SD,SD为时间序列的标准差,本文取0.15SD;参数n决定相似容限边界的梯度,取较小的整数值2;尺度大小的选取通过对实际数据的分析得到,尺度因子为1~10时,轴承不同退化状态下的多尺度模糊熵值如图4所示,从图中可以看出,尺度因子为1~5时各退化状态的模糊熵值区分度较好,事实上随着尺度增大,时间序列粗粒化加重导致细节信息丢失,难以有效反应序列的特征信息,主要特征信息包含在尺度较小的模糊熵内,因此取前5个尺度下的模糊熵,联合VMD能谱熵作为退化特征向量。VMD能谱熵仅需要选取一个参数,即VMD的分解个数K,采用观察中心频率[16]的方法取K=6。

图4 多尺度模糊熵

4.3 退化状态识别及结果

根据GG聚类的退化状态阶段划分,需要训练4个分别代表4种退化状态的HMM模型,取每种退化状态下的40组采样数据作为样本集,随机抽取其中的20组数据作为训练样本集,剩余20组则为测试样本集。提取训练样本的退化特征向量,每组数据中设定2048个采样点为一帧数据,从而每组数据分为10帧,对每帧数据计算尺度因子为1~5的多尺度模糊熵和VMD能谱熵作为特征向量,形成观测值序列。取HMM模型隐状态个数为4,随机初始化模型,然后利用每种退化状态下的20组特征向量观测值序列和Baum-Welch算法分别训练正常模型、轻度退化模型、中度退化模型和重度退化模型4种HMM模型。

将4种退化状态下的20组测试样本集分别输入HMM模型进行退化状态识别,每个样本以输出最大对数似然概率的模型为其对应的退化识别结果,测试结果如图5和表1所示,正常测试样本集的20组样本中,有2组误判为轻度退化,识别率为90%;轻度退化样本集的20组样本中,有1组误判为正常,识别率为95%;中度退化样本集的20组样本中,有1组误判为轻度退化,识别率为95%;重度退化样本集的20组样本识别结果全部正确,识别率达到100%,因此总的识别率达到90%以上。

(a)正常样本测试结果

(b)轻度退化样本测试结果

(c)中度退化样本测试结果

(d)重度退化样本测试结果图5 基于熵特征和HMM模型的退化识别结果

为验证基于多尺度模糊熵熵与VMD能谱熵的HMM退化识别优势,将常用的均方值、方差值、峰值、波形因子、峭度以及特征频率能量值指标作为退化特征向量,训练各退化状态下的HMM模型,并得到测试样本的识别结果如表2所示,通过与表1进行比较可以得到,常用指标下各退化状态的识别率均低于本文方法得到的识别率,其中,轻度退化的正确识别率只有80%,最高识别率只达到90%,因此,相对于常用指标,所提方法具有更优的识别效果。

表1 基于熵特征与HMM的识别结果

表2 基于常用指标与HMM的识别结果

5 结论

针对滚动轴承退化状态识别问题,提出一种以多尺度模糊熵和VMD能谱熵作为退化特征,利用HMM模型进行退化状态评估的识别方法:

(1)针对识别中的退化特征提取问题,引入多尺度模糊熵作为退化特征,并结合VMD时频分解方法提出VMD能谱熵特征;

(2)对于人为划分滚动轴承全寿命数据退化阶段的不足,利用GG聚类方法实现了全寿命数据的自适应聚类划分;

(3)利用所提熵特征建立各退化阶段下的HMM模型并对轴承各退化状态进行识别,测试结果表明,所提方法能够有效识别出轴承的不同退化状态,正确识别率达到90%以上,较常用指标下的识别率得到大大提高,所提方法具有较好的识别性能和工程实用性。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!