当前位置:首页 期刊杂志

基于DWT-DSCNN-SVM的轴承故障诊断*

时间:2024-07-28

杨瑞恒,唐向红,b,c,陆见光,b,c,陈功胜

(贵州大学a.现代制造技术教育部重点实验室;b.机械工程学院;c.公共大数据国家重点实验室,贵阳 550025)

0 引言

轴承是广泛运用在各种机械装备中的一种重要的零件,它能否正常运行对于机械装备来说及其重要[1];轴承出现故障,不仅会造成经济损失,甚至会导致人员受伤。目前,轴承故障诊断日益成熟。若轴承出现了故障,其解决流程一般是收集轴承故障信号,然后提取故障特征,再进行故障分类[2-3]。对于故障的特征提取,其方法有希伯尔特变换[4]、傅里叶变换、经验模态分解[5]、小波变换[6]等。随着机器学习不断发展,其在故障诊断领域得到了很高的重视。把故障特征应用在决策树[7]、贝叶斯分类器[8]、支持向量机[9]和神经网络等机器学习算法[10]中,可以有效地对故障进行分类。

在故障诊断过程中,很多情况下提取的都是非平稳的信号。小波变换能够对该类信号进行时域和频域的局部分析,相较于单一的时域或者频域,小波变换能够更好聚焦在信号的细节上[11]。离散小波变换(Discrete Wavelet Transform,DWT)是小波变换的一种,经过DWT分解的信号拥有无冗余的特点[12],并且能够较好的展现故障信号的时频特性。

深度可分离神经网络是近年来提出的一种新颖的网络结构,它可以达到和普通CNN同样的效果,并且学习效率更高,可实现在保证准确率的基础上轻量化的网络结构[13]。一些领域内的研究者对深度可分离网络也进行了相关的研究。Shang R H 等[14]使用基于CNN的深度可分离卷积进行SAR图像分类得到了很好的分类效果。曹渝昆等[15]提出了一种基于深度可分离的轻量级卷积神经网络方法,该方法证实了深度可分离神经网络可以明显减少网络结构的参数量,节省结构空间。Wang G H等[16]提出一种将可分离神经网络应用到多尺度学习网络中,并且得到了良好的分类效果。

本文提出一种基于离散小波变换和深度可分离神经网络以及SVM分类器的故障诊断方法。该模型首先利用离散小波变换对原始振动信号进行处理形成样本,然后把样本输入深度可分离神经网络进行训练,最后在全连接层后接SVM分类器进行故障分类。本文基于CTU-2实验平台进行故障信号的采集并选取十种故障进行训练与识别,结果表明,该方法拥有良好的准确率和泛化能力。

1 DWT-DSCNN-SVM基本理论

1.1 离散小波变换

通过实验采集的信号能够被小波在不同尺度进行分解,小波分解能够通过这样提取特征的方式,提取到非平稳信号的特征。离散小波是在连续小波的尺度和位移的基础上离散化得到的。连续小波变换(Continues WaveletTransform,CWT)可表达为:

(1)

在连续小波变换的公式中,φ(t)代表的是母小波,a为伸缩因子,b为平移因子。在此基础上对连续小波进行二阶离散化,就可以得到离散小波变换:

(2)

在离散小波变换中,a变为2j,b变为2jk,经过离散小波变换的信号具有无冗余的特点,能够有效地反应信号特征。离散小波能够将信号分解成高频通道和低频通道,分解后的高频和低频还可以被继续分解,形成高高频、高低频、低高频、低低频。

1.2 深度可分离卷积

深度可分离卷积是近几年机器学习领域比较热门的一种神经网络结构,在各类分类任务中有着十分良好的效果。它可以避免提取一些冗余的有限元,大大减少所需的参数。与标准卷积相比,深度可分离卷积将整个特征提取分成深度卷积和逐点卷积,如图1所示。

图1 深度可分离卷积

由图1可知,深度可分离卷积的第一步是深度卷积。深度卷积对每个输入通道都使用单独的过滤器,经过深度卷积后的输入通道,输出的特征的映射个数和输入通道数相同。经过深度卷积后,总通道数保持不变,深度卷积的过程可以表示为:

(3)

其中,x为卷积层的输入特征映射,W是卷积核的权值矩阵,(i,j)为输出特征图的坐标点,m,n和k是卷积核的三个维度。

深度可分离卷积的第二步就是逐点卷积,即对第一步深度卷的输出进行1×1卷积,逐点卷积可以提取空间特征,它在改变通道数的同时并且不会改变特征图的大小,逐点卷积可以表示为:

(4)

对一个5×5×3的输入映射进行,使用两个3×3×3的标准卷积核进行卷积,得到一个3×3×2的特征映射。使用深度可分离卷积,对于每个单一通道,3个3×3×1的卷积核会单独进行卷积,生成3个3×3的特征图,然后,使用两个1×1×3的卷积核进行卷积。

由上述两个公式,深度可分离卷积可以表示为:

SConv(Wp,Wd,x)(i,j)=
PConv(W,x)(i,j)(Wp,DConv(Wd,x)(i,j))

(5)

普通的卷积过程为:

(6)

与普通的卷积相比,如果输出通道的数量是O,对于普通卷积层,由式(6)可知,需要的总参数为M×N×K×O。根据式(5),深度可分离需要的总参数为M×N×K+K×O,其比值为:

(7)

由此可见,深度可分离卷积的参数量大大减少,参数优化很明显,训练速度提升效果十分明显。

可分离卷积层后接有激活层和池化层,激活层的激活函数有Tanh、ReLU、PReLU等,它主要表示的是上层输入与下层输出之间的函数关系。PReLU函数又称参数化纠正线性单元,是由Leaky ReLU变化而来,它为负值的输入添加了一个线性项。PReLU函数的表达式如下:

(8)

其中,x为输入,a为一个固定参数,通常取0.01。激活层过后是池化层,池化层的池化函数通常有平均池化(Meaning Pooling),最大池(Max pooling),重叠池化(Overlapping Pooling),空金字塔池化(Spatial Pyramid Pooling)等。池化层的主要作用就是简化数据、去除冗杂的信息,减小网络的复杂度,较好的保留信息的完整度。它的数学表达式为:

(9)

1.3 SVM支持向量机

支持向量机分类器主要由分离超平面的存在定义。也就对是给定标记的训练数据集,该算法输出一个最优分类的超平面,超平面基本上将数据分为两类。其主要目的是找出具有最大边际的平面,边际距离最大化为数据的分类提供了一定的支持。SVM通常是作为首选的几个分类器之一,因为其只需要分配很小的计算力,就能得到很显著的准确率。SVM主要用于二分类和也可用于多类分类。现阶段,SVM已经广泛运用在机器学习的各个领域内,比如图像识别,SAR目标识别等等。

对于非线性分类,SVM不同的核函数是用来映射给定的输入数据到高维空间。SVM所使用的核函数通常有多项式核函数(Polynomial Kernal)、线性核函数(Liner Kernal)、径向基高斯核函数(Radial Basic Function)等。其中,RBF核函数在实际运用中比较多,其数学表达式如下:

(10)

2 DWT-DSCNN-SVM模型

模型首先对故障信号数据进行DWT分解成高高(HH)、高低(HL)、低高(LH)、低低(LL)4种不同的信号,并形成四通道样本作为输入信号输入到可分离神经网路进行训练。在离散变换的过程中,小波基的选取也是十分重要。常用的小波基有Haar小波和Db小波等,但是Haar小波的紧支撑范围窄,光滑性不是很好,对信号的时频局部化的性能较差。对比Haar小波,Db小的光滑性能较好,在分析信号局部化方面比较优秀。因此,本文选取Db1小波作为离散小波变换的小波基。

利用DWT形成样本后,将样本输入进深度可分离神经网络进行训练。神经网络的分离卷积层共有4层,在卷积层后,为了减少参数量和解决梯度下降的问题,使用PReLU作为激活函数。深度可分离神经网络和传统的神经网络一样,也有池化层,主要是用来减小参数,加快模型训练速度。模型选择最大池化作为池化函数。对于最大池化,它的原理是在选取的范围内,将范围内的最大特征当作输出,从而可以达到很好的泛化能力,并且可以防止过拟合。

在可分离神经网络的全连接层后接的是SVM分类器。其中RBF核函数在SVM的实际运用中比较多,该函数需要调试的参数比较少,样本大小对于其功能来说影响并不是很大。最为重要的是它能够把低维的样本点映射到更高维度。SVM经过交叉验证选择的惩罚参数为9。

3 实验验证

3.1 实验环境及数据

本文实验环境为Intel i7-6700,Windows10,Python 3.6+Keras。使用的数据来自 CTU-2 轴承实验平台,该实验平台如图2所示。

图2 CTU-2 轴承平台

在该平台上,采集数据所使用的轴承型号为6900ZZ,采用电火花加工技术分别在轴承内圈,滚动体和外圈上加工直径为0.2 mm 和0.3 mm的故障,轴承的故障如图3所示。

图3 轴承故障

电机的采样频率为2 K,轴承的转速为2000 r/min,采集故障信号数据的样本长度为2048,训练集和测试集的划分以及标签的分类如表1所示。

表1 实验样本结构

3.2 实验数据处理

本文的故障信号的长度为2048,为形象展示选取的不同故障信号,且使用离散小波变换对故障信号进行分解后的结果,选取了6类不同的标签样本分别绘制了未被离散小波分解的波形以及被离散小波分解成HH、HL、LH、LL四种不同信号后的波形图,图4~图9是原始振动信号以及对其进行离散小波分解成4种不同信号的结果。

图4 各种故障信号的波形图

图5 正常信号分解图

图6 内圈(0.2 mm)故障信号分解图

图7 外圈(0.2 mm)故障信号分解图

图8 滚珠(0.2 mm)故障信号分解图

图9 内圈(0.2 mm)+外圈(0.2 mm)故障信号分解图

从故障信号波形图中可以看出,不同的故障信号其波形图是不一样的。在提取的各个信号中,正常信号波形图的波形是非常平稳的,没有出现较大幅度的变化。单一故障中的三类故障信号在波形图上有相似的波形变化,但是外圈故障信号(0.2 mm)的波形变化明显,波动幅度较大;内圈故障信号(0.2 mm)波动幅度相对较小。选取的两类复合故障信号波形没有像单一故障那样出现很明显的变化,但是相较于正常信号的波形图,两类复合故障信号在波形图的一些相邻点出现了幅值差过大的情况。在选取信号的离散小波分解图中,正常信号的4类信号波形相似且比较平稳,内圈(0.2 mm)故障信号中的HH信号波形变化最明显,HL和LL信号相对平稳。外圈(0.2 mm)故障信号中HH信号波形变化较大,HL信号最为平稳。滚珠(0.2 mm)故障信号中HH信号波形变化最为明显,其次是LH信号,其余两类信号的波形也出现了不同程度的变化。在内圈(0.2 mm)+外圈(0.2 mm)的复合故障信号中,LH信号波形变化最为明显,集中在后半段。从图中可知,经过离散小波分解后,不同故障信号的特征是不同的,且能够被四类信号更好的表达。

3.3 模型参数结构

本文最先开始对原始信号进行了DWT分解,组成16×32×4的4通道输入样本,对输入样本进行训练的SDCNN的结构参数设置如表2所示。DSCNN分为9层,第一层的分离卷积卷积核个数为35个,大小为3×3,第一层的池化层的卷积核个数为35个,大小为2×2,池化层在降维的同时,不会过多的丢失信息。第二层的分离卷积和池化层的参数设置和第一层的相同。第三层的分离卷积卷积核个数为66个,大小为3×3,第三层的池化层卷积核个数为66个,大小为2×2,第四层的分离卷积和池化层的参数设置和第三层的相同。

表2 模型训练参数选择

在DSCNN训练的过程中,使用了adam函数进行优化,改善模型的收敛速度,学习率为0.001,并且为了防止过拟合,在全连接层前添加了dropout函数。训练网络中BatchSize设置为66,训练轮数为50,并且增加了Early-Stopping机制,在5个训练轮数内如果损失值不再明显降低,则停止训练。

3.4 实验结果及分析

本文对实验的数据集使用4种不同的方法来进行比较,每种方式重复做10次实验,然后取其平均值。在CNN模型中输入的是512维向量,从表中可以看出CNN的平均准确率为0.973 9,这是因为传统CNN在特征提取方面有所不足。SVM输入为手工提取3类特征的512维向量,平均准确率达到了0.968 5,这是因为SVM没有很好的挖掘数据的深层的信息,分类能力有限。相对比传统的CNN,DWT-DSCNN能够充分挖掘数据的特征,其次通过DSCNN模型的训连,能够减小模型运算的参数,轻量化模型,平均准确率达到了0.991 3。本文提出的DWT-DSCNN-SVM的平均准确率达到了0.998 5,这是因为除了利用了DWT和DSCNN的优点外,还结合了SVM的优秀分类能力,从而达到优秀的分类功能,达到了令人满意的结果。

表3 模型对比准确率

为了更好地描述本文模型的优越性,本文引入了分类报告来进一步说明该模型。如表4所示,10种故障标签的准确率都达到了1,充分说明了该模型的优越;在召回率指标上,除了标签4和9外,另外8种标签的值都达到了1,效果显著;F1指标除标签9外,其余都达到了1。

表4 不同指标下的值

4 结论

本文提出一种基于DWT-DSCNN-SVM的故障诊断方法,通过实验验证,该模型的诊断效果显著,同时,对比很多传统的故障诊断方法,该模型具有以下优点:

(1)通过离散小波分解,相较于传统的CNN直接将数据输入模型训练的方式,充分的挖掘了数据的特征。

(2)通过深度可分离神经网络,达到了预期的训练效果,并且达到轻量化整体训练结构的目的。

(3)为了达到更好的分类效果,在神经网络全连接层后添加了SVM分类器,该分类器经过验证,可以达到很好的分类效果,并且准确率相较于传统的分类模型提高了很多。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!