当前位置:首页 期刊杂志

一种应用于不均衡小样本集的石化设备故障智能诊断方法*

时间:2024-07-28

袁 壮

(中国石化青岛安全工程研究院化学品安全控制国家重点实验室,山东青岛 266104)

0 前言

故障诊断能有效检测、识别和预示连续运行设备的状态,避免故障带来的伤亡或损失。随着石化设备的大型化、复杂化和信息化,非线性和不确定性激增,难以建立解析模型以辨识和定位异常。构建诊断规则库所需的专业知识也更为高深,存在获取和表达瓶颈;此外,设备时刻产生大量反映其运行状态的监测数据,如何利用这些数据满足日益提升的可靠性需求成为亟待解决的新课题。

智能诊断从正常和故障数据出发,运用机器学习建立测量特征与故障模式之间的映射模型,实现更加精准和智能的模式识别。常用的机器学习算法,如BP神经网络(Back Propagation Neural Network, BPNN)、支持向量机(Support Vector Machine, SVM)和深度神经网络(Deep Neural Network, DNN)等均有不俗效果。

上述算法的优异性能多建立在可用故障样本充足的基础上。而实际工业环境中,设备长期正常运行,故障频次较低,加之样本标注代价高昂,致使监测数据呈现出小样本不均衡特性。受制于有限的标签样本,模型训练不足,泛化能力有限,无法辨识极少样本或没有样本的故障。因此,智能诊断多在模拟实验下开展,工程应用较少,且面临准确率低、漏报误报等难题。针对小样本困境,部分学者引入迁移学习:沈飞等构造迁移分类器,用于变转速、变负载的电机故障诊断;陈超等基于辅助集提出样本不足时的迁移诊断算法;基于深度迁移网络的跨工况诊断也在轴承和齿轮箱上加以验证。上述研究提升了故障样本和诊断知识的复用性,但大多局限于同一设备不同运行工况间的迁移,并假定某一工况下的可用样本充足,与实际不符。此外,半监督学习利用少量有标签样本和大量无标签样本联合建模,也适合小样本问题,但要求无标签样本含有大量故障数据,当其仍以正常数据为主时,效果有限。

SVM适用于高维数、小样本场景下的模式识别,且易于建模,基于遗传算法(Genetic Algorithm, GA)优化的GA-SVM已广泛应用。此外,其拓展One-Class SVM更是仅需正常数据便能构建模型,辨识异常。因此,面向实际工程场景,基于One-Class SVM和GA-SVM,提出应用于小样本不均衡数据集的分步诊断策略One-Class & GA-SVM。首先,基于正常样本,运用One-Class SVM构建超球模型,实现零先例异常辨识;然后,基于已知故障样本,运用相同的方式甄别复现故障和未知故障;最后,对于复现故障,运用GA-SVM诊断故障原因,对于未知故障,则由专家进行诊断和标注,并加入样本集,将未知故障转变为复现故障。该方法能在无任何故障数据的情况下开展增量学习,完善故障模式,提升诊断精度。滚动轴承和往复压缩机气阀的故障诊断实验证明了其有效性。

1 背景知识

1.1 小样本不均衡问题

小样本不均衡是指正常样本易获取,占数据集绝大多数;而故障样本难获取,只占极小比例。出现这种问题的原因有:①故障数据获取难。虽然积累有海量历史数据,但设备大部分时期正常运行,故障并不常见,且工业生产不允许设备带病运行,可采集数据的时间窗也不长,造成监测数据重复度高,典型故障信息缺失。②故障数据标注难。仅有的异常样本中,故障模式明确且已知的又只占少数,大部分是未知的。从繁复的参数变化和隐晦的异常征兆中锁定故障原因,依赖丰富的专家经验,甚至需专家会诊乃至停车自检,代价高昂。③故障数据复用难。受生产环境、运行工况等因素的影响,监测数据的分布规律高度个性化,某一设备、某一工况下积累的样本、训练的模型很难适用于其他设备或工况,加剧了故障样本的匮乏。

上述问题会导致模式识别侧重样本较多类别,轻视样本较少类别。具体而言,诊断模型会倾向于判断设备正常,漏报潜在故障。

1.2 一类支持向量机

One-Class SVM通过非线性核函数

K

将单一类别(定义为正常,其它所有类别统称为异常)样本集{

x

,

i

=1,2,…,

M

}

x

R

映射到高维特征空间

H

中,计算一个包含尽可能多样本的最小超球体作决策边界,即一个描述样本密度分布的二值模型。

(1)

式中:

S

——正常样本;

S

’——异常样本。如图1所示,One-Class SVM仅需正常样本便能确定球心

a

和半径

R

,并在正确区分正常样本与异常样本的基础上,使半径

R

尽可能小,将其转化为求解凸优化问题:

图1 基于One-Class SVM的超球模型

s

.

t

.(

x

-

a

)(

x

-

a

)

R

+

σ

σ

≥0,1,…,

N

(2)

式中:

σ

>0——超球外异常点,即

x

S

′。

定义Lagrange函数:

(3)

式中:

C

——惩罚系数;

σ

——松弛变量;

α

≥0,

γ

≥0——Lagrange系数。对

R

α

求偏微分,并令其为0:

(4)

引入高斯径向基核函数(

x

,

y

)→

K

(

x

,

y

),即:

(5)

其相应的优化方程为:

(6)

根据KKT(Karush-Kuhn-Tucker)条件,大部分

α

=0,小部分

α

>0,其对应样本点决定超球边界,即支持向量。对于待识别样本点

y

,其到球心的距离平方为:

(7)

设任一支持向量

x

,球体半径的平方为:

R

=

K

(

x

,

x

)-

(8)

则定义判据

RC

=

f

(

y

)/

R

以判断

y

所属类别:

(9)

2 诊断方法与流程

2.1 零先例异常辨识

将设备正常运行视为一类,将其他所有已知或未知的故障视为另一类,统称为异常状态。振动监测信号在不同频段的动态能量分布能够有效反映设备状态的变化。因此,对正常状态下的振动信号进行db4小波分解,提取分解后的前5层频带能量值作为特征,训练One-Class SVM超球模型,在无任何故障数据的前提下,检测设备对正常状态的偏离,可实现零先例异常辨识。

2.2 未知故障甄别

传统方法假设训练模型的故障模式库能够描述设备运行的所有状态,但实际工程中,存在大量无历史数据的未知故障,模型会将其强行归类为已知故障的一种,造成漏诊或误诊。因此,识别异常后需先对潜在的未知故障进行甄别。

将存在历史样本的复现故障视为“正常”,其他所有未知故障视为异常。基于历史故障样本,除5层频带能量外进一步提取32维统计特征,训练One-Class SVM超球模型,甄别未知故障。特征组成如表1所示,1~14为时域特征,15~22为频域特征,23~37为时频域特征。

表1 振动信号的故障特征组成

2.3 故障根原因诊断

对于复现故障,基于历史故障数据,通过GA-SVM建立最优诊断模型,分析故障根原因;对于未知故障,则邀请专家进行人工诊断和样本标注,并加入已知故障模式库以重新训练GA-SVM,将未知故障转变为复现故障,实现动态增量学习。

2.4 故障诊断流程

故障诊断流程如图2所示,具体步骤如下。

图2 应用于小样本不均衡数据集的故障诊断方法

a)离线阶段:①异常辨识建模:运用设备正常数据,提取5维小波频带能量,建立基于One-Class SVM的异常辨识模型;②未知故障甄别:运用所有可用的历史故障样本,提取37维故障特征,建立基于One-Class SVM的未知故障甄别模型;③故障诊断建模:运用37维故障特征,建立基于GA-SVM的复现故障诊断模型。

b)在线阶段:①状态监测:对设备进行实时振动监测,提取5维小波频带能量;②异常辨识:将能量特征输入异常辨识模型,若设备正常,则等待下一次检测;若设备异常,则进入步骤③;③故障诊断:提取异常振动信号的37维故障特征,输入未知故障甄别模型。若为复现故障,则将特征输入故障诊断模型,判断故障根原因;若为未知故障,则由专家分析标注后加入故障模式库。

3 应用与分析

3.1 评判标准

准确率常用于评判诊断模型性能,但对于不均衡样本而言并不适用。例如,数据集中有99个正常样本和1个故障样本,若将所有样本均预测为正常,准确率高达99%,但并无实际意义。为全面衡量诊断效果,提出若干项评判指标,如表2所示。

表2 故障诊断效果评判指标

表2中,重要度越大,则该事件潜在后果越严重。例如,漏报会导致设备异常的持续发展,引起非计划停机乃至安全事故,危害最大;误报则会中断原有的正常生产,造成经济损失,危害次之;误诊会使原有维修方案失效,延长维修时间,危害较小。因此,上述3个指标越小诊断性能越优异。

3.2 实验数据验证

3.2.1

数据说明与任务

采用美国凯斯西储大学滚动轴承故障数据集,如图3所示。轴承位于电机驱动端,转速1 797 r/min,振动信号采样频率12 kHz。设正常、内圈故障、滚动体故障和外圈故障等4类状态,每类故障又包含0.18,0.36,0.53 mm 3种损伤直径,设0.53 mm的外圈故障为未知故障,其余8种为复现故障。训练集与测试集设置详见表3,样本不均衡比为正常(800)∶故障(8×5)=20∶1,样本长度为1 024。

表3 滚动轴承故障数据说明

图3 轴承故障测试装置

3.2.2

诊断模型与对比

除One-Class & GA-SVM外,一些常用模型也采用上述数据开展诊断任务以进行对比验证,包括BPNN、堆栈降噪自编码器(Stacked Denoising Auto-encoder, SDA)和GA-SVM,其参数详见表4。

表4中,BPNN和SDA分别是浅层网络和深度学习的代表方法。其中,SDA具有强大的特征学习能力,因此将振动信号的单边频率幅值(长度512)作为输入,以挖掘深度故障特征。GA-SVM则在参数设置不变的前提下被独立出来,用于验证One-Class SVM和所提出诊断结构的有效性。

表4 诊断模型及参数设置

3.2.3

诊断结果与分析

One-Class SVM超球诊断模型的二维投影如图4所示。蓝色和红色椭圆分别为异常辨识模型和未知故障甄别模型的边界投影,其能有效区分正常状态、复现故障以及未知故障,且无需历史标签样本。绿色圆圈为选取的支持向量,用以在高维空间中确定超球边界或最优超平面,其数量随训练样本多少而自动调整,受标签样本数量的制约较少。

图4 轴承故障超球诊断模型的二维投影

实验结果如表5所示,对比分析得出如下结论。

表5 各诊断模型的性能评估(轴承) %

a)漏报率方面,除提出方法外其余模型均出现不同程度的漏报。原因在于,实验数据集的不均衡比高达20∶1,致使模型向占据样本绝大多数的正常状态偏移,难以对数量稀少的故障样本建立精准的辨识条件。

b)误报率方面,除BPNN外其余模型均能有效识别正常状态,未出现误报。但值得注意的是,这同样建立在正常样本充足、其辨识条件得到充分训练的基础上。

综合以上分析可知,在故障样本严重不足的前提下,传统模型训练所用的正常样本较多,不均衡比上升,可能造成漏报;所用正常样本较少,不均衡比下降,又存在误报风险。而所提出的分步辨识结构,充分利用正常数据以完善正常状态的超球模型,最大程度地明确异常界限,能够同步消除漏报和误报问题。

c)误诊率方面,BPNN和SDA的误诊率高达75%,GA-SVM也有30%。传统模型误诊如此严重是因为:一方面,设有4组未知故障,不存在与之对应的历史样本,传统模型将其强行归类为已知状态,必然误诊;另一方面,每类故障只有5组训练样本,且同一故障模式的不同损伤程度间存在特征相似性,加剧了诊断难度。

d)总准确率方面,One-Class & GA-SVM的准确率高达99%,GA-SVM也有94%,远超BPNN和SDA,表明SVM在不均衡数据集上表现更佳。此外,将每类状态的测试样本数量固定为20组,逐步减少训练样本数量,模拟标签样本匮乏的场景,测试各模型在小样本集上的性能,结果详见图5。

图5 小样本故障诊断正确率

将训练样本与测试样本的数量比定义为小样本比例。如图5所示,随着训练样本的减少,3种模型的性能均有所下降。其中,GA-SVM最为稳定,在小样本比为0.3∶1时,仍有98.75%的高准确率,即使最恶劣的0.1∶1场景,即只有2组训练样本,准确率也达90.63%;BPNN表现次之,小样本比0.1∶1时测试准确率为64%;SDA效果最差,最恶劣场景下只能识别34.38%的样本。因为SDA等深度模型的网络结构更复杂,所需训练样本更多。因此,当样本不足时,模型训练不完善,诊断性能大幅下降。而SVM则搜寻少量的支持向量以确定最优超平面,受样本数量的制约较小,更适合小样本场景。

3.3 工程数据验证

3.3.1

数据说明与任务

采用现场数据验证提出方法的工程适用性。诊断对象为西部油田某作业区的高压气原料压缩机,有4个压缩气缸,转速993 r/min。由于机组老化,排气阀故障频发。如图6所示,采集第2气缸排气阀阀盖处振动信号,采样频率16 kHz,共有气阀正常、阀片断裂、阀片磨损和弹簧失效等4种状态。具体设置如表6所示,样本不均衡比为正常(400)∶故障(10×2)=20∶1,样本长度为1 024。

图6 往复压缩机气阀振动监测

表6 滚往复压缩机气阀故障数据

3.3.2

诊断结果与分析

模型设置和对比方法与3.2.2节一致,相应超球诊断模型如图7所示。图7中,不同状态的样本均得到了正确辨识。与图4相比,由于正常状态和复现故障的样本数量下降,One-Class SVM选取的支持向量也适当减少,但仍能有效确定超球边界。实验结果如表7所示,One-Class & GA-SVM在各项评判指标中均显著优于对比方法,取得了100%的诊断正确率,无漏报、误报及误诊现象,表明所提方法更能适应实际工业生产中,正常样本众多、故障样本稀少、数据重复度高且极端不均衡的复杂环境。

表7 各诊断模型的性能评估(压缩机气阀) %

图7 往复压缩机气阀故障超球诊断模型的二维投影

4 结论

面向实际工程场景,提出一种适用于小样本不均衡数据集的故障分步诊断策略。经实验验证得到如下结论。

a)基于One-Class SVM构建超球诊断模型,能够在没有任何先例样本的条件下实现异常状态辨识和未知故障甄别。实验结果表明,其能显著降低诊断模型的漏报率、误报率和误诊率,提升算法对复杂工程环境的适应性。

b)所提出的One-Class & GA-SVM在小样本不均衡数据集上取得了优异的模式识别效果,在不均衡比20∶1的实验和工程数据上,分别取得了99%和100%的准确率,在小样本比0.1∶1的场景下也有90%以上的准确率。

所提方法仍有诸多不足,如未知故障仍需人工判断其所属类型,可考虑通过特征相似度开展研究。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!