当前位置:首页 期刊杂志

基于支持向量数据描述的往复式注水泵健康度评价方法

时间:2024-07-28

王文明,张永鑫,侯春来,王禹琪,王海龙,李志伟

1 中国石油大学(北京) 机械与储运工程学院海洋油气智能装备实验室,北京 102249

2 长庆油田分公司第四采油厂,靖边 718500

0 引言

注水泵是油田注水作业工艺中的“心脏”设备,由于实际生产中注水压力需求较高,常采用柱塞式往复注水泵进行作业。然而,由于恶劣的工作环境,注水泵易损部件的故障率较高,容易出现轴瓦损坏、缸体与十字头磨损严重、电机烧损等问题,从而影响整个注水系统的平稳安全运行。针对上述问题,研究往复式注水泵的健康状态定量评估,及时发现设备故障状态,将为后续优化维修策略提供依据,对保障注水系统的安全运行具有重要意义。

往复式注水泵设备健康度评价流程主要分为数据采集、数据预处理和健康度计算3 部分。数据采集方面,由于体现注水泵健康状态的性能参数主要为机械零部件的振动信号,通常将振动信号作为注水泵的健康度评价指标。针对泵类设备的健康状态评价方法,目前主要以健康状态分类和故障诊断研究为主,对注水泵的健康程度量化的相关研究较少。国内学者如左学谦等[1]基于模糊层次分析法建立了柱塞泵的健康状态评估模型,成功应用于油田用柱塞泵的故障定位与健康状态分类,判断矩阵的选取主观性较强,导致在实际应用中自适应能力较弱;王前江等[2]使用经验模态分解(Empirical Mode Decomposition,EMD)对采集的信号进行降噪处理,提取信号特征指标后利用核熵成分分析实现了对离心泵的健康状态客观评价,EMD方法存在模态混叠和端点效应问题[3];魏晓良等[4]基于长短时记忆和卷积神经网络相结合的方法,实现了对高速柱塞泵的故障诊断,基于大数据的机器学习分类方法又需要大量设备运行数据,尤其是设备异常数据用于训练健康状态分类模型,但在实际生产工作中,大多数设备处于健康工作状态,故障数据较少,因此容易造成样本不均衡问题。国外学者如HANCOCK等[5]采用小波包分析方法对立式泵的振动信号进行分解,将包含泵正常和故障状态特征信号的数据包输入自适应神经模糊推理系统,实现了对泵的健康状态分类,但小波包分解中阈值和小波包基函数的选取对降噪结果影响较大,导致自适应能力不强;Lee等[6]利用卡尔曼滤波将液压齿轮泵的振动信号与压力信号进行融合,提取特征后利用长短时记忆神经网络成功对齿轮泵进行了健康指数分析及寿命预测,Orrù PF等[7]采集离心泵的温度、振动、压力信号,采用多层感知机与支持向量机相结合的方法,实现了对离心泵潜在故障的识别与分类,但这些方法同样需要大量故障数据进行训练机器学习模型,易造成样本不均衡的问题。

结合上述研究中存在的优点和问题,本文借鉴变分模态分解(Variational Mode Decomposition, VMD)与支持向量数据描述(Support Vector Data Description,SVDD)相结合的方法[8]。对往复式注水泵进行健康度评价计算,该方法在液压泵与火炮自动机的健康状态监测及评价中已取得较好的实际应用效果[9-10]。算法流程:利用VMD方法对注水泵的振动信号进行分解,提取模态分量的排列熵(Permutation Entropy,PE)组成注水泵健康度评价特征向量;采用SVDD在单值分类问题上的优势,仅使用健康状态运行下注水泵数据样本的特征向量进行SVDD超球体模型的构建,引入粒子群优化(Particle Swarm Optimization,PSO)算法对模型参数进行优化;计算注水泵不同健康状态的数据到超球体球心的距离D,参考隶属度函数进行公式拟合,实现注水泵的健康度定量评价。

1 算法简介

1.1 变分模态分解

VMD[11]是2014年出现的一种自适应信号分解方法,与经验模态分解法相比,VMD算法将最优分解问题转化为变分约束问题,可将信号分解为K个有限带宽且带有中心频率的本征模态函数(Band-Limited Intrinsic Mode Function,BIMF)分量,有效抑制了EMD算法中的模态混叠问题,具有较高的运算效率和抗噪能力。

为检验VMD算法相较于其他数据预处理方法的优势,从采集到的注水泵振动信号中随机截取100个数据点,然后分别利用EMD、集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)[12]、自适应噪声完备集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)[13]、VMD算法对截取的信号进行分解。将分解得到的BIMF分量用频谱图(图1)的形式展现,比较信号分解效果。观察图1 可以得出,相较于其他信号处理方法,VMD能更明显的将信号的不同频率成分分解到不同的BIMF分量中,而且有效抑制了模态混叠问题。

图1 信号处理方法BIMF分量频谱图Fig. 1 Spectrogram of BIMF component of each signal processing method

1.2 排列熵

熵值可体现出信号序列的复杂程度,当机械设备出现故障时,其振动信号的信息熵会发生改变,因此可以通过信息熵的变化间接判断出注水泵设备的健康状态变化情况。常见的信息熵有近似熵(Approximate Entropy, AE)[14]、 样本熵(Sample Entropy, SE)[15]、 模糊熵(Fuzzy Entropy,FE)[16]、 排列熵(Permutation Entropy,PE)[17]等。根据目前学者的研究[18],对比这几类信息熵,排列熵可有效反映非平稳信号随时间序列的微小变化,对实时的数据变化有很强的敏感性,具有计算量少、鲁棒性强、灵敏度高等优点,目前已广泛应用于机械设备故障诊断、健康状态监测等领域[19-20]。因此本文提取注水泵振动信号的排列熵构建特征向量,用于后续注水泵健康度评价的相关计算。

1.3 支持向量数据描述

支持向量数据描述[21]的核心思想是利用核函数对样本进行非线性映射,映射到高维的内积空间,在特征空间中寻找一个尽可能多地包含样本且体积最小的超球体(最优超球体),使用同样的映射算法将待测试数据集映射至高维空间,计算数据点到超球体中心的距离D,与超球体半径R相比较便可以判断其是否正常,如图2 所示。SVDD可以只对设备健康运行数据进行最优超球体模型的构建,同时将样本映射到高维空间也降低了不均衡数据中样本重叠的风险,因此相对于其他分类学习方法,SVDD分类精度更高。

图2 SVDD超球体示意图Fig. 2 Schematic diagram of SVDD hypersphere

1.4 粒子群优化算法

选择高斯核作为SVDD模型搭建过程的核函数,其关键参数为惩罚因子C和高斯核参数s,超球体的体积也主要由惩罚因子C和高斯核参数s决定[22]。惩罚因子C可以控制模型的复杂度,s不变时,随着C的增加,排除在超球体之外的样本受到的惩罚变重,对大样本数据的分类效果越差。高斯核参数s的大小影响支持向量的数量,当C不变时,s越小,支持向量越多,容易导致超球体模型过拟合。因此这2 个参数的选取对SVDD算法的准确率和鲁棒性有很大的影响。为了提高SVDD算法的性能,引入粒子群优化(PSO)算法对惩罚因子C和高斯核参数s进行优化。

PSO算法主要模拟鸟类觅食的迁移和聚集行为[23]。PSO优化SVDD参数的步骤[24]如下:

(1) 初始化

任意分配初始值给SVDD的惩罚因子C与核函数参数s。

(2) 评价适配度

用C和s表示的待优化的每个粒子来训练SVDD,并计算每个粒子的适配值F,计算公式为:

式中:y为测试样本的正确分类数;N为测试样本总数。

(3) 迭代更新

假设在一个n维空间中,种群X包含m个粒子,即X=[x1,x2, …,xm],那么第i个粒子的位置为xi=[xi1,xi2, …,xin],第i个粒子的历史最优位置为,速度为,群体的最佳位置。对于每个粒子,将C和s下的当前适配值与上一步得到的最佳历史适配值进行比较,如果当前的适配值优于历史最优适配值,则在每次迭代中更新粒子的历史最优值C和s,求解粒子速度和位置的公式为:

式中,i为粒子数;d为粒子维数;k为迭代次数;w为惯性权重;r1,r2为[0,1]之间的随机数;c1和c2为学习系数,c1代表粒子跟踪自身历史最优值的系数,c2代表当前粒子对全局最优粒子学习程度的系数。

(4) 迭代结束

设定最大迭代次数作为迭代终止条件,当达到最大迭代次数时输出SVDD参数最优解。

2 数据采集

2.1 往复式注水泵现场情况

长庆油田某注水泵房为往复式柱塞泵,注水压力需求较高,泵体内部振动无法避免。部分注水泵因安装及工艺布局问题振动较为明显,影响正常注水。因此需要对其注水泵进行振动监测,并进行健康度评价,从而能第一时间发现泵的异常状态,避免因不及时维修造成的严重损失。

选用3 台型号相同但健康状态不同的三缸柱塞泵为研究对象,其中第1 台为刚安装一个月的健康运行注水泵I,第2 台为运行半年、未发生过故障的健康状态注水泵Ⅱ,第3 台为振动严重以致更换为临时管线的健康状态较差的注水泵Ⅲ,主要参数如表1 所示。

表1 注水泵主要参数Table 1 Main parameters of injection pump

现场采集设备振动数据,分别进行健康度评价,与设备实际健康状态进行对比。注水泵现场图片如图3 所示。

图3 注水泵现场图片Fig. 3 On-site picture of injection pump

2.2 注水泵运行数据采集

(1)振动数据采集设备

选用压电式加速度传感器PCB 352C33,灵敏度为100 mVg,最高分辨率1 μg,同时选用美国NI(National Instruments)公司生产的NI 9234 型4 通道数据采集器进行传感器数据的采集,其模拟电压的采集范围为±5 V,最大采样率51.2 kS/s。根据采样定理,采样频率必须大于信号成分中最高频率的2 倍,本研究项目中采样频率设为1652 Hz。使用LabVIEW软件编程实现数据的可视化,测量系统及程序界面如图4 所示。

图4 采集设备展示Fig. 4 Collection equipment display

(2)测点布置

振动信号采集另一个关键是测点的布置。测点的选取原则是基于用尽量少的测点,采集到尽量多的设备运行信息。研究项目中振动测点均在机壳表面,每台注水泵有4 个测点,注水泵平面结构图如图5 所示,测点分别位于:泵阀入口、十字头部位、曲轴输入端、驱动电机输出端,分别对应图6 的1、2、3、4 标记点位置。

图5 注水泵平面结构Fig. 5 Plane structure of injection pump

图6 测点布置Fig. 6 Measuring point layout

各测点振动信号单次采样时间为10 s,每间隔10 min采样一次,采样5 次,则每台注水泵采集到20个样本,3 台注水泵共采集到60 个样本,每个样本中有约21 000 个数据点,利用这些样本数据进行后续的注水泵健康度分析。

3 数据预处理

采集的振动数据在进行VMD分解之前,首先需要确定分解层数K的取值。从健康注水泵I的4 个测点的数据样本中,每个测点随机抽取一个样本,从抽取的4 个样本中各截取1000 个数据点作为K值计算样本,分别使用依次增加的K值对其进行VMD分解,以泵阀处样本数据为例,不同分解层数K对应的各BIMF分量的归一化中心频率如表1 所示。相邻分量中心频率的差值越小,则越容易出现模态混叠(过分解)现象,观察表2 可知,当K值为6 时,第一次出现0.2657 Hz和0.2464 Hz这2 个相近的中心频率,即可认为发生了过分解,因此分解层数确立为5。

表2 泵阀待评价样本不同K值下的归一化中心频率Table 2 The normalized center frequency of the pump valve under different K values of the sample to be evaluated

将各测点样本数据按照确立的分解层数分解,并进行频谱分析得到图7。

图7 不同测点样本数据VMD分解及频谱分析Fig. 7 VMD decomposition and spectrum analysis of sample data at different measurement points

从图7 可以看出,VMD方法可以准确地将振动信号分解为从低频到高频的多个单分量模态信号,且各测点BIMF分量的中心频率没有发生混叠现象。按照同样的方法,经计算,十字头、曲轴、电机测点处数据的VMD分解层数K分别确立为4、5、3。

确定好各测点数据的分解层数后,再随机从注水泵I 4 个测点的数据样本中,每个测点各抽取1 个样本,然后将抽取的数据样本各截取20 000 个数据点,按每组1000 个数据平均分为20 组,共获得80 组数据作为注水泵健康度评价模型的数据基础。对每组数据按照各自位置确定的分解层数K值进行VMD分解,即每组泵阀处样本数据分解为5 个BIMF分量、每组十字头处样本数据分解为4 个BIMF分量、每组曲轴输入端处样本数据分解为5 个BIMF分量、每组电机输出端处样本数据分解为3 个BIMF分量,计算所有分量的排列熵,最后将每组分量的排列熵同样按照泵阀、十字头、曲轴、电机的顺序组合成17 维特征向量,作为健康注水泵I的特征向量,如表3 所示。

表3 各测点振动信号模态分量的排列熵值(部分)Table 3 Arrangement entropy of modal components of vibration signal at each measuring point (part)

4 健康度计算

4.1 健康度定量评估

基于1.3 和1.4 的算法理论,取上述健康注水泵I的特征向量作为训练样本,输入用Matlab搭建的PSO-SVDD算法程序构建超球体模型。训练样本经PSO-SVDD方法训练后得到优化后的惩罚因子C=0.7563,高斯核参数s=8,超球体模型的半径R=0.0413。超球体模型搭建完毕,再从注水泵I、注水泵Ⅱ及注水泵Ⅲ的各测点数据样本中各随机抽取一个样本,按照上述注水泵I特征向量的构建方法构建测试样本特征向量。最后将测试样本特征向量输入搭建的超球体模型中,通过欧氏距离法[25]得到各个样本点到超球体球心的距离D如图8 所示。

图8 不同样本点到超球体球心距离Fig. 8 Distances from different sample points to the center of the hypersphere

由图8 可知,注水泵I、注水泵Ⅱ的测试样本数据中,绝大部分到超球体球心的距离D小于超球体半径R,即数据点在超球体内部,说明注水泵处于健康状态。而对于健康状态较差的注水泵Ⅲ,其所有样本数据到超球体球心的距离D均大于超球体半径,即数据点均在超球体外部,说明注水泵Ⅲ的运行状态与健康状态注水泵相比产生了较大偏差,健康状态较差。计算结果与现场注水泵的实际健康状态相符,证明了算法的可靠性。

为进一步对注水泵的健康状态进行定量评估,引入变形后的隶属度函数[26]将注水泵样本数据距离超球体球心的距离D转换为健康度H。根据样本数据距离超球体球心的距离越大,则注水泵健康状态越差的特点,设置当D小于R时,用二次项公式拟合H与R的线性关系,且满足D=R时,健康度约为90 分;当D>R时,用变形后的降半柯西型公式进行拟合,并满足拐点处健康度约为60 分,基于上述条件拟合公式确立为:

将此拟合公式用于定量评估注水泵健康度,得到2 台测试用注水泵的健康度评价曲线如图9 所示。

图9 注水泵健康度评价结果Fig. 9 Health evaluation results of water injection pump

从图9 中可以看出,注水泵I和注水泵Ⅱ健康度分值基本在90 分以上,总体上说明两泵均处于健康状态;而注水泵Ⅲ健康度分值普遍在70 分左右,说明健康状态较差,与实际情况相符,证明了定量评估健康度算法的可靠性。

4.2 算法对比

为验证PSO-SVDD相较于其他方法优化模型的准确性,采用与上文相同的注水泵训练样本数据,利用五折交叉验证法,将训练样本数据平均分为5 组,每次选取4 组数据作为训练集,剩余1 组作为测试集,轮流选取5 次,每次都将训练集分别利用单SVDD方法、贝叶斯优化(Bayesian Optimization Algorithm,BOA)[27]SVDD(BOA-SVDD)方法、遗传算法(Genetic Algorithm,GA)[28]优 化SVDD(GA-SVDD)方 法 及PSO-SVDD方法进行超球体模型的搭建,将测试集输入超球体模型,计算测试集数据映射后落在超球体内部的比率,作为模型的准确率,最后分别将5 次的准确率取平均值,得到每个算法的综合准确率。其中单SVDD方法根据经验手动调参,最终设置惩罚因子C=0.3,高斯核参数s=5。计算结果对比如表4 所示。

表4 各算法计算结果对比Table 4 Comparison of calculation results of various algorithms

由表4 数据可得,使用不同算法优化参数后得到的高斯核参数s几乎相同,此时BOA-SVDD、GASVDD和PSO-SVDD这3 种方法的惩罚因子C依次减小,得到SVDD模型的准确率依次提升,验证了前文所述研究结果:即当s不变时,随着C的增加,对样本数据的分类效果越差,建立的模型准确率也越低。PSO-SVDD准确率为95%,相比于其他3 种评价方法的准确率分别提高了15%、10%和10%,准确率最高,证明更适合应用于对注水泵设备的健康度评价。

5 结论

本文结合VMD与PSO-SVDD方法对实际工程中的注水泵进行了健康度评价研究。该评价方法结合了VMD和SVDD算法的优点,同时考虑了健康度定量评估的准确性和真实性,主要结论如下:

(1)利用VMD对数据集进行变分模态分解,相比EMD等算法,可有效抑制模态混叠现象。计算模态分量的排列熵组成特征向量,保留注水泵健康状态特征的同时,极大提高了计算效率。

(2)建立了一套可用于对注水泵进行健康度定量评价的方法流程,该方法无需大量设备故障数据,仅利用健康状态注水泵的各测点振动数据,便可建立健康度评价算法模型。

(3)将健康状态不同注水泵的特征向量数据输入到搭建好的健康度算法模型中测试,然后将测试结果与注水泵的实际健康状态进行对比,得出所提出的健康度评价方法能够真实有效地对注水泵的健康度进行定量评估。

(4)对比了单SVDD、BOA-SVDD、GA-SVDD与PSO-SVDD方法的准确率,结果表明PSO-SVDD方法的准确性最高,进一步验证了该方法的实用性。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!