当前位置:首页 期刊杂志

基于MPA 优化MKL-FSVDD 模型的聚合釜设备故障诊断①

时间:2024-05-22

李国友 才士文 李东朔 张新魁 贾曜宇 宁 泽

(*燕山大学智能控制系统与智能装备教育部工程研究中心 秦皇岛066004)

(**电子科技大学光电科学与工程学院 成都611731)

0 引言

化工生产流程通常为非流水型、不透明的状态,聚氯乙烯(polyvinyl chloride,PVC)生产过程是一个传质、传热的复杂化学工艺过程,其中聚合釜故障是导致聚氯乙烯产品质量下降的主要原因之一。工业生产过程中聚合釜设备会产生大量高维数据,工作人员通过数据进行间接观察[1-2],不仅加大了故障诊断难度,而且诊断效果并不理想。相比简单系统的解析模型,利用数据驱动模型,解决化工流程工艺中复杂故障数据特征不易区分问题的优势显而易见[3-5]。

国内外针对聚合釜设备的故障诊断研究,早期是使用神经网络的方法[6]。为满足PVC 生产过程中聚合釜故障实时诊断和优化监测的要求,文献[7]提出惯性权值动态调整粒子群优化算法优化自组织映射(self-organizing map,SOM)神经网络结构参数的故障诊断策略,结合聚合釜的工业现场历史数据的仿真,证明其有效性。针对复杂化工生产过程中的检测异常和故障诊断,文献[8]提出过程拓扑卷积网络模型,减小对训练数据量和计算资源的依赖,提高了故障诊断的准确率。但由于神经网络模型训练过程需要大规模样本数据集支撑的要求,其应用场合受到很多局限[9],相关学者相继引入支持向量机(support vector machine,SVM)[10]和支持向量机数据描述(support vector data description,SVDD)[11-12]的机器学习算法,并以此为基础不断完善发展。我国故障诊断研究起步晚,但发展比较快,故障诊断技术在化工流程工业领域的研究与应用都取得了一定的成效。文献[13]采用改进布谷鸟算法优化支持向量机,进行聚合釜故障诊断的仿真研究,提高了PVC 聚合过程中聚合釜故障的诊断率和预测率。文献[14]针对聚合釜聚合过程故障特点和生产过程的非线性、动态性特征,提出基于动态核主元分析(dynamic kernel principal component analysis,DKPCA)的故障诊断算法,以利于实际PVC 聚合生产过程的故障监测。

由于传统经典算法默认为输入的每个训练样本以同等机会属于其所在类,存在忽略实际工艺流程过程中不同训练样本对于其所属类的置信程度不同[15-16],这使得模型出现在噪声干扰下分类效果不佳的问题。文献[17]结合模糊理论思想,在SVDD的基础上,为每个样本确立一个隶属度,提出模糊支持向量数据描述(fuzzy support vector data description,FSVDD)算法,算法能够描述数据样本的重要程度,处理噪声敏感问题。但是FSVDD 依然存在SVDD 在模型训练过程中核函数核参数的选择难题[18]。文献[19]利用banana 数据集仿真验证了多核分类器的数据描述能力明显优于任何一个单核分类器,能够获得比较理想的分类精度。考虑分类器训练准确率受其给定参数值的影响较大的问题,通过元启发式参数寻优算法对分类器参数进行优化,以有效提高故障诊断的效率和准确率。文献[20]于2020 年开发了一种元启发式海洋捕食者算法(marine predators algorithm,MPA),在工程基准测试中,通过对比实验证明了MPA 相比于其他元启发式算法更好的寻优性能,且计算成本较低。文献[21]将MPA 与SVM 结合对滚动轴承故障进行类型识别,可以得到较好的诊断效果同时避免模型陷入局部最优,表明了寻优算法对分类器参数优化的良好应用。

综上,本文构建了一种基于海洋捕食者算法优化多核学习(multiple kernel learning,MKL)-模糊支持向量机数据描述MPA-MKL-FSVDD 故障数据分类模型,可有效应用于PVC 聚合反应聚合釜设备的工业数据的故障诊断,减小PVC 聚合釜设备故障诊断难度,并实现保证聚合反应安全生产质量的目的。

本文主要进行了以下工作。

(1) 为减小野点对分类边界影响、避免过拟合情况,运用基于距离的模糊隶属度函数确定训练样本的模糊隶属度,构造FSVDD 模型。

(2) 为充分利用复杂样本数据集的特征信息,采用线性加权方式,构造多核学习函数,通过核权重系数计算获得组合核,弥补单核函数描述数据信息特征的局限性。

(3) 针对故障诊断模型核参数选择问题,采用MPA 智能搜索算法明确寻找模型最优参数,提高模型寻优精度和故障诊断效率,同时避免陷入局部最优。

(4) 利用田纳西-伊斯曼(TE)数据集和PVC 聚合反应聚合釜设备工业历史数据集进行故障诊断的实验仿真,对比故障诊断效果,以验证MPA-MKLFSVDD 分类模型的故障诊断性能。

1 MPA-MKL-FSVDD 算法介绍

1.1 FSVDD 算法基本原理

FSVDD 模型继承了SVDD 模型的无需考虑数据是否符合高斯分布、计算复杂度低、约束条件简单、鲁棒性强、泛化能力良好等优点[22],在标准SVDD 模型的基础上,通过引入模糊系数,以隶属度的形式报告每个样本的值,对异常点赋予较低的隶属度值,减小野点对模型过拟合的影响,解决了SVDD 对噪声数据敏感问题和大规模数据分类处理能力欠佳的问题,提高模型的鲁棒性[23]。

设目标数据XN×dim={x1,x2,…,xN},N为样本个数,dim为样本维度。FSVDD 将目标数据T封装在一个半径为R、中心为a的超球面中。对样本形成的特征向量为

加入模糊系数si的支持向量数据描述的优化问题可表示为

其中,i=1,2,…,N,N为样本个数;松弛因子ξi≥0;si(σ <si <1,σ >0),si在一定程度上减小了ξi影响,代入拉格朗日因子αi、βi,对构成的拉格朗日函数求极值:

其中,αi≥0,βi≥0。

对R、a、ξi偏微分求导,有:

对式(4)、式(5)优化,设定i=1,2,…,N;j=1,2,…,N,将超球体问题转为对偶形式,即:

将高维特征空间内积运算转化为核函数运算:

根据KKT 条件,对所有满足0 ≤αi≤C的支持向量样本xsv,可得超球体半径为

测试样本z在特征空间中离球心a的距离为

由式(11)和式(12)可知,通过比较样本点到球心a的距离与超球体半径R的大小关系,可以判断样本点是否属于目标类。因此,FSVDD 模型选用基于距离的模糊隶属度函数计算模糊隶属度值,来描述样本点属于目标类别的可能性。

通过选定的隶属度函数给每个样本赋予权重量,降低噪声或离群点对最优决策球面的影响。本文采用降半高斯函数作为隶属度函数[24],计算样本对应隶属度为

其中R*为类半径值,设定带宽φ=0.2R*;隶属度越大,表示样本点距离中心的距离越近,即属于目标样本的可能性越大,反之,属于野点的可能性越大。

1.2 多核学习算法

针对化工生产过程中工业数据具有的复杂非线性和动态性特点,故障诊断算法对数据描述能力的强弱,直接影响故障诊断效果。因核函数的选择与数据信息特征密切相关,故选择合适的核函数核参数,实现算法对数据的描述能力的增强,对保障分类器性能具有重要意义[25]。

对FSVDD 模型利用多核学习算法,通过调整权重将各特征的最优核函数组合[26],将核选择问题转化为选择组合系数的算法[27]。这样既可以针对非线性关系的数据选择合适的单一核函数,又可以针对既存在线性关系又存在非线性关系的复杂数据集选用多个基本核的组合代替单核,具有更强的适应性。

鉴于多项式核函数良好的全局性能和高斯核函数较强的局部性能,二者结合用以构建混合核函数分类模型。

多核矩阵K=Kij,i=1,2,…,N,j=1,2,…,N;核矩阵中的元素Kij为

其中,m为权值,p为多项式次幂数,σ为高斯核参数,组合的多核函数由权值矩阵调节。

1.3 海洋捕食者算法基本原理

为进一步提高分类准确率、提高分类效率,多核学习优化的FSVDD 可以进一步利用寻优算法寻找核函数的最优参数组合,提高模型训练速度;并且可以通过对数据的不断学习,修正权重系数保证诊断精度[26]。2020 年Faramarzi 等人[20]开发的一种自然启发式优化算法——海洋捕食者算法(MPA)遵循在最佳觅食策略中自然支配的规则,Le'vy 和布朗运动作为海洋捕食者选择的两种最佳觅食策略,同时具备全局和局部搜索的能力,拓宽了MPA 算法解决优化问题的应用范围[28-30]。

MPA 的算法步骤如下。

步骤1初始化。

MPA 种群的随机初始化如下:

步骤2探索顶级捕食者。

首先,最适的解被指定为顶级捕食者,构建Elite矩阵,矩阵的数组根据猎物的位置信息监视猎物的搜寻和发现:

其次,种群排列在Prey猎物矩阵的矩阵中,捕食者根据Prey矩阵更新自己的位置,最适者(捕食者)构建Elite矩阵。

其中,Xi,j代表第i个猎物的第j位,整个优化过程主要与Elite、Prey两个矩阵直接相关。

步骤3Le'vy 飞行运动和布朗运动。

猎物和捕食者的位置根据猎物和捕食者的速度比分为3 个阶段进行更新。

阶段1 为算法的探索阶段,采用高速比。猎物和捕食者根据布朗运动进行更新,布朗运动用数学表示为

式中,T和Tmax分别为当前迭代次数和最大迭代次数;是一个基于正态分布表示布朗运动的包含随机数的矢量;是步长向量,P是等于0.5 的常数。

阶段2 为间歇阶段,当捕食者的速度等于猎物的速度时,种群被分为两组。

第一组用于开发,另一组用于勘探,可以表示为如下所述。

(1) 开发组

(2) 勘探组

阶段3 为开发阶段,优化过程的最后迭代中,在低速比(v=0.1)下,捕食者的最佳策略为Le'vy。在低速比或当捕食者比猎物移动得快时应用此阶段:在Elite位置中增加步长模拟捕食者的移动,帮助更新猎物的位置。

步骤4Eddy 形成和FADs 效应。

其中,r是0~1 范围内的随机值;r1 和r2 代表猎物矩阵的随机指标;FADs表示FADs概率,等于0.2;是一个二进制向量。

步骤5海洋记忆。每更新捕食者位置和完成FADs 效应后,计算相应适应度,与前一次迭代中的解进行比较,选择最优适应度位置作为顶级捕食者位置。

步骤6重复步骤3~步骤5,直到满足终止条件,输出顶级捕食者位置坐标,以获得最优解。

海洋捕食者算法探索流程如图1 所示。

图1 MPA 寻优流程图

2 MPA-MKL-FSVDD 集成算法

MPA-MKL-FSVDD 集成算法采用离线训练、在线测试的工作模式。如图2 所示,具体步骤如下。

图2 基于数据的故障分类模型流程图

(1) 离线建模阶段

步骤1选取正常工况数据集和故障情况数据集组成训练集样本。

步骤2对数据进行标准化处理,FSVDD 引入MKL确定核函数,采用MPA对FSVDD的多核函数寻优核参数,构建训练过程的故障诊断MPA-MKLFSVDD 模型。

步骤3数据样本在模型中迭代更新参数,达到最佳适应度终止,获得判断是否为目标类样本的model 参数。

(2)在线测试阶段

步骤1选取正常工况数据集和故障情况数据集组成测试集样本。

步骤2对数据进行标准化,根据离线建模阶段步骤3 所得model 参数赋值测试模型,同时计算测试样本在超球半径空间的样本距离f(z)。

步骤3将f(z) 与最优超球体半径R*相比较,对数据集进行故障诊断,判断是否为目标类样本。

3 MPA-MKL-FSVDD 算法验证

实验仿真在仿真软件上进行,硬件配置处理器为Intel(R) Core(TM) i5-5200H CPU@2.20 GHz,Win10 64 位计算机。

3.1 田纳西-伊斯曼平台数据集选取

为验证本文所提算法性能,对MPA-MKL-FSVDD 故障诊断模型进行仿真实验,并将结果与MKL-FSVDD、FSVDD 和SVDD 模型进行比较。选用田纳西-伊斯曼(TE)仿真平台过程数据集,该数据集中训练样本和测试样本分别包含20 种故障工况和1 种正常工况数据,每个样本信号包含41 个测量变量和11 个控制变量,在化工过程的故障诊断领域,是一个相对认可的公开数据集资源。与TE 过程中的其他故障相比,反应器单元中故障7(反应器压力)相对正常状态的可分性较低[31],故障9(反应器温度)对测量和操作变量的影响很小[32],难以进行检测分类。鉴于需要对FSVDD 对噪声处理能力和MKL 描述数据特征效果进行验证,本案例研究选择了故障7 和故障9 测试集数据,两故障分别除去样本在8 h 前的160 个正常数据,余下800 组故障样本构成故障数据集,定义故障7 为标签+1、故障9 为标签-1。

3.2 FSVDD 噪声数据的处理

FSVDD 模型利用模糊系数si对训练样本赋予一个权重,降低噪声或离群点对最优决策球面的影响。FSVDD 模型训练建立故障诊断检测分类模型,需要目标类样本建立样本库[31],示例将选取故障7和故障9 两类样本各200,样本标签+1 作为目标样本,借助点到中心的距离计算样本模糊隶属度。样本对应模糊隶属度越大,表示样本点为目标样本的可能性越大,而对隶属度非常小的样本视为野点。

将FSVDD 对目标样本的决策边界曲线可视化处理,如图3(a)所示,其中菱形◇为在决策边界曲线上的支持向量;星形☆为避免过拟合而忽略的支持向量;圆点○为训练样本中判断为目标类的样本;方块□为非目标类样本。根据基于距离的模糊隶属度函数得到的模糊系数,反映出的是隶属度值大小,由式(14)可知,当时该样本点属于目标样本;当时,此时隶属度小于0.05,将此类样本点视作野点剔除,对分类面的影响几乎可以忽略不计,但是可以提高分类速度。可视化处理将隶属度值映射成等高线式图,如图3(b)所示,以形成的目标类超球体球心(标值0.8 等高线包围的中心位置)为球心,自球心向外周,隶属度值逐渐减小,标值1.15 等高线圈外的区域表示隶属度小于0.05 的样本所在的区域,即为避免模型过拟合而忽略的野点落于此范围。综上,由FSVDD 模型分类可视化图对目标类样本决策边界的分类拟合效果,可知FSVDD 模型在避免模型过拟合、有效处理噪声数据方面的可行性。

图3 FSVDD 模型分类可视化图

3.3 FSVDD 决策边界的MKL 优化

MKL-FSVDD 模型训练过程寻求一种使外围球在核空间中半径最小的核组合。为验证模型应用性能,本示例随机选取数据集中两个属性生成一个2D的目标类,对算法的分类性能进行了可视化展示。FSVDD 模型在加入多核学习函数后,随着核权重在多项式核和高斯核间的比重不断修正,决策边界表现出寻优过程的训练效果如图4 所示。由MKL-FSVDD 边界支持向量的决策曲线可视化效果图可以观察出,MKL 的引入使得模型对目标类形成拟合比较精准的决策边界,相对于单核FSVDD 模型,可以获得更好的分类效果,验证了MKL-FSVDD 模型数据分类的有效性。

图4 MKL-FSVDD 模型边界决策曲线修正过程可视化图

3.4 MPA-MKL-FSVDD 实验及分析

为验证MPA-MKL-FSVDD 故障诊断的能力,利用故障7 和故障9 数据样本,通过与MKL-FSVDD、单核FSVDD、SVDD 模型的对照实验,验证MPAMKL-FSVDD 模型故障诊断的效率、准确性以及抗噪能力。

MKL-FSVDD 模型训练中多核函数包含高斯径向基核和多项式两类核函数,程序调试中对参数进行初始设置[17]:高斯径向基核带宽g取值范围为[0.01,100];多项式核幂指数p选值范围为[1,2,3,4];惩罚因子c取值范围为[0.01,200]。设最大迭代次数为100。

数据预处理后按7:3 比例分为训练样本和测试样本,取10 次实验的平均值作为结果(见表1)。对比可知:

(1) FSVDD 和SVDD 在数据集的分类精度上差异并不显著,但FSVDD 相对于SVDD 的训练时间和分类时间有所降低。

(2) MKL-FSVDD 相对于单核FSVDD 训练时间增加了25.21%左右,但是故障诊断精度明显提高。

(3) 因多核学习过程中寻找最优核参数权值组合的过程耗时较长,针对此问题引入的MPA 对模型参数进行全局优化,MPA-MKL-FSVDD 相对于单核FSVDD 训练时间仅增加了12.09%左右,改进了故障诊断效率。

另一方面,鉴于在实际的工程应用中模型训练是前置的,在使用时采用的是训练完好的模型,算法训练时间的增加不会影响生产线效率[33]。所以综合表1 中各模型故障诊断分类性能参量的对比分析,可以验证MPA-MKL-FSVDD 算法在故障诊断准确率和效率方面的优势性能。

表1 模型性能比较

4 MPA-MKL-FSVDD 故障分类模型应用

4.1 PVC 聚合反应工艺流程分析

PVC 生产过程是一个传质、传热的复杂化学反应工业过程,监测变量存在种类多、纯滞后、强耦合、参数广等特性。反应过程的安全性是决定产品质量的关键,其中聚合釜故障是导致聚氯乙烯产品质量下降的主要原因之一[34],本文以某化工集团公司PVC 生产过程聚合反应中70 m3的聚合釜为例,图5所示为该化工集团PVC聚合釜设备流程示意图。其中聚合釜搅拌系统在搅拌转速、搅拌桨叶形式及内件设置等3 个方面配置满足悬浮法生产聚氯乙烯工艺的需要;聚合釜传热系统由釜体传热系统、内冷挡板传热系统、体外冷凝器传热系统3 部分组成[35]。

图5 聚合釜化工过程工艺流程图

PVC 聚合过程中,将各种原料和添加剂加入反应釜中,冷却水注入反应釜的夹套和挡板内,聚合釜进行搅拌加热,当氯乙烯(VCM)的转化率达到要求值并稳定后产生压降,压力降到设定值后反应终止,得到最终产物。汽提工艺分离出剩余浆料中的氯乙烯单体(vingl chloride monomer,VCM),余下浆料送入干燥工艺[36]。

使用聚合设备运行监控中的各种变量的历史数据,根据聚合釜相关参数如釜内温度、釜内压力、搅拌电流、搅拌速度、注入水流量、密封水流量、夹套水流量、档板水流量、冷却水进口温度、夹套水出口温度、档板水出口温度等相关变量[7],可确定聚合釜设备聚合反应故障的类型。表2 示例了聚合釜监控变量包含的部分参数。

表2 聚合釜参数示例

4.2 故障数据集选取

为验证本文所提算法在实际工艺中的应用性能,选用PVC 聚合釜工业历史数据库存储的数据,分类整理选出具有均匀性和代表性的500 组数据作为训练和测试样本集,其中包括聚氯乙烯聚合釜正常聚合过程下的100 组数据和典型故障情况下的400 组故障数据样本。数据预处理后按3:1 比例分为训练样本和测试样本,输入故障分类模型进行验证。

对应于聚合釜工业数据集定义训练过程的标签类别如下:聚合釜正常工况数据样本定义标签为0,聚合釜电机出现故障定义标签为1,聚合釜减速机出现故障定义标签为2,聚合釜机封中轴故障定义标签为3,聚合釜组件故障诊断定义标签为4。

4.3 优化MKL-FSVDD 实验及分析

为验证MPA-MKL-FSVDD 故障诊断分类模型的性能,另选取哈里斯鹰算法(Harris hawks optimization,HHO)、鲸鱼算法(whale optimization algorithm,WOA)、粒子群算法(particle swarm optimization,PSO)3 种元启发式算法,与本文优化的MKLFSVDD 故障分类模型结合并对其优化效果进行对比分析。

实验参数同3.4 节初始化设置,利用相同的数据集、设定相同的迭代次数上限及模型参数的搜索范围,搜索代理数量为20。MKL-FSVDD 模型分别与MPA、HHO、WOA、PSO 算法结合,优化的效果由其最佳适应度曲线和平均适应度变化曲线体现,其中程序中适应度值的大小即为适应度函数值大小,适应度值曲线呈上升趋势。

4 种算法适应度寻优的过程如图6、图7、图8和图9 的子图(a)所示。根据适应度曲线变化趋势可知,优化过程中,MPA 算法的寻优速度最快,最佳适应度在第3 代时达到最佳,其次是WOA 算法(第10 代),HHO 算法(第16 代),最后是PSO 算法(第20 代之后)。且MPA 算法平均适应度在第13 代时就完成收敛,达到最佳适应度值并趋于稳定状态,此间段其他算法的平均适应度曲线仍处于波动状态,收敛速度明显低于MPA 算法,证明MPA 算法具有较强的搜索能力。且HHO、WOA、PSO 优化算法寻优过程中适应度曲线均存在明显的折线式跳跃状态的收敛过程,其中PSO 算法更是出现了多次层断式阶跃状态,说明PSO 算法搜索陷入局部收敛的概率较大,易导致寻优效果的不稳定性。相较之下,MPA算法适应度收敛曲线的收敛趋势近似圆滑曲线状态,体现了MPA 参数寻优过程中比较好的稳定性。

图6、图7、图8 和图9 的子图(b)所示为MKLFSVDD 模型利用MPA、HHO、WOA、PSO 算法在目标空间内搜索,取得的最佳适应度得分情况,从图中可以看到,MPA 优化的MKL-FSVDD 故障分类模型的最佳适应度得分最高为99.67%,寻优精度值最佳。

图6 MPA-MKL-FSVDD 模型寻优效果图

图7 HHO-MKL-FSVDD 模型寻优效果图

图8 WOA-MKL-FSVDD 模型寻优效果图

图9 PSO-MKL-FSVDD 模型寻优效果图

对比可知,4 种算法中最优解质量最佳的是MPA 算法,其次是WOA 算法和HHO 算法,最后是PSO 算法。

通过MPA、HHO、WOA、PSO 算法优化MKL-FSVDD 模型后得到对应的寻优参数、准确率及运行时间结果如表3 所示,4 种模型故障诊断结果如图10所示。对比可知,MPA 优化的MKL-FSVDD模型故障分类的准确率最高,为92.80%,其次是WOA 算法和HHO 算法,最后是PSO 算法。MPA-MKL-FSVDD 模型运行时间最短,仅需48 s,且该模型训练速度最快。HHO-MKL-FSVDD 模型训练速度较快,为52 s,其次是WOA-MKL-FSVDD 模型,最后是PSOMKL-FSVDD 模型。综上可知,MPA 算法优化的MKL-FSVDD 故障分类模型在训练精度和测试精度上可以得到较佳的分类效果,模型分类的运行速度相对较快,在基于数据参数下聚氯乙烯聚合工艺的故障诊断中可满足对故障分类效率和质量的要求。

表3 寻优参数及模型性能比较

图10 MKL-FSVDD 结合4 种寻优算法故障诊断结果比较

5 结论

本文以处理噪声干扰较好的FSVDD 模型为基础,通过引入MKL 算法保留复杂数据集的原始特征,再结合MPA 寻优算法优化MKL-FSVDD 模型,构造MPA-MKL-FSVDD 故障诊断模型。通过应用TE 平台故障数据集,与SVDD、FSVDD、MKL-FSVDD故障诊断模型进行对照实验,验证了所提算法具有较高的诊断效率和精度。通过利用PVC 聚合反应聚合釜设备的工业历史数据,对MPA、HHO、WOA、PSO 算法优化的MKL-FSVDD 模型进行故障分类仿真,实验对比各算法的优化效果,结果表明MPA 对模型参数全局优化、精准寻优的显著优势,说明本文选用的MPA 优化MKL-FSVDD 模型具有较精准的故障分类能力以及在聚合釜设备故障诊断中较强的鲁棒性和泛化性能,达到了减小PVC 聚合釜设备故障诊断难度和提高聚合反应安全性的应用效果,该模型为其相关化工过程的故障诊断及其他流程工艺的生产过程建模、智能控制提供了新的优化方案。

鉴于实验选用了工业历史数据库中具有均匀性特征的数据集进行仿真验证,考虑实际工业数据库中故障类别不平衡数据问题的存在,接下来将以处理不平衡样本故障诊断问题为方向进行深入研究。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!