当前位置:首页 期刊杂志

基于动态阈值的酸轧机组设备健康监测及故障诊断

时间:2024-05-19

潘明皓

(武钢日铁(武汉)镀锡板有限公司,湖北武汉 430080)

0. 引言

党的十九大报告提出“加快建设制造强国,加快发展先进制造业,推动互联网、大数据、人工智能和实体经济深度融合”,以促进新一代信息技术和人工智能技术与制造业深度融合,推动实体经济转型升级,大力发展智能制造[1]。

武钢日铁(武汉)镀锡板酸轧机组(后简称CDCM机组)已运行10 年,为全国运行速度最高(出口速度最高2000m/s),可轧最薄(0.15mm)的高速机组,由于前期先天涉及缺陷,为了保障设备高效稳定地运行,设备管理人员一直在探索设备管理的方法。但高速旋转的传动设备和嘈杂的现场给点巡检造成一定安全风险和难度。 为了及时掌握其运行状态,及时调整运行模式,避免大故障发生。因此需要结合最新的技术手段,通过远程智能监控保证机组的稳定运行,同时通过智能分析提高设备预判,进行相关故障诊断与排除。

基于目前冷轧机组现状,以及设备管理要求及公司的“四个一律”的发展方向。实现对设备运行、维修、故障诊断及预测、缺陷及事故分析、设备状态健康评估、风险评价等业务的有效管控,促使管理人员和基层职工自觉地将企业管理要求落实在日常工作中,帮助企业提高管理水平,优化业务流程,改善数据信息系统,实现设备管理的技术与经济管控与生产安全风险预控,同时通过该服务,统一、集中收集、掌握设备管理核心业务和技术,有力提升决策支持,实时掌握设备健康信息,降低设备成本及故障率,提高维护检修水平及效率。

综上,本文根据新技术的应用结合现场实际,针对冷轧机组现状,在冷轧机组准备新增一套酸轧齿轮轴承振动监测系统,如图1 所示,现场新增温度振动数据采集设备,同时根据工艺及逻辑需要甄选采集现有生产线PLC 系统及现场智能传感器仪表相关数据,结合机组负荷/轧制速度等参数,通过AI 技术与数据信息及工艺逻辑支撑对设备的评估、判断、决策,以预设的作业标准或工作方法制约工作、作业的决定或处理结合工艺逻辑,提供关键设备的故障诊断预测服务,变被动计划性维护为预测性维护,及时预警,提供诊断建议,避免事故发生。从而减少故障,降低设备损坏率,提高设备运行时间,降低维护成本,降低备件及运营成本,降低由于设备损坏对生产造成的影响。

图1 CDCM机组组成结构图

1. 相关研究

近年来,越来越多的过程监控与故障诊断技术被用于保证工业生产过程的安全、节能、稳定与高效,目前针对故障诊断问题已经建立了相对完整的理论体系,并积累了一定的实践经验,但是冷轧过程中的不确定、不规则、强相关、高主观等因素仍制约着这项传统工业的数字化转型进程[2]。

Gartner 连续3 年(2017—2019 年)在其发布的“十大战略科技发展趋势”报告中,将动态阈值(Dynamic Threshold)和数字孪生(Digital Twin)列为在未来5 ~10 年内会产生颠覆性创新的技术之一[3]。

在动态阈值与孪生数据的驱动下,基于物理设备与虚拟设备的同步映射与实时交互而形成的设备健康管理新模式,设备状态监测系统可以实现快速捕捉故障现象,同时建立设备档案,并对前期数据进行自学习,准确定位故障原因,合理设计并验证维修策略。

传统的电机报警系统主要使用固定的阈值用以监测SCADA 和CMS 指标,而没有考虑指标参数直接的相关性,从而使得部分故障不能被及时识别。

采用逐步回归法筛选得到神经网络输出为t时刻主轴承温度时的输入参数,当模型预测值与实际检测数据的马氏距离超过阈值时,则判断当前时刻数据异常;该方法优于传统利用预测误差进行故障预警的方法。

利用径向基核函数的支持向量机回归(Support Vector Regression, SVR)建立正常状态下的温度预测模型,并使用统计过程控制分析得到残差近似服从正态分布,并依此设定故障预警与报警阈值,后期通过机器学习结合工况和大数据智能生成动态阈值,若发现实际值与动态阈值之间的残差长时间超过预警范围且越过报警线,则发出警报。但由于数据量的限制,未能指明报警前残差越限的具体时长,从而也无法定量得出模型的超前预测时长。

2. 基于动态阈值和数字孪生的设备健康状态监测

动态阈值是人工智慧物联网(AIoT)的基础智能化。通过将传统工艺中固定的阈值转化为基于机器学习算法的动态阈值,将实时变化的环境因素、温度、震动、厚度红外等传感器参数与PLC 参数相结合,动态地绘制出一条更加贴近于显示状态的阈值线,如图2 所示。结合了实时的传感器读数,用户可以更有信心地将工艺系统的效率推向极限。更进一步结合对单点数据的预测,系统也实现了对动态阈值的预测。最终,该系统帮助用户实现了从实时报警到实时预警再到动态预警的功能跨越。

图2 动态阈值预警线(橙色)

数字孪生系统通过展示工艺流程上的实时传感器读数帮助工程师掌握冷轧线的最新动态。超出健康阈值的数据点将会产生亚健康和异常事件,提醒用户进行处理。经过升级后的数字孪生系统还将拥有流程模拟功能,通过输入钢卷规格型号和冷轧工艺的控制参数,系统帮助工程师模拟冷轧工艺流程中的状态和产出钢材参数。帮助工程师探索特定用户需求下的工艺参数预设值,提高成材率,降低错误成本,相关报表功能如图3 所示。

图3 CDCM机组5机架数字孪生示意图(动态)

通过动态阈值和数字孪生系统对单体设备可以进行单点数据的预测和预警,包括传统MES 系统中的数据历史统计和趋势分析。同时,系统会对工艺线上的属性值和输出参数进行预测,如震动、温度、张力信息(tension information)、IMR 曲率(IMR Bending Rate)、轧制力、钢板厚度等。得益于对单点数据的预测,系统不仅实现了对单点信息的实时报警,也进一步实现了对单点数据的提前预警,从而帮助工程师提前定位可疑信息点,帮助实现从被动维护到主动优化的转变,防患于未然。

通过单点预测和预警,然后结合工艺,同时对机器学习的深度使用,通过基于K-Means Clustering, Mean-Shifted Clustering, Density-based Clustering,Expectationmaximization clustering 和Mahalanobis 距离等算法的健康状态诊断系统。系统将收集(1)温度、振动等传感器读数,(2)PLC 的控制信号(电机电流、压力、张力,变形量、转速等),(3)钢板规格(coil identification number)、厚度、宽度等全面的冷轧线信息综合信息。使用聚类算法将综合信息汇聚成不同健康状态下的类别,从而训练出针对用户冷轧线的定制健康模型。最终使用Mahalanobis 距离等算法比较系统实时状态、预测状态与模型中健康状态的距离,分析出系统的实时健康状态和未来健康状态。

2.1 数据抓取和预处理

酸轧机组此次共采集振动温度点99 个,如图4 和图5所示,通过FDAA 系统可读取机组日立PLC 系统工艺数据,并通过平台设备档案输入对应设备参数,以上数据和工艺、生产数据实时相结合,结合工艺专家的经验,作为本项目中用来建模分析的所有变量。

图4 CDCM机组轧机振动检测点示意图

图5 CDCM机组卷曲振动检测点示意

2.2 机器学习建模分析

人工神经网络基于称为人工神经元的连接单元或节点的集合,它们对生物大脑中的神经元进行松散的建模。每个连接就像生物大脑中的突触一样,可以将信号传递给其他神经元,如图6 所示。人工神经元接收信号,然后对其进行处理,并可以向与其相连的神经元发出信号。连接处的“信号”是一个实数,每个神经元的输出由其输入之和的某个非线性函数计算得出。这些连接称为边,神经元和边缘通常具有随着学习的进行而调整的权重。权重增加或减少连接处的信号强度。神经元可能有一个阈值,这样只有当聚合信号超过该阈值时才会发送信号。通常,神经元被聚合成层。不同的层可以对其输入执行不同的转换。信号从第一层输入层传播到最后一层输出层,可能是在多次遍历这些层之后,如图7 所示。

图6 神经网络结构示意图

图7 钢卷模型与振动及工艺参数关联模型构建图

隐藏层中的每个神经元接收加权输入加上前一层中每个神经元的偏差,如公式1 所示。

Zi被传递给一个激活函数,该函数数用于对非线性行为进行建模。

以产生节点的输出,计算公式:Yi=f(Zi)。sigmoidal函数是最常用的激活函数,计算公式为:

3. 应用及结果分析

实际项目从部署到实验开始经历了4 个月的时间,在该时间内冷轧线工况稳定,相关设备并未出现明显的故障特征。因此,为了实验的完整性,本项目基于真实、健康的电机振动、温度数据生成了部分人工异常数据,以便检测模型效果。

项目过程中使用到的相关术语和计算规则如下。

(1)样本总数:给定测试集的样本总数,用F 表示。

(2)正确预测样本数:模型预测结果与样本实际相吻合的样本数量,包含两部分,即故障样本预测为故障样本,用TP(True Positive)表示;正常样本预测为正常样本数量,用TN(True Negative)表示。

(3)误报样本数:将正常的样本预测为故障样本的数量,用FP(False Positive)表示。

(4)漏报样本数:将故障样本预测为正常样本的数量,用FN(False Negative)表示。

(5)准确率:在给定测试数据集的基础上,样本数据中模型预测结果与样本数据实际结果相吻合的程度,用Accuracy 表示,计算公式:Accuracy=(TP+TN)/(TP+TN+FP+FN)*100%=(TP+TN)/F*100%。

(6)误报率:在样本数据测试中,被模型误报成故障的正常样本数占正常样本总数的百分比,用FAR(False Alarm Rate)表示,计算公式如下:FAR=FP/(FP+TN)*100%。

(7)故障检测率:在样本测试数据集中,被正确检测的故障样本数占故障总数目的百分比,用FDR(Fault Detection Rate)表示,计算公式:FDR=TP/(TP+ FN)*100%。

项目最终效果如表1所示。

表1 项目实验结果

4. 结语

本项目通过冷轧生产过程中的实际数据构建了一套针对客户场景的神经网络算法和针对同样冷轧场景的模型搭建方法。模型最终在真实的健康数据和模拟的异常数据集中达到了准确率96.7%和故障检测率98.1%的表现。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!