当前位置:首页 期刊杂志

基于长短期记忆算法的空调系统故障检测

时间:2024-05-04

朱 涛, 庞爱心

(贵州东华工程股份有限公司, 贵阳 550025)

0 引 言

以暖通空调系统为代表的现代工业系统往往都是具有大惯性、大滞后的复杂非线性系统[1]。 这类复杂大系统的故障在初期阶段往往缺乏有效的检测策略而难以发现,从而导致过多的能耗损失,甚至造成巨大的财产损失,并产生不小的社会影响。 因此,需要对暖通空调系统进行实时故障检测,发现系统的潜在故障,从而计划及时的维护措施,保证空调系统的正常运行。

近年来,针对复杂非线性系统进行了一系列的故障检测研究,主要分为2 类:基于模型的方法和基于数据驱动的方法。 其中,基于模型的方法是通过建立对特定故障较为敏感的指标模型,主要是利用受诊断的物理对象的期望值与实际值的偏差来检测系统故障。 Zabala 等学者[2]建立了一种物理模型,该方法基于模型进行故障诊断,能准确检测到故障,但这些方法依赖于物理模型的精度。 采用传统的建模技术来建立暖通空调系统的准确模型是非常困难的[3]。 然而,基于数据驱动的方法可以不需要物理模型,直接从暖通空调系统运行过程中提取故障特征,现已成为研究热点[4]。 历史的系统运行数据用于训练模型,一旦新的运行数据与训练模型学习到的模式不一致,就会发出故障警报。 故障样本对于构建平衡的训练数据集是必要的。 不平衡的训练数据集使大多数基于数据驱动的故障检测方法性能下降、甚至无效[5-6]。

Modelica 建模语言可以比其他仿真工具更快、更精确地完成此类系统的建模和故障仿真工作[7]。本文提出一种基于Modelica 语言的面向对象的建模方法在OpenModelica 仿真平台上对暖通空调系统故障进行模拟以生成故障样本。

暖通空调系统的运行数据往往具有较强的时序特征。 Kayacan[7]采用多种深度学习方法对时序数据进行了预测研究。 而LSTM 网络拥有对时间序列特征的强提取能力,非常适用于空调系统时序性监测变量的预测。 Zhang 等学者[8]利用LSTM 网络对时间序列较强的学习能力显著地提高了电力系统中线路跳闸的故障预测准确率。

与其它神经网络相比,尽管基于LSTM 网络的方法在暖通空调系统变量预测中可能获得更好的结果,但暖通空调系统的实时故障检测结果不仅与神经网络的预测性能有关,往往也与故障阈值的大小密切相关[9-10]。 设置固定阈值的传统方法通常会导致错过检测故障的机会、延迟检测故障或假警报[11-13]。 如果阈值设置得太高,则可能会错过故障,或者如果阈值太低,则会发生错误报警。 因此,对于LSTM 网络的预测误差、即故障残差,设置一个合理的阈值十分重要。 当系统正常运行时,故障残差值往往很小,当系统出现故障时,故障残差值往往大于正常状态,就可以将其视为一个分类问题。SVDD 算法作为一种优秀的单分类算法,通过将球形边界更改为更灵活的边界,可以控制离群点敏感性[14-15]。 因此,SVDD 算法超球体的半径往往可以很好地充当故障检测的自动阈值。 Li 等学者[14]采用支持向量数据描述(SVDD)算法对冷水机组的传感器故障进行检测,取得了非常准确的故障诊断结果。

因此,在通过仿真系统研究暖通空调系统故障特征后,提出了一种基于长短时间记忆网络和支持向量数据描述(LSTM-SVDD)相结合的方法来实现暖通空调系统故障的实时、准确检测。 该方法首先利用双层LSTM 网络对系统时序特征向量的强学习能力,对系统的工作车间温度进行实时预测。 然后,通过将LSTM 网络的输出与工作车间温度传感器的实际值进行比较而产生残差值。 最后,将该残差值作为SVDD 方法的输入,将SVDD 超球面的半径作为故障检测阈值,从而检测系统是否发生故障。

1 系统模型及故障模拟

该部分对暖通空调系统的结构和工作原理进行仿真建模,并采取人工注入故障的方式对故障进行模拟。

1.1 系统建模

所研究的暖通空调系统为某数据中心的水冷式暖通空调系统,其系统结构类似于文献[16],如图1所示。

图1 某厂房暖通空调系统结构Fig. 1 HVAC system structure of a factory building

这个HVAC 系统在面向对象的建模基础上被分为水路子系统和气路子系统。 水路子系统由一个冷水机模型和一个冷却塔模型组成,而气路子系统由一个风机盘管模型和一个数据中心车间模型组成。 本文在OpenModelica 平台[17]上建立了基于Modelica 标准库和建筑物库的HVAC 系统仿真模型。 然后根据实际HVAC 系统的传感器测量结果,对模拟系统参数进行了设置和校准,以保持293 K左右的室温。 通过使用数据中心的温度变化作为评估指标来验证模拟系统和实际HVAC 系统之间的差异。 同时,从被HVAC 系统冷却的实际数据中心车间收集温度数据。 图2 显示了从实际系统中收集的数据与模拟模型中的数据的比较。

图2 实际系统与仿真系统的工作车间温度对比Fig. 2 Workshop temperature comparison between actual system and simulation system

1.2 系统监测变量及故障模拟

暖通空调系统故障是指降低系统性能的运行异常,包括使用比正常运行更多的能量,或未能根据恒温器设定点维持工作车间温度[18]。 在现实场景中,综合考虑到实际系统中暖通空调系统传感器的分布和系统重要变量,在模拟系统中通过构建虚拟传感器和监测关键变量来更加全面地监控系统运行状态。 在本研究中,选择了11 个系统监测变量,所有这些不同的参数都与暖通空调系统运行状态有关,见表1。

表1 系统监测变量Tab. 1 System monitoring variables

由于暖通空调系统应用于对工作车间的温度调节,因此,工作车间的温度变化与系统故障密切相关。 研究中,选用工作车间温度用于演示的监控参数。 为了准确监测工作车间温度,应考虑所有监测变量的相关性。 表1 中的各监测变量相关性如图3所示。

图3 各变量相关性分析热力图Fig. 3 Variables correlation analysis thermogram

从图3 可以看出,与工作车间温度最相关的5个监测变量分别是冷水机供水温度、冷水机回水温度、来自盘管的供气质量流量、混合空气的温度和来自盘管的空气出口温度。 因此,将包含工作车间温度的6 个监测变量选作故障检测模型的输入。 通过使用所提出的故障检测模型从这6 个参数中提取信息,可以实现系统故障检测。 经过标准化后的6 个监测变量如图4 所示。 该数据集共有15 000 个样本点,其中前10 000 个样本点当作训练集,后5 000个样本点作为测试集。

图4 标准化后的6 个监测变量Fig. 4 Six standardized monitoring variables

在该研究中,由于暖通空调系统的末端设备送风管道发生故障将导致工作车间温度偏离其正常设定值,从而选取送风管道破裂故障进行研究说明。在仿真系统上,采取人工注入故障的方式进行了该故障数据的获取试验。 系统正常运行稳定后,在稳定运行的某一时间点对送风管道设置故障,该模拟故障通过在仿真模型的送风管道上额外连接一小的容器以模拟送风管道破裂,导致送风量发生泄漏故障。 同时,不同的故障大小可以通过连接多个容器进行模拟。 训练集中的工作车间温度如图5 所示。在测试集中,正常工作车间温度和故障工作车间温度如图6 所示。 故障从第3 000 个采样点开始,一直持续到测试集结束。

图5 训练集中的工作车间温度Fig. 5 Workshop temperature in training set

图6 有故障的测试集中的工作车间温度Fig. 6 Workshop temperature in faulty test set

2 基于LSTM-SVDD 的故障检测框架

在这节中,详细描述了基于LSTM-SVDD 的故障检测方法的总体框架,然后给出了故障检测模型的参数。 最后,通过实验分析了本文提出的方法的性能。 方法验证的程序在Python 3.7 环境下实现,LSTM 网络和SVDD 算法程序在Jupyter Notebook 中结合Python 语言编写,建立了HVAC 系统的故障检测模型。 实验在一台装有Intel ® CoreTMi5-9300U CPU 的Windows 计算机上运行,CPU 主频为2.40 GHz,物理内存为8.0 GB 的物理内存。

2.1 故障检测模型

该故障检测框架主要由2 部分组成:基于实际传感器测量数据的仿真系统建立和基于LSTM-SVDD 的系统故障检测。 故障检测模型的总体框架如图7 所示。 首先,在现实场景中,暖通空调系统的服务器通过传感器采集到系统正常运行的数据,依据采集到的数据,对建立的仿真系统进行参数校正和设定,使得该仿真系统的性能近似于实际系统。 随后,在校正好的仿真系统上进行故障注入,获得系统的故障运行数据。最后,LSTM-SVDD 对仿真系统的数据进行特征提取和识别,及时发现系统故障并进行故障预警。

图7 基于LSTM-SVDD 的故障检测框架Fig. 7 Fault detection framework based on LSTM-SVDD

暖通空调系统故障检测不仅取决于当前时刻的变化,还与先前时刻的状态有关。 LSTM-SVDD 方法充分利用时序数据的特性,可以在一定程度上避免误判并提高检测性能。 LSTM-SVDD 故障检测数据流程如图8 所示,LSTM-SVDD 故障检测步骤如下:

图8 LSTM-SVDD 故障检测数据流程图Fig. 8 LSTM-SVDD fault detection data flow chart

步骤1收集数据。 数据集收集自仿真平台的暖通空调系统,包括6 个特征变量。 工作车间温度作为预测输出变量。

步骤2标准化数据以消除特征之间的差异,同时重构后的数据应转换为带有滑动窗口的序列。

步骤3将处理好的数据作为双层LSTM 网络的输入数据,从而建立双层LSTM 模型以实现预测输出。 该LSTM 网络的损失函数为式(1)中给出的均方误差:

其中,m是预测点的数量;YL表示实际输出;表示模型预测输出。

训练目标是使总损失函数之和最小化。 经过训练后,最终损失函数约为0.02,并保持稳定,这表明双层LSTM 经过训练后满足要求。

步骤4将残差r作为SVDD 算法的输入值,SVDD 模型将其超球体半径R作为故障阈值进行故障检测,以确定系统是否存在故障。

2.2 模型参数设置

在本文中,基于LSTM-SVDD 的故障检测模型的2 个LSTM 层用于增加模型的深度,并获得更好的预测结果。 每个LSTM 层有20 个隐藏节点。 此外,将LSTM 滑动窗口的长度设置为20,可以获得更好的时间序列预测性能。 表2 总结了提出的故障检测模型中使用的参数。

表2 LSTM-SVDD 模型参数Tab. 2 LSTM-SVDD model parameters

3 故障检测结果和讨论

本节根据给出的故障检测评价方法和对比实验结果,证明了所提出的方法的有效性。

3.1 检测评价方法

为了评价故障检测模型的计算精度,需要分析不同实验条件下的故障检测性能。 故障检测有4 种可能的结果,通常称为真阳性(TP)、假阳性(FP)、假阴性(FN) 和真阴性(TN)[19-20]。 对于本次研究中涉及的评价测试指标,拟做阐释分述如下。

(1)准确度(Acc)。 是所有预测中预测正确的比例,并可由如下公式计算求得:

准确度是一个常用的评价指标,准确度越高代表检测模型性能越好。 但在正负样本不平衡和数据分布不均衡的情况下,准确度这个评价指标对少样本的错误分类不敏感。 精确率和召回率能够弥补这一缺陷。 同时,F1值综合考虑了精确率和召回率。因此,为了综合评价模型性能,选取ACC和F1评分作为评价指标。

(2)精密率(P)。 可由如下公式计算求出:

(3)召回率(R)。 可由如下公式计算求出:

(4)F1分数。 是精确性和召回率的调和平均值。 可由如下公式计算求出:

3.2 基于LSTM-SVDD 的故障检测结果及分析

为了全面分析所提出的故障检测模型的性能,分别从提出的LSTM 网络的预测性能和LSTMSVDD 模型对不同故障大小的故障检测性能两个角度对其进行了验证。 对于提出的LSTM 网络的预测性能,由于存在噪声和建模误差,即使在无故障状态下,模型预测值也永远不会完美。 因此,在识别系统故障发生之前,必须进一步处理这些预测值。 最常用的处理方法是对预测和实际值之间的差值应用固定阈值。 如果差值大于阈值,则识别故障。 以残差来评估其对工作车间温度的预测性能。 在系统正常运行时,该LSTM 网络的残差r如图9 所示。

图9 正常状态下的工作车间温度预测误差曲线Fig. 9 Workplace temperature prediction error curve in normal state

假设在第3 000 个采样点后系统发生送风管道破裂故障,此时训练好的LSTM 网络输出值与实际的房间温度传感器残差值r将会改变,如图10 所示。 故障检测过程一般分为2 个阶段。 第一阶段为无故障阶段,包括前3 000 个样本数据;第二阶段为故障阶段,包括后2 000 个样本数据。 在无故障阶段,残差值越小,故障检测性能越好。 相反地,在故障阶段,残差值越大,故障检测性能越好。 不同方法的预测性能直接影响后续的故障检测结果。

图10 1%故障偏差下的工作车间温度预测误差曲线Fig. 10 Workplace temperature prediction error curve with 1%fault deviation

从图10 可以看出,在系统正常运行时的前3 000个样本残差值较小,而当系统发生故障后,残差值幅度变大并且发生较大波动。

对于系统正常运行和故障运行阶段,残差值的变化特征往往可以作为一个故障检测依据,在故障检测阶段,将系统正常运行阶段产生的所有残差样本视为正样本,故障阶段运行导致的所有残差样本均为负样本,并采用SVDD 算法进行自动检测。 其检测结果如图11 所示。 故障检测过程分为2 个阶段。 第一阶段为无故障阶段,包括前3 000 个样本数据;第二阶段为故障阶段,包括后2 000 个样本数据。 从图11 中可以看出,提出的基于LSTM-SVDD的故障检测方法在无故障阶段,残差均低于故障阈值,这意味着该阶段不存在假警报;而在故障阶段,绝大多数高于故障阈值,只有少数几个低于故障阈值,造成极少数的漏报。 这表明LSTM-SVDD 对该故障有很好的检测效果。

图11 1%故障偏差下的LSTM-SVDD 检测结果Fig. 11 LSTM-SVDD detection results with 1%fault bias

故障幅值的大小也会严重影响故障检测结果。为了检验提出的方法对故障大小的检测效果,在暖通空调系统仿真模型上改变送风管泄漏量的大小以引入使工作车间温度偏离正常范围的不同级别故障。 以工作车间温度偏离正常状态下平均温度的百分比为基准划分故障级别。 在偏差率分别取2%、1.5%、1%、0.5%、0 五个故障级别的条件下,LSTMSVDD 方法的检测准确度ACC和F1得分曲线如图12 所示。

图12 不同故障级别下的检测效率Fig. 12 Detection efficiency at different failure levels

由图12 可看到,LSTM-SVDD 方法对小偏差故障仍然保持着较高的检测效果,即使在故障偏差率为0.5%时,其检测效率也达到0.946;而在故障偏离2%时,其检测效率达到了0.999。 同时,故障越大,故障检测程度越准确。 这是由于故障偏差幅值越大,偏离SVDD 最小超球面中心距离越大,超出边界概率显著增加,更容易被识别为异常状态。

3.3 方法对比分析

为验证本文提出的方法的性能,从回归预测性能和故障检测效率与其它方法进行对比试验。 对于预测性能,在相同的时序数据下,即相同的测试集和训练集划分,选择测试集上的预测值与实际值的绝对差值即预测误差r作为预测性能评价指标。 对LSTM 网络[20]、XGBoost[21]方法和提出的LSTM 网络,研究得到的工作车间温度的预测误差如图13 所示。

图13 LSTM[20]、XGBoost[21]和提出的LSTM 对数据中心温度的预测结果Fig. 13 The prediction results of LSTM[20]、XGBoost[21] and the proposed LSTM on data center temperature

从图13 可以看出,文中提出的LSTM 网络预测误差小于文献[20]提出的LSTM 网络和文献[21]提出的XGBoost 方法的预测误差。 因此,本文提出的LSTM 网络预测性能表现最好,同时,在时序数据波动较大时,XGBoost 方法预测性能最差。 这是因为对于预测时序数据而言,LSTM 网络往往比其它神经网络更具优势。 由于传统的LSTM 网络只使用了一层单向LSTM 层,因此,提出的LSTM 网络在相同训练次数的条件下训练后的预测模型精度更高。

对于故障检测效率,文献[20]提出的LSTM 网络和文献[21]提出的XGBoost 方法结合文献[21]给出的固定阈值进行故障检测。 在不同故障大小的条件下,3 种方法的最终检测效率见表3。 可以发现,LSTM-SVDD 检测模型具有比其它2 种方法更高的检测准确度和F1得分,因此其故障检测性能最好。

表3 不同方法检测结果Tab. 3 Test results of different methods

可以发现,LSTM-SVDD 检测模型具有比其它2种方法更高的检测准确度和F1得分,因此其故障检测性能最好。 在实际工程中,由于暖通空调系统的滞后性,很难及时发现故障,造成系统的损坏和能源的浪费。 实验结果表明,本研究中提出的方法在一定程度上可以更及时、准确地检测到系统故障。

4 结束语

暖通空调系统工作过程复杂,故障传播迟滞。为了实现暖通空调系统的及时故障检测,及时发现故障,提出一种仿真模型结合LSTM-SVDD 算法的故障检测框架。 系统仿真模型及引入故障模拟解决了HVAC 系统大部分时间在正常条件下运行导致故障数据样本难以充分收集的问题。 由于暖通空调系统的运行数据往往具有时序性,因此提出LSTMSVDD 故障检测方法来对系统进行及时故障检测,并且引入不同的故障大小验证和分析了该方法的检测效率。 结果表明:该方法对于较小偏差故障仍具有较好的检测性能,且故障偏差越大,检测效果越好。 而在与其它方法对比试验后发现,LSTM-SVDD检测模型具有比传统LSTM 网络和XGBoost 方法更高的检测准确度。 文中提出的故障检测框架不仅能得到有效仿真故障数据并对其进行准确的故障检测,而且可以在缺乏故障样本的情况下为其它暖通空调系统的故障检测方法研究提供参考。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!