时间:2024-09-03
邓翔 陈文景 邓仕钧
1 深圳达实智能股份有限公司
2 华南理工大学自动化科学与工程学院
3 清华大学建筑学院
中央空调系统为人们带来舒适的室内环境同时也消耗着巨大的电能。由于室外天气、室内得热量等因素的变化会使空调冷负荷需求也不断改变。这时需要通过改变冷水机组的运行策略进行,满足冷负荷需求同时保持冷水机组的高效率运行。由于空调系统的高延迟、大滞后性特点[1],仅依靠负反馈调节的空调系统可能无法保证室内热舒适性和冷水机组节能运行。因此本文旨在研究通过负荷预测模型得到下一时刻的负荷预测值,从而帮助空调冷水机组实现预调节。
目前关于空调负荷预测预测的方法主要可以分为两类[2]:
1)基于数学统计分析的方法,如自回归积分滑动平均模型(Autoregressive Moving Average,ARMA)、多元线性回归(Multiple Linear Regressions,MLR)等。这些方法考虑了数据的时序性关系,然而对非线性关系数据的预测精度不足。
2)基于人工智能的算法,如BP 神经网络、随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)等。这些方法解决了数据的非线性问题然而却缺少对时序数据时间相关性的考虑。
空调负荷预测受很多因素的影响,难以建立直观地线性预测模型了,同时空调负荷具有较强的时序性。因此,为解决空调负荷预测中数据非线性和时序性的问题,本文采用基于深度学习LSTM 学习模型[3]对短期空调负荷进行预测。
长短期记忆网络(Long-short Term Memory,LSTM)是基于循环神经网络(Recurrent Neural Networks,RNN)[4]改进的一种算法。传统神经网络中,所有的输入(包括输出)之间是相互独立的。与传统的前馈神经网络不同,RNN 通过周期性地连接隐层节点,利用在序列数据中上一时刻保存的记录历史信息用于当前输出的计算。一个典型的RNN 网络结构展开后如图1 所示,x(t)表示t 时刻的输入,为t 时刻的隐藏层状态,O(t)是t 时刻的输出。
图1 RNN 结构
由图1 可知,不同于传统神经网络,隐藏层的输入有两个,即当前时刻的输入x(t)和上一个隐藏层的输出s(t-1)。W 表示输入的权重,U 表示此刻输入的样本的权重,V 表示输出的样本权重。故有:
虽然RNN 解决了输入信息前后关联的问题,但是当先前信息和当前任务之间的时间间隔不断增大时,循环神经网络会丧失学习过去较久远信息的能力。因此本文计划采用基于RNN 改进算法,即LSTM神经网络模型,来解决上述梯度消失的问题。
LSTM 的计算节点由输入门(Input gate)、输出门(Output gate)、遗忘门(Forget gate)三个门组成,用以记录当前时刻状态。三个门是从块的内部与外部接收激励的非线性求和单元,并通过乘法(图2 中的黑色圆点)计算来控制输入细胞状态的激励。虚线表示从细胞状态到门的加权连接。输入和输出门分别与输入和输出相乘,而遗忘门则与细胞的前一状态相乘。遗忘门有激活函数,使得门的输出值在[0,1]之间,当门输出不为0 时,标示将保留部分上一状态的信息。乘法门允许长短期记忆存储器单元长时间存储和访问信息,从而减轻梯度消失的问题。
图2 LSTM 结构
本次试验使用的数据是某大楼从2017 年到2018年逐时空调负荷数据。每组逐时空调负荷数据包括时间、室外气象参数(温度、相对湿度、风速、风向、降雨)、冷水机组冷却水和冷冻水供回水温度及空调负荷(由冷冻水供回水温差乘以冷冻水流量计算获得)。
1)数据清洗
对数据检查发现,由于数据存储设备故障,从2017 年11 月18 日到2018 年6 月8 日空调系统数据库内存在大量无效值,故将此段数据剔除数据集。并对其他时间段内个别无效数据,异常数据和缺失数据则进行替换或插值填补,最终获取12170 组数据。
2)数据标准化
由于不同数据(如室外温度与大气压力)之间量纲差距较大会造成数值间的差异,在进行空间距离计算时会影响结果的准确性。本文采用离差标准化法[5]对数据进行标准化处理:
式中:Xnorm为标准化后的值,X 为标准化前的值,Xmin为样本数据最小值,Xmax为样本数据最大值。
3)数据适配
采用LSTM 模型时,需要将数据集转化为有监督学习问题,将当前时刻空调负荷特征移除,从而利用前n 个时刻的空调数据组数据预测了当前时刻的空调负荷。
4)数据划分
本次实验以2017 年数据为训练集,共7898 组数据。以2018 年数据为测试集,共4271 组数据。
5)预测结果误差评估标准
采用均方根误差(Root Mean Squared Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)[6]对模型预测结果及精度进行评估。RMSE 与MAE 分别定义为:
本次实验采用单层LSTM 网络,模型中的损失函数采用平均绝对误差(Mean Absolute Error,MAE),优化算法采用Adam 算法。在选取batch size 时,batch size 越大,其确定的下降方向越准确,处理相同数据量的速度越快,引起训练震荡越小。然而,随着batch size的增大,处理相同数据量的速度越快,但达到相同精度所需要的epoch 数量越来越多,最终收敛精度会陷入局部极值。在不同bath size 和Epoch 下,模型预测结果的均方根误差与平均绝对误差结果如表1 所示:
表1 不同Batch size 和Epoch 组合下的模型精度
根据调试结果,模型采用200 个epoch 并且每个batch 的大小为800 时,获得的最终结果最为理想(均方根误差与平均绝对误差相对较小且计算速度相对较快)。
为对模型预测精度进行评估,本文将所用负荷预测模型与现有预测方法进行比较,包括基于数学统计分析的多元线性回归法(MLR)和基于人工智能的支持向量机法(SVM)[7]。表2 该出了采用不同预测方法时的负荷预测结果误差情况:
表2 不同预测方法的预测结果误差对比
基于数学统计分析的MLR 法主要考虑了数据的时序性关系,而对非线性关系数据的预测精度不足;相反地,基于人工智能的SVM 法解决了数据的非线性问题然而却缺少对时序数据时间相关性的考虑。从表2 的结果可以看出,基于MLR 方法的负荷预测误差均要高于采用SVM 的方法预测结果误差。可以推测,相对于数据的时序性关系,数据的非线性关系对负荷预测的结果的准确性影响更大。然而,由于两种预测方法没有同时考虑数据时序性和非线性,因此两者的误差结果均偏大。而采用LSTM 深度学习时由于同时考虑了数据的时序性和非线性问题,其负荷预测结果误差要显著小于其他两种预测方法,精度最高。
图3 进一步展示了某一周内案例建筑空调短期负荷预测结果(由于周六周天存在加班人员,空调也会开启,但是空调冷负荷明显小于工作日)。从图3 中可以看出,采用LSTM 深度学习预测方法整体上能够比较准确的预测空调负荷的变化趋势以及各个时刻的负荷值。值得注意的是,由于空调晚上并未开启且建筑未做夜间自然通风降温处理,刚上班时(7:00AM-8:00AM),室内温度较高,需要空调短时间提供大量冷负荷进行降温。此时的空调负荷需求阶跃式变化会导致预测结果会出现较大误差。
图3 基于LSTM 算法的空调负荷短期预测结果
空调负荷受很多因素的影响,难以建立直观地线性预测模型,由于这些影响因素整体会随时间会发生规律性变化,因此空调负荷也具有较强的时序性。空调冷负荷预测一般会采用传统的时序模型或普通机器学习模型,因而无法兼顾空调负荷预测的这两个特点。本文采用某大楼空调负荷系统历史数据建立了一个基于深度学习的LSTM 神经网络,并利用该模型对大楼空调短期负荷预测效果进行了测试。试验结果表明,LSTM 模型相比于其他两类预测模型,在预测准确度上有明显得提升。结果还显示当空调负荷需求阶跃式变化会导致预测结果会出现较大误差,因此在将来的研究中可针对该情况对模型做进一步的改进。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!