时间:2024-05-04
纪严杰, 樊重俊
(上海理工大学管理学院, 上海 200093)
从供给侧角度来看, 能够提前知道未来一段时间内的电力供给情况, 能够帮助企业制定更合理的生产计划, 减少不必要的损失。 目前,短期电力负荷预测模型大体上可以分为3 类。 其中, 统计分析模型, 如多元回归和自回归移动平均模型(ARIMA)等。 Amber 等学者[1]利用多元回归(MR)模型预测了伦敦某大学的日用电量。 李晨熙[2]采用基于ARIMA 模型对短期电力负荷数据进行预测,但是ARIMA 模型一般只能处理线性关系, 对于非线性关系来说则运行效果欠佳。 Amaral 等学者[3]使用平稳过渡周期自回归(STPAR)模型来对短期负荷进行预测,其本质上涉及到与非周期自回归模型相同的过程。 Mbamalu 等学者(1993)[4]提出了在负荷预测中考虑季节性因素的乘法自回归模型。浅机器学习, 如灰色预测方法、支持向量机回归(SVR)、随机森林、集成学习等。 Zhou 等学者[5]将传统灰色GM(1,1) 模型与三角残差修正技术相结合, 提出了一种电力需求预测的三角灰色预测方法。 该方法提高了GM(1,1) 的预测精度, 获得了合理的灰色预测区间。 王鑫[6]将支持向量机多个核函数进行加权处理, 得到一个新的核函数, 使其能够具有不同核函数的特性, 并将其用于短期电力负荷预测中。 游文霞等学者[7]提出了基于AdaBoost的集成学习算法, 该模型考虑了时间、温度和历史负荷等特征并选择CART 决策树作为模型的基学习器; 然后,通过AdaBoost 算法训练各CART 决策树基学习器并计算各个基学习器的权重。 深度学习模型, 如反向传播神经网络(BPNN)、递归神经网络(RNN)、长短期记忆(LSTM)网络等。 易丹等学者[8]基于BP 神经网络搭建了一个3 层的神经网络模型,来进行电力负荷的预测, 由于BP 算法中的初始权值和阈值等是手动输入的, 选取不当可能会导致预测精度差和出现不收敛的情况。 进一步地,Li等学者[9]采用果蝇优化算法优化BP 神经网络的权值和阈值进行预测, 来提高预测的精度。 Zheng 等学者[10]提出了一种基于测量的递归神经网络(RNN)方法来构建主动配电系统的精确当量, 然而RNN 在处理长时间序列时候,难免会出现梯度爆炸并消失。 LSTM 可以通过门控单元来避免梯度爆炸, Muzaffar 等学者[11]将LSTM 用于短期电力负荷预测, 但LSTM 中隐藏层神经元个数、学习率等需要通过手动输入, 这在一定程度上会影响网络的预测精度。 基于此,本文提出了一种改进的樽海鞘群算法优化LSTM 参数, 使其能够更好地进行电力负荷预测。
小波分析能够分析信号在频域上的差异,这是傅里叶变换迄今为止仍无法解决的问题,但是小波分析对于非平稳信号不是很有效。 小波分析的重要应用之一就是信号降噪[12], 其中的小波变换可以利用时域和频域的信号与噪声差异来区分信息和噪声。 小波变换既保留了Gabor 变换的局部化思想,又具有窗口形状可滑动的特点。 因此, 小波分析可以更好地处理时变非平稳信号。 小波降噪(Wavelet Domain Denoising)流程具体如下:
(1) 信号的小波分解。 选择合适的正交小波基并确定分解层数,随后进行小波变换。
(2) 阈值选择。 对分解后所得到的高频小波系数进行阈值处理, 同时选择合适的阈值,选择满足信号规律的小波系数,同时删除不符合要求的小波系数。
(3) 小波重建。 根据小波分解后的最后一层的低频系数和经过阈值处理后的每一层高频系数来对信号进行小波重构。
(4) 评价效果。一般选择信噪比(SNR) 和均方根误差(RMSE),尽量选择SNR大、且RMSE小的小波变换函数。
樽海鞘群算法(Salp Swarm Algorithm, SSA)是Mirjalili 等学者[13]于2017 年受海洋中微生物—樽海鞘聚集成链的生活习性而提出的算法。 算法将群体分为领导者和跟随者, 领导者以全局最优为中心进行搜索, 为算法提供了全局搜索能力, 保证种群收敛, 跟随者跟随自己的前一个个体, 为算法提供局部搜索能力, 来保证算法的精度。 樽海鞘算法的模型简单, 更新过程清晰, 同时寻优也有不错的效果, 但是算法后期欠缺跳出局部最优的情况。
在该算法中, 每个樽海鞘个体的位置表示成一个d维的向量,则N个樽海鞘就形成了樽海鞘链。这个链就是一个种群,因此该樽海鞘种群就可以用N×d的矩阵进行描述:
第i个樽海鞘个体的位置表示如下:
在SSA 中, 种群在捕食或者向食物源移动时,领导者的位置更新策略如下:
其中,为第1 个樽海鞘群领导者在第j维空间中位置;Fj为食物源在第j维空间的位置;uj和lj分别为第j维空间的上界和下界; 参数c2和c3都为区间[0,1] 范围内的随机数, 参数c2决定的是领导者移动的长度, 参数c3决定的是领导者移动的方向; 参数c1是一个重要参数,主要控制着整个樽海鞘群体的探索和开发能力。 该参数受当前樽海鞘种群的迭代次数的影响, 其表达式如下:
其中,t为当前樽海鞘种群的迭代次数;Tmax为樽海鞘种群的最大迭代次数。 追随者的位置更新公式如下:
其中,(t) 为经过第t次迭代时, 第i个樽海鞘追随者在第j维空间的位置。 算法流程如下:
(1) 初始化种群。 根据上界与下界, 利用式(1)初始化一个N×d的樽海鞘种群。
(2)计算初始适应度。 计算N个樽海鞘的适应度值。
(3)选定食物。 将樽海鞘群根据适应度值的大小排序, 放在首位的位置设定为当前食物源的位置。
(4)选定领导者与追随者。 选定食物位置后,群体中剩余N -1 个樽海鞘, 将排在前一半的樽海鞘视为领导者, 后一半为追随者。
(5) 位置更新。 根据领导者及跟随者的位置公式更新位置。
(6) 计算适应度。 计算更新后的群体的适应度。将更新后的每个樽海鞘个体的适应度值与当前食物的适应度值进行比较,以重新决定食物源的位置。
(7) 重复步骤(4)~(6), 直至达到一定迭代次数或适应度值达到要求后, 输出当前的食物位置作为目标的估计位置。
1.3.1 混沌初始化种群
伪随机数生成器是目前大部分群体智能算法生成初始种群的方法, 能够覆盖到搜索空间中有希望的区域。 混沌数生成器是基于混沌技术的随机数生成器,混沌映射[14]可以用于替代伪随机数生成器,生成[0,1]之间的混沌数。 利用混沌序列进行种群初始化会影响算法的整个过程, 初始种群的全局覆盖能力更强, 搜索能力更好,并且能够取得比伪随机数初始化更好的效果。 本文采用最常见的混沌映射方法, Cubic 混沌映射来初始化种群, 其数学表达式如下:
其中,ρ为控制参数, 且当ρ=2.595 时生成的混沌变量具有更好的遍历性。
1.3.2 Levy 飞行策略
Levy 飞行[15]使用的是高频短距离的局部搜索结合低频长距的全局搜索的非高斯随机过程, 因此能够增强局部搜索的能力,而低频长距的跳跃式搜索则有利于扩大种群的搜索范围, 使算法很容易跳出局部最优的状况。 Levy 飞行策略的公式如下:
其中,μ=0.01;ω为0 到1 之间的随机数(rand);σ的计算公式如下:
其中,Γ(x)=(x- 1)!,β取1.5。
1.3.3 引入Levy 飞行策略的樽海鞘群优化算法LSSA
将Levy 飞行策略加入到樽海鞘群优化算法的领导者及跟随者的位置更新策略中, 改进后的领导者位置更新公式为:
跟随者的位置更新公式为:
其中,(t -1) 表示第t -1 次位置更新过程中的适应度值最好的位置维度j。 这样能够让追随者更快地向最优食物源的位置靠近, 不会只依赖前一个位置进行更新, 从而使算法更快地收敛。 同时,也弥补了原来算法中容易陷入局部最优的不足,避免了这一情况的出现。
1.3.4 CLSSA 算法性能测试
为了测试改进后的樽海鞘群优化算法(CLSSA)、 本文对比分析了樽海鞘群算法(SSA)、粒子群算法(PSO)、萤火虫算法(FA)、CLSSA 的局部与全局搜索能力以及算法的迭代速度,分别选取了3 个单峰函数及3 个多峰函数。 算法的种群规模为50, 迭代次数为200, 维度为20, 分别独立运行30 次记录并以适应度值最优为选取标准(无限接近理论值)。 测试基准函数见表1, 不同算法在基准函数中测试结果对比如图1 所示。
图1 不同算法在基准函数中测试结果对比Fig. 1 Different algorithms test results comparison in the benchmark function
表1 基准函数Tab. 1 Benchmark functions
图1 中,(a)~(f)分别对应了6 个基准函数,从图1(a)~图1(c)可知,在单峰函数f1(x) 和f2(x)中,CLSSA 虽然没有部分算法收敛速度快,但是寻优的精度却比其他算法更好, 更能接近适应度函数的理论值。 其中, 无论是迭代速度、还是寻优精度,CLSSA 相较于其他算法表现都是很好的, 能够很快地跳出局部最优的情况。 从图1(d)~图1(f)中可知, 在多峰函数中, CLSSA 在保证搜索精度的情况下, 适应度值都小于其他算法, 收敛速度都有很不错的表现。 综上所述, CLSSA 相对于其他算法来说,CLSSA 不仅能够更好地跳出局部最优解的情况, 同时全局搜索的能力也不错, 适应度值最小, 表明了CLSSA 的稳定性和鲁棒性要明显优于其他算法。
1.3.5 LSTM 模型
LSTM(Long Short Term Memory)是具有长短期记忆的神经网络。 LSTM 的提出旨在解决RNN 在训练过程中存在的长期依赖问题, 避免出现梯度消失和梯度爆炸。 这是因为LSTM 引入了门控机制来控制特征的流通和损失。 LSTM 的细胞单元结构如图2 所示。
图2 LSTM 细胞段元结构Fig. 2 LSTM cell segment element structure
由图2 可看到,LSTM 细胞单元结构中各参数的求解方法依次见下式:
其中,σ为激活函数;W和b为参数矩阵;xt表示当前t时刻的输入;ft表示遗忘门, 决定了前一时刻的单元状态ct-1可以有多少信息能够保留到当前时刻;it表示输入门, 决定了当前时刻网络的输入xt保存到单元状态ct; ~ct用于描述当前输入的单元状态, 来记忆单元的临时状态;ct表示当前时刻的单元状态; 输出门控制单元状态ct有多少输出到当前的输出值ht。LSTM共有2 个输出, 分别是当前状态的输出ot,以及下一时刻的隐层状态ht。
1.3.6 WDD-CLSSA-LSTM 预测模型
研究给出的模型流程如图3 所示。
图3 WNR-CLSSA-LSTM 流程图Fig. 3 WNR-CLSSA-LSTM flowchart
选取了巴拿马电力数据集来进行电力负荷预测, 该数据集由2015 年1 月到2020 年6 月每隔1 h 采集记录的数据构成。 数据集的列名描述见表2。
表2 数据集描述Tab. 2 Data set description
选取2019 年前11 个月的数据作为训练集, 预测12 月的用电负荷。 其中,用电负荷Demand为研究所需要预测的目标值, 其余的为特征向量。
基于上面介绍的小波降噪的流程, 小波基采用sym10、coif5 和db8, 层数为3, 阈值选用启发式阈值和固定阈值来进行软、硬阈值函数的对比。 对比结果见表3。
表3 不同阈值函数及小波基结果对比Tab. 3 Different threshold functions and wavelet bases results comparison
由于启发式阈值硬阈值函数的SNR和RMSE最优, 本文采取coif5 小波基、 启发式阈值及硬阈值函数来对数据进行降噪处理。
归一化处理, 将所有数据映射到0 到1 之间,其公式为:
本文选取3 种评价指标, 分别阐释如下。
(1) 平均绝对误差。 值越接近0, 得到的模型越准确。 可由如下公式计算得到:
2) 均方根误差(Root Mean Square Error,RMSE)。 数值越低, 表示模型越稳定。 可由如下公式计算得到:
3)R2。 用来衡量回归模型的拟合程度。 可由如下公式计算得到:
将所提出的CLSSA_LSTM 模型与不同算法优化的 LSTM、 SSA _ LSTM、 GA _ LSTM[16]、 PSO _LSTM[17]以及单一的LSTM 做对比, 选取RMSE,MAPE以及R2评价模型的预测性能。
其中,LSTM 的参数设置如下, 隐藏层包括2 个LSTM 层、2 个Dense 层,最后则为输出层, 神经元数量为1,droupout比率为0.1,batchsize为256, 时间步长为48, 记录2 天的数据, 单一LSTM 模型的学习率为0.01。 利用算法寻优迭代次数、 LSTM 层与Dense 层的神经元数量以及学习率四个参数。
各参数的寻优范围见表4。
表4 参数寻优范围Tab. 4 Parameters optimization range
算法的种群规模都为20, 迭代次数为50 次,PSO 的惯性因子w为0.5, 学习因子c1=2,c2=2,GA 的交叉概率为0.8, 变异概率为0.1, 优化后的预测模型的评价指标见表5。
表5 不同算法优化LSTM 的结果Tab. 5 The results of LSTM optimized by different algorithms
为了更直观显示预测结果的误差, 绘制出了各模型评价指标的垂直直方图、水平直方图和雷达图,如图4~图6 所示。
图4 不同算法优化LSTM 的R2 对比Fig. 4 R2 comparison of LSTM optimized by different algorithms
图5 不同算法优化LSTM 的MAPE 对比Fig. 5 MAPG comparison of LSTM optimized by different algorithms
图6 不同算法优化LSTM 的RMSE 对比Fig. 6 RMSE comparison of LSTM optimized by different algorithms
从图4~图6 的结果可知, LSTM 的训练拟合度R2为0. 866 3,MAPE为55. 224 3,RMSE为67.427 7,训练的精度为对比模型中最差的, 其次是SSA-LSTM、GA-LSTM 和PSO-LSTM, 这3 个模型的拟合度在训练时, 拟合度R2的均值都在0.93 左右, 模型预测的效果相差不大; CLSSA-LSTM 模型的结果为最优, 其拟合度最高并且训练集上的误差最小、为33.066 7,拟合度值R2达到了0.967 9, 是对比模型中表现最好的。 CLSSA-LSTM 模型的预测效果比单一LSTM 模型提高了12.71%,比其他3 个对比模型高出4.07%左右, 这也说明了相比于其他算法, CLSSA 能有效地选择最佳的参数。 各模型的预测对比如图7 所示。
图7 不同模型的预测对比图Fig. 7 Prediction comparison chart of different models
截取图7 中第550~650 条数据进行分析,分析结果如图8 所示。
图8 不同算法优化LSTM 预测结果在550~650 条数据对比图Fig. 8 Prediction results comparison chart from 550 to 650 data optimized by different algorithms
由图8 中可以看到, 红色线条的CLSSA-LSTM拟合的曲线与真实值曲线最为接近, 特别是在一些端点处, CLSSA-LSTM 模型的拟合值比其他模型更贴近真实值, 这样就能为电力负荷预测出最好的结果,同时在某些特定情况下也能满足正常的电力需求,对电力公司运行和管理的供需平衡发挥重要作用。
接着,分别将CLSSA-LSTM 预测模型和不同的预测模型PSO-SVR[18]、GA-BP[19]做对比, 其中SVR 的参数采用rbf 核函数, 利用粒子群优化算法PSO 优化gamma值以及惩罚项系数C, BP 采用3层结构, 输入层节点数为10, 输出层为1, 中间隐藏层的节点数根据经验公式计算得到5, 利用遗传算法GA 优化初始的权值和阈值。 同样地,截取第550~650 条数据进行对比分析, 对比结果见表6,不同预测模型在550~650 条数据对比如图9 所示。
图9 不同预测模型在550~650 条数据对比图Fig. 9 Comparison chart from 550 to 650 data of different prediction models
表6 不同预测模型的结果对比Tab. 6 Comparison of results of different prediction models
从图9 中可以看出, PSO-SVR 的拟合效果最差,R2值为0.881 2,RMSE 为63.557 8;其次是GABP,R2值为0.926 8,RMSE为50.343 7, CLSSALSTM 的预测精度比PSO-SVR 提高了9.830 8%,比GA-BP 提高了4.429 3%,有着不错的预测效果,这也验证了该模型的预测准确性。
为了更有效地预测短期电力负荷, 本文提出了一种基于小波降噪和CLSSA-LSTM 的混合深度学习方法。 研究过程中, 使用小波降噪来为数据进行降噪处理, 并利用混沌初始化策略和引入Levy 飞行策略以及引入新的跟着随者的更新公式改进了标准樽海鞘群算法(SSA)。 随后将其用于LSTM 的参数优化, 从6 而得到具有最佳参数的LSTM 负荷预测模型。 采用6 个基准函数来对比PSO、FA、SSA、CLSSA 的模型效果, 用于验证算法的寻优速度和精度, 构建了不同算法优化LSTM、PSO-LSTM、GALSTM、SSA-LSTM 和CLSSA-LSTM 以及与单一LSTM 五个比较模型, 验证了WNR-CLSSA-LSTM模型的负荷预测效果。 同时,也对比了不同预测模型GA-BP、PSO-SVR 的预测效果。 结果表明:
(1)CLSSA 算法对比其他算法有着较好的寻优速度和寻优精度。
(2)CLSSA 优化的LSTM 对比其他算法优化的LSTM 拥有更好的拟合度R2以及最小的RMSE和MAPE。
(3)CLSSA-LSTM 模型对比不同的预测模型表现出更好的预测效果, 该模型具有较强的预测能力, 因此能够对电力负荷数据进行有效预测。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!