当前位置:首页 期刊杂志

基于经验模态分解与多分支神经网络的超短期风功率预测

时间:2024-05-04

孟鑫禹,王睿涵,张喜平,王明杰,丘 刚,王政霞

(1.重庆交通大学信息科学与工程学院,重庆 400074;2.中国大唐集团新能源科学技术研究院有限公司,北京 100043;3.积成电子股份有限公司,济南 250104;4.国网新疆电力公司,乌鲁木齐 830002;5.海南大学计算机与网络空间安全学院,海口 570228)

0 引言

当今世界面临能源危机,风能是最具开发前景的一种可再生能源。风力发电具有环保可持续、成本低廉、规模经济显著等优点。但由于受温度、海拔、地形、气压等因素的影响,风能具有波动性、随机性和不稳定性的特点。而风机的运行效率随着风速的变化而变化[1],大规模风电并网必然会对电网调度产生负面影响,从而降低电网的可靠性[2]。风电场需要完备的风功率预测系统来制定合适的发电、配电和维护策略,提高风电并网的可靠性。因此,精准的风功率预测能够有效提高电网调峰能力,增强电网的风电接纳能力,改善电力系统运行的安全性与经济性,对于风电一体化和电力系统的稳定运行至关重要[3]。

根据预测时间范畴,风功率预测可分为四类[4]:应用于风电场设计可行性研究的长期预测;应用于指导风电场维护规划和运行管理的中期预测;应用于电网调度,以保证供电质量[5]的短期预测;以及超短期预测。超短期风功率预测精度要求较高,用于平衡负荷和优化调度能源,通常需要提前几分钟或几小时进行预测[6]。

风功率预测方法可分为物理方法和统计方法两大类。物理方法通常使用数值天气预报[7]、地形、地貌等信息,建立完整的流体力学和热力学模型,通过求解高维非线性方程,计算出风机轮毂高度处的风速大小,然后结合风机功率曲线,得到风机的输出功率。该类方法能较好地运用大气运动的本质,不需要积累大量的历史风电机组运行数据。但由于风电场特殊的地理环境和一些物理现象(如尾流效应等)的影响,风况往往难以准确评估,因此数值天气预报的时空分辨率往往会制约预测结果的准确率。另一方面需根据风机自身运行状态和外部环境因素建立符合风机真实运行工况的风机功率曲线模型[8-9],这增加了风功率预测的不稳定性因素。统计方法是通过分析历史风功率数据的统计规律,建立时序风功率样本之间的非线性映射关系,以此得到风功率的预测值。传统的时间序列预测方法,如自回归移动平均(AutoRegressive Moving Average,ARMA)模型,常用于风功率的预测;文献[10]提出了使用Burg 和Shanks 算法的ARMA 过程预测风功率,文献[11]考虑了风速的自相关和波动特性,基于F 准则建立了ARMA模型用于风功率预测。随着人工智能技术的飞速发展,一些基于机器学习算法的风功率预测工作涌现。如:文献[3]提出一种基于支持向量机(Support Vector Machine,SVM)和改进的蜻蜓算法的短期风功率预测方法;文献[12]介绍了一种基于深度神经网络(Deep Neural Network,DNN)的预测方法;文献[13-14]介绍了循环神经网络(Recurrent Neural Network,RNN)在预测引擎中的应用,其中,文献[13]提出了脊波神经网络(Ridgelet Neural Network,RNN)与埃尔曼神经网络(Elman Neural Network,ENN)结合的两阶段预测方法,文献[14]提出了一种结合门控循环单元(Gated Recurrent Unit,GRU)与卷积神经网络(Convolutional Neural Network,CNN)的预测方法。这些基于统计模型的算法,可以避免对物理机制把握不足的差异,更适合于风功率的短期和超短期预测任务。

ARMA 算法适合处理平稳时序信号,对于风速、风功率这样的非平稳信号,往往需要将原始信号差分处理成平稳信号再输入模型训练。文献[15]提出了小波分解与重构的方法;文献[16-17]采用了局域波分解以及经验模态分解(Empirical Mode Decomposition,EMD)的方法,将原始信号转化为平稳信号后使用ARMA算法,取得了较好的效果;文献[18]提出了基于集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)与小波神经网络(Wavelet Neural Network,WNN)的新型风功率组合预测模型,WNN 集人工神经网络和小波分析优点于一身,具有网络收敛速度快,避免陷入局部最优,同时又具备时频局部分析的特点。近年来,循环神经网络作为一种利用时间关系的统计模型,在风功率预测任务中显示出了良好的优势。然而,由于天气环境、切入切出风速、风机状态等诸多不确定因素的存在,风功率信号表现出非平稳的性质,循环神经网络的预测机制也很难捕获其时序规律。考虑到信号分解能增强数据的平稳性,提出了一种基于经验模态分解与融合GRU 层、卷积层的多分支神经网络模型——经验模态分解的卷积循环神经网络(Convolutional Recurrent Neural Network based on Empirical Mode Decomposition,EMD_CRNN):首先,原始风功率信号经过EMD 算法分解后再重构,获得风功率的相对平稳信号;然后,将重构后的张量输入一个融合了GRU 层与卷积层的多分支神经网络,分别学习风功率时序信号的趋势特征和局部特征;最后经过特征融合得到风功率预测结果。该模型具有如下优点:

1)经过EMD 算法分解后再重构的多维度信号,每个维度是相对平稳的,网络在平稳频域学习到的特征有更强的时间趋势表示性,该方法可以弱化非平稳因素带来的扰动;

2)原始信号分解成多个信号分量后重构成多维张量输入网络,并非每一分量单独预测,考虑了分量之间的内在相关性,采用信息互补的策略增强网络模型的鲁棒性;

3)兼顾时间序列分量的趋势特征和局部特征,两部分特征并行提取并融合。不仅保留了不同策略提取特征的独立性,同时也在特征融合阶段对目标函数做了整体约束。

1 风功率经验模态分解

1.1 经验模态分解

经验模态分解(EMD)是将非平稳信号按不同尺度的波动或趋势逐级分解成若干个内在模式函数(Intrinsic Mode Function,IMF)的平稳化处理。IMF 满足以下条件:1)函数在整个时间序列范围内,局部极值点和过零点的数目相等或最多相差一个;2)在任意时间点,局部最大值的包络(上包络线)和局部最小值的包络(下包络线)平均值为零。

设x(t)为任意时序信号,经验模态分解具体步骤如下。

1)确定信号x(t)的局部极大值点和局部极小值点,利用三次样条插值拟合形成原数据的上、下包络线;

2)令上包络线和下包络线的均值为m(t),计算h(t)=x(t) -m(t),判断h(t)是否满足IMF 条件,若不满足,则把h(t)看作新的x(t),重复以上操作,即:

直到hk(t)满足IMF 条件,这样就得到了第一个IMF,即c1(t)和信号的剩余分量r1(t):

3)对r1(t)按照步骤2)的方法继续进行分解,直到所得的剩余分量满足给定的终止条件,分解过程结束,得到若干IMF和一个剩余分量:

原始信号可表示为若干IMF和剩余分量之和,即:

剩余分量rn(t)反映原始信号的中心趋势。

1.2 风功率经验模态分解数据重构

受不确定性环境因素影响,风速是非平稳的时序信号,风速与风功率存在一定的映射关系,因此风功率是随风速波动的非平稳信号。将风功率原始时序信号利用EMD 算法进行分解,得到的信号分量与原始信号结合进行数据重构,重构的张量作为神经网络模型的输入。设原始风功率信号长度为t,经验模态分解之后得到n个IMF分量和1个剩余分量,加上原始信号后数据重构成t×(n+2)的2D 张量。重构过程表示为:

其中:x是重构后的2D 张量,x(t)是原始时序信号,ci(t)是IMF,rn(t)是剩余分量。重构后的信号既保留了原始风功率的信息也融合了多个频段的平稳信号信息,对后面的神经网络学习过程有促进作用。

2 EMD_CRNN超短期风功率预测

这部分将详细介绍本文模型(EMD_CRNN)的结构,依次介绍了卷积层和GRU 层在特征提取方面各自的优势,以及特征融合的方法。EMD_CRNN的整体架构如图1所示。

图1 EMD_CRNN 整体架构Fig.1 Overall framework of EMD_CRNN

2.1 局部特征提取

卷积神经网络(CNN)的核心是对数据张量的卷积。CNN学到的模式具有平移不变性,这使得它可以高效地利用数据,少量的样本也可以学到具有泛化能力的数据表示。此外CNN还可以学到模式的空间层次结构,这使得它可以有效地学习抽象的空间层次概念。卷积层具有指定大小的滤波器,用以提取数据的局部特征,这一过程可以表示为:

其中:⊗表示卷积运算,x是数据张量,ReLU(Rectified Linear Unit)是激活函数,Wc和bc是网络学习过程中需要修正的权重和偏置。重构后的风功率信号作为卷积层的输入,网络可以学习到不同频段信号之间的相互依赖,卷积层提取到的是不同频段信号的局部特征。

2.2 趋势特征提取

循环神经网络(RNN)处理时间序列任务有独特的优势,但随着层数的增加,其面临梯度消失的问题。门控循环单元(GRU)神经网络作为RNN 的一种变体,它特殊的门结构可以有效地解决长短时间序列上的变化问题。GRU 层的过程可以表示为:

其中:zt是记忆门,rt是遗忘门是更新的隐含层单元,ht是隐含层单元,⊙表示内积运算,σ表示sigmoid 函数,Wz、Wr、Wh表示网络学习的权重。重构后的风功率信号作为GRU 层的输入,网络可以学习到历史信号的时序依赖关系,GRU 层提取时序信号的长期趋势特征。

2.3 多分支神经网络预测模型

多分支神经网络模型由GRU 层和卷积层分别提取特征,经过特征融合后再通过全连接层,最后得到网络的输出。GRU 层学习到的特征侧重于时序信号的长期趋势,而卷积层学习到的特征侧重于不同频段信号的局部关联,全连接层可以拟合复杂的非线性映射[19]。这样组合的混合神经网络优势在于:兼顾了CNN 和GRU 两种神经网络的独立性和相关性,在网络中两个分支是并行的,以保证针对数据的不同特性学习到不同的参数分布,并通过特征融合来约束统一的目标。

特征融合采用特征向量连接的方式实现,经过卷积层提取到的特征是3D 张量,经过GRU 层提取到的特征是1D 张量。两部分特征向量无法直接连接,文章使用Keras 中的Flatten 层将多维特征一维化,即把3D 张量“压平”,然后再进行连接。连接方式采用向量合并的策略,合并之后的总特征数为各部分特征数相加之和,文章使用Keras 中的concatenate函数实现特征融合。

风功率预测的流程如下:首先原始风功率时序信号经过EMD 算法分解成若干子信号,通过1.2 节提到的方法将信号重构;然后重构张量作为神经网络的输入,由GRU 层和卷积层分别提取趋势特征和局部特征;最后将两个分支得到的特征融合,经过全连接层后得到最后的预测结果。整个多分支神经网络可以用式(11)来表示:

其中:p是预测功率;C(x)和R(ht)分别由式(6)、(10)计算得到,代表提取到的特征向量表示向量合并;W和b是需要训练的权重和偏置,Φ代表整个网络学习的函数。

3 实验与结果分析

3.1 数据集及预处理

本文实验使用内蒙古某风场的实际运行数据,风机信息如下,风机型号(http://wp.china-nengyuan.com/member_product/21293.html):CCWE-1500/77,额定功率1500 kW,轮毂高度:70 m,转子直径:77 m。原始数据的采样周期是10 s,单位采样次数下的数据波动很小,因此对原始数据的缺失信息,采用了邻近值填充的方式,即对于某时刻缺失的风功率数值,向上搜寻一个时间单位的数值,如果依旧缺失则继续向上搜寻一个时间单位,直到搜寻到数值为止。称搜寻到的这个数值为当前缺失信息位置的最邻近值,依次找到所有缺失信息位置的最邻近值进行填充,补全整个数据集。

样本数据的波动会影响预测精度,导致解的不确定性。数据的标准化可以减小样本波动的影响,提高预测性能。标准化方程为:

其中:di是标准化后的值,d是待标准化的数据,dmax是待标准化数据的最大值,dmin是待标准化数据的最小值。

3.2 模型参数

神经网络的目标函数表示为:

其中:W、b为神经网络学习的权重和偏置,i是指某一样本点,pi是实测功率值是预测功率值。网络优化器选择考虑了动量的Adam 方法。卷积层、GRU 层和全连接层中相应的神经元参数通过大量的实验调整到相对最优值,卷积层的过滤器个数为32,尺寸为5×5,GRU 中隐含层的特征数为128。使用平均绝对误差(Mean Absolute Error,MAE)和均方误差(Mean Square Error,MSE)来评估各种方法的性能,MAE 的优势体现在对异常数据的鲁棒性[20]。

3.3 结果分析

此课题使用了数据集中2 880 个样本作为训练集,1 440个样本作为测试集,对比了在风功率预测中较常用的一些传统算法,同时也对比了引言部分提及的几个重要算法:差分整合自回归移动平均(AutoRegressive Integrated Moving Average,ARIMA)模型[21]、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)[22]、支持向量机(SVM)[3]、深度神经网络(DNN)[12]、门控循环单元神经网络(GRU)、文献[14]提出的GRU_CNN 和文献[17]提出的EMD_ARMA,此外为了说明多分支神经网络的优势,还对比了EMD 重构分别与DNN、CNN、GRU 网络结合的结果(依次记作EMD+DNN、EMD+CNN、EMD+GRU)。为了观察算法时间跨度预测性能,实验也列举了模型在不同时间跨度下的表现。由于计算出的评价指标精度高,为了便于展示,结果上做了1E-1和1E-2的运算。

图2 可视化了一段时间内的原始风功率信号和分解后各频段的信号,图的右边是EMD 算法对图左边原始信号的分解。可以看出原始信号的无周期性和非平稳性,信号分解后,满足IMF条件的分量是平稳信号,而且表现出了弱规律性,这给神经网络的学习降低了难度。

图2 风功率信号EMD可视化Fig.2 EMD visualization of wind power signal

表1 记录了所有对比模型的MAE 和MSE 结果,随着预测步长的增加,预测的准确度会降低。历史风功率信号经过EMD 重构之后再输入神经网络的优势很明显,与ARIMA、DNN、GRU 相比,EMD_ARMA、EMD+DNN、EMD+GRU 在MAE表现方面都至少有1E-3 的提升,EMD+GRU 更是提升了将近5E-3。GRU_CNN 并没有表现出很好的性能,因为对于风功率的单一信号而言,一维卷积并没有发挥出预测性能方面的优势。EMD_CRNN 的卷积是针对EMD 分解过后的多维信号,相比之下,它展现出来的优势就很明显,其MAE 比传统的ARIMA 方法下降了30%左右。EMD+CNN 和EMD+GRU 相对其他模型也有较小的MAE 和MSE,EMD_CRNN 发挥了卷积层和GRU 层的优势,达到了更好的效果。EMD+CNN 和EMD+GRU 在预测性能上差别不大,因为对预测结果起决定性作用的样本序列较短,CNN 中的卷积核也能挖掘到重要的时序特征。

为了证明EMD_CRNN 的普适性,表2给出了EMD重构后的几个神经网络模型在不同采样周期下的评价指标结果,采样周期分别为1 min、3 min和5 min。结果表明EMD_CRNN在各个采样周期上都比其他方法有优势。采样间隔时间越长,所有方法预测结果准确度都会降低,因为风速的不稳定性导致长间隔内的不确定性因素的增加,故预测难度增加。

图3是表1中MAE和MSE的柱状图,纵坐标是模型名称,横坐标分别是评价指标MAE和MSE的值。

图4 展示了GRU、EMD+GRU 与EMD_CRNN 三种模型在训练过程中随着迭代次数增加的损失折线图。可以看出,经过EMD 数据重构的神经网络更能训练得到较小的损失。GRU 神经网络在迭代过程中损失一直比较平稳,EMD_CRNN在迭代到5 次时模型效果达到最佳,后面则开始出现过拟合的现象,所以训练模型时,选择一个合适的迭代参数尤为关键。图5 给出了EMD_CRNN 预测结果与实测值的对比,采样周期和预测跨度皆为1 min,模型能较为准确地预测出风功率的走势和突变值,在应用上有一定的参考价值。

表1 不同模型评价指标对比Tab.1 Evaluation index comparison of different models

表2 不同采样周期的评价指标对比Tab.2 Evaluation index comparison of different sampling peroids

图3 MAE、MSE柱状图Fig.3 Histograms of MAE and MSE

图4 不同模型在验证集上的loss折线图Fig.4 Loss graph of different models on validation set

图5 预测结果与实测值可视化Fig.5 Visualization of prediction results and real values

4 结语

本文模型EMD_CRNN 是一种基于EMD 算法与数据重构,以及多分支神经网络的超短期风功率预测模型。多分支体现在利用卷积层和GRU 层并行提取局部特征和趋势特征。实验结果验证了该模型在实际风场数据集上预测风功率的优势,主要包括以下3个方面:

1)把非平稳风功率信号重构为在各频段相对平稳的数据张量,循环神经网络在平稳信号的数据驱动下能学习到更强的趋势依赖特征,克服了风功率预测中非平稳信号给模型学习带来的困难;

2)卷积层提取不同频段信号的局部特征,GRU 层提取时序信号的长期趋势特征,兼顾了不同特征之间的独立性与相关性,使得模型对风功率数据有更强的挖掘能力;

3)数据重构与多分支神经网络在数据层面与特征层面都体现出了信息互补的策略,该策略能提高风功率预测模型的鲁棒性。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!