当前位置:首页 期刊杂志

基于Copula函数的风-电-热相关性及其潜在不确定性分析*

时间:2024-07-28

杨 柳 杨德友 张宇时 许小鹏 李典阳

(1. 东北电力大学电气工程学院 吉林 132012;2. 国网辽宁省电力有限公司 沈阳 110000)

1 引言①

随着我国大规模的风电并网,给电网的运行也带来了一定的冲击,风电与热、电负荷在时间和空间上均可能存在较强的相关性,如果不考虑这种关系将会影响风电的合理消纳及风能的利用效率[1-2]。因此,在电网经济调度中有必要对风电与热、电负荷间的相关性进行建模,以量化变量的随机性给电力系统带来的影响,实现电网安全经济运行。

研究变量间相关性问题的关键在于正确处理非正态随机变量之间的相关性[3]。Copula理论作为多元分析方法中的一种方法,能较准确地描述多元变量的相关结构,被广泛应用于两个(或多个)随机变量的依赖结构建模。该方法被用于许多领域的研究,包括金融[4]、风电场相关性分析[5]、洪水风险分析[6]、频率分析等[7]。文献[8]提出构造混合Copula函数来模拟两个风场之间的风速相关性,但没有关于模型结构和验证的细节。文献[9]基于动态Copula理论构建风光联合出力模型,用动态相关系数来描述相关性,并将其运用于数据驱动的风光联合系统中。文献[10]基于Copula理论,通过描述变量间非线性相关系数,对冷热电负荷之间的相关性进行定量分析,但仅限于少量的Copula函数。文献[11]利用Copula理论对不同风电场下风速和风力的联合分布进行了建模,采用两阶段最大似然估计方法来估计联合Copula函数中的未知参数,但该方法容易陷入局部最优。以上研究方法均采用Copula理论分析了变量间的相关性,但仅限于少量的Copula函数,并且没有分析Copula建模中潜在的不确定性,以至于不能准确地描述变量间相关性。

鉴于此,本文采用Copula函数构建风-电-热相关性模型。以某一地区的热负荷、电负荷和风电出力作为数据样本,利用全局优化方法 MCMC对不同Copula族的参数进行约束,并提供了参数值的后验分布,来拟合 Copula概率等值线的不确定性信息。结果表明所提方法构造的Copula函数模型可以准确地描述变量间的相关性,并且可以定量地反映建模的潜在不确定性。

2 Copula理论及相关性评价指标

2.1 Copula理论

Copula是一个无论其单变量分布如何,“连接”或“耦合”两个或多个与时间无关变量的数学函数[12]。设H是具有边际单变量分布F和G的联合累积分布函数,(x,y)是连续的二维随机变量。Sklar定理指出当 F和 G连续时,存在唯一一个确定的Copula 函数 C( · )满足

Sklar定理也可以推广到多元分布的联合分布函数。

2.2 相关性指标

在非正态分布情况下,需要引入能够很好测量随机变量相关性的指标,通常通过参数和经验依赖性度量之间的理论关系来估计,如 Kendall秩相关系数τ和Spearman相关系数ρ,若τ>0,表示变量间呈正相关;τ<0,表示变量间呈负相关[13]。ρ相关系数也呈同样的变化关系。设两随机变量x、y的分布函数分别为F(x)、G(y),若u=F(x),v=G(y),则两变量之间的相关性可由τ和ρ相关系数得到,即

3 基于 Copula函数变量相关性分析与建模

3.1 贝叶斯分析

贝叶斯(Bayes)分析已成功地应用于各个领域,用于模型推断和不确定性量化[14-15]。MvCAT采用基于残差高斯似然函数的贝叶斯框架来推断 Copula参数和估计潜在的不确定性。当获得新信息时,Bayes定理更新某个假设的先验概率,方便地将所有建模不确定性归结为参数,并通过以下方法估计模型参数的后验分布

Bayes方程计算起来有点困难,为了解决这一问题,本文采用了 MCMC模拟的数值分析方法,从后验分布中提取样本。

3.2 马尔可夫链蒙特卡罗模拟

马尔可夫链蒙特卡罗(MCMC)算法提出了一种新的混合卷积 MCMC方法,该方法利用自适应建议分布来描述贝叶斯背景下的后验参数区域[16]。混合演化 MCMC受益于智能起点的选择,并采用自适应大都市(Adaptive metropolis,AM)、差分演化(Differential evolution,DE)和斯诺克更新算法来搜索可行空间。MCMC算法可在一次运行中受益于多个起点,多个并行链可以即时通信以适应搜索的规模和方向。MCMC算法能够搜索多个吸引区域,不仅可以找到全局最优解的估计值,还可以近似于参数的后验分布。局部优化方法得益于高效、快速的搜索,并权衡了寻找局部最优的敏感性。与局部优化算法相比,MCMC算法计算范围更广,其优越性在于它可以确保找到全局最优估计,并可以描述潜在的不确定性。

3.3 拟合优度措施

在本研究中,使用几种拟合优度来评价不同的Copula模型的性能,包括似然值、Akaike信息标准(Akaike information criterion,AIC)、贝叶斯信息准则(Bayesian information criterion,BIC)、均方根误差(Root mean square error,RMSE)和 Nash-Sutcliffe效率(Nash-Sutcliffe efficiency,NSE)[17]。最大似然参数集通过式(6)进行计算,从残差最小化意义上讲,它提供了最适合观测数据。AIC通过增加一个基于参数的惩罚项来避免过度调整的问题,AIC被表述为

式中,D是统计模型的参数;CS为常数。AIC值越低,模型拟合越好。类似地,BIC表示为

与AIC相似,BIC值越低,模型拟合越好。NSE和RMSE也是两种广泛使用的拟合优度措施,仅侧重于最小化残差,其表达式为

基于Copula函数变量相关性分析理论,计算风电出力、热负荷、电负荷之间的相关性及其潜在的不确定性,算法流程如图1所示。

4 多元Copula分析工具箱

本文在贝叶斯框架内采用马尔可夫链蒙特卡罗模拟的多元 Copula分析工具箱(MvCAT)来估计Copula参数和潜在的不确定性。当前版本的MvCAT仅适用于二元变量分析,所以风-电-热三变量需要分成两两一组进行分析,采用基于核密度的估计方法来确立随机变量的边缘分布,对各变量的边缘分布进行了实证估计,并构造了变量间的联合分布。根据最大似然法、Akaike信息准则(AIC)和贝叶斯信息准则(BIC)对所选Copulas的性能进行排序,选取五个最好的 Copula函数,进而选出最优的 Copula函数来刻画变量间的相关性。采用基于残差的高斯似然函数的贝叶斯框架对所选取的 Copula函数进行参数估计和潜在的不确定性估计。

5 算例分析

本文选取阜新区域一年的风力发电和电、热负荷的数据进行分析,采样的时间间隔为1 h,如图2所示,它代表了在“三北”地区一年中热负荷和电负荷的基本趋势和风电场输出功率的波动情况。

首先分析电负荷与风电出力的相关性,确立电负荷与风电出力的边缘分布,并构造了电负荷与风电出力的联合分布。根据最大似然法(Max-Likelihood)、Akaike信息准则(AIC)和贝叶斯信息准则(BIC)对所选Copulas的性能进行排序,如表1所示。

表1 五个最好的Copula函数

通过拟合优度检验确定最合适的模型—Linear-Spearman函数,它能更好地拟合电负荷和风电出力两个指标间的相关性,表达式为

采用基于残差的高斯似然函数的贝叶斯框架对所选取的 Copula函数进行参数估计和潜在的不确定性估计。表2为模型估计所得到的参数,图3是阜新区域电负荷和风电出力的依赖结构。

表2 模型估计所得参数

由表2可知,电负荷和风电出力的相关性系数Kendall=−0.325 2,Spearman=−0.563 7,Pearson=−0.430 6,存在较强的负相关性。图3显示了电负荷和风电出力之间的依赖关系,图3a、3c分别为风电出力的边缘分布函数和电负荷的边缘分布函数,图 3b中实线表示Copula的概率等值线,散点表示观测数据。图 3b中可以看出数据的不对称和倾斜依赖结构,用Linear-Spearman Copula得到的概率等值线明显偏向左上角(电负荷概率低,风电出力概率高)。在其他26个Copula函数中,Linear-Spearman Copula对于观测数据提供了最好的拟合,NSE=0.981 4,RMSE=0.793 3。这突出了选择合适Copula函数的重要性,更重要的是RMSE量化潜在的Copula建模不确定性。在观测数据中缺乏足够约束信息的情况下,不确定性量化尤为必要。

将关注Copula建模的不确定性,并绘制一组六个代表性Copula家族的后验参数分布,如图4所示。

每个图上方的实心点表示为局部优化方法导出的Copula参数值,而柱状图区域是MCMC衍生的参数,横坐标的“×”表示为 MCMC的最大似然参数。Linear-Spearman、Galambos Copula的后验参数(图 4b、图 4f)受到很好的约束。更重要的是,Copula参数通过局部优化算法(每个图顶部的星号)导出的值与从MCMC模拟得到的分布模式(最可能的参数,在每个图的底部以十字显示)一致。然而,来自局部优化算法的Shih-Louis、Nelsen Copula的推断参数与 MCMC模拟的对应参数明显不同,MCMC模拟的Shih-Louis最佳参数返回RMSE值为0.863 2,而局部优化算法的RMSE值为2.019 7。与MCMC结果相比局部优化具有较差拟合度(根据RMSE),所以采用全局优化算法非常重要,这些算法和 MCMC框架受益于多个起始点,可以更好地检索目标值。Cubic Copula的参数分布合并到参数边界,最大似然(最佳)参数放在边界上。优化算法试图通过超出边界来改善拟合,这是强制不允许的,也就是说可能这种数据的 Copula选择不合适。由图 4d可以看出Burr参数几乎具有统一的边缘分布,这表明观察数据中的信息(24个数据点)不足以约束Burr Copula参数。

使用贝叶斯分析和 MCMC模拟找到后验参数分布,并将它们转化为概率等值线不确定性,为了研究数据长度对依赖结构和潜在模型不确定性的影响,使用了年数据和典型日数据进行对比分析,图 5和图6分别给出了年数据和典型日数据与后验参数相关的概率等值线的不确定性范围。

Copula等值线的不确定性范围用概率等值线中的不规则区域面积表示,不确定性范围仅归因于贝叶斯分析中得出的参数不确定性,数据长度也对不确定度有显著影响。由图5可以看出不确定性范围很小,这种情况表示数据集可以很好地约束Copula模型中的参数,这也跟观测数据的长短有关。当概率等值线的不确定性范围很大时(图6),它可以包含本文所研究的大多数Copula函数的最佳预测,以至于不能准确地选择到最优的 Copula函数进行建模分析,这一点也突出了Copula应用的不确定性分析的重要性。

热负荷和电负荷、热负荷和风电出力同样采用Copula理论相关分析方法进行分析,由于篇幅有限,不再赘述。总之,在数据长度一定的情况下(尽量采用长的数据),在贝叶斯框架内选取的最优 Copula函数可以很好地反映变量间的相关性。

6 结论

热负荷、电负荷和风电出力三者之间的相关性对于风电合理消纳、提高风能利用效率具有重要的意义。

(1) 以Copula理论为基础,在贝叶斯框架内采用基于残差高斯似然函数来推断 Copula参数和估计潜在的不确定性,通过拟合优度检验有效地评价了相对于其数据长度的Copula的最佳选择,并说明数据长度对建模的不确定度有显著影响。

(2) 通过实例分析表明,在数据长度更长的情况下,所选取的最优 Copula函数能更好地刻画风-电-热间的相关结构,避免了传统相关性分析方法中只关注相关程度的缺点,定量反映建模的潜在不确定性,也验证了所提方法的有效性。

(3) 基于所提方法的优越性为下一步优化经济调度奠定了基础。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!