当前位置:首页 期刊杂志

稳健回归方法在电力消费预测中的应用

时间:2024-05-22

刘晓娟,方建安

(1.东华大学信息科学与技术学院,上海 200051;2.上海电力学院数理学院,上海 201300)

稳健回归方法在电力消费预测中的应用

刘晓娟1,2,方建安1

(1.东华大学信息科学与技术学院,上海 200051;2.上海电力学院数理学院,上海 201300)

电力系统电力消费量受诸多因素的影响,为了提高其预测的精度,得到更好的预测结果,首先分析了异常数据产生的原因以及其对预测结果的影响,提出了基于M-估计的稳健回归预测算法。在该预测算法中首先选择恰当的目标函数和权重函数,接着利用泰勒展开对参数进行迭代估计,得到稳健的预测值,最后进行算例分析。算例数值表明该算法同传统线性回归方法相比,具有较好的抗干扰性,预测结果能更好地吻合实际数据和未来的趋势。

最小二乘法;M-估计;稳健回归;预测;电力消费

随着科学技术和经济的发展,电力能源在日常生活和生产中起着越来越重要的作用。电力消费量与工农业生产以及居民的消费水平有着密切的联系,随着我国工农业生产的快速发展和居民人口的不断增长,如何精确地预测电力消费量,以期能够及时调整电力系统能源的分布,对进行有效地计划调度和优化电力设施的功能等具有十分重要的现实意义[1,2]。

电力消费量是受诸多因素影响的既有规律性又有随机性的时间序列,电力消费量的预测是依赖于大量的历史数据和相关影响因素资料的被动型预测。翔实可靠的资料数据对预测精度有至关重要的影响。但大量的测量数据中经常出现一些异常数据(Hampel(1977)指出实际数据中含有10%左右的异常值是正常的),很多方法对异常数值非常敏感,少量的异常值可能会对预测规律和预测结果产生完全错误的影响[3,4]。近年来,大量的模型和方法被应用于电力消费的预测[5~9]。但是目前的一些模型和方法,常常假设历史的数据资料完全正确,忽略了对异常数据的预处理。

本文提出了一种基于稳健统计的预测算法,该算法可降低异常数据对预测结果的影响,并且具有较好的稳定性。

1 基于最小二乘法的传统的回归分析

1.1 异常值的产生以及对预测结果的影响

异常值是指在一个预测样本中,其残差严重偏离其他样本残差的数据。异常值的出现有3种原因:一方面,电力系统在实际运行时,数据采集系统的量测、记录和传输过程中的任一环节都可能导致观测数据的异常;另一方面,数据采集系统正常,特殊事件(线路停电检修、大事件冲击等)引起负荷的异常变化,也会导致观测数据的异常;第三,抽样调查技术不完善、记录错误、人为虚报等原因也有可能产生异常值。

如果这些异常值得不到正确地识别和有效地校正,它们将以伪变化规律的方式提供给预测者作为参考,影响预测结果的精确度和可靠性。在实际电力负荷预测时,历史资料数据中的异常数据常常会产生两方面的影响:①作为建模数据,干扰了变化规律,影响了训练精度;②作为检验预测结果的预测值,会导致对预测结果预测精度的误判。

1.2 传统的多元回归分析

传统的多元线性回归分析的基本原理模型为

式中:β0,β1,…,βk为未知的回归系数;e1,e2,…,en为随机误差且独立同分布,常假设:E[ei]=0;E(ei2)=σ2,E(ei2)为一常数。

基于以上原理,采用最小二乘法进行参数β的估计。可以看出传统的最小二乘回归分析是通过极小化残差的平方和求得各个回归系数的,而这个过程本身使得回归系数的大小对残差的大小异常敏感。如果样本数据中有异常值,其对应的回归残差也异常(偏大或偏小),往往导致拟合、预测模型的失真。可见,传统的多元回归分析具有较大的弊端,特别是样本中存在异常数据时。

2 基于M-估计的稳健回归算法

当样本数据中含异常值时,最小二乘估计OLS(optimal leastsquare)估计出的残差一般不是正态分布,往往是偏尾的,由于考虑残差的平方和,使异常值的作用显著增加,导致估计的精度较差。稳健回归方法的主要目的在于改进最小二乘估计受异常值影响太大的缺点,其基本思想是极小化残差函数ρ(ei),得到各个回归系数,选取的残差函数ρ(ei)不是像OLS选取残差平方和那样,对所有样本数据赋予相同的影响因子,而是根据残差的大小赋予不同的权重,从而减弱异常值对回归结果的影响。

常用的稳健回归方法是由Huber在1964年提出的M-估计方法。其基本原理的回归模型为

式中:β0,β1,…,βp为未知的回归系数;e1,e2,…,en独立同分布,且E[ei]=0。

Huber提出的M-估计就是寻找β,使得

达到最小。

为减小Y1,Y2,…,Yn中异常值的作用,取ρ(x)为增长速度比x2慢的函数,且满足:①ρ(x)处处连续,-∞<x<+∞;②ρ(0)=0,ρ(x)=ρ(-x);且当

显然,当ρ(ei)=ei2时,M-估计就是OLS,因此可视M-估计为OLS估计的扩展。记

则目标函数对参数β求偏导数,并令偏导数等于0,则得到关于参数的k+1个方程组为

为使上述方程组有解,ρ(x)需满足:ρ(x)为定义在(-∞,+∞)上的非负凸函数,且ρ′(x)=ψ(x)处处存在且

可见,M-估计的性质与所选择的函数ρ(x)有很大关系,并且在计算β时,初始值的选择非常重要。经尺度同变性,式(7)可化简为

式(8)为一加权最小二乘估计问题,且它的权重依赖于残差ei的大小,残差又依赖于回归系数β,回归系数又依赖于估计时的权重Wi,因此必须使用迭代法对方程进行求解。并且在求解时,关键点在于:一是选择恰当的目标函数ρ(x);二是权重函数W(x)的选择,使导致残差异常的异常值权重变小,残差小的样本数据权重变大,以减弱异常点对回归分析的影响,增强回归方程的稳健性。

3 稳健回归预测算法

稳健回归估计预测的目的不在于缩小残差,而在于求得回归系数较正确的估计,以达到比较精确的预测。稳健回归估计预测的主要作用是对付异常值,尽可能减小异常值对预测的影响。因此,在构造目标函数时,充分考虑函数的时间优先性,即越靠近预测时间的数据具有更高的参考价值,应赋予较高的权重。此外,参数ˆ的估计依赖于目标函数ρ(t,et,x)的迭代估计;Y的预测则考虑了权重函数W(t,et)和目标函数。

稳健回归预测算法步骤如下。

步骤1选择初始估计值β(0)、目标函数ρ(t,ei,x)和权重函数W(t,ei);

步骤2令

关于βk泰勒展开至二次项,并令残差

4 数值算例及结果分析

本文以上海市1985、1990—2010年共22年的工业总产值(亿元)、农业总产值(亿元)、常驻人口(万人)和电力消费量(亿千瓦时)的数据[10]为依据,建立上海市电力消费量关于工业总产值、农业总产值以及常驻人口数的线性回归方程,并对该回归方程进行传统回归预测分析和稳健回归预测方法分析。

对其进行传统多元线性回归分析,得到的回归方程为

通过分析其残差和残差,明显可以看出,2005年的原始数据有异常,该回归方程受其影响,明显偏离原始数据。

采用稳健回归预测算法分析,得到的回归方程为

与传统的回归分析预测模型相比较,结果如图1所示。

图1 实际值与两种回归算法预测值比较Fig.1 Comparison of the actualdata and the forecasting data obtained by the two regression algorithms

从图1可以看出,在2005年数据(第17个原始数据)以后,传统回归曲线明显偏离了实际数据,并且随着原始数据的不断增加,传统回归曲线具有越来越偏离原始数据的趋势。事实上,由于政治、经济等各方面的原因,近期数据对预测未来电力消费量的的影响远大于远期数据,传统回归曲线并不能较为准确地拟合预测未来的电力消费量。

为了比较预测的精度,定义绝对百分比误差APE(absolute percentage error)来作为预测的误差准则。

式中:yk为k年电力消费量的真实值;yˆk为k年电力消费量的预测值。

从表1预测误差比较可以看出,异常点2007年以后,稳健回归误差有较大程度的改善。稳健回归的主要目的不是减小预测误差,而是减弱异常点对回归分析的影响,增强回归方程的稳健性。由此可以看出文中所给出的稳健回归算法在异常点以后能更准确地描述电力消费量的趋势。

表1 误差比较表Tab.1 Comparison of the error

5 结语

针对上海市年用电量受工业总产值、农业总产值和常驻人口等诸多因素的影响可能出现异常值数据与预测模型不能高度吻合直接影响到预测的精度的情况,本文提出了一种稳健回归的预测算法,该算法同传统线性回归算法相比,能自动减弱异常数据对预测结果的影响,增强对异常数据的抗干扰性。数值结果表明,该稳健算法比传统的线性回归算法能更好地吻合实际数据。

[1]李培强,李欣然,林舜江(LiPeiqiang,LiXinran,Lin Shunjiang).电力负荷建模研究述评(Critical review on synthesis load modeling)[J].电力系统及其自动化学报(ProceedingsoftheCSU-EPSA),2008,20(5):56-64,123.

[2]吴曾,张庆丰(Wu Zeng,Zhang Qingfeng).基于稳健回归的电力负荷预测(Forecastofpower load based on robust regression)[J].电力科学与工程(Electric Power Science and Engineering),2009,25(4):25-27.

[3]Moller SF,Frese JV,Bro R.Robustmethods formultivariate data analysis[J].JournalofChemometrics,2005,19(10):549-563.

[4]Pell R J.Multiple outlier detection formultivariate calibration using robuststatistical techniques[J].Chemometricsand Intelligent Laboratory Systems,2000,52(1):87-104.

[5]王新军,黄守坤(Wang Xinjun,Huang Shoukun).预测型稳健回归模型及其实证分析(Forecasting robust regressionmodel and the experimental analysis)[J].统计研究(StatisticalResearch),2004,(12):42-45.

[6]奇凤,魏占民(QiFeng,WeiZhanmin).Matlab稳健回归在作物水模型建模中的应用(Application ofMatlab robust regressionmodeling of crop response towater)[J].内蒙古农业大学学报(Journalof InnerMongolia AgriculturalUniversity),2008,29(2):144-147.

[7]李建伟,赵法起,刘凤玲(Li Jianwei,Zhao Faqi,Liu Fengling).中长期电力负荷的组合预测法(Forecast combining approach ofmid-long term power load)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2011,23(4):133-136.

[8]Liu Jin,Yu Jilai,Tang Xianglong,etal.Peak load forecasting based on robust regressionmodel[C]//International Conference on Probabilistic Methods Applied to Power Systems.Ames,USA:2004.

[9]Jia Runda,Mao Zhizhong,Chang Yuqing.A nonlinear robustpartial leastsquaresmethod with application[C]//Chinese Control and Decision Conference.Xuzhou,China:2010.

[10]上海市统计局编.2011年上海统计年鉴[M].北京:中国统计出版社,2011.

Application of Robust Regression M ethod in Electric Power Consumption Forecasting

LIUXiao-juan1,2,FANG Jian-an1
(1.College of Information Scienceand Technology,Donghua University,Shanghai200051,China;2.SchoolofMathematicsand physics,ShanghaiUniversity of Electric Power,Shanghai201300,China)

Electric power consumption is influenced bymany factors.To improve its forecasting precision and obtain better results,the cause and effectofanomalousdataare analyzed,and a robust regression algorithm based on M-estimation isgiven.In the algorithm,properobjective function and weight functionsare chosen,and then iterative estimation using Taylor expansion ismade to obtain robust forecasting results.In the end,experiment results show that the proposedmethod performsbetterboth in robustnessand in accuracy than the conventional linear regressionmethod.

optimal leastsquare;M-estimation;robust regression;forecasting;electric power consumption

TM715;O212

A

1003-8930(2013)05-0022-04

刘晓娟(1977—)女,博士研究生,讲师,研究方向为最优化理论、最优预测及控制等。Email:xiaojl_01@163.com

2012-07-03;

2012-11-30

国家自然科学基金项目(60874113)

方建安(1966—)男,博士,教授,博士生导师,研究方向为复杂系统建模与仿真等。Email:jafang@dhu.edu.cn(通讯作者)

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!