当前位置:首页 期刊杂志

回归法设定指数平滑模型的最优预测参数

时间:2024-06-19

徐齐利

(江西财经大学 经济学院,江西 南昌330013)

一、引言

指数平滑预测法(Exponential Smoothing Prediction Method)是一种常用的时间序列预测技术,主要由三个预测模型组成,即一次指数平滑预测模型、二次指数平滑预测模型和三次指数平滑预测模型。在预测实践中,指数平滑法的应用面临两个难题,一是平滑次数的设定(吴德会,2007)[1],二是平滑参数的设置(吴德会,2008)[2]。

关于平滑次数的设定,目前主要凭经验判断。在时间序列中,若波动占优,则主要考虑一次指数平滑模型(王长江,2006)[3];若趋势占优,则主要考虑三次指数平滑模型(冯金巧等,2007)[4];若波动和趋势平分秋色,则主要考虑二次指数平滑模型(Khairina et al.,2021)[5]。

关于平滑参数的设置,现行的方法主要有经验法、试算法、枚举法。

其一,经验法。该方法对时间序列的波动态势、发展趋势做出经验性判断,据此给出平滑参数设置的参考区间。(1)当时间序列呈现较稳定的水平趋势时,平滑参数可在0.05~0.20之间取值;(2)当时间序列有波动,但长期趋势变化并不大时,平滑参数可在0.1~0.4之间取值;(3)当时间序列波动很大,长期趋势变化幅度较大,呈现出上升或下降趋势时,平滑参数可在0.6~0.8之间取值;(4)当时间序列呈明显上升或下降趋势时,平滑参数可在0.6~1之间取值。在预测操作上,无论静态预测还是动态预测,通常将所给区间的中间值选为具体的平滑参数值(崔世杰等,2016;Joseph,2019;Ani,2019)[6-8]。

其二,试算法。该方法在经验法给出平滑参数的参考区间内,选取少量几个(通常为3个)具体数值作为待选的平滑参数,对每个待选的平滑参数分别试算其预测的均方误差,选择使预测的均方误差最小的平滑参数作为实际应用的预测参数。在预测操作上,无论静态预测还是动态预测,通常在经验法所选平滑参数值的左右两边再各取一个数值做第二轮优选,在左中右三个待选数值中确定一个使预测的均方误差最小的数值。然后,再在该最优值的左右两边进一步各选一个数值,做第三轮优选。以此类推,循环下去,直至最优的平滑参数收敛或预测的均方误差收敛为止(高春雷等,2014;Hsieh et al.,2020;Shi et al.,2020)[9-11]。

其三,枚举法。该方法既放弃经验法的先验判断,又借鉴试算法的基本思路,待选的平滑参数是一个区间更长的等差数列,该区间通常是0~1,对数列中的每个待选参数分别试算其预测的均方误差,选择使预测的均方误差最小的平滑参数为实际应用的预测参数。在预测操作上,无论静态预测还是动态预测,根据业务需要,若对预测精度要求并不高,但对预测速度要求很高,则通常枚举共9个数值组成的等差数列待选;若对预测精度要求较高,且对预测速度要求也较高,则通常枚举共19个数值组成的等差数列待选;若对预测精度要求很高,但对预测速度要求并不高,则通常枚举共39个数值组成的等差数列待选(罗辰辉等,2018;Seong,2020;Sulandari,2021)[12-14]。

经验法、试算法、枚举法各有优劣(李守金等,2018;黎锁平、刘坤会,2004;Gustriansyah,2019)[15-17],但三者有四个共同的弊端。(1)弊端1:非全域取值。平滑参数的取值范围皆被限定在0~1的区间内。学界和业界从没有解释过平滑参数为什么必须严格限定在0~1的范围内,选择0~1区间取值仅因当初的主观直觉和方便操作。根据指数平滑模型的结构和性质,平滑参数完全可以在1以上取值,也完全可以在0以下取值。(2)弊端2:非连续取值。平滑参数本是一个连续型变量,三种方法均将其变更为离散型变量来操作。经验法表面上是给出了取值区间,但在实践操作上则是将所给区间的中间值作为平滑参数值,试算法和枚举法则更是直接将连续变量进行了离散化处理。(3)弊端3:非自适应取值。平滑参数皆是人为赋值,预测人员自己列示出若干备选答案,然后自己从中挑一个最合适的答案。经验法仅给出四个备选数值,试算法也仅是在此基础上多增加了两个备选数值,枚举法无非是再多增加几个数值待选。(4)弊端4:非最优取值。平滑参数的取值皆不是最优,肯定不是全局最优,充其量是局部最优。经验法、试算法、枚举法均按照残差平方和最小或均方误差最小的原则确定最优平滑参数,但其可选集皆是可行集的子集的子集,即实数集上0~1区间内的若干数值。

为克服经验法、试算法和枚举法的弊端,本文提出了回归法。不同于陈武(2016)[18]对二次指数平滑预测模型回归系数计算方法的探讨,本文将回归所得的平滑参数估计值作为指数平滑预测法的预测参数。其理论过程为:针对平滑次数分别为一次、二次、三次的指数平滑预测模型,对应构造平滑次数分别为一次、二次、三次的指数平滑随机过程,以此建立平滑次数分别为一次、二次、三次的指数平滑回归模型,随之进行平滑次数分别为一次、二次、三次的指数平滑参数估计。

在实验模拟中,事先设定平滑参数的真实值,由一次、二次、三次指数平滑随机过程生成对应的指数平滑时间序列,采用对应的指数平滑回归模型对相应的指数平滑时间序列进行回归分析。参数估计的结果说明,回归法设定指数平滑模型的最优预测参数是可行的。假设检验的结果证明,回归法设定指数平滑模型的最优预测参数是可信的。

在实证应用中,将回归法用于GDP和税收的年度时间序列预测,并与经验法、试算法和枚举法的预测效果进行对比。在预测效果上,回归法的预测效果确实能够全面优于经验法、试算法和枚举法。在预测技术上,回归法确实能够有效规避经验法、试算法和枚举法在平滑参数设置上存在的非全域取值、非连续取值、非自适应取值、非最优取值等弊端。

二、指数平滑预测模型

(一)一次指数平滑预测模型

对时间序列{Xt}t=1,2,…进行一次指数平滑预测的模型为:

其中,预测参数α需事前设定。回归法设定该一次指数平滑模型最优预测参数的逻辑过程分为三步:第一步,根据一次指数平滑预测模型构造一次指数平滑随机过程;第二步,基于一次指数平滑随机过程建立一次指数平滑回归模型;第三步,估计一次指数平滑回归模型的回归系数,以获得最优的预测参数。

(二)二次指数平滑预测模型

对时间序列{Xt}t=1,2,…进行二次指数平滑预测的模型为:

其中,预测参数α也需事前设定。回归法设定该二次指数平滑模型最优预测参数的逻辑过程分为三步:第一步,根据二次指数平滑预测模型构造二次指数平滑随机过程;第二步,基于二次指数平滑随机过程建立二次指数平滑回归模型;第三步,估计二次指数平滑回归模型的回归系数,以获得最优的预测参数。

(三)三次指数平滑预测模型

对时间序列{Xt}t=1,2,…进行三次指数平滑预测的模型为:

其中,预测参数α仍需事前设定。回归法设定该三次指数平滑模型最优预测参数的逻辑过程分为三步:第一步,根据三次指数平滑预测模型构造三次指数平滑随机过程;第二步,基于三次指数平滑随机过程建立三次指数平滑回归模型;第三步,估计三次指数平滑回归模型的回归系数,以获得最优的预测参数。

三、指数平滑随机过程

(一)一次指数平滑随机过程

回归法设定一次指数平滑模型最优预测参数的逻辑过程的第一步:根据一次指数平滑预测模型构造一次指数平滑随机过程。为使(1)式一次指数平滑模型的预测值Xˆt+1与该模型的条件期望E(Xt+1|Xt,…,X1;α)建立起等价关系E(Xt+1|Xt,…,X1;α)=Xˆt+1,特建立如下一次指数平滑随机过程为:

如此设置一次指数平滑随机过程,则预测参数α可以通过建立回归模型进行估计。

(二)二次指数平滑随机过程

回归法设定二次指数平滑模型最优预测参数的逻辑过程的第一步:根据二次指数平滑预测模型构造二次指数平滑随机过程。为使(2)式二次指数平滑模型的预测值1与该模型的条件期望E(Xt+1|Xt,…,X1;α)建立起等价关系E(Xt+1|Xt,…,X1;α)=Xˆt+1,特建立如下二次指数平滑随机过程为:

如此设置二次指数平滑随机过程,则预测参数α可以通过建立回归模型进行估计。

(三)三次指数平滑随机过程

回归法设定三次指数平滑模型最优预测参数的逻辑过程的第一步:根据三次指数平滑预测模型构造三次指数平滑随机过程。为使(3)式三次指数平滑模型的预测值Xˆt+1与该模型的条件期望E(Xt+1|Xt,…,X1;α)建立起等价关系E(Xt+1|Xt,…,X1;α)=Xˆt+1,特建立如下三次指数平滑随机过程为:

如此设置三次指数平滑随机过程,则预测参数α可以通过建立回归模型进行估计。

四、指数平滑回归模型

(一)一次指数平滑回归模型

回归法设定一次指数平滑模型最优预测参数的逻辑过程的第二步:基于一次指数平滑随机过程建立一次指数平滑回归模型。针对由(4)式一次指数平滑随机过程生成的时间序列{X1,X2,…,Xn},可建立如下回归模型来估计未知参数α:

模型中,直接决定可观测时间序列{X1,X2,…,Xn}基本走势的平滑因子{S1,S2,…,Sn}是不可直接观测的时间序列。

(二)二次指数平滑回归模型

回归法设定二次指数平滑模型最优预测参数的逻辑过程的第二步:基于二次指数平滑随机过程建立二次指数平滑回归模型。针对由(5)式二次指数平滑随机过程生成的时间序列{X1,X2,…,Xn},可建立如下回归模型来估计未知参数α:

模型中,直接决定可观测时间序列{X1,X2,…,Xn}基本走势的平滑因子是不可直接观测的时间序列。

(三)三次指数平滑回归模型

回归法设定三次指数平滑模型最优预测参数的逻辑过程的第二步:基于三次指数平滑随机过程建立三次指数平滑回归模型。针对由(6)式三次指数平滑随机过程生成的时间序列{X1,X2,…,Xn},可建立如下回归模型来估计未知参数α:

模型中,直接决定可观测时间序列{X1,X2,…,Xn}基本走势的平滑因子是不可直接观测的时间序列。

五、指数平滑参数估计

(一)一次指数平滑参数估计

对时间序列{X1,X2,…,Xn}的一次指数平滑模型(7)式、二次指数平滑模型(8)式、三次指数平滑模型(9)式,皆采取最小二乘的方法进行估计,从而得到最优预测参数αˆ为:

求解非线性最小二乘,通用的迭代算法可参考Seber和Wild(2003)的研究[19]。

以往n-2期预测的均方误差MSE是随机扰动项εt+1~N(0,σ2)方差σ2的估计值,即:

其中,n-2维雅阁比向量J=(J3,…,Jn)T的分量Jt+1为:

与通常的非线性回归模型不同,本文所建的回归模型其雅阁比向量各分量之间存在递推关系。

回归法设定一次指数平滑模型最优预测参数的逻辑过程的第三步:估计一次指数平滑回归模型的回归系数,以获得最优的预测参数。对一次指数平滑回归模型(7)式的参数α进行最小二乘估计,算法在迭代过程中雅阁比向量各分量之间的递推关系为:

(二)二次指数平滑参数估计

回归法设定二次指数平滑模型最优预测参数的逻辑过程的第三步:估计二次指数平滑回归模型的回归系数,以获得最优的预测参数。对二次指数平滑回归模型(8)式的参数α进行最小二乘估计,算法在迭代过程中雅阁比向量各分量之间的递推关系为:

(三)三次指数平滑参数估计

回归法设定三次指数平滑模型最优预测参数的逻辑过程的第三步:估计三次指数平滑回归模型的回归系数,以获得最优的预测参数。对三次指数平滑回归模型(9)式的参数α进行最小二乘估计,算法在迭代过程中雅阁比向量各分量之间的递推关系为:

六、实验模拟

(一)一次指数平滑时间序列

为检验上述回归法设定一次指数平滑模型的最优预测参数是否可行、是否可信,需采用蒙特卡洛方法做模拟实验。针对(4)式的一次指数平滑随机过程,令初值X1=1 000.0,X2=1 025.0,参数α=0.10,生成两个样本容量n=1 000的一次指数平滑时间序列,如图1所示。

图1 一次指数平滑随机过程的实现

对这两个一次指数平滑时间序列,按照(7)式的一次指数平滑回归模型,估计其参数α,结果如表1所示。

表1 一次指数平滑时间序列的估计结果

表1显示,一次指数平滑回归模型的估计结果与参数实际值非常接近,这从参数估计上说明,针对一次指数平滑时间序列,通过回归的方法设定其最优预测参数是可行的。根据表1的参数估计结果,构造原假设H0、备择假设H1以及检验统计量τ,分别为:

其中,Sα为α的标准误,以此考察估计结果的置信水平。表1显示,两序列检验统计量的取值皆充分接近0,在自由度n-3=997的t分布下以高置信水平支持原假设H0:α=0.10。这从假设检验上证明,针对一次指数平滑时间序列,通过回归的方法设定其最优预测参数是可信的。

(二)二次指数平滑时间序列

为检验上述回归法设定二次指数平滑模型的最优预测参数是否可行、是否可信,也需采用蒙特卡洛方法做模拟实验。针对(5)式的二次指数平滑随机过程,令初值X1=1 000.0,X2=1 025.0,参数α=0.10,生成两个样本容量n=1 000的二次指数平滑时间序列,如图2所示。

图2 二次指数平滑随机过程的实现

对这两个二次指数平滑时间序列,按照(8)式的二次指数平滑回归模型,估计其参数α,结果如表2所示。

表2 二次指数平滑时间序列的估计结果

表2显示,二次指数平滑回归模型的估计结果与参数实际值非常接近,这从参数估计上说明,针对二次指数平滑时间序列,通过回归的方法设定其最优预测参数是可行的。根据表2的参数估计结果,按照(10)式进行假设检验,以此考察估计结果的置信水平。表2进一步显示,两序列检验统计量的取值皆充分接近0,在自由度n-3=997的t分布下以高置信水平支持原假设H0:α=0.10。这从假设检验上证明,针对二次指数平滑时间序列,通过回归的方法设定其最优预测参数是可信的。

(三)三次指数平滑时间序列

为检验上述回归法设定三次指数平滑模型的最优预测参数是否可行、是否可信,仍需采用蒙特卡洛方法做模拟实验。针对(6)式的三次指数平滑随机过程,令初值X1=1 000.0,X2=1 025.0,参数α=0.10,生成两个样本容量n=1 000的三次指数平滑时间序列,如图3所示。

对这两个三次指数平滑时间序列,按照(9)式的三次指数平滑回归模型,估计其参数α,结果如表3所示。

表3显示,三次指数平滑回归模型的估计结果与参数实际值都非常接近,这从参数估计上说明,针对三次指数平滑时间序列,通过回归的方法设定其最优预测参数是可行的。根据表3中的参数估计结果,按照(10)式进行假设检验,以此考察估计结果的置信水平。表3进一步显示,两序列检验统计量的取值皆充分接近0,在自由度n-3=997的t分布下以高置信水平支持原假设H0:α=0.10。这从假设检验上证明,针对三次指数平滑时间序列,通过回归的方法设定其最优预测参数是可信的。

图3 三次指数平滑随机过程的实现

表3 三次指数平滑时间序列的估计结果

七、实证应用

(一)GDP预测

既然实验模拟显示回归法设定指数平滑模型的预测参数是可行和可信的,那么接下来的工作是实证检验在预测实践中回归法较之已有的经验法、试算法、枚举法的边际进步性。实证目标之一是:在平滑参数的设定上,检验回归法是否确实能够有效规避经验法、试算法、枚举法的四个弊端。实证目标之二是:在指数平滑的预测效果上,检验回归法是否确实明显优于经验法、试算法、枚举法。虽然前面的逻辑过程已经在理论上做了肯定性回答,但现实应用效果到底如何、能否达到理论所述的预期效果,需要做出验证性回答。俗话说“是骡子是马,拉出来遛遛”,哲学所言“实践是检验真理的唯一标准”,讲的就是这个道理。

以GDP的年度预测为例,针对表4的GDP时间序列数据,分别按照(7)式的一次指数平滑回归模型、(8)式的二次指数平滑回归模型、(9)式的三次指数平滑回归模型,估计各自的参数α,结果如表5所示。

表4 对GDP进行二次指数平滑和三次指数平滑的预测结果

(续表4)

表5显示,三个模型的回归系数皆显著非零,说明一次平滑模型、二次平滑模型、三次平滑模型均可用于预测GDP的时间序列走势。进一步考察预测效果,利用均方误差MSE构造F检验统计量MSEi/MSEj~F(n-3,n-3),可从逻辑上做出判断,利用指数平滑模型预测GDP的时间序列走势时,一次平滑模型的预测效果可能较差,二次平滑模型和三次平滑模型的预测效果基本相当。

利用表5的参数取值,分别按照(1)式的一次指数平滑预测模型、(2)式的二次指数平滑预测模型、(3)式的三次指数平滑预测模型,对GDP的走势进行向前一步预测,结果如表4所示。表4显示,与回归分析时的判断一致,对GDP时间序列进行指数平滑预测时,一次平滑模型的预测效果较差,二次平滑模型和三次平滑模型的预测效果基本相当。

表5 对GDP进行指数平滑预测的模型参数设置

从表5的参数估计值可以看出,对GDP进行指数平滑预测,在平滑参数的设定上,回归法确实能够有效规避经验法、试算法、枚举法的弊端。图4的黑点显示回归法的预测效果,白点显示经验法、试算法与枚举法的预测效果,可以看出,对GDP进行指数平滑预测时,在预测效果的对比上,平滑参数即便在0~1区间内取值,经验法、试算法、枚举法也难以达到最优预测,而回归法几乎是最优预测。

图4 回归法与经验法、试算法、枚举法对GDP进行三次指数平滑预测的效果比较

(二)税收预测

以税收的年度预测为例,针对表6的税收时间序列数据,分别按照(7)式的一次指数平滑回归模型、(8)式的二次指数平滑回归模型、(9)式的三次指数平滑回归模型,估计各自的参数α,结果如表7所示。

表7显示,三个模型的回归系数皆显著非零,说明一次平滑模型、二次平滑模型、三次平滑模型均可用于预测税收的时间序列走势。进一步考察预测效果,利用均方误差MSE,构造F检验统计量MSEi/MSEj~F(n-3,n-3),可从逻辑上做出判断,利用指数平滑模型用于预测税收的时间序列走势时,一次平滑模型的预测效果可能较差,二次平滑模型和三次平滑模型的预测效果基本相当。

表6 对税收进行二次指数平滑和三次指数平滑的预测结果

(续表6)

表7 对税收进行指数平滑预测的模型参数设置

利用表7的参数取值,分别按照(1)式的一次指数平滑预测模型、(2)式的二次指数平滑预测模型、(3)式的三次指数平滑预测模型,对税收的走势进行向前一步预测,结果如表6所示。表6显示,与回归分析时的判断一致,在对税收时间序列进行指数平滑预测时,一次平滑模型的预测效果较差,二次平滑模型和三次平滑模型的预测效果基本相当。

图5 回归法与经验法、试算法、枚举法对税收进行三次指数平滑预测的效果比较

从表7的参数估计值可以看出,对税收进行指数平滑预测,在平滑参数的设定上,回归法确实能够有效规避经验法、试算法、枚举法的弊端。图5的黑点显示回归法的预测效果,白点显示经验法、试算法与枚举法的预测效果,可以看出,对税收进行指数平滑预测时,在预测效果的对比上,平滑参数即便在0~1区间内取值,经验法、试算法、枚举法也难以达到最优预测,而回归法几乎是最优预测。

八、结论

对于指数平滑预测模型的参数设置方法,为克服现行的经验法、试算法和枚举法的弊端,本文提出了回归法。将回归所得的平滑参数估计值作为指数平滑预测法的预测参数,其理论过程为:针对一次指数平滑预测模型、二次指数平滑预测模型、三次指数平滑预测模型,对应构造一次指数平滑随机过程、二次指数平滑随机过程、三次指数平滑随机过程,以此建立一次指数平滑回归模型、二次指数平滑回归模型、三次指数平滑回归模型,随之进行一次指数平滑参数估计、二次指数平滑参数估计、三次指数平滑参数估计。

实验模拟中,事先给定平滑参数真实值,由一次、二次、三次指数平滑随机过程的一次、二次、三次指数平滑时间序列进行回归分析。参数估计结果皆说明,回归法设定指数平滑模型对应生成一次、二次、三次指数平滑时间序列,利用一次、二次、三次指数平滑回归模型估计相应的最优预测参数是可行的。假设检验结果证明,回归法设定指数平滑模型的最优预测参数是可信的。

实证应用中,将回归法用于GDP和税收年度时间序列的一次、二次、三次指数平滑预测,并与经验法、试算法和枚举法的预测效果进行对比。结果显示,在预测效果上,回归法的预测效果确实能够全面优于经验法、试算法和枚举法。在预测技术上,回归法确实能够有效规避经验法、试算法和枚举法在平滑参数设置上存在的非全域取值、非连续取值、非自适应取值、非最优取值等弊端。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!