时间:2024-07-28
张医铭
(中国石化上海石油化工股份有限公司统计中心,上海 200540)
时间序列是以时间为顺序排列并随时间而变化,同时又具有一定关联关系的数据序列。时间序列分析是根据相邻数据点之间具有相关性的特点,建立相应的数学模型来对观测数据进行拟合,并实现相关信息的有效预测[1]。时间序列分析通常在经济领域应用较为广泛。文章试图采用这一方法对中国石化上海石油化工股份有限公司(以下简称上海石化)海运码头出厂数据的计量误差进行预测,为计量数据管理提供决策依据。上海石化的柴油海运出厂通过计量流量计进行结算,但是计量数据和商检量之间存在着随机误差,并且随着季节变化存在周期性特点。为方便管理,需要知道该误差的趋势范围,以便能够及时发现异常情况,因此拟采用时间序列分析方法来进行分析建模,这里将采用移动平均自回归模型(ARMA)对误差数据进行预测分析。ARMA模型是一种专门处理一维时间序列数据的模型,可为柴油出厂计量误差规律性分析提供一种新思路。
时间序列分析方法最初只有自回归模型(AR)用于市场变化规律的预测,在此基础上数学家瓦格儿又提出了滑动平均模型(MA)和移动平均自回归模型(ARMA),这3个模型奠定了时间序列分析理论的基础。ARMA模型主要应用于对一维、方差稳定的平稳时间序列分析,认为时间序列当前观测项的值可以表示为其之前的p项观测值及q项随机误差的线性组合,即满足式(1),为移动平均自回归模型,并记作ARMA(p,q)模型[2]。
移动平均自回归模型的数学表达形式为:
Xy-φ1Xt-1-...φpXt-p=εt-θt-1-θqεt-q
(1)
式中:φ1为自回归因子,θ1为滑动平均因子,{ε1}为白噪声序列。
引入后移算子B,用Bk表示k步线性推移算子,即BkX1=Xt-k,Bkε1=εt-k,令
φ(B)=1-φ1B-φ2B2-...-φpBp
(2)
θ(B)=1-θ1B-θ2B2-...-θpBp
(3)
则(1)式简写为:
φ(B)Xt=θ(B)εt
(4)
这就是p阶自回归q阶移动平均模型,记为ARMA(p,q)。当p=0时为纯滑动平均模型,记为MA(q);当q=0时为纯自回归模型,记为AR(p);当p=q=0时,则模型表示为Xt=εt,此时,该序列为白噪声序列[3]。
ARMA模型建模过程主要包括数据预处理、阶数选取、参数估计和模型检验4个步骤。
(1)数据预处理:使用ARMA模型需要对数据进行预处理,主要包括异常数据剔除和序列平稳性检验。序列平稳性可以通过时序图初步判断,然后通过计算样本数据的自相关函数与偏相关函数等判断。如果自相关图是截尾或者拖尾,则可以判断数据适用ARMA模型。如果样本数据非平稳,则可通过差分法处理进行非平稳序列建模。
(2)阶数选取:确定模型的阶数,即p和q值。可以通过自相关图选择相应的阶数进行拟合,也可以采用AIC准则进行判断。
(3)参数估计:确定自回归因子和移动平均因子的值。参数估计主要包括最小二乘法和极大似然估计等,文章拟采用极大似然估计,使用Eviews软件进行数据计算。
(4)模型检验:模型检验的方法主要包括卡方检验和实测检验法。卡方检验的基本思路是,在相应的显著性水平下检验模型的残差序列是否为白噪声序列;实测检验法是将模型预测值与实测数据进行比对,计算相应的误差,从而进一步修改完善模型[4]。
由于柴油海运出厂并非每天都有,因此数据不可能严格连续,为了更好地分析时间序列方法在误差数据中的预测[5],选取2015—2017年误差实测月平均数据作为样本数据,根据直观法剔除明显的异常数据后得到误差数据时间序列{Xt},剔除异常值后的柴油计量数据误差值时序图见图1。序列自相关和偏自相关情况见图2。
图1 序列时序
图2 序列自相关情况
综合分析序列时序图、自相关图,判定该序列为非平稳序列,可以考虑使用差分法对序列进行处理。
一阶差分后的序列时序(y)、一阶差分序列自相关(ACF)和一阶段差分序列偏自相关(PACF)情况见图3~5。
图4 一阶差分序列自相关
图5 一阶差分序列偏自相关情况
由图4~5可知:该序列围绕0点上下波动,且样本自相关和偏自相关因子很快落入随机区间,说明一阶差分后的序列呈现平稳性,可以对其建立ARMA模型。由图5可见,序列的样本自相关因子在k=3处显著不为0,表现为拖尾性,因此可以考虑q=3;偏自相关因子表现为一阶截尾性,因此可以考虑取p=1。由于对原数列进行了一阶差分,因此最终可以建立ARIMA(1,1,3)模型。模型参数估计结果见表1。
表1 模型参数估计结果
根据自相关图显示的自相关因子的3阶截尾的性质,尝试拟合MA(3)模型,使用极大似然估计方法,确定MA(3)模型的口径为:
xt=(1-0.6 046B+0.0 583B2-0.4 535B3)εt
(5)
根据偏自相关图的1阶截尾性,可以尝试使用AR(1)模型进行拟合,使用极大似然估计方法确定模型口径为:
(6)
参数估计完成后,为了验证ARIMA(1,1,3)模型是否符合意义,运用白噪声检验法对残差序列进行检验。通过对残差序列的检验后,发现该模型是合适的,因此可以对此进行短期预测。预测结果见表2,拟合预测见图6。
表2 5期预测结果
图6 拟合预测情况
(1)根据误差数据的时序图分析,发现该序列为非白噪声、非平稳序列,在对其数列进行差分后满足ARMA模型的建模要求。
(2)通过AIC定阶准则选取了ARMA(1,3)模型作为最终的拟合模型对数据进行分析,最终使用极大似然估计的方法确定了模型的拟合方程。
(3)通过小样本时间序列的预测分析,运用ARMA模型对误差数据进行建模,得到具体的分析方程,可以预测短期的误差值,在实际的计量数据管理中,可以提供甄别异常值的理论依据,具有较高的实用价值。
(4)模型优点:通过对油品出厂计量数据误差进行分析,建立了相应的ARMA(p,q)模型,从预测的静态图上看,此种方法可以模拟数据的走势,具有一定的参考意义,可以对异常数据进行准确的判断。
(5)模型缺点:在数据处理上,由于这些数据本身具有一定的随机性,规律性较弱,采用单一的模型处理时会存在较大的误差,所以对于预测的具体数值精度较低,只能提供大概率的置信区间供参考。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!