时间:2024-04-25
刘 洁
(仲恺农业工程学院 经贸学院,广州 510220)
时间序列是将某个统计量的数值按照时间先后的顺序排列而成的序列,即同一个体在不同时点上的数据。在现实的经济、金融领域中有很多问题,如股票价格、石油价格、利率变动或汇率变动都是时间序列。而股票价格虽影响因素众多,变幻莫测,表面看上去毫无规律,但利用时间序列的分析也可找出一些变化规律,不管是对需要及时了解价格波动的投资者,还是需要把握市场动态、维护稳定交易环境的市场管理者来说都意义重大。ARMA 模型在处理平稳时间序列的问题上有较好的拟合效果,是处理时间序列非常有效的工具。将ARMA 模型应用在股票价格的拟合和应用方面,可以让我们更好地了解股市波动特点,总结相关规律,不管是对理论还是实践都有重要的指导意义。
本文将根据格力电器股票价格的历史数据,利用ARMA理论建立模型并进行预测,从而推断格力电器股价未来变化趋势。
ARMA 是自回归移动平均过程(Auto Regressive Moving Average)的缩写,由G.E.P.Box 和G.M.Jenkins 在1970 年出版的《Time Series Analysis Forecasting and Control》中提出,ARMA就是由自回归和移动平均两部分共同构成的一个随机过程,通常记为ARMA(p,q),数学表达式如下:
其中,{et}是白噪声序列,其中p、q 分别表示自回归和移动平均部分的滞后阶数。当p 等于0 时,ARMA(p,q)模型退化成AR(p)模型;当q 等于0 时,ARMA(p,q)模型退化成MA(q)模型。
需要注意的是,ARMA 模型仅可对平稳时间序列进行分析,如果某时间序列非平稳,则需要进行预处理,生成一个新的平稳时间序列后才能应用。在实践中,通常采用对数差分或差分的方式进行预处理,而经过d 次差分后平稳的序列,可以写成ARIMA(p,d,q)的形式,d 的取值通常不会超过2。
滞后阶数p、q 的确定可以通过自相关图和偏自相关图来确定。若某平稳序列的自相关函数是拖尾的,偏自相关函数是截尾的,则该序列可建立AR(p)模型;若某平稳序列的自相关函数是截尾的,偏自相关函数是拖尾的,则该序列可建立MA(q)模型;若某平稳序列的自相关函数与偏自相关函数都是拖尾的,则可建立ARMA(p,q)模型。此外,还需要利用AIC 信息准则和SC 信息准则来判断,p、q 的选取若能使AIC 和SC 取值最小,即为最佳的阶数。
第一步,判断时间序列是否平稳,可以通过建立该组序列的时序图,或用统计软件Eviews10 生成自相关和偏自相关图来判断。第二步,如果该序列平稳,便可以建立ARMA(p,q)模型;若该序列不平稳,则需要进行预处理,将其转换成平稳序列,而通常转化的方法是进行差分或对数差分。第三步,利用Eviews10 生成新序列的自相关图和偏自相关图,预估p,q 的阶数。第四步,估计参数并进行检验,选出符合AIC 和SC 信息准则最小化的模型。第五步,对生成的残差序列实施白噪声检验。最后,检验模型拟合结果,对序列进行短期预测。
本文选取格力电器(000651)2018 年12 月3 日至2019 年11 月29 日的股票收盘价格,共240 个数据建立模型,最后对2019 年11 月29 日数据进行预测,并与真实交易价格对比,由此来检测本模型预测的效果和准确性。
将格力电器原始收盘价(记为X)导入Eviews10 得到图1,该组数据(2018 年12 月3 日至2019 年11 月29 日)不是一个平稳的时间序列,虽有波动,但总体是一个向上的趋势。为了验证原收盘价格非平稳,需要对该组数据进行ADF 单位根检验。由图2 的检验结果可知,P 值为0.320 7 不具有显著性,T统计量也大于10%的临界值,因此存在一个单位根,该组数据是非平稳时间序列。此外,还可以对原序列做出自相关-偏自相关图,由图4 可以发现原序列相关系数减弱很慢,也可以说明该组数据是非平稳时间序列。
图1 格力电器(000651)股价时序图
图2 股价原序列X 的ADF 单位根检验
图3 对数差分序列DX 的ADF 单位根检验
图4 原序列X 的自相关-偏自相关图
由于原序列非平稳,如需建立ARMA 模型进行分析预测,则必须消除这种不平稳特征,因此尝试在原序列基础上进行差分。对于股票价格来说我们更应该关心收益率,因此我们先对原始收盘价格取对数,再求差分。在此首先利用Excel 求得对数差分后的新序列(记为DX),并将其导入Eviews 10,做出时序图(如图5 所示)。由图5 可知,一阶差分后序列看起来更加平稳,除了个别时刻波动较大,整体围绕0 值上下波动,可以大致判断经过对数差分后的序列为平稳时间序列。但是仅仅从图形得出结论是不准确的,为了验证这一结论,需要对新序列进行ADF 单位根检验,得到结果如图3。由图3 可以看出,P 值小于0.05 具有显著性,且T 统计量为-7.607 414,均小于1%、5%和10%的临界值,因此可以拒绝原假设,新序列不存在单位根,新序列是一组平稳的时间序列,可以在此基础上建立模型。
图5 对数差分后新序列DX 时序图
根据ARMA 的识别准则,若某平稳序列的自相关函数是拖尾的,偏自相关函数是截尾的,则该序列可建立AR 模型;若某平稳序列的自相关函数是截尾的,偏自相关函数是拖尾的,则该序列可建立MA 模型;若某平稳序列的自相关函数与偏自相关函数都是拖尾的,则可建立ARMA 模型。作为时间序列分析的始祖,Box,Jenkins and Reinsel 认为,对于大多数情况,p≤2与q≤2 就足够了。为了保险起见,可以让p 与q 更大些,但具体如何确定p 和q,需要根据信息法则来判断。
因此运用Eviews10 可得,格力电器股票价格经过一阶差分后的自相关系数和偏自相关系数图。由图6 可见,序列DX的ACF 和PACF 都是拖尾,又因一阶差分,因此可以建立ARIMA(p,1,q)模型,而模型的滞后阶数p、q 则要根据p 值、AIC 准则和SC 准则加以确定。
图6 对数差分后序列DX 的自相关-偏自相关图
根据对数差分后序列DX 的自相关-偏自相关图,本文尝试了ARIMA(1,1,1),ARIMA(1,1,2),ARIMA(2,1,1),ARIMA(2,1,2)四种模型,并根据AIC 准则和SC 准则最小的原则,建立ARIMA(2,1,1)模型。从图7 可以看出,ARIMA(2,1,1)模型p 值小于0.05,系数的显著性符合要求,并且AIC 和SC 均为最小。更进一步我们可以加大滞后阶数对模型进行过度拟合,发现效果仍然没有很大改善,因此可以确定ARIMA(2,1,1)就是合适的模型。最后,该模型的数学表达式可写为:
图7 ARIMA(2,1,1)模型输出结果
式中,et为残差序列。
在经过参数估计后,还需要对残差进行白噪声检测以确认建立的ARIMA 模型是否合适。因此对Eviews10 中对残差进行时序图分析和Ljung-Box 检验(即Q 统计量检测),得到结果如图8 和图9。图8 显示残差基本在0 值上下波动,残差是一个平稳的时间序列。图9 的自相关和偏自相关图显示,两个系数都在两条虚线内,且p 值大于0.05,说明Q 统计量小于检测水平为0.05 的卡方分布临界值,即已经建立的模型的随机误差项是一个白噪声序列,因此该模型是合理的。此外我们还可以通过检验残差的正态性来检验模型,如果模型正确,则分位数-分位数图应该有一条直线穿过众多的点,而从图10 中也可以看到,除了少数几个点偏离直线较多,其余点都分布在直线附近,从而验证了模型的准确性。
图8 残差时序图
图9 残差自相关-偏自相关图
图10 序列分位数-分位数图
由于已经建立好的ARIMA(2,1,1)模型通过了白噪声检测,因而其可以对格力电器股票未来收盘价格进行预测。在Eviews10 软件中可以选择静态预测或动态预测,首先进行动态预测,而动态预测值基本呈水平线,说明动态预测效果不好。然后进行静态预测,由于静态预测只能一步向前,得到结果见图11,可以看出静态预测效果还是比较好的。这是因为股票价格变动较大,随着预测期数的增加,所得到的结果误差也增大,因此应用ARIMA 模型对股票价格进行预测短期效果比较合适。
图11 静态预测图
由已建立的ARIMA(2,1,1)模型对格力电器2019 年11月29 日的收盘价进行短期预测,可得结果为57.62,当天实际收盘价为57.71,误差为0.09,比较接近,也由此可以证明用ARIMA 模型对股票价格进行预测短期效果比较好。
综上所述,ARMA 对描述股价波动有一定参考性,对股价短期的预测效果也比较好,对投资者有一定参考价值。但是应用ARMA 模型对于股票价格的长期预测就有较大偏差,因为ARMA 模型只是对时间序列本身的属性进行分析,而股票价格的预测一直是一个难题,且股票市场的影响因素众多,如市场规则、国家宏观经济政策和公司内部结构的变化等都会对股票价格产生重大影响,因此对股票价格的预测还需要结合其他条件进行综合判断。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!