当前位置:首页 期刊杂志

动态混合HGARCH模型的估计和预测①

时间:2024-07-06

李木易,方 颖*

(1.教育部计量经济学重点实验室(厦门大学),厦门 361005;2.厦门大学王亚南经济研究院与经济学院,厦门 361005;3.福建省统计科学重点实验室(厦门大学),厦门 361005)

0 引 言

自从Ding等[1]首次在美国标普500指数收益率的幂律转换序列{|rt|d}上发现长记忆现象以来,金融资产波动率的长记忆性已作为资产收益率的10大经验特征之一而被广泛接受[2](1)目前对于长记忆波动率产生的内在原因学术界并没有统一的解释.Mikosch 和Stărică[6]对金融时间序列的非平稳性、长记忆性以及IGARCH产生的内在原因进行了系统的研究.Baillie和 Morana[7]指出条件方差出现结构上的变化是导致波动率产生长记忆性的潜在原因之一..忽略波动率的长记忆性将会提高模型误设的风险,不能精确量化波动率的产生机制和对未来波动率的预测,从而导致对整个市场风险的错判.为刻画波动率的长记忆性质,Baillie[3]借用ARFIMA模型的思想,建立了FIGARCH模型,用来刻画二阶矩序列的长记忆性质.但FIGARCH模型的无条件方差不存在,因而无法对FIGARCH建立相应的统计推断.Davidson[4]通过将经典GARCH模型[5]和FIGARCH模型进行加权组合,得到双曲GARCH模型(hyperbolic GARCH,HY-GARCH),并讨论了此模型宽平稳解的存在性和参数估计的统计推断.基于脉冲响应系数的衰减速度,可以将经典GARCH模型称为短记忆GARCH(脉冲响应系数呈快速的几何衰减),而将FIGARCH和HY-GARCH称为长记忆GARCH(脉冲响应系数呈缓慢的双曲衰减).

波动率有两个本质特征,一个是波动的振幅大小,一个是波动的衰减速度.HY-GARCH模型中既包含GARCH模型中没有的记忆参数,也包含FIGARCH中没有的振幅参数,因而可以从两个维度刻画波动率的经验特征.该模型也是目前最为广泛使用的长记忆波动率模型之一.但HY-GARCH模型的表达形式不够直观,且因为振幅参数对脉冲响应系数的非线性影响,使得非负约束条件比在FIGARCH模型下更加复杂,继而加大了优化难度.基于这些原因,Li等[8]建立了新的双曲GARCH模型(记为HGARCH),该模型具有简单的参数化形式,且与HY-GARCH一样可以同时捕捉波动率的振幅大小和衰减速度两个维度.与HY-GARCH模型相比,HGARCH所容许的参数空间与FIGARCH相同,简化了参数约束条件的表达形式.实证分析也表明,该模型在拟合和预测上与HY-GARH模型有相同的优良表现.

在时间序列涵盖较长时间范围时,用单一的模型结构进行拟合是不合理的,使用含有结构变化的模型更能捕捉数据的动态特征.Davidson[4]也发现,用单一HY-GARCH模型对1997年~1998年亚洲金融危机爆发期间中国台湾、韩国和印度尼西亚的美元汇率进行拟合时,3条序列的加权系数均大于1或者接近于1,这意味着整个过程仍然是爆炸的或非平稳的;该现象在Li等[8]中也有类似发现.

基于上述研究的启发,本文考虑在长记忆的基础上,采用时变模型来解释波动率的结构变化.混合模型作为特殊的时变模型,已有很多文献对其进行研究,例如Wong和Li[9]通过混合ARCH来刻画波动率的变化情况,并捕捉极端厚尾情形;Cheng等[10]则将混合ARCH推广到混合GARCH,指出该模型在VaR的失败率检验上超过混合ARCH以及单一GARCH类模型.但以上这些模型都属于短记忆波动率模型,不足以捕捉波动率的慢衰减性质.为此,Li等[11]将HY-GARCH模型中的加权系数看成区制变量,把HY-GARCH模型中的条件方差看成是短记忆平稳GARCH模型和长记忆非平稳FIGARCH模型的混合,构造了混合记忆(mixture memory)GARCH模型.该模型同时具备协方差平稳、平方项双曲衰减(波动率长记忆性)以及结构时变的特点.Klein和Walther[12]将其应用到原油价格波动率的预测时发现,相对其他离散型的GARCH模型,该模型具有更好的预测能力.Li等[13]进一步提出混合双自回归模型来同时刻画均值和方差序列可能存在的不同成分结构.近年来混合记忆模型得到进一步扩展,如Catania[14]提出的动态自适应(dynamic adaptive)混合模型和Basatini和Rezakhah[15]提出的马尔可夫平滑转移HY-GARCH模型.

在Li等[11]的混合记忆GARCH模型中,由于限定了混合的两个成分必须是GARCH和FIGARCH,因而对混合模型的灵活性造成一定损失.为了克服这一缺点,并且考虑到GARCH、IGARCH以及FIGARCH本身就是HGARCH模型的特殊形式,在本文中直接建立新的动态混合HGARCH模型,记为DM-HGARCH.DM-HGARCH模型的各个成分更具有一般性,可以由数据驱动决定每一个成分的实际结构,并且在一定条件下,可以同时具备协方差平稳、波动率双曲衰减以及结构变化3个重要性质.

国内学术界关于金融市场波动率的长记忆性和混合分布的理论研究较少,实证研究较多.在股票指数方面,林宇[16]利用HY-GARCH模型及有偏学生t分布来捕捉中国沪深股市资产收益率的分布形态;曹广喜等[17]利用双长记忆模型对中国沪深股市收益率和波动率序列同时进行拟合,并比较了不同分布下的拟合与预测精度;李云红等[18]对上证指数、深证指数、日经225指数、标普500指数在不同时间区间内的序列进行分析,指出收益序列的长记忆性具有时变特征;王安兴和谭鲜明[19]利用混合分布和GARCH模型对中国上市公司股票波动率进行分组,可将异常股票找出并归为同一组;近几年对GARCH类模型波动率的长记忆性和时变性的研究,还可以参考文献[20-26].

1 动态混合HGARCH模型

1.1 单一双曲GARCH模型

Davidson[4]通过加权组合的思路,将平稳短记忆GARCH与非平稳长记忆FIGARCH相组合,得到新的HY-GARCH(p,d,q)模型

(1)

式中εt是均值为0且方差为1的独立同分布序列;L为滞后算子;α≥0;0≤d≤1;Γ(·)代表伽马函数.

相比经典GARCH模型,此模型中有两个额外参数α和d.参数α控制了波动的振幅大小(称为振幅参数),继而决定过程的矩存在条件.参数d控制了波动带来的冲击消散的速度(称为记忆参数).由πj的表达式可知,记忆的衰减速度与d成反比,d值越大,脉冲系数衰减速度越快;相反,d值越小,脉冲系数衰减速度越慢.从HY-GARCH条件方差的形式可以进一步发现,此模型包含了经典GRACH、IGARCH以及FIGARCH等模型.例如,当α=1,0

(2)

式中α≥0,0≤d≤1.

关于该模型的可识别性、(弱)平稳解存在条件、高阶矩条件、拟似然估计(QMLE)的渐近性质以及双曲记忆检验,详见文献[8],这里只做简单概括.该模型仍然由α和d两个参数来控制波动的振幅和消散速度.相比HY-GARCH,该模型中θ(L)只是简单的将FIGARCH的脉冲响应重新尺度化(rescale).当α=1时,该模型退化为FIGARCH.同时,由于α≥0,使得该模型中条件方差的非负约束和FIGARCH模型中相同[28].因此,HGARCH模型同时拥有协方差平稳(当0<α<1)以及波动率双曲衰减两个性质,同时参数化形式比HY-GARCH模型更为直观简单.Li等[8]实证分析表明,该模型与HY-GARCH模型在有限样本下,有同样的拟合和预测表现.

1.2 混合HGARCH模型

受混合模型的启发,考虑如下含有K个成分的混合HGARCH模型

(3)

(4)

值得注意的是,Wong和Li[9]的混合ARCH模型,Cheng等[10]的混合GARCH模型,以及Li等[11]的混合记忆GARCH模型都是模型(3)的特殊形式,因而模型(3)更具有一般性,可以降低模型误设的风险.但对于模型(3),需要重新给出弱平稳解和高阶矩的存在条件.为此,将模型(3)中的条件方差重新表达成如下式的ARCH(∞)模型

(5)

式中对每一个i都有

假设1

j=1,2,…,i=1,…,K

2)当di=0或者di=1时,此时退化成GARCH模型或者IGARCH模型,可参考经典GARCH模型的非负条件[29].

假设2

定理1在假设1和假设2下,模型(3)存在唯一的不可预期(non-anticipative)且方差有限的严平稳解.

假设3

M是正整数.

4)定理2给出了模型(3)高阶矩存在的充分条件,是定理1的推广.特别地,当M=1时,定理2退化成定理1.

考虑更一般的混合概率是动态时变函数的情形,此时pi变成pit,表示t时刻波动率来自第i个成分的概率.由于金融市场的动态性绝大多数时候都可以用震荡或平静两个状态来刻画,因此只考虑有两个混合成分的简单情形.这里采用逻辑斯特函数作为连接函数(link function).连接函数的具体形式则依赖于实际经济意义和研究目的,可以是解释变量的线性或者非线性函数,这里不做具体讨论.值得注意的是,如果在逻辑斯特函数中引入外生变量Xt,此时平稳性的讨论将更为复杂.由于本文的重点是考虑动态混合时间序列自回归模型,因此这里假设连接函数只依赖自身的历史信息,是个自激励过程.本文使用的连接函数具体形式如下

(6)

进一步,可以利用极大似然比检验,针对原假设H0:λ1=…=λp=0,检验混合概率是否为常数.如果接受原假设,则表示混合概率不随时间变化而变化.

2 模型估计方法

2.1 EM 算法

由于混合模型中存在不可观测的哑变量Zit,在这种情况下文献中通常采用EM算法进行参数估计.暂且假设εt服从正态分布,且假设均值为0,则伪对数似然函数(pseudo-log-likelihood)为

(7)

在模型满足一定条件下,利用EM算法可以求得L*(θ)的最大值点,即θ的伪最大似然估计量.但为了更容易处理似然函数L*(θ)的优化问题,将哑变量Zit加入似然函数,并且将{yt,zit,t=1,…,n,i=1,…,K}看作样本.现考虑如下对数似然函数形式

(8)

将函数L(θ)称为完整对数似然函数,相应地,L*(θ)称为不完整对数似然函数.

由于Zit不可观测,按照混合模型的一般惯例,采用迭代EM算法对L(θ)求解伪极大似然估计[30].迭代EM算法的两个步骤如下:

①求期望(E步) 假定θ的初始值θ0,对缺失数据{zkt}用其条件期望(用τkt表示)来替代.依据Wong和Li[9],该步可表述为

(9)

式中g(·)为标准正态分布的密度函数.显然,当混合成分只有两个时,有τ1t=1-τ2t.

i=1,…,K

以及

2.2 估计的渐近方差

根据Louis[31]的缺失数据原则,观测信息矩阵可以通过以下方式计算

(10)

(11)

其中

详细证明可以参考文献[9,11].值得注意的是,当误差项εt不满足正态分布时,参数估计的渐近方差将有更复杂的表达式.这将留作以后研究.

3 模拟结果

利用蒙特卡罗模拟试验,研究EM算法在DM-HGARCH模型中参数估计的有限样本表现.由于本文主要研究二阶矩性质,所以在整个试验过程中将均值项μt都设定为0.为考察序列本身的自反馈行为,逻辑斯特连接函数设定为只依赖于yt的历史值,不包含其他外生变量,且考虑只有两个混合成分的情况.数据产生过程如下

(12)

式中εt~i.i.d.N(0,1).

P(Z2t=1)=p2t=1-p1t

以上参数设置满足条件方差的非负约束条件[28],并且在两个条件方差中,d的取值均大于0.5,这是为了保证d的估计的渐近正态性[32].两个波动率成分均为HGARCH(1,d,0)结构,都没有包含自回归多项式δ(·)部分,原因在于即使包含δ(·)部分,其对应的脉冲响应系数呈几何衰减,当滞后阶数足够大时,衰减速度则完全由更慢的双曲衰减所控制,因而该部分不改变波动率记忆的根本属性.不失一般性,本文只考虑上述简化的模型.

由表1可以看出,随着样本量的增大,两个波动率成分和连接函数部分的参数估计的乖离率和均方差都在逐渐减小,与估计的渐近性质基本保持一致.并且观察到,在第一部分条件方差HGARCH1中,α的真实值大于1,即此过程是非平稳的,但参数估计仍然表现良好,说明EM迭代估计法对于非平稳过程的参数估计也是有效的.另外,由于(1-B)d展开式中,πj=O(j-1-d),表明脉冲响应系数的衰减速度与d的取值呈负相关,即d值越大,衰减越快,d的参数估计的渐近方差越小;d值越小,衰减越慢,d的参数估计的渐近方差越大.这在表1中也有所体现.

表1 模型(12)中EM估计在有限样本下的表现Table 1 Finite-sample performance of EM estimation in model (12)

4 实证分析

图1 上证指数的原始价格序列Pt、对数收益率yt、yt的自相关图和的自相关图Fig.1 Shangzheng index:Original pricePt,log-return yt,autocorrelations of yt,autocorrelations of

图2 标普500指数的原始价格序列Pt、对数收益率yt、yt的自相关图和的自相关图Fig.2 S&P500 index:Original pricePt,log-return yt,autocorrelations of yt,autocorrelations of

在拟合部分,将每一个样本集都分为两个部分,1至n-500用于样本内(训练集)拟合,最后500个数据用于样本外 (测试集) 预测效果的评价.表2报告了DM-HGARCH模型和单一HY-GARCH模型的拟合结果.由于HY-GARCH和HGARCH 有相同的表现,为节约篇幅,此处仅汇报单一HY-GARCH模型的实证结果.

表2 参数估计结果Table 2 Estimation results of parameters

表3 基于1步向前和5步向前预报区间覆盖率的预报效果比较(95%置信水平下)Table 3 Comparison of forecasting performance based on the 1-day-ahead and 5-days-ahead predictive interval coverage rate(under 95% confidence level)

从表3可以看出,当预测步长为1时,上证指数和标普500指数基本都能通过检验(p值超过0.05表示通过检验),且上下尾覆盖率接近95%.但是当预测步长增加到5时,只有标普500指数通过相应检验,而对上证指数检验的所有p值均为极端小值,因而拒绝原假设.Conrad[27]指出,长记忆GARCH模型在多步预测上会有更好的表现,这与表3中给出的对标普500指数的1步预测和5步预测结果相吻合.综上所述,在对上证指数和标普500指数两支序列的实证分析中,本文发现DM-HGARCH模型对后者在1995年~2014年的日收益率序列的波动具有更好的解释和预测能力.

值得注意的是,田存志等[36]通过对现代经典金融理论和新金融理论进行梳理和归纳,指出金融市场具有多元的记忆模式,即在不同时间区段上会表现出不同的记忆类型,有时表现为长记忆,有时表现为短记忆,甚至是白噪声.因而这里的实证分析只是在基于给定的有限样本,通过模型选择、风险测度的预测等标准进行比较,得出DM-HGARCH模型在该时间段内对标普500指数的波动率具有更好的解释和预测能力.但是对不同时间段的不同样本,可能会有不一样的实证结果.对“金融市场是否存在长记忆”和长记忆的产生机制,相应的理论基础在文献中尚且匮乏.这也是作者未来的研究方向之一.

5 结束语

当时间序列跨度较长时,其观测值往往来自不同的驱动机制,混合模型是简单有效的捕捉结构变化的模型.本文在Li等[8]的基础上提出一类动态混合HGARCH模型,该模型可以同时刻画波动率的长记忆性和结构变化,并且在一定条件下,存在协方差平稳解.本文讨论了模型的弱平稳解存在条件,研究了EM算法进行参数估计的大样本性质,并用蒙特卡罗模拟展现该估计方法在有限样本下的表现.最后利用该模型对上证指数和标普500指数进行实证分析.从拟合结果和预测结果两方面来看,DM-HGARCH模型对标普500指数的拟合和预测能力远好于单一的HY-GARCH模型,但对上证指数的拟合效果一般.值得注意的是,本文中给出的动态混合模型可以推广到多个混合成分(即混合成分的个数大于2),但是如何确定混合成分的个数,目前仍是混合时间序列研究的难点,也是本文的局限所在.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!