当前位置:首页 期刊杂志

我国食品价格变化的实证研究——以机器学习为视角

时间:2024-05-22

陈 普,覃盈盈

(1.华东交通大学 经济管理学院,江西 南昌 330013;2.中国人民银行南宁中心支行,广西 南宁 530028)

一、引言

近年来,食品价格的波动常常引起人们的极大关注。比如,猪肉在2019年10月一度达到每千克56元,而不到2年,在2021年9月价格跌去一半多,每千克仅21元。①数据源自Wind数据库,22省市猪肉平均价格。文章假设猪肉价格的剧烈波动与母猪存栏量的剧烈变动有着紧密联系,并在图1绘制了猪肉价格指数环比和母猪存栏量环比。从中可以看到,自2018年下半年开始,母猪存栏量开始趋势性下跌,然后在2019年下半年猪肉价格环比达到一个最大峰值。然后在2020年初母猪存栏量显著上升,1年后即2021年初开始,猪肉价格环比开始持续下行。

图1 猪肉价格指数环比和母猪存栏量环比趋势图

那么如何为猪肉价格和母猪存栏量建立一个合理的模型捕捉它们间的动态关系?对于商品价格的研究,经济学中存在一个清晰的研究脉络,就是下游商品价格往往敏感于上游生产部门的生产波动(杨文玉,2011;Ahmed,2018)。[1][2]为捕捉这种相关性,人们最初通常借助于经典的协整模型进行估计,Palaskas(1995)就利用协整方法估计了欧洲7个国家农产品价格在市场的动态传播,他们的研究表明部分农产品价格即便在短期内出现重大变化,但长期来看,最终会回到一个均衡水平,不过仍有部分农产品并未呈现出这种特征。[3]这可能源自标准的线性模型无法捕捉现实的非线性特征,简单来说,上游产品与下游产品的价差可能会在小于均衡差距时更快扩张,但在远离均衡差距时缓慢缩减。Cramon-Taubadel(1998)就利用一个阈值向量误差修正模型来捕捉该特征,他发现猪肉的生产价格和批发价格在价差挤压时更快地恢复到均衡状态。[4]前期类似的经典文献还包括 Chavas和 Mehta(2004)[5]、Girapunthong(2004)[6]等发表的文章。Frey(2007)关于商品上下游的价格传导做了一个很好的综述[7],在其之后,为食品价格传导建模在方法上并未有更大变化,人们更多的是转移了研究的视角。比如Yu和Gould(2019)从非对称食品价格建模中寻找市场竞争程度和社会福利变化的信息,白华艳和关建波(2021)从养殖、屠宰和零售三个环节讨论猪肉价格波动的根源[8],而杨继生和徐娟(2015)则着力讨论了农产品生产资料、生产价格直至批发零售时食品价格的传递机制,发现食品价格上涨主要源自货币及其预期主导的需求冲击[9]。

可以看到食品价格传导的研究中,向量误差修正模型(VECM;Chang and Griffith,1998)[10]以及阈值向量误差修正模型(TVECM;Abddulai,2002;Ricci et al.,2019)[11]均非常常见,因为它们有足够的能力捕捉上游与下游产品间的动态关系。但这些模型一个显著的局限,在于其受制于OLS或极大似然的参数估计方法,而不能包含太多的内生变量。因此,在这些模型中很少能发现它们包含了超过7阶滞后的内生变量。例如,Cramon-Taubadel(1998)估计了一个非对称价格传导模型以评估德国猪肉价格的传递,他们的协整模型包含了5阶滞后。[4]Adbdulai(2002)估计了一个类似的模型以评价瑞士的猪肉价格传导,他们的模型包含了2阶滞后。[11]Antonioli(2019)讨论了意大利的传统有机液体牛奶的价格传导,他的模型是7阶滞后的VECM。[12]

陈秀兰等提出,在真实的经济体中,许多商品的价格传导过程往往超过1年,如果在模型中使用月度数据,滞后阶数必然大于12。[13]例如,母猪存栏量影响着生猪的数目,生猪的数目又影响了猪肉的价格,因此,母猪存栏量对于猪肉价格来说是非常重要的。但很明显,从母猪存栏量的变化传递到猪肉价格的变化,时间跨度往往超过12个月①母猪从怀孕到生出小猪大约5个月,从小猪到成年猪出栏需要6-8个月。整个过程大约12个月。。实际上,这一点从图1也能直观感受到,从母猪存栏量开始趋势性变化,到猪肉价格环比达到峰值,大约间隔一年。因此,如果对母猪存栏量和猪肉价格进行向量自回归(VAR)或者VECM建模,在月度数据情况下我们也许应该对每个内生变量包含12阶滞后。这就意味着对于包含2个内生变量的VECM模型而言,需要估计12×2×2=48参数。进一步,如果我们要建立TVECM模型的话,则有48×2=96个系数需要估计。一般而言,宏观经济研究中100-200个观测值较为常见,在这样的样本数目下很难用TVECM模型获得96个稳健的估计系数。估计的参数越多,预测的表现越坏。同时,遗漏变量也是一个值得关注的问题。通常VECM和VAR无法包含太多内生变量。因此,需要考虑是否存在更好的模型可以捕捉价格传导中的动态相关,我们发现,随机森林模型有足够的能力捕捉这种超长的滞后变量建模。

随机森林是由Breiman(2001)提出的一种机器学习方法[14],机器学习是以理解数据为目的的一个庞大工具集(James et al.,2021)[15]。随机森林作为机器学习中的一个重要工具,其可包含任意数目的解释变量,即便解释变量的数目超过观测值数目。同时,该模型的预测能力能得到广泛认可。然而,在价格传递的多元时序建模中,还很少有文献使用机器学习算法建模来捕捉变量间的动态关系,文章尝试在此方向上做出探索。首先,我们检查了VECM、TVECM和随机森林模型的预测表现,发现随机森林模型往往能更好地捕捉到价格传导中的动态关系。然后,基于Koop(1996)的广义脉冲的计算思路,重新设计了广义脉冲的算法以适应随机森林建模。[16]最后,利用随机森林模型,我们计算了母猪存栏量冲击对猪肉价格的动态影响。相对VECM或TVECM,我们发现随机森林模型给出了更多有益的信息,比如不同滞后变量的重要性明显不同、自变量在不同取值范围下对猪肉价格冲击的影响存在巨大差异等。因此,在理论上,文章从机器学习的角度为多变量时间序列建模提供了新的思路;在实践上,文章的研究结果对于平抑食品价格具有重要的指导意义;特别地,文章的实证结果表明上游母猪存栏量的变化能在之后6个月对猪肉价格造成更大影响,那么及时调整上游母猪存栏量就是稳定猪肉价格的重要手段。

文章后续结构安排如下:第二部分简单描述了随机森林、VECM和TVECM模型的估计步骤,然后利用模拟数据比较了这三个模型的预测精度。该部分的内容使得我们相信随机森林在动态建模中通常是一个更优的选择。尽管如此,VECM和TVECM的脉冲响应和方差分解往往有着丰富的经济内涵,因此,我们基于随机森林算法提出了广义脉冲响应和方差分解的计算方式。第三部分是随机森林模型的一个应用,讨论了母猪存栏量冲击对猪肉价格的影响。第四部分是全文总结。

二、研究方法

文章主要使用随机森林的方法对猪肉价格进行建模,为表明该方法在该研究上的适用性,将随机森林与通常食品价格的建模方法VECM和TVECM进行了比较,并提出了广义脉冲响应和方差分解的算法。

(一)VECM和TVECM建模

VECM和TVECM都是时间序列分析中非常经典的模型。Lutkepoho(2005)和Hamilton(1994)对VECM做出了细致阐述。[17][18]Balke和Fomby(1997),Enders和Granger(1998)以及Hansen和Seo(2002)的文章则是对TVECM一个很好的参考。[19][20][21][此处,为保持内容的完备,我们对这两个模型进行简单勾勒。一个VECM模型可以如下书写,

基于Hansen and Seo(2002),一个两体制的TVECM可以书写如下,

其中,γ是阈值,脚标H和L分别表示模型中高低两个体制,利用Hansen和Seo(2002)的集中似然函数算法,我们在协整系数和门槛变量(β,γ)上建立一个二维网格,然后最大化模型(2)的约束似然函数,得到基于每个网格值的(β,γ)的估计值,此时,与最大的相对应的即为最终估计值,我们同时也得到了,和的最终估计系数。[21]

(二)随机森林模型

在机器学习中,一个样本通常被分为两部分:训练集和测试集,前者用于拟合模型,后者用于测试模型的预测表现。在训练集中,对于第i个观测值是因变量,而是P维的自变量,对于任意一个观测值,比如Xip=8,样本可以分成两部分。第一部分用S1表示,它满足Xip>0.8的条件,基于S1的y的拟合值是中的平均值,记为。另一部分用S2表示,它满足条件Xip<0.8,类似地,是S2的拟合值。通过在范围内逐一搜索Xip值,我们可以找到一个最佳的Xip来最小化如下函数,

类似地,我们可以用相同的逻辑将S1分成S3和S4,将S2分成S5和S6。当算法满足某些条件时我们就停止拆分,为方便起见,令Sj为终端节点。这样,比如当Sj的样本量小于6时即可停止分裂。这种算法被称为回归树中的递归二元分割。然而,利用这种方式估计的模型一般都是通过拟合的:即在样本内拟合效果很好但在测试集中预测效果很差。因此,通常会对该模型再次进行剪枝。剪枝意味着我们不是最小化目标函数(3),而是最小化了如下函数,

其中J是终端节点的数量,而α是一个惩罚参数,α越小,终端节点就越多。通常情况下,α是通过交叉验证得到的。比如,将样本分成10份,其中1份作为测试集,其他9份作为训练集,然后基于该测试集,可以得到模型预测结果的均方根误差(RMSE)。其他9份训练集也可以依次成为测试集,因此,最后的RMSE是10个RMSE的平均值。这样,不同的值对应于不同的RMSE,而对应最小RMSE的α值就是最终的α值。

上面阐述的单个回归树算法,其预测性能并不令人满意,一个有用的改进就是随机森林算法。具体而言,是从原始数据集中有放回重复抽样,然后为每一个抽样样本集拟合一个模型(或获得一个回归树),将这些模型(或树)的估计结果进行简单平均后作为最终结果。但该算法的特殊之处在于在考虑回归树中每个节点的样本时,只考虑m<p个随机内生变量,这就是随机森林算法。更多算法细节,请参考Hastie等(2009)。[22]

(三)基于蒙特卡洛模拟的预测比较

在价格传递机制的研究中,我们主要对变量间的动态关联感兴趣。换句话说,当上游部门发生冲击时,我们希望有一个模型能够准确预测下游部门的价格。在传统文献中,VECM和TVECM在捕捉这种动态相关性中有着广泛应用。然而,随着机器学习的普及,这一模型可以得到极大改善。为了看到这种改善的程度,我们通过生成不同的数据集,使用VECM、TVECM和随机森林模型进行拟合,并评估这些模型的预测表现。一般来说,宏观经济学中使用的样本量约为200个,因此我们生成300个随机样本,其中第1至第200个用于拟合模型,第201至第300个用于评估模型的样本外预测性能。模拟步骤如下:

第二步:使用VECM和基于标准估计程序的随机森林对样本1-200进行拟合,并使用RMSE、平均绝对误差(MAE)和基于样本201-300的Diebold-Mariano(DM)检验来计算预测性能。RMSE和MAE的计算方式分别如公式(6)和(7)所示,DM检验源自Diebold和Mariano(1995),DM检验的原假设是两种方法的预测精度相同。

第三步:对每一组新的随机抽样重复步骤一和二重复1000次,并对DM检验的RMSE、MAP和p值进行平均。在VECM中,我们使用赤池信息准则(AIC)或贝叶斯信息准则(BIC)选择滞后期。根据公式(5),24个滞后期是真正的滞后期,但依据AIC和BIC准则,它们在大多数情况下选择了2阶滞后。为了比较,我们也用VECM的24阶滞后来拟合样本。在随机森林中,内生变量的数量不受限制,所以我们选择6、12和24阶滞后来进行估计。三个模型的预测表现见表1的面板A。

表1 VECM与随机森林预测性能比较

无论pf=6,12还是24,VECM的RMSE和MAE的预测性能都远远劣于随机森林模型的结果。如果通过AIC选择pv,VECM的RMSE和MAE指标都比随机森林模型的RMSE和MAE指标高出3-4倍。此外,当pf=pv=24(即滞后阶数取真实值),来自VECM的RMSE和MAE更高,因为估计的参数更多。此外,DM检验的p值总是在1%的水平上显著。

在许多宏观时间序列分析中,滞后期通常在6期以内,因此,我们再次在一个有着较短滞后期的真实模型中,重新观察三个模型的预测表现。具体来说,c,α,β和εt与上述步骤1相同,但p=6和Φj的情况如下:

在不同的参数设置下重复步骤1-3,VECM和随机森林模型的预测性能显示在表1的面板B。我们观察到,VECM的RMSE和MAE大约是随机森林模型的2-3倍。尽管VECM和随机森林模型的RMSE(或MAE)之比很小,但VECM的预测精度仍然远远低于随机森林模型。总的来说,如果真实模型有较长的滞后阶数,VECM的性能会更差①当修改一些其他参数时,基准结果并没有改变。。

同时,我们也比较了TVECM和随机森林的预测表现。我们用TVECM来生成数据,真实模型的参数设置为在模型有着较长滞后时(模拟的预测表现见表2的面板B),令Φj取值如下,

表2 TVECM与随机森林预测性能比较

我们还分析了不同参数集的模型,但由于基本特征没有变化,所以结果省略。

尽管我们是用真实的TVECM来生成数据,但即便基于该模拟数据,随机森林模型的性能仍然更优。我们注意到,当估计模型的滞后期等于真实滞后期时,TVECM的预测性能(表2的面板A和B的最后两行)比由AIC选择估计模型的滞后期时要差。原因是真实滞后期比TVECM中AIC选择的滞后期要长。一般来说,在传统计量经济学模型中,当样本量固定时,参数越多,估计精度越差。然而,随机森林模型的预测性能并没有受到滞后期的实质性影响。因此,我们发现,随机森林模型在预测精度方面远远优于VECM和TVECM。一般来说,当滞后期较长时,随机森林的预测性能会得到有效改善。

因此,我们认为,在诸多利用VECM或者TVECM建模的领域,使用随机森林是一个更好的建模选项。考虑到VECM和TVECM可以计算有着丰富经济含义的脉冲响应和方差分解,我们在下一节给出如何利用随机森林计算相应的脉冲响应和方差分解。

(四)基于随机森林模型的广义脉冲响应(GIR)和方差分解(GFEVD)

脉冲响应具有丰富的经济含义。在宏观经济学中,脉冲响应通常被用来进行结构冲击分析,乘数效应分析,以及研究宏观经济变量的动态变化。在价格传导建模中,它也被用来显示上游变量的冲击对下游变量的影响。然而,由于随机森林是非参数化的,脉冲响应不能通过经典的算法得到(Lutkepohl,2005)。在这里,我们阐述了一种基于随机森林的新的广义脉冲响应算法。一个捕捉y1和y2之间动态相关关系的随机森林模型可以写成如下:

其中f是随机森林模型。按照Koop等人(1996)对广义脉冲响应(GIR)的定义,GIRy1衡量的是作用于y1的冲击对y2的影响,—即对y1的冲击导致下一期y2的变化。[17]它可以按以下方式计算:

第三步:用与第二步相同的残差对估计模型进行h期模拟,其中第一个残差用ε11+δ代替。重复1000次,得到对应于冲击δ的条件期望值。

第四步:重复第二步和第三步,用ε12+δ替换第一个残差。

第五步:重复第四步,获得基准和冲击条件期望的脉冲响应T,对每个时期进行平均,取两个样本平均数之差,得到GIR。

从上述步骤中,我们可以得到两个平均数。第一个是在步骤二和三中,对于任何对1000次模拟的结果进行平均化。第二个是在步骤四和五中,基于所有εt的平均结果T再次被平均化。

一旦得到GIR,按照Lanne和Nyberg(2016)的做法,可以将h期的广义预测方差分解写成如下:

公式(10)表示来自冲击δ1的y1的GFEVD,它是来自冲击δ1的y1的GIR在所有冲击的y1的GIR中的百分比。[24]

三、实证分析

2019年7月至2021年9月,中国猪肉价格从高峰跌到了低谷,这种大起大落已经引起了学术界和政府部门的广泛关注。理论上,从母猪存栏量冲击到猪肉价格波动,这种传导需要近1年时间。如果使用月度数据,动态模型需要包括12个滞后期。对于这么长的滞后期,正如前文所述,使用随机森林模型是理想的。

(一)研究对象

消费价格指数包含许多子类别,猪肉价格指数就是其中之一。我们以猪肉价格指数的环比(以下简称PI)为因变量,以滞后的PI、母猪存栏量的环比(以下简称SS)及其滞后值为内生变量。频率为月度,所有数据均来自Wind数据库。因为PI数据的起始日期是2009年2月,所以样本的时间范围为2009年2月至2021年11月,样本量为151,描述性统计见表3。PI的平均值为正,标准差为0.04,而SS的平均值为负,其标准差更小。

表3 描述性统计

(二)VECM和随机森林的预测性能

研究利用PI和SS数据,比较VECM和随机森林的预测性能并按照以下步骤建立VECM模型。第一,对猪肉价格指数和母猪存栏量以2010年12月为1的定基比数据(以下分别称为RFPI和RFSS)进行单位根检验,结果见表4,其中RFPI和RFSS都是一阶单整时间序列。然后进行Johansen协整检验,结果见表5,因为当秩为2时,其迹统计量小于5%的临界值,无法拒绝原假设——有一个协整关系,因此,认为RFPI和RFSS之间存在一个协整关系。最后,进行Hansen和Seo(2002)的非线性协整检验:检验的统计量为12.61,在10%的水平上不显著。综上,传统的时序建模步骤表明,线性VECM是合适的。

表4 单位根检验(Dickey-Fuller检验)

表5 约翰森协整检验

为将传统时序建模与随机森林建模再次进行比较,我们再次对该数据进行了随机森林建模。鉴于猪肉价格传导的时间,而随机森林可以纳入任意多的滞后,因此建模时选择了2年的滞后期(24个月)①研究还尝试了其他滞后期的模型,最后发现滞后期为24的模型具有最好的预测性能。。根据方程(9),我们将PI和SS的24阶滞后作为内生变量。因此,我们的模型中包含了72个内生变量。显然,基于151个样本,VAR和VECM模型均不能处理如此多的内生变量。此外,在建立模型时,生成了2000棵树,在每个分割节点中考虑了18个内生变量。需要注意的是,模型中使用的是PI和SS,而不是RFPI和 RFSS②在评估VECM的预测性能时,将定基比又转化为环比。。

研究使用滚动窗口来比较VECM和随机森林的预测性能。具体来说,首先用第1至第127个观测值作为训练集来估计模型参数并训练模型,用最后24个观测值(即最近两年的观测值)作为测试集来评估超前1步至超前12步的预测表现。其次,我们将第2至第128个观测值作为训练集,将第129至第151个观测值作为测试集,再次得到1至12步超前预测的预测性能。通过向前滚动,可以得到对应超前步数的预测表现的一个合集。最后,将所有的预测性能按预测的超前步数进行分组,然后计算出组平均预测性能,这些预测结果展示在图2中。圆圈代表的是VECM的预测表现,三角形代表的是随机森林的预测表现,上图是RMSE,下图是MAE,图中的数字是DM检验的p值。可以看到,无论使用那个预测指标,随机森林模型的RMSE或MAE总是小于VECM方法的RMSE或MAE,而且这种差异均非常显著。因此,基于PI和SS数据,随机森林方法优于VECM。在下一节中,研究将计算基于随机森林方法的广义脉冲响应和广义预测误差方差分解。

图2 VECM和随机森林的预测表现

(三)广义脉冲响应和广义预测误差方差分解

GIR衡量一个变量对另一个变量冲击下的动态响应。由于GIR取决于冲击的大小和方向以及变量的历史取值,按照前文的步骤,我们在图3中画出了六个不同大小和方向的GIR,所有这些都是基于样本中的最后一个时期。为了计算GIR,我们进行了多次模拟。实线是中位数,虚线是90%的置信区间。图3第一行的两张图片显示了SS受到的冲击(=±0.01)对PI的影响,SS的标准差约为0.01;第二行的图像显示SS的冲击=±0.02;第三行的图像显示SS的冲击=±0.04。

图3中有两个结论值得注意。第一,SS的正向冲击对PI的影响与负向冲击的影响存在很大差异。当冲击=±0.01时,这一点非常明显,负冲击的峰值效应是正冲击的四倍。当冲击=±0.02时,负冲击的峰值效应约为1.2倍。当冲击=±0.04时,正冲击的效应呈倒驼峰状,负冲击的效应呈单峰状,绝对峰值大小大致相等。第二,当冲击加倍时,峰值效应不会加倍。当冲击从0.01变化到0.02时,峰值效应增加了三倍。然而,当冲击从-0.01变为-0.02或从-0.02变为-0.04时,峰值效应变化很小或根本没有变化。这意味着PI对SS的负面冲击的大小变化不是很敏感。正如我们在图6中观察到的,PI在SS的大多数数值范围内变化不大。然而,在SS的某些数值范围内,PI变化很快,这意味着对SS的冲击对PI可能有一个阈值效应。

图3 SS的不同冲击对PI的影响

为了探索PI的波动来源,我们根据方程(10)计算广义预测误差方差分解,结果见图4。图中第一行的冲击幅度为0.01,第二行和第三行的冲击幅度分别为0.02和0.04。无论冲击的幅度是多少,PI的波动主要来自于SS。当冲击为正(负)时,冲击越大,PI的波动越大(小)。

图 4 PI的GFEVD

(四)进一步探索

在图1中观察到PI和SS的变化在大多数时候是温和的,而在2019年8月之后,它们的波动都很极端。研究推测,SS对PI可能存在一些阈值效应。在随机森林模型中,研究包括SS和PI的24阶滞后。这个模型是非参数性的,在有限的空间内讨论SS的每个滞后期对PI的阈值效应是很困难的。因此,研究首先尝试找到一些对PI影响较大的SS的重要滞后期,然后用Friedman(2001)的方法计算SS的重要滞后期对PI的偏效应。[25]通过绘制SS对PI的偏效应,我们可以发现一些有趣的阈值特征。

随机森林是高度非线性的,所以不能像OLS那样获得系数以定义内生变量的重要性。然而,在本研究的模型中,每棵树都有自己的袋外RMSE,对于PI,2000棵树的平均RMSE是0.032,是PI标准差的75%。对于SS来说,2000棵树的平均RMSE是0.010,是SS标准差的60%。随着更多的内生变量被添加到模型中,RSS会下降:它下降得越多,相应的内生变量就越重要。图5显示了内生变量的重要性,即SS对因变量PI的滞后期哪个更多地影响了猪肉价格PI。

图5 内生变量的重要性

从图5中可以发现SS的前面6个月滞后期,以及第21、22个月滞后期均有着相对较大的影响,这也意味着传导时间超过1年,与从母猪存栏量到猪肉价格的理论传导机制一致。我们选择了2、6两个滞后期来计算其对PI的偏效应。Friedman(2001)提出了以下公式来估计内生变量的偏效应:

其中f是一个函数,如随机森林模型;x是一个我们感兴趣的内生变量;而xic是模型中的其他内生变量。

图6显示了根据公式(11),SS的2和6阶滞后对PI的偏效应。在图中的每个子中都可以看到一个PI剧烈变化阈值区间,即当SS的滞后期接近该阈值区间时,PI变化很大,但它在其他区域表现的变化较小。当滞后期为2时,SS的阈值接近于-4.5%,当滞后期为6时,阈值接近于-2%。这意味着,在这个区间,SS的微小变化会带来PI的巨大变化。比如对于滞后两期的SS,在当其增速从-4.5%左右减缓到-4%左右,即增速在这个区间减缓约0.5%时,PI从2%下降到了0.5%。但若在-1%处减缓0.5%,PI几乎没有变化。另外值得指出的是,理论上,SS的冲击需要一年多的时间才能影响到PI,但滞后1-6期的SS却有着重要影响,研究认为预期在这里起着重要作用。譬如,当SS有非常明显的变化时,中间商就会出现对未来猪肉价格的担忧,从而迅速引起猪肉价格的改变。

图 6 SS的2、6和15阶滞后对PI的偏效应

四、结论

在食品价格传导建模中,如果上游部门变量对下游部门变量冲击的影响有着较长的滞后,那么通常的VECM或者TVECM建模往往很难准确捕捉到这两个变量间的动态关系。文章提出用机器学习的随机森林算法可以良好地解决该问题。

第一,通过在多种模型设定中,利用蒙特卡洛模拟,比较了VECM和TVECM与随机森林模型的预测性能,发现在任何情况下,随机森林模型的预测精度均更优。因此,可以认为在利用VECM进行长滞后的建模中,随机森林模型应该更加合适。第二,为了进一步拓展随机森林模型在经济研究中的应用,研究提出了基于该模型的广义脉冲响应和广义误差方差分解。第三,利用随机森林模型,研究评估了中国市场上从母猪存栏量到猪肉价格的价格传导。据此,我们观察到GIR的一些不对称特征:正向冲击的峰值效应的绝对值远远低于负向冲击;然而,当冲击加倍时,峰值效应并没有加倍。因此,监管机构应密切关注负向冲击。此外,我们还发现,母猪存栏量的前面1至6阶滞后对PI有重要影响,而且存在阈值效应,一旦SS接近这些阈值,PI通常有着剧烈的波动。

基于文章的研究结论,为保障未来猪肉价格的平稳运行,第一,稳定猪肉价格可以从上游源头入手。现实生活中人们往往可以直观感受到猪肉价格的变化,却并不敏感其上游影响因素的变化。而文章的结论表明,母猪存栏量对猪肉价格变化具有明显的冲击效应,存在通畅的“一荣俱荣、一损俱损”的动态传导路径。因此,当猪肉价格按照不利方向发生变动时,一个有效的策略就是激励上游母猪存栏的反向变动,以此平抑价格波动。第二,应特别关注母猪存栏量的负向变化。文章结论表明猪肉价格在滞后半年的时间里对母猪存栏量的下跌表现出更强的上涨效应,而对母猪存栏量增加则猪肉价格的下跌却相对较弱。因此,在政策上应更多关注母猪存栏量下跌,采取多元化养殖、建立完善的储备制度避免出现大的跌幅。同时,也要注意到,如果猪肉价格下跌,为恢复至均衡水平,那么向下调整母猪存栏量的作用将会非常显著。第三,设立猪肉价格的预警指标体系,为猪肉价格稳定做好提前量。母猪存栏量的跌幅存在一些重要的门槛值,而这些门槛值即为重要的预警指标,在达到该指标之前,母猪存栏量的变化都是正常的,猪肉市场的价格不会经历太多波动,而一旦突破则可能会引起市场较大的波幅。因此,可以建立相应的市场价格风险预警指标,一旦发现母猪存栏量出现预警信号,要根据其形成原因和过程,制定相应的风险管理策略,进一步降低其危害程度。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!