时间:2024-04-24
马腾 汪晶 丁绍纹 潘佳铭 朱家明
【摘 要】在“互联网+大数据”的背景下,搜索引擎为人类提供了多源的瞬时信息。在预测中,由于预测系统的复杂性,区间数作为刻画事物随机阶段性信息的一种表现形式,蕴含信息较时点序列更加丰富。而传统的区间组合预测模型并不能很好地处理非线性时間序列,因此,论文研究多尺度视角下区间组合预测模型及其在金融时间序列中的应用。首先利用改进的BEMD算法对区间金融时间序列进行多尺度分解,其次利用三种区间型单项预测方法对分解后的序列进行单项预测,最后组合单项预测的结果得到最优组合预测结果,通过对上证指数的实证,验证了论文所提多尺度区间组合预测模型的有效性。
【Abstract】Under the background of "internet + big data", search engines provide human with instantaneous information of multiple sources. In forecasting, because of the complexity of the forecasting system, interval number, as a form of expression to describe the random periodic information of things, contains more rich information than the time point series. However, the traditional interval combination forecasting model can not deal with the nonlinear time series well. Therefore, this paper studies the interval combination forecasting model from the multi-scale perspective and its application in financial time series. The paper firstly performs a multi-scale decomposition of interval financial time series using the improved BEMD algorithm, and then uses three interval single forecasting methods to perform single forecasting on the decomposed series, and finally combines the results of the single forecasting to obtain the optimal combination forecasting results. The validity of the multi-scale interval combination forecasting model proposed in the paper is verified through the empirical evidence of the Shanghai Composite Index.
【关键词】多尺度分解;组合预测;区间预测;金融时间序列
【Keywords】multiscale decomposition; combination forecasting; interval forecasting; financial time series
【中图分类号】F224;F832 【文献标志码】A 【文章编号】1673-1069(2021)09-0059-04
1 引言
金融市场是中国市场经济体制中的一个极其重要的组成部分,而股票指数则是金融市场的核心。近年来,金融市场价格波动频繁,不仅为投资者们带来经营风险,也对金融管理部门决策造成一定不良影响。准确地预测股票指数不仅有助于建立稳定有效的金融市场定价机制,为政府制定合理金融市场交易政策提供帮助,同时,有利于金融市场的稳定和健康发展。
近年来,随着计算机网络技术的广泛和深入发展,金融数据出现和使用的频率越来越密集,其不确定性在不断地增加,时间序列数据在量上要更庞大,从特征上看要更为复杂,因此,利用传统的预测方法对非线性的时间序列进行预测,效果较差。同时,利用点值序列描述不确定现象要更为困难,而且容易造成信息的丢失,如在上证指数中,每天的指数都是在变化的,如果只用一个数来描述,很难描述出全天的变化趋势,此时用区间值来描述要更为合理。除此之外,由于区间型数据相对于点值序列蕴含了大量市场信息,从而在数据层面反映金融市场的复杂性和不确定性。研究多尺度视角下区间型时间序列组合预测模型,准确地预测金融时间序列,有望对金融市场的状态给出更加准确的反映和预警,为制定合理的管理政策提供科学的依据。
区间型数据最早由Moore教授[1]提出,用于解决数学模型中变量不确定取值的问题。由于区间型数据中蕴含了丰富的历史信息,相对传统点值数据在不完全信息处理上具有明显的优势,因而在经济和金融领域逐渐被采用[2-4]。近年来,从区间样本总体出发,杨威等[5]将传统计量和时序模型拓展到区间型信息环境下并与传统点值模型和方法进行了比较,结果表明,区间型数据具有更高的预测优势。Tao Xiong等[6]则考虑了区间型时间序列以区间形式方式的分解及其预测研究。可以看出,从区间样本总体出发对区间型数据进行建模和分析能够充分利用区间型数据的优势,这成为区间型数据分析的趋势。然而,利用现有的传统统计预测方法处理大数据背景下的金融时间序列较为困难,并且已有的区间型分解集成预测模型通常只用单一的方法对分解后的时间序列进行预测,这样可能导致预测风险的加大,因此,本文为了降低预测的风险,提出基于多尺度视角的区间组合预测模型。首先,利用改进的BEMD分解方法对金融区间时间序列模型进行分解;其次,从不同的视角构建区间型金融时间序列单项预测模型对分解后的序列进行单项预测;最后,根据左右端点构建最优组合预测模型,并将模型应用到上证指数的预测中。
2 预备知识
3 基于改进的BEMD的多尺度区间组合预测模型
对于多尺度区间值时间序列的组合预测,我们首先利用改进的BEMD模型对区间值时间序列进行多尺度分解;其次,分别利用区间HoltI指数平滑方法、区间支持向量回归模型和时空自回归区间预测方法对分解后得到的序列进行单项区间预测,进而根据单项预测方法的预测结果对分解后不同的序列构建最优组合预测模型;最后,将所有序列的最优预测结果进行简单集成得到多尺度最优组合预测值,并将该模型用于区间金融时间序列中。具体流程如图1所示。
3.1 改进的BEMD分解方法
BEMD分解算法[7]是在EMD算法的基础上提出的,适用于对两列不同的非线性时间序列同时分解。由于BEMD在序列的分解过程中并没有考虑到极端值的影响,也就是说当端点值不能够被识别为极端值时,会加大分解的误差。因此,本文为了改进这个问题,在分解前利用镜像法对原始时间序列进行处理,具体处理过程为在原始值时间序列端点附近找到极大值和极小值点,分别以镜面做对称图像,得到新的极大值点和极小值点,进而再利用BEMD进行分解,具体步骤为:
4 案例实证分析
4.1 上证指数区间型数据的来源
本文通过WIND数据库收集2018年1月2日至2021年1月13日共738天的上证指数股票价格的区间数据作为样本进行数据仿真,以一天中上证指数的最大值为观察区间的上界,最小值为观察区间的下界。为防止算法的过拟合,本文将2018年1月2日至2020年12月7日的数据集作为训练集,2020年9月14日至2020年12月7日的数据集作为验证集,2020年12月7日至2021年1月13日的数据集作为测试集进行比较分析。所有实验是在Windows 10和MATLAB R2017a环境下运行的。
对上证指数区间时间序列运用改进的BEMD算法,分解后得到8个IMF序列和1个残差序列,如图2所示。
对分解后的序列分别采用三种区间单项预测方法进行组合预测,结果如图3所示。
4.2 误差分析和模型比较
为验证本文提出模型的优势,本文采用三种区间误差度量标准来评价不同模型之间的优劣性,如下:
根据式(10)~(12)计算各预测方法的预测结果,如表1所示。
通过表1结果表明,本文模型的三种误差评价指标均为最小,说明使用单一的预测方法进行预测,并不能完全反映时间序列的发展规律,可以看出在面对复杂、非线性、非平稳的时间序列数据,使用多尺度分解可以将数据的信息提取出来,减少冗余信息的影响,提高模型预测精度,因而引入多尺度视角下组合预测模型是有必要的。
5 结论
首先,针对上证指数区间时间序列的复杂性以及非线性、非平稳性特征,本文提出新的多尺度区间时间序列分解模型,在原有的分解模型基础上,提高精度,保证信息的完整性。其次,对分解后的序列采用三种不同的区间单项预测方法,并用组合预测方法进行集成。将预测结果序列集成重构,得到预测结果。最后,通过比较不同预测模型和本文模型的误差结果,说明了本文提出模型具有较好的可行性。在未来的研究中,可以考虑对分解后的序列重构,得到趋势明显的序列,并针对使用最适合的预测方法,提高运算精度和运算速度。
【参考文献】
【1】Ramon E. Moore.Interval Analysis[M].Englewood Cliffs:Prentice-Hall,1966.
【2】Max E. Jerrell.Interval Arithmetic for Input-output Models with Inexact Data[J].Computational Economics,1997,10(1):89-100.
【3】Vladik Kreinovich,Luc Longpré,Scott A. Starks,et al.Interval versions of statistical techniques with applications to environmental analysis, bioinformatics, and privacy in statistical databases[J].Journal of Computational and Applied Mathematics,2005,199(2):418-423.
【4】Ramon E. Moore,R. Baker Kearfott,Michael J. Cloud.Introduction to Interval Analysis[M].Philadelphia:SIAM,2009.
【5】楊威,韩艾,汪寿阳.基于区间型数据的金融时间序列预测研究[J].系统工程学报,2016,31(6):816-830.
【6】Tao Xiong,Chongguang Li,Yukun Bao,et al.A combination method for interval forecasting of agricultural commodity futures prices[J].Knowledge-Based Systems,2015(77):92-102.
【7】Rilling G,Flandrin P,Gonalves P,et al.Bivariate Empirical Mode Decomposition[J].IEEE Signal Processing Letters,2007,14(12):936-939.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!