基于双向循环神经网络的金融数据预测研究

时间：2024-09-03

◆任楚岚宋才彦

基于双向循环神经网络的金融数据预测研究

◆任楚岚1，2宋才彦1，2

（1.沈阳化工大学计算机科学与技术学院辽宁 110142；2.辽宁省化工过程工业智能化技术重点实验室辽宁 110142）

近年来，越来越多的人加入到股票投资的队伍当中，金融学家和社会学家也将股票市场的发展作为衡量一个国家或者地区发展水平的一项重要标准。对于股民来讲，若可以准确预测股价变化，就可以及时采取措施达到较高的收益。为此，建立一种基于CBAM注意力机制的神经网络模型实现对未来股票价格的预测。通过与建立的其他模型预测结果对比发现，基于CBAM注意力机制的BiLSTM神经网络模型对于股票价格的预测性能最优。

股票预测；长短时记忆神经网络；注意力模块；深度学习

如今，社会学家和金融学家将股票市场的发展作为一个国家或是地区发展水平的衡量标准[1]。对于普通股民来讲，若可以准确预测股价变化，则会带来较大的经济收益，因此国内外众多研究者着手于股票价格的预测。早期金融学家使用传统简单的数学模型对股票数据进行处理，随着时间的延长暴露出线性模型的局限性，因此使用传统数学模型难以满足对股票价格的预测。研究者尝试建立非线性模型对股票价格进行预测，成功并引入支持向量机和人工神经网络等方法[2]。目前神经网络在股票预测领域已经取得较好的成果，但是对于预测股票价格的准确性仍然存在较大的提升空间。

1 股票预测模型

1.1 ARIMA预测模型

股票价格移动自回归平均ARMA（p，q）模型表示的形式如下：

1.2 LSTM预测模型

传统的人工神经网络模型（RNN）主要用来处理基于时间序列的数据，但是随着时间的推移，传统人工神经网络会对先前的信息有所遗忘，容易出现梯度消失或者梯度爆炸等现象[3]。长短时记忆神经网络（LSTM）对RNN进行了改进，在神经网络每个单元的隐藏层增加了记忆模块，使得神经网络可以长时间记忆。LSTM神经网络主要加入了遗忘门、输入门和输出门[4]。遗忘门用于控制对于先前隐藏单元传递的信息要遗忘的程度，进行选择性遗忘；输入门控制对于前一隐藏层状态以及当前新信息的输入程度，避免当前时间步的非关键特征传递到记忆模块；输出门控制对于经过遗忘门和输入门处理后的信息的输出程度。通过这三个门对先前历史信息以及当前新信息的权重进行调整，找到模型的最优参数及权重，解决了传统神经网络的梯度消失或者梯度爆炸问题。因此，LSTM被广泛用于对于时间序列数据的研究。

1.3 BiLSTM预测模型

LSTM只能够按照时间从过去到未来的顺序对数据信息进行传递，而双向长短时记忆神经网络（BiLSTM）还可以做到按照时间从后向前的顺序对数据信息进行特征提取和处理。

BiLSTM主要由前向和后向两个方向的LSTM神经网络构成，充分地考虑了数据间的关联性，将前向和后向传播层通过线性融合到一起传递到输出层，使得模型的输出结果更为准确。BiLSTM网络拓扑图如图1所示。

图1 BiLSTM网络拓扑图

1.4 CBAM注意力机制

CBAM包含两个通道，在通道维度上，BiLSTM神经网络与CBAM注意力模块经过融合后在通道和空间两个方面进行过滤非重要特征信息，然后将权重图与输入的特征图相乘来进行特征的自适应学习，提高网络的特征提取[5]。

2 实验过程

2.1 数据收集与处理

本文研究的是股票开盘价的预测，以从CSMAR数据库选取沪深交易所上市A股中光大银行（股票编号为601818）的股票数据为例进行分析，收集2019年6月1日到2021年5月31日的股票日交易信息数据。

由于收集到的历史股票交易数据存在重复值以及数据缺失情况，因此需要对收集到的数据集进行数据预处理，将证券代码“601818”特征进行删除，然后对数据集按照日期顺序进行排序，获得一个较为有序的数据集。但是，股票交易数据中的数据之间的量纲不同，导致量纲值域范围较小的特征数据受到量纲值域范围较大的特征数据影响而产生“失效”问题，因此，使用归一化的措施对收集到的特征数据进行无量纲化处理，加快模型的收敛速度。利用Z-socre标准化方法和原数据的均值和标准差使数据符合标准正态分布[6]。使用的转换函数如下所示：

归一化后的数据分布在[-1，1]区间内。模型得到预测值时，需要对其去归一化处理得到其真实值，使用的函数如下所示：

2.2 模型搭建

将四种模型在相同的操作环境下以及相同的数据集的测试集条件下进行实验。

对于ARIMA模型，将收集到的2019年6月1日到2021年5月31日的股票样本数据直接进行输入并寻找最优参数，得到股票价格的预测结果。

对于LSTM和BiLSTM模型，使用移动窗口化的方法进行建模。将采集到的股票样本数据划分为独立窗口。BiLSTM神经网络，每层神经网络有128个隐藏单元，然后在每个结构模块的线性融合后再加入CBAM模块，最后反向传播神经网络输出最终的预测价格[7]。

3 实验结果与分析

3.1 实验结果

四种模型对于股票预测的实验结果如图2～图5所示，其中虚心红色方框的散点图表示股票开盘价的预测值，实心蓝色方块的散点图表示股票开盘价的真实值，横坐标为时间，纵坐标为股票标准化处理后的结果。

通过观察以上四个实验预测结果拟合图可知，四种模型都能够较为准确地预测股票的价格，但是LSTM模型、BiLSTM模型以及CBAM-BiLSTM模型的曲线更贴近于实际股票价格曲线，并且CBAM-BiLSTM模型最贴近实际股票价格曲线。

图2 ARIMA模型预测结果

图3 LSTM模型预测结果

图4 BiLSTM网络模型预测结果

图5 CBAM-BiLSTM网络模型预测结果

3.2 实验结果分析

均方根误差表示观测值与真实值之间的偏差，常用来作为深度学习模型预测结果衡量的标准，因此采用均方根误差（RMSE）对各个模型的实验结果进行评估[8]。RMSE计算公式如下：

四种模型的预测结果的RMSE如表1所示。

表1 网络模型的预测误差

模型RMSE ARIMA0.0845 LSTM0.0572 BiLSTM0.0348 CBAM-BiLSTM0.0235

均方根误差的值越小，表示预测结果越准确。LSTM模型和BiLSTM模型的猜测结果优于ARIMA模型，且在加入CBAM模块之后，模型预测结果的准确率得到提升。因此，从模型的预测误差方面来讲，基于CBAM-BiLSTM模型对于股票价格的预测结果更优。

回归方程的拟合程度使用决定系数（R2score）进行定量的判断，决定系数越大表示模型的预测性能越好[9]，因此可以使用决定系数衡量模型的预测能力，计算公式如下。

四种模型的预测结果的R2如表2所示。

由表2可知，CBAM-BiLSTM模型和BiLSTM模型以及LSTM模型的决定系数较ARIMA模型更大，且CBAM-BiLSTM模型的决定系数最大，说明加入CBAM注意力模块的BiLSTM模型的拟合度最好。

表2 各网络模型的决定系数

模型R2score ARIMA0.715615 LSTM0.845623 BiLSTM0.916578 CBAM-BiLSTM0.934574

模型的时间复杂度决定了模型的预测时间[10]，如果模型的时间复杂度过高就会耗费大量时间。对四种股票预测模型的时效性做了一个对比分析，得到的四种模型的预测完成所需时间如表3所示。

表3 网络模型的预测时效性

模型用时/ms ARIMA4.646 LSTM4.846 BiLSTM7.481 CBAM-BiLSTM8.706

由表3可知，四种模型的预测时间均在5～9毫秒，可以做到快速的预测。虽然CBAM-BiLSTM模型的预测时间较其他三种模型的预测时间较长，但是相差在2～4毫秒之间，在预测过程中均不会耗费大量时间。因此，表3定量地证明CBAM-BiLSTM模型具有一定的时效性。

4 结束语

根据股票价格数据的时间序列特征，将CBAM注意力模块加入到BiLSTM神经网络模型中实现对未来股票开盘价的预测。充分利用股票数据的时间序列特征。实验结果表明，基于CBAM-BiLSTM神经网络模型相较于ARIMA模型、传统的LSTM模型以及标准的BilSTM模型对于股票的预测有着更高的准确性，为投资者提供了一定的参考，有助于投资者实现投资利益的最大化。

[1]FISCHER T，KRAUSS C.Deep learning with long short-term memory networks for financial market predictions[J].European Journal of Operational Re-search，2017，270（2）：654-669．

[2]谢琪，程耕国，徐旭.基于神经网络集成学习股票预测模型的研究[J].计算机工程与应用，2019，55（8）：238-243.

[3]Sharma，Dinesh K.，Hota et al. Integration of genetic algorithm with artificial neural network for stock market forecasting[J]. International Journal of System Assurance Engineering and Management，2021（prepublish）.

[4]张婷婷，唐振鹏，吴俊传.基于优化KELM模型的股票指数预测方法[J].统计与决策，2021，37（13）：148-150.

[5]Prachyachuwong Kittisak，Vateekul Peerapon. Stock Trend Prediction Using Deep Learning Approach on Technical Indicator and Industrial Specific Information[J]. Information，2021，12（6）：124-132.

[6]孙丽丽，方宏彬，朱星星，等.基于网格搜索优化的XGBoost模型的股票预测[J].阜阳师范大学学报（自然科学版），2021，38（02）：97-101.

[7]赵红蕊，薛雷.基于LSTM-CNN-CBAM模型的股票预测研究[J].计算机工程与应用，2021，57（03）：203-207.

[8]蒙懿，徐庆娟.基于LSTM神经网络——马氏链的股票价格预测[J].时代金融，2021（11）：3-6.

[9]宋刚，张云峰，包芳勋，等.基于粒子群优化LSTM的股票预测模型[J].北京航空航天大学学报，2019，45（12）：2533-2542.

[10]Shengyin Luo. Review on the Application of Machine Learning in Stock Forecasting[J]. Academic Journal of Business &； Management，2021，3（4）：75-86.

辽宁省科技厅博士启动基金，项目编号：201601204