时间:2024-07-28
付 洁,黄 洪
(西南交通大学 信息科学与技术学院,成都 611756)
铁路运输因运量大、速度快、安全性高等优点,一直被人们作为长途出行的优选交通工具,但由于成本造价的影响,若不能及时掌握客流动态,极易出现运能紧张、成本浪费等问题[1]。合理精确的客运量预测能够实现成本最小化和利益最大化[1]。一个地区铁路客运量的影响因素多种多样,涵盖经济、人口、地理、旅游、国家政策甚至重大事件等[2]。不同因素对客运量的影响程度不同,且二者间存在复杂的非线性关系[3]。
铁路客运量预测的主要模型有GM(1,1) 模型、Verhulst 模型、SCGM 模型、BP 神经网络和RBF神经网络等。目前,科研人员已经针对多种单一模型对客运量进行预测研究[4-6],但单一模型往往精确度较低,为弥补误差过大的不足,组合模型应运而生。灰色- 回归组合模型[7-9]、GM- 马尔科夫链组合模型[10-11]、GA-BP 组合模型[12]等都已成功应用于客运量预测领域。
本文通过灰色关联法定量分析四川省铁路客运量的影响因素,确定关联度,找出主要影响因子,并研究一种简单可行的Verhulst-RBF 神经网络组合预测模型。
四川省铁路客运量与众多影响因素紧密相关,其中,部分影响因素可定量分析,其余因素由于数据获取难或无法获取只能定性分析。本文选取地区生产总值、人均地区生产总值、第一产业总产值、第二产业总产值、第三产业总产值、居民消费水平、年末常住人口、铁路营业里程、铁路旅客周转量、进出口总额、建成区面积共11 项可量化因素作为客运量的影响因子。
笔者从国家统计局官方网站上获取了四川省2004—2017 年(共14 年)铁路客运量及相关影响因子的数据,经整理汇总,部分汇总数据如表1所示。
表1 四川省铁路客运量及相关影响因子统计数据表
灰色关联度分析是灰色系统理论的一部分,由邓聚龙教授首先提出,通过确定不同数据列的发展趋势和相似性,来判断数据列的关联程度[13]。灰色关联分析法适用性很强,受数据量不足或信息不确定等情况的影响较小[13]。其主要计算步骤如下[13-16]:
(1)确定因素序列和特征序列;
(2)对原始数据进行无量纲化处理;
(3)求差序列;
(4)求关联系数;
(5)计算关联度。
将铁路客运量数据分别与上述11 项影响因素的数据进行灰色关联度分析,分析结果如表 2 所示。
根据关联度分析结果可知:(1)四川省铁路客运量受铁路旅客周转量、建成区面积、第一产业总产值和铁路营业里程的影响程度最大,影响程度都在0.9 以上;(2)年末常住人口和居民消费水平影响程度位于0.8 ~0.9 ;(3)第三产业总产值、人均地区生产总值、地区生产总值和第二产业总产值影响程度位于0.7 ~0.8 ;(4)影响最弱的为进出口总额,但其影响度仍然在0.6 以上。由此可见,表2 中显示的影响因子与铁路客运量都有较为显著的相关性,为保证后续预测模型具有更高的精确度,本文选取影响度在0.8 以上的6 项因素作为主要影响因素,即铁路旅客周转量、建成区面积、第一产业总产值、铁路营业里程、年末常住人口和居民消费水平。
表2 影响因子灰色关联度分析结果列表
Verhulst 模型是灰色系统模型的一种,它能对无序离散的序列进行研究,具有所需信息量少、保持原始序列特点等优点,其主要计算步骤如下[17-19]。
(1) 设原始序列为X(0)=(X(0)(1),X(0)(2),…,X(0)(n))。
(2)通过公式(1)对X(0)进行一次累减生成,得到序列X(1)=(X(1)(1),X(1)(2),…,X(1)(n))。
其中,k=2,3,…,n;X(1)(1)=X(0)(1)。
(3)通过公式(2)对X(0)进行紧邻均值生成,得到序列Z(1)=(Z(1)(1),Z(1)(2),…,Z(1)(n))。
其中,k=2,3,…,n;Z(1)(1)=X(0)(1)。
(4)Verhulst 模型的方程式如公式(3)所示,其白化方程如公式(4)所示。
其中,a为发展系数;b为作业量;a、b为待求解参数。
根据X(1)和Z(1)得到矩阵B和Y
求解a、b,得到公式(5):
(5)公式(6)为模型的时间响应式,以X(1)(1)=X(0)(1) 为初始值,将所求得的a、b代入公式(6),即可得到最终预测序列H。
其中,k=1,2,…,n。
RBF 神经网络[20-22]是一种性能良好的基于径向基函数的3 层前向网络。RBF 神经网络的3 层结构分别为输入层、隐含层和输出层。其中,输入层的节点个数一般为影响因子的数目;隐含层节点数目由聚类算法随机生成;输出层的节点数为预测结果数。
RBF 神经网络的学习过程[20-22]主要分为训练和测试两个阶段。在训练阶段根据输入样本决定隐含层各节点径向基函数的中心和方差。在隐含层的各个参数决定后,测试阶段利用最小二乘原则,求出隐含层和输出层的权值。RBF 神经网络结构如图1 所示。
图1 RBF神经网络结构图
GM-RBF 组合模型已被应用于股票价格等的预测分析中, 文献[23]中提出了一种可行的GM(1,1)与RBF 神经网络结合的方式,它使用GM(1,1) 模型,对原始序列进行预测得到预测序列,再将预测序列作为RBF 神经网络模型的输入序列,从而得到最终预测结果。本文结合Verhulst 模型原理和RBF 神经网络原理,在文献[23]的基础上,提出的组合模型基本思路如下[23]。
(1)将原始序列X(0)使用Verhulst 模型预测得到预测序列H;
(2)对H序列进行累减生成和紧邻均值生成,得到累减生成序列X(1)和紧邻均值序列Z(1);
(3)将X(1)和Z(1)用RBF 神经网络进行预测,得到新的累减生成序列X*(1)和紧邻均值序列Z*(1);
(4)将X(0)、X*(1)和Z*(1)再次代入Verhulst 模型进行预测,得到最终预测序列Y。
本文基于表1 中的统计数据,并以表2 中的灰色关联度分析结果为基础,对单一的Verhulst 模型、RBF 神经网络模型和本文提出的Verhulst-RBF 神经网络组合模型进行了测试。使用Matlab 2017a 版本建立模型,将2004—2014 年的数据作为训练数据,2015—2017 年的数据作为测试数据,对2015—2017年的铁路客运量进行预测,并对比预测结果。在进行RBF 神经网络模型预测时,还利用了Matlab 自带的mapminmax 函数,对数据进行归一化与反归一化,以防止出现过拟合现象,造成预测不准。
3 种模型的预测结果如表3 所示,单一Verhulst模型预测的平均误差为7.27%,RBF 神经网络模型预测的平均误差则为8.9%,而本文提出的组合模型预测的平均误差为6.93%。相对单一RBF 神经网络模型而言,精确度提高了1.97%,与单一Verhulst 模型比较,精确度提高了0.34%,且组合模型在兼顾了多种影响因子与客运量的关系的同时保留了RBF 神经网络容错性强的特点。
表3 实验结果对比
图2 和图3 分别表示RBF 神经网络模型和Verhulst-RBF 神经网络组合模型的迭代误差。从中可得出,相比于RBF 模型,组合模型的误差收敛速度也得到了提升。
图2 RBF神经网络迭代误差图
图3 Verhulst-RBF组合模型迭代误差图
综上所述,Verhulst-RBF 神经网络组合模型的预测精确度更高,且具有误差收敛速度快、容错性强等特点。针对四川省铁路客运量预测具有较好的应用效果。
本文针对传统预测方法在非线性、不确定、时变系统预测上的不足,以及单一预测模型精确度低、拟合能力弱等特点,提出了Verhulst-RBF 神经网络组合模型。该模型结合Verhulst 模型少样本情况下精度较高和RBF 神经网络非线性拟合能力强的特点,在影响因素相同的条件下,对3 种模型的预测效果进行对比,证明该组合模型有效地提高了预测精度。但本文所提出的Verhulst-RBF 组合模型在构建网络时,对网络参数的处理仅仅采用默认值进行测试,并没有对网络参数进行充分的调整分析,这将是接下来研究工作的重点。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!