当前位置:首页 期刊杂志

基于改进PSO-LSTM模型的城市轨道交通站点客流预测

时间:2024-05-04

张国赟 金 辉

(辽宁工业大学汽车与交通工程学院 辽宁 锦州 121001)

0 引 言

近年来中国经济水平迅速提升,交通行业中乘客出行对交通工具的需求量大幅度增加,中国城市轨道交通的水平也步入快速发展的新篇章。出于缓和城市交通拥堵问题的考虑,给城市居民带来更快速、更优质的出行服务,越来越多的城市选择具有客运量大的公共交通系统来解决这一问题。而城市轨道交通很快成为城市公共交通系统中交通工具的第一选择,不但因为其客运量大,更是因为其具有快捷迅速等突出特点。因此,做到对城市轨道交通站点的短时客流量的准确预测是非常有必要的。

对城市轨道交通站点的短时客流预测的模型现如今主要分成以下几类,第一类有基于时间序列的预测模型[1]、基于回归分析的预测模型[2]等,统称为线性预测模型,这类模型容易理解,有利于决策分析,但难以很好地表达高度复杂的数据;第二类有小波理论预测模型[3]等,统称为非线性预测模型;第三类有元胞自动机模型[4]等,统称为基于模拟交通的预测模型;第四类有基于模糊神经网络的预测模型[5]、基于BP神经网络的预测模型[6]等,统称为基于各种神经网络的预测模型;第五类有由两种预测模型组合而成等,统称为组合预测模型。Chiang等[7]使用回归分析(具有自回归误差校正)、神经网络和ARIMA模型对客流影响因素进行分析,随后进行客流预测,发现这些预测方法的简单组合比单独的模型会产生更高的预测精度,但是存在建模难度较大的问题。Gutiérrez等[8]采用地理信息系统(GIS)、距离衰减函数和多元回归模型相结合的方法建立了系统乘客预测模型,经过分析表明,预测中使用距离衰减函数对变量进行加权,系统地提供了较好的结果,但数据受限较大,分析具有局限性。邹巍等[9]建立了运用遗传算法优化小波理论的轨道交通客流预测模型,这个模型的优势在于能够避免客流预测陷入部分最小值情况的发生。李科君等[10]构建了非线性自回归神经网络模型对地铁进站客流进行短时预测。

通常短时客流量预测会随时间的变化从而发生改变,长短时记忆网络模型[11](Long Short Time Memory Network,LSTM)会在原有基础上增添时间属性,能对模型进行深度的训练和特点提取。Kumar等[12]应用人工神经网络(ANN)对过去的交通数据进行交通流量的短期预测;Polson等[13]设计了一个深度学习模型来预测交通流,建立了一种序列拟合的线性模型体系结构;李梅等[14]通过建立深度学习LSTM网络模型,并用模型来对地铁站客流量进行短时客流预测;李若怡[15]通过优化LSTM网络的神经元以及隐藏层的方法,构造得到了改良后的LSTM模型,但输入层仅为OD客流数据,具有局限性;张伟林[16]通过分析客流量的特点,构建利用优化神经网络的深度学习预测模型。

本文利用成都轨道交通一号线火车北站2020年1月4日至1月13日的进站客流量真实数据,综合考虑能够影响城市轨道交通站点客流量的内外部因素,设计一种基于改进PSO-LSTM模型的城市轨道交通站点短时客流预测方法,并通过模型的运行求解以及与其他模型的结果比较,验证改进后的PSO-LSTM模型在客流预测中具有较高的精度,能够取得更好的预测效果。

1 AFC数据与处理

1.1 AFC系统

自动收费系统(Automatic Fare Collection System,AFC)中保存有乘客刷卡进出车站的数据,通常作为基本数据对城市轨道交通站点进站客流进行实时预测。AFC系统具备自动售票、检票、收费等功能,是一种电脑统一控制并且封闭的全自动化网络系统。近年来,我国对城市轨道交通车站的AFC系统不但进行了大量的研究,并且提出了多重形式并行的新模式。随着电脑技术的稳步发展,中国城市轨道交通AFC系统也逐渐走向成熟,并且完成了很多大城市的AFC系统与居民城市刷卡通行的同步,甚至还实现了城市内或者城市与城市之间的刷卡通行同步。

1.2 AFC数据

成都轨道交通1号线上的火车北站是一个换乘车站,它串联着成都轨道交通1号线与成都轨道交通7号线,客流相对比较密集,方便研究。因此采集成都地铁1号线火车北站2020年1月4日至1月13日进站客流数据,由原始数据分析可得,火车北站有进站客流的时间段为5:00到00:55,以5分钟为时间间隔,一天共包含240个时间段,每条数据包含起始时间、输入流、输出流、结束时间等信息。

2 基于LSTM模型的城市轨道交通站点短时客流预测

长短时记忆网络是一种目前常用的使用特殊方式把循环神经网络改良的神经网络,具备处理长时间储存信息的功能。一般的循环神经网络(Recurrent Neural Network,RNN)存在一个弊端就是不能够处理信息的过度依赖问题。为了弥补循环神经网络的这个弊端,设计了长短时记忆网络模型。LSTM的优势在于它对信息的长期过度依赖具备良好的自然处理能力。LSTM模型的主要设计结构有两个:存储元组和非线性门单元。存储元组的作用是维护保持模型的正常系统模式,非线性门单元起到调整各个不同节点输入和输出存储元组的信息的作用。LSTM与RNN一样,模型中的每个递归神经网络都可以无限向下分化,成为无数个反复的基本神经单元。在一般的RNN结构中,分化出的反复基本神经单元网络层结构非常简易,通常每个神经单元网络层只由一个基本的tanh模块组成,如图1所示;而在LSTM神经网络层中,组成结构相对来说较为复杂,通常有互相联系作用的四个模块组成,如图2所示。LSTM的总体网络结构如图3所示。

图1 RNN神经网络层

图2 LSTM神经网络层

图3 LSTM网络结构

在LSTM神经网络中,每个神经元里面都加入了三个基本单元门,分别是忘记门ft、输入门i和输出门Ot。忘记门的作用是帮助确定我们需要忘记的所有信息,并且帮助辨别前一时刻的隐含层状态ht-1,然后帮助读取当前时刻的输入Xt,读取完成后输出结果,最后再为Ct-1赋值,这个结果的输出数值保持在0~1之间,两个端点分别表示信息的全数抛弃和信息的全数保留,具体算法如下:

ft=σ(Wf·[ht-1,Xt]+bf)

(1)

式中:ft为忘记门的输出值;σ为Sigmoid函数;Wf为忘记门的权重矩阵;bf为忘记门的偏置项。

输入门的作用是指定新的信息保存到Cell中。输入门由两部分构成,一部分是根据Sigmoid层函数来计算输入值,另一部分是添加新的候选值向量。新的候选值向量遵循tanh层的规则重新计算得来,具体计算方法如下:

it=σ(Wt·[ht-1,Xt]+bi)

(2)

对Cell的新贡献见式(3)。

(3)

(4)

输出门主要基于Cell当前时刻的状态经由滤波器进行过滤后输出。先利用Sigmoid函数计算出Cell状态中将要输出的值,然后利用tanh函数计算Cell状态中将要输出的值,最后把两个计算结果相乘,得到最终要输出的值。具体计算方法为:

Ot=σ(Wo·[ht-1,Xt]+bo)

(5)

ht=Ot·tanh(Ct)

(6)

式中:W为权重值;b为偏置项;tanh为双曲正切激活函数。

3 基于改进PSO-LSTM模型的短时客流预测

3.1 粒子群算法

粒子群优化算法(Particle Swarm Optimization,PSO)是一种能够相互推动并且能够在不同状态下随机产生的优化算法,即使要被优化的函数存在不连续、不可导等特点,也可以凭借较快的速度优化收敛。粒子群优化算法的根本概念是研究鸟类的取食行为的结果,所以这个算法中任何一个问题的结果都可以比作搜索空间中的一只鸟,也就是我们所说的粒子。解空间的所有替代解由所有粒子确定,所有粒子的匹配度值由优化函数确定,并且凭借任意速度在全解空间中随意活动,通过与其他粒子之间建立一种特定形式的信息交换来获得发现信息,从而能够引导整个组的运动。

3.2 粒子群算法的改进

首先将粒子群初始化为任意粒子组,然后经过迭代计算得到最佳解。粒子每次重复运动时都会更新速度向量和位置向量。用追踪粒子通过的位置和粒子群通过的位置的方法,可以获得这两个结果的最佳值。具体方法见式(7)和式(8)。

vi=vi+c1×(pbesti-xi)+c2×(gbesti-xi)

(7)

xi=xi+vi

(8)

式中:i=1,2,…,N,N是此群中粒子的总数;vi为粒子的速度;xi为粒子的当前位置;c1和c2为学习因子;pbesti为粒子本身经历过的最优位置;gbesti为粒子群经历过的最优位置。

为了获得更好的寻优结果,引入惯性因子ω,方便对粒子群算法的全体搜索能力和部分搜索能力进行调节,使其能够在PSO搜索过程中依据粒子群算法功能中的一个搜索函数发生改变。当惯性因子值较大时,粒子群算法的全体搜索结果较好,部分搜索结果较差;反之,则粒子群算法的全体搜索结果较差,部分搜索结果较好。具体方法见式(9)和式(10)。

vi=ω×vi+c1×(pbesti-xi)+c2×(gbesti-xi)

(9)

(10)

式中:ωstart表示开始时的惯性因子权值;ωend表示结束时的惯性因子权值;t1表示当前时刻的迭代次数;t表示迭代完成的最大迭代次数。

3.3 算法求解流程与步骤

图4为改进PSO的求解流程。

图4 改进PSO求解流程

具体操作步骤如下:

步骤1初始化粒子群并设定好相关参数,种群大小设置为N,随机位置为x,速度为v。

步骤2确定各个粒子的适应度值。

步骤3确定粒子通过的最佳位置和粒子群通过的最佳位置。

步骤4确定是否满足粒子群算法的收敛条件,如果满足条件,那么输出最后的寻优结果;如果不满足条件,那么继续下面的步骤。

步骤5依据粒子通过的最优位置和粒子群通过的最优位置来更新速度向量。

步骤6依据更新的速度向量来更新粒子的位置向量。

步骤7更新全体最优粒子和部分最优粒子。

步骤8返回步骤4,直至满足收敛准则,输出最优结果和迭代次数。

4 实例研究

4.1 LSTM模型的预测结果

本文使用MATLAB软件对LSTM预测模型进行编程设计。首先设定训练集函数与测试集函数,设定训练集数量为75%,测试集数量为25%;其次设定神经网络变量;最后建立LSTM城轨交通站点短时客流量预测模型。通过运行模型,最优隐藏节点数为101,最优学习速率为0.001,最优迭代次数为30时,LSTM预测模型得到的预测结果最优。运行得到的进站量预测结果如图5所示。

图5 LSTM进站量预测结果

4.2 改进PSO-LSTM模型的预测结果

从图5结果可以看出,虽然利用LSTM预测模型得到了结果,但是精度并不太高,因此本文设计了改进PSO来优化LSTM预测模型,希望能得到预测精度较高的结果。本文构建改进PSO-LSTM模型来实现城市轨道交通站点短时客流预测,经过反复实验,最优隐藏节点数为101,最优学习速率为0.001,最优迭代次数为30时,预测精度最高,预测结果如图6所示。与没有经过优化的LSTM模型作对比,对比结果如图7所示。

图6 改进PSO-LSTM进站量预测结果

图7 改进PSO-LSTM进站量预测结果对比

4.3 基于GA-LSTM模型的短时客流预测对比分析

遗传算法(Genetic Algorithm,GA)拥有天然选择能力和种群传播制度,有着较强的全体寻优本领,是一种常用的传统搜索算法。天然选择和种群传播过程中通常伴随着交配、繁衍、变异现象的发生,遗传算法极佳地模仿了这种现象。基本的遗传算法包含选择操作、交叉操作、变异操作三种常规操作。

本文通过设计GA-LSTM预测模型对城市轨道交通站点进行短时客流预测,为保证其结果能与上述结果进行公平合理的对比,预测时选用与上述模型预测时相同的数据,模型得出预测结果如图8所示。与没有经过优化的LSTM模型作对比,结果如图9所示,并与LSTM模型预测结果、改进PSO-LSTM预测结果进行比较,结果如图10所示。

图8 GA-LSTM进站量预测结果

图9 GA-LSTM进站量预测结果对比

4.4 模型误差分析

为了更好地比较LSTM模型、改进PSO-LSTM模型、GA-LSTM模型的预测效果,本文运用均方根误差(RMSE)以及平均绝对误差(MAE)两个常用的误差评价方法进行比较分析,其计算公式如下:

(11)

(12)

均方根误差计算的是客流预测值与客流实际值的平方误差与总数量N的比值的平方根,一般用来解释预测中的离散程度;平均绝对误差计算的是客流预测值与客流实际值的偏差,一般用于预测值与真值的比较。分别计算上述三种预测模型的结果误差分析如表1所示。

表1 预测结果误差分析

计算的RMSE以及MAE两种评价指标数值越小,证明相对应的模型的预测性能越好。可以看出,改进PSO-LSTM预测模型的两种指标数值较小,所以预测性能较好,预测精度也比其他两种模型更高。

5 结 语

针对城市轨道交通站点短时客流预测问题,本文搭建了LSTM预测模型,并且提出改进方法——改进粒子群优化算法(PSO)与LSTM模型的结合。通过实例研究,与优化前的LSTM模型以及GA-LSTM模型预测结果进行比较,得到以下结论:改进PSO-LSTM预测模型预测精度提高较大,可以提供更加准确的预测结果。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!