列车自动运行迭代学习控制算法的研究

时间：2024-07-28

窦鹏飞，王化深

（北京交通大学轨道交通控制与安全国家重点实验室，北京100044）

采用先进的列车自动控制（ATC）技术，可以提高行车的密度、效率与安全性[1]，列车自动运行（ATO）系统是ATC系统中用于取代司机并对列车进行自动控制的智能子系统，其功能包括列车的自动启动、自动调速、自动停车和定点停车等。作为ATC的一个重要子系统，ATO是提高轨道交通列车运行效率、实现列车高密度运行的关键[2]。

ATO系统的核心技术是列车速度自动控制（ASC）算法，列车速度自动控制的主要功能是根据接收到的来自ATP的目标速度，对列车的牵引与制动实施控制。其控制目标是在有限时间区间上对给定计划速度曲线（由ATP系统计算得到的一次模式制动曲线）进行完全跟踪。ATO速度控制算法的性能对整个系统的效率、安全性、准时性、舒适性和节能具有重大的影响，是列车自动控制系统的关键技术之一[3]。

早期的ATO算法基于列车动力学模型的经验公式，通过比例、积分、微分（PID）控制技术实现列车速度调整。基于PID的ATO速度控制算法是目前为大部分城市轨道交通ATO系统所采用，并且具有成功应用经验的控制算法[4～5]。许多学者后来提出各种改进的PID算法（智能型PID算法），主要是通过与其他智能控制算法结合实现对PID控制器的参数的自整定。20世纪80年代，一些学者开始尝试将模糊控制应用到ATO中，其控制质量高于PID，并能实现多目标控制。但由于经验不完善导致控制规则不能细化，致使模糊控制不能适应控制过程中列车动力系统参数的不断变化。许多研究将专家系统运用到ATO中，但专家系统中专家知识仍然是移植自驾驶员的经验，因此专家系统与模糊控制一样无法克服因经验不完善而带来的控制质量的下降。

1 ATO控制器设计

1.1 迭代学习控制

在城市轨道交通实际运营中，列车在区间的运行是由运行图及运行计划决定的，因此是近似重复的。在重复的任务中，受控系统会表现出相似的行为，但上述PID控制算法及一些智能控制算法都未能充分利用系统在重复过程中的有用信息，不能在过去的操作中对系统知识进行学习。而迭代学习控制方法在提出之前，其创始人Arimoto就充分认识到这点，所有迭代学习控制在构造当前的控制行为时，可以学习并充分利用过去重复操作中的重要信息[6]。因而，迭代学习控制以完全跟踪为目标，对系统的先验知识要求较少，可用于具有强不确定性，复杂非线性的列车自动驾驶控制。

迭代学习控制的核心思想是：在具有重复性的系统中进行轨迹跟踪时，利用前几次操作得到的控制输入和误差信息修正本次跟踪的控制输入，使控制任务完成得更好[6～7]。

相对于PID控制，迭代学习控制器的设计需要较少的系统知识，本质上是一种无模型的控制方法，而且非常适用于像列车速度控制这种非线性控制系统。相对于其他智能控制方法如模糊控制、专家系统等，迭代学习控制通过重复操作，不断学习并积累“控制经验”，以保证随着迭代次数的增加控制效果会不断提高或保持稳定，而不需要总结人工经验然后向控制器移植。但是，迭代学习控制应用于ATO中，必须考虑安全性要求，如果控制稳定性差，精度不足，列车速度极有可能超出限速从而触发紧急制动停车。

在文献[9] 中，作者将迭代学习控制应用到列车自动驾驶中，从理论上证明了系统的收敛性，仿真结果也显示经过数次迭代后能够保证很高的控制精度。但其算法的设计不能保证迭代初期列车运行的安全性，即列车速度会超出限速，这将引发列车实施紧急制动。在本文控制方案的设计中，将引入一些改进措施来解决这一问题。

1.2 ATO迭代学习控制算法

列车的动力学模型可以表述为[10]

在实际中，牵引力与制动力不会同时作用于列车。在不同的工作状况下，列车的受力情况各不相同。不考虑紧急制动的情况，把列车的工况划分为加速、动力制动（调速制动）、惰行、常用制动。在这4种工况中，牵引力Ftr(t)与主动制动力Fb(t)只有一个在起作用。

在迭代学习控制中，列车动力学模型改写为：

在文献[1] 和文献[9] 中，取迭代学习控制律为uk(t)=uk-1(t)+gek-1(t)时，学习增益g只要满足|1－g|≤γ<1，系统即收敛。然而，其迭代学习控制方案设计不能避免迭代初期因控制不稳定导致列车超速触发紧急制动停车。

为避免迭代初期列车超速，我们提出一种新的控制方案。在迭代控制的初期，期望轨迹的设定远低于计划速度曲线，因此，即便列车速度会超出期望轨迹，这种冗余设计也能保证速度不会超过计划速度曲线。随着迭代次数的增加，设置期望轨迹接近并保持为计划速度曲线。因为控制精度逐渐提高，期望轨迹的设置既能保证列车速度不会超出计划速度曲线，又能保证经过一定的迭代后列车在该算法的控制下按照计划速度曲线运行，完成控制任务。

图1为整个迭代学习控制过程中期望轨迹的变化，前10次迭代中，期望轨迹逐渐向列车在区间运行的计划速度曲线逼近。并且在最后10次迭代中，期望轨迹一致为计划速度曲线。

为了实现变期望轨迹渐近跟踪，学习律中加入期望轨迹的变化信息，并改写为：

其中，esk(t)=sk(t)－sk-1(t)，为2次迭代之间期望轨迹的变化信息。通过在学习律中加入期望轨迹的变化信息，迭代学习控制能够响应期望轨迹的变化，并根据变化量的相关信息对列车进行额外的超前控制，更有效地控制列车，使其按新的期望轨迹运行。

图1 迭代过程中期望轨迹的变化

期望轨迹的设置可以保证esk(t)的值随迭代次数的增加而单调下降，并且由于期望轨迹最后与计划速度曲线保持一致而不再变化，即

esk(t)=0，k≥m，m为一常数。

因此，期望轨迹变化信息esk(t)的加入不会改变控制的收敛性。

2 仿真结果及分析

[10] ，在仿真中，设定运行中列车单位质量所受的基本阻力rv为：

假设区间长度Ls为6 km，设置列车单位质量所受的附加阻力ws=ws+wi+wr：

列车在区间中运行的计划速度曲线为：

与之对应的列车计划运行轨迹为：

仿真中，学习律中的学习增益取g=0.9，gs=1，带入式（3)，得uk(t)=uk-1(t)+0.9·ek-1(t)+esk(t)。图2显示了仿真结果。

图2 速度跟踪曲线

2.1 速度跟踪曲线

图2为仿真得到的速度跟踪曲线。由于在初次迭代中，设置的期望轨迹低于列车在区间的计划速度曲线，所以在迭代学习控制下，列车速度不会超出速度曲线，从而避免出现列车超出限速触发ATP实施紧急制动的情况。由于期望轨迹逐渐逼近计划速度曲线，故仿真中随着迭代次数的增加，列车的速度逐渐接近速度曲线，在第12次迭代中，列车的运行曲线与计划速度曲线重合而且没有超速。这一结果表明，变期望轨迹的设计可以有效地防止因控制初期的不稳定性导致列车超速触发紧急制动停车。学习律中引入期望轨迹变化信息可以使迭代学习控制对变化的期望轨迹进行有效跟踪，期望轨迹保持稳定后，迭代学习控制能快速地以高精度控制列车按期望轨迹运行。

2.2 位置跟踪曲线

图3 位置跟踪曲线

图3为位置跟踪曲线，显示了列车运行轨迹与计划运行轨迹的关系。在迭代初期，由于较低的期望轨迹设置，列车没有完成计划的整个行程。随着迭代次数的逐渐增加，计划速度曲线成为期望轨迹，列车运行也逐渐接近计划运行轨迹。在第12次迭代中，列车实际运行轨迹与计划运行轨迹重合，列车完成预订的行驶计划。

2.3 牵引力变化曲线与列车运行加速度曲线

图4 牵引力变化曲线与列车运行加速度曲线

迭代学习控制具有很高的平稳性，可以避免列车频繁的加速与减速切换，保证旅行的舒适度。从图4所示的列车牵引力变化曲线中可以看到，在列车运行过程中，牵引力没有出现较大或者频繁的波动，当目标速度逐渐增加或降低，列车需要进行加速或减速时，列车牵引力能够快速响应，对列车进行加速或制动。从图4中的列车运行过程中加速度变化曲线可以看到，在计划速度曲线中匀速运行区段，列车的加速度能够稳定地保持在零附近，即列车的牵引力全部用于克服列车运行基本阻力与线路附加阻力，而不会对列车产生额外的加速度或减速度。在计划速度曲线中列车速度变化阶段，加速度能够保持恒定，不会出现震荡。

2.4 速度跟踪误差与位置跟踪误差

图5中的列车平均速度误差曲线显示，随着迭代次数的增加，列车的速度误差逐渐减小，经过一定的迭代之后，列车的速度误差可以保持在零附近的水平。平均误差结果显示，该迭代学习算法的控制效果随着迭代次数的增加而迅速提高，基于该算法的ATO在经过几次学习之后能够保证列车运行的高精度与平稳性。

图5 速度跟踪误差与位置跟踪误差

图5中的列车位置误差显示，在迭代初期，位置追踪误差处于较高水平，这是因为列车速度控制中期望轨迹的设置致使列车不能在有限的时间范围内跑完一个区间全程。随着迭代次数的增加，位置误差迅速下降，从第11次迭代开始，由于计划速度曲线成为期望轨迹，基于迭代学习算法的ATO能够控制列车跑完区间全程，位置追踪误差降低到0附近，并维持在这一较低水平。该结果显示，迭代初期较低的期望轨迹设置造成列车无法在计划的时间内完成整个旅程。因此，合理的期望轨迹设计会缩短需要的迭代学习次数，同时又不会对列车的安全运行造成负面影响。

3 结束语

迭代学习控制是一种无模型控制方法，经过足够次数的迭代学习后可以保证较高的控制精度，因此非常适用于像列车速度控制这类控制目标重复的复杂非线性系统。在本文中，我们提出了基于迭代学习的ATO控制算法来控制列车按照计划速度曲线行车。为了避免迭代初期的控制误差导致列车速度超出计划速度曲线触发ATP紧急制动停车，在迭代学习控制的初期，设置低于计划速度曲线的期望轨迹，随着迭代次数的增加，期望轨迹快速接近并保持为计划速度曲线。在学习律中加入期望轨迹的变化信息，以实现迭代学习控制算法对变化期望轨迹的跟踪。由于在一定迭代次数后期望轨迹将保持计划速度曲线不变，故学习律中期望轨迹变化信息的加入不会改变系统在迭代方向上的收敛性。

仿真结果表明，在迭代学习的初期，列车运行速度不会超出计划速度曲线，从而可以有效避免紧急制动停车的发生。随着迭代次数的增加，列车的运行速度曲线逐渐接近并最终与计划速度曲线重合，列车的运行轨迹也与计划运行轨迹一致。仿真得到的速度追踪误差和位置追踪误差也显示：随着迭代次数的增加，列车的速度误差与位置误差快速接近并保持在零水平。因此，本文提出的迭代学习算法在列车自动运行控制中具有良好的控制能力，可以保证列车运行的高精度、高平稳性与高安全性。

参考文献：

[1] 唐涛，黄良骥. 列车自动驾驶系统控制算法综述[J] . 铁道学报，2003，25（2）： 98-102.

[2] 黄良骥，唐涛.地铁列车自动运行系统的分析与设计[J] .城市轨道交通研究，2003，6（2）：51-55.

[3] 陈荣武，刘莉，诸昌钤. 基于CBTC的列车自动驾驶算法[J] . 计算机应用，2007，27 （11）：2649-2651.

[4] 刘贺文，赵海东，贾利民. 列车运行自动控制(ATO)算法的研究[J] . 中国铁道科学，2000，21（4）：38-43.

[5] 刘海东，毛宝华，丁勇，和天健.列车自动驾驶仿真系统算法及其实施研究[J] .系统仿真学报，2005，17（3）：577-580.

[6] 许建新，侯忠生.学习控制的现状与展望[J] .自动化学报，2005，31（6）： 943-955.

[7] 李仁俊，韩正之. 迭代学习控制综述[J] . 控制与决策，2005，20（9）：961-966.

[8] 池荣虎，侯忠生，于镭，隋树林. 高阶无模型自适应迭代学习控制[J] . 控制与决策，2008，23（7）：795-798.

[9] Yi Wang, Zhongsheng Hou, Xingyi Li, A Novel Automatic Train Operation Algorithm Based on Iterative Learning Control Theory[C] . IEEE International Conference on Service Operations and Logistics, and Informatics, Beijing, 2008: 1766-1770.

[10] 中华人民共和国铁道部.列车牵引计算规程[Z] . 北京：中国铁道出版社，1999.