时间:2024-07-28
高博文,许 伟,王建英
(1.中国铁道科学研究院 铁道技术研修学院,北京 100081;2.中国铁道科学研究院 通信信号研究所,北京 100081)
铁路列车调度指挥应急系统的研究
高博文1,许 伟2,王建英2
(1.中国铁道科学研究院 铁道技术研修学院,北京 100081;2.中国铁道科学研究院 通信信号研究所,北京 100081)
在现有铁路列车调度指挥系统的基础上,采用硬件备份、数据实时同步和调度终端单机本地工作的方式构建铁路列车调度指挥应急系统。当核心设备故障(网络、数据库宕机)或离线维护时,故障修复时自动恢复正常联网工作模式,数据自动回传服务器;同时,为保证数据的完整性,建立应急灾备数据库,故障情况下可以随时接替生产库提供数据服务。在核心设备故障情况下,提供基本的列车调度指挥功能,保持列车调度指挥业务的连续性,提高了行车指挥效率和运输安全。
列车调度指挥系统;应急系统;数据同步;实时备份
随着铁路系统深化改革、全面推进铁路信息化建设的要求,作为运输生产组织中的铁路列车调度指挥系统的信息越来越丰富,应用也越来越复杂,现已成为铁路运输业务运转的基础和核心。
系统硬件故障、软件故障、人为误操作和突发性灾难等因素都可能会导致数据丢失、业务中断,行车指挥只能回到最原始的传统手工作业方式严重的影响行车指挥效率,甚至危及行车安全,因此选择和利用各种高可用技术构造一套完整的、多层次、实用的、高可用性的应急指挥系统具有重要的意义。
通过对铁路局列车调度指挥系统(TDCS,Train operation Dispatching Command System)中心设备部署、核心业务流程和故障统计分析,TDCS系统故障主要有硬件故障、软件故障和人为因素3个方面。硬件方面主要有网络故障、服务器故障、存储设备故障等;软件方面主要有操作系统故障、数据库故障和应用程序故障等;人为因素主要是由于维护不完善或使用人员操作失误导致的故障。
根据设备的功能和对业务的影响进行分析,导致系统瘫痪主要有2类:(1)数据库故障,不能进行实时数据的存取业务;(2)网络中断,依赖数据库和网络的客户端不能正常的工作。TDCS作为24 h不间断运行的系统,不允许行车指挥业务长时间的中断,应急指挥系统必须具有保护业务关键数据和维持业务运行的高可用性的能力,主要表现形式为保证行车指挥数据的安全完整和行车指挥业务不间断。
有鉴于此,铁路列车调度指挥应急系统在功能和性能上必须满足如下基本要求:
(1)应急系统应能够提高主用系统的可靠性和可用性,保证核心业务的连续性;(2)采用的应急或备用系统不影响既有TDCS系统;(3)应急系统与既有系统保持兼容性;(4)系统之间切换简便;(5)故障恢复保证数据完整。
1.1 系统结构
铁路列车调度指挥应急系统采用设置备用数据库服务器、关键设备N+1备份以及建设应急备用中心等技术来降低因设备严重故障导致的行车指挥中断,为生产系统的抢修争取时间,并可把对正常生产运营的影响减至最低,如图1所示。
图1 TDCS应急系统结构示意图
正常情况下,采取数据库同步方式实现主用数据库和备用数据库之间数据的实时动态同步,以主用数据库支撑生产业务。当检测到主用数据库故障时,由应用服务器自动切换至备用数据库,实现调度指挥业务的连续性。备用数据库完全独立于主用数据库,不共用任何设备,数据存储满足最近3个月调度业务运行数据存储要求。
扩展列车调度台功能,实现列车调整计划、调度命令等重要数据本地存储的同时存储模式,当数据库服务器短时间故障时,当前工作数据不丢失;同时支持离线工作模式,当服务器或者网络中断时,能够利用本地数据维持基本工作状态。
TDCS根据需要设置应急备用中心系统,当主中心机房全面故障时,启用备用系统接管,维持调度指挥基本功能运行。应急备用中心系统的逻辑结构与主用系统基本一致,主要由、应急调度终端、数据库服务器以及应用、通信、接口服务器等设备构成,并保持与车站基层网稳定可靠连接,实现应急接管条件下的基本调度指挥功能。
1.2 系统功能
列车调度指挥系统应急系统主要分为硬件设备N+1备份,设置应急数据库服务器,调度台支持离线工作模式和全系统设置应急备用中,本文只考虑设置应急数据库器和调度台支持离线工作模式两种方式下的应急系统功能,另外两种主要通过硬件和商用软件实现,此处不再赘述。
应急系统软件架构如图2所示。
采用合理的生产数据库的灾备或应急方案,建立实时或准实时灾备数据库,不仅在生产数据库出现故障时可最大程度的保证关键数据的安全性,将可能出现的数据损失降到最低;根据应急处理方案,若生产库故障恢复时间过长,可以将业务切换到灾备数据库,尽快恢复业务的连续性,将影响降到最低。
核心业务终端能够快速、有效的诊断网络或服务器故障,能够将本终端切为单机模式。工作在单机模式可以继续为行车调度员提供业务服务,本地数据存储采用与硬件、平台、系统无关的XML描述语言,提高可用性和兼容性;故障修复后,系统启动分散存储的数据“归一”管理模块,将本地数据适时同步到数据库中,保证离线终端和网络终端数据的一致性,实现数据网络共享。
2.1 应急数据库技术
图2 应急系统软件架构示意图
建立应急数据库,当生产数据库宕机时,业务系统可以直接切换至应急数据库保证系统能够持续的运行,同时保证数据的不丢失和连续性。
应急数据库主要作为铁路局TDCS中心生产数据库的备份和应急使用,应急数据库系统和生产库采用同样的库和表结构。正常情况下,应急数据库只是备份生产库数据;生产库故障接替生产库提供数据存取服务,保证数据的完整性;生产库故障修复,进行应急库和生产库数据的同步和各种应用业务的回切工作。流程如图3所示。
综合应急数据库、生产库性能以及数据间断对运输组织的影响,应急数据库与生产数据库每5 min进行一次全部数据同步,每3 min可以进行一次增量数据备份同步即可满足要求。
2.2 应急调度指挥业务终端
优化目前整体架构,采用面向服务架构(SOA)技术构建铁路列车调度指挥应急系统,开发调度员运行图终端、调度命令终端等核心业务满足智能存取数据的客户端程序。当TDCS/CTC系统核心设备故障(核心网络、数据库宕机)或离线维护时,故障检测服务将核心业务终端自动启用应急模式(单机模式),即行调运行图终端、调度命令终端能够快速、有效的诊断网络或服务器故障,将本终端切为单机模式,列车运行数据进行本地存储,继续为行车调度员提供业务服务。当网络或服务器故障修复后,故障检测服务将启动恢复联网模式(正常指挥模式),同时将分散存储的数据与数据库服务器进行同步,业务数据进行网络共享。采用如下策略开发设计业务终端,保证业务连续性。
(1)列车调度台终端,根据网络和生产库的状态,其工作模式可以分为联网工作模式和单机工作模式。
(2)联网工作模式,数据全部存取来自生产数据库,单机工作模式,数据存取来自客户端机器。
(3)列车调度台运行图终端本地存储一份列车运行图的静态数据,在单机工作模式下将动态数据以XML格式存储于该终端设备,主要信息包括本班内实绩运行图、阶段计划、封锁、慢行、天窗、调度命令等信息。
(4)列车调度台终端软件可以自动检测生产库的工作状态。
2.3 数据准实时同步技术
开发数据准实时同步服务,通过访问生产库和应急数据库,不断将生产库的新增数据备份至应急数据库,实现数据库对用户和表的备份。在该服务启动之初可以一次性将用户的所有数据的同步到应急数据库,平时工作的过程中将从生产库中读取动态数据向应急数据库进行更新,实现数据的增量备份,既提高了效率,又极大地降低对生产库的影响。
图3 TDCS中心应急数据库工作模式
该服务可以满足2 min时间间隔的数据同步要求,支持全部数据备份和增量备份两种策略,支持插入、更新和删除等操作,支持多种数据类型。
TDCS/CTC系统是7*24 h不间断运行,行车数据会实时发生变化,对应生产库中的数据也应同步实时更新。一旦生产库崩溃,应急备份库必定不是最新数据,备份功能主要解决生产库崩溃后,尽可能不影响TDCS/CTC的正常运转。因此,按以下原则设计备份转储策略:
(1)无法实现“完全最优”备份,只能实现“次优”备份,即备份库的数据与生产库的数据差别不大,备份库数据与生产库数据之间测时延不宜大于10 min。
(2)采用定时增量备份策略有效解决数据量过大的问题,备份间隔设计为2 min~30 min。
(3)针对TDCS/CTC的某些核心动态表的数据更新,开发同步软件,定时自动地将生产库的数据同步至应急库中。同步软件设计为定时工作模式,首先连接至应急库,利用该库的远程“数据库链接”,访问到生产库,抓取生产库的数据,然后将该数据更新至应急库中,如图4所示。
图4 同步软件连接方式
2.4 分布式数据存储技术
分布式存储技术主要是指列车运行图终端在数据库故障的情况下,本地化的数据存储以及存储数据的组织结构。列车运行图的数据主要分为静态数据和动态数据,静态数据主要存储在本地文本文件,动态数据由于其本身不停的变化,需要交换、更新,所以存储为XML格式类型的文件。静态数据主要包括运行图底图、车站的《站细》、股道名称、站间距离、区间运行时分、供电臂、图定线等信息;动态数据主要包括运行线数据、图表注释、封锁、慢行和天窗等信息。
分布式数据存储技术的实现流程如下所述:
(1)运行图终端程序正常工作时,通过远程数据库实现数据的访问。
(2)当检测到与远程数据库连接中断时,则将当前内存中所有动态数据写入本地数据库。配置文件中更新动态数据存储地点标志为1。
(3)与远程数据库连接恢复时,若程序没有退出或接班,则将内存中的动态数据全部同步至远程数据库中,成功后删除本地数据库已同步文件。配置文件中更新动态数据存储地点标志为0。本地数据库中未自动清除的文件是远程数据库中未更新的历史数据,待远程数据库服务恢复后人工同步至远程数据库中并及时将本地数据库清空。
(4)运行图终端程序重新启动或者交接班情况下,如果与远程数据库连接中断,则所有数据从本地数据库中获取;如果与远程数据库连接正常,则需要根据配置文件中标志位来选择动态数据获取地点。如果标志位为0,所有数据从远程数据库中获取;相反,如果标志位为1,所有数据从本地数据库中获取。
(5)运行图终端程序退出情况下,若当前处于本地数据库存储方式下,则将当前内存中所有动态数据写入本地数据库,配置文件中更新动态数据存储地点标志为1;若当前处于远程数据库存储方式下,配置文件中更新动态数据存储地点标志为0。
以既有TDCS/CTC为基础,采用面向服务架构技术构建铁路列车调度指挥应急系统,当核心设备故障(网络、数据库宕机)或离线维护时,故障检测服务将核心业务终端自动启用应急模式(单机工作),故障修复时自动恢复正常联网工作模式,数据自动回传服务器;
为保证数据的完整性,建立应急灾备数据库,在发生故障情况下,随时接替生产库提供数据服务。该系统在核心设备故障情况下,仍然保持列车调度指挥业务的连续性,提高了行车指挥效率和运输安全。
应急数据库技术和运行图实时查询技术已经在成都局和郑州局得到了应用,系统的功能和性能都得到了现场实践的有效验证,能够满足现场列车调度指挥业务的实际需要,为进一步的深入推广奠定了良好的基础。
[1] 中国铁路总公司.TJ/DW 151-2013 列车调度指挥系统(TDCS)3.0技术条件[R].北京:中国铁路总公司, 2013. [2] 中华人民共和国铁道部.TB/T2499-2008列车调度指挥系统(TDCS)数据通信规程[R].北京:中华人民共和国铁道部,2008.
[3] 中华人民共和国铁道部科学技术司.科技运函[2004]15号分散自律调度集中系统(CTC)技术条件(暂行修订稿)[R]. 北京:中华人民共和国铁道部科学技术司,2004.
[4] 中国铁道科学研究院.中国铁道科学研究院研究报告2012 Y064铁路列车调度指挥应急系统的研究[R]. 北京:中国铁道科学研究院,2012.
责任编辑 徐侃春
Emergency strategy for Railway Train Dispatching Control System
GAO Bowen1, XU Wei2, WANG Jianying2
( 1.Railway Technology Research College, China Academy of Railway Sciences, Beijing 100081, China; 2.Signal and Communication Research Institute, China Academy of Railway Sciences, Beijing 100081, China )
On the basis of railway Train Dispatching Control System (TDCS), using hardware backup realtime data synchronization and scheduling terminal single way to build Train Dispatching Emergency System with local work. When the core equipment failure (network, database downtime) or off l ine for maintenance, fault detection service would automatically enable the emergency core business terminal mode (single job), automatically resume normal operation mode when troubleshooting networking, the data back to the server automatically. Meanwhile, to ensure data integrity, the emergency disaster database was established to take over the production of the next library under fault conditions, and provide data services. In the case of core equipment failure, basic train dispatching functions were provided to keep the train dispatching business continuity, improve the eff i ciency of traff i c control and transportation safety.
TDCS; emergency strstem; data synchronization; real-time backup
U284.59∶TP39
A
1005-8451(2014)08-0029-05
2014-02-14
高博文 ,在读硕士研究生;许 伟,副研究员。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!