时间:2024-07-28
赵正阳,吴艳华,程智博,王云龙
(1. 中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081;2. 北京轨道交通运营管理有限公司,北京 102600)
高速铁路新线运营里程已经超过2.2 万km,占全球高速铁路运营里程的50%以上。轨道质量指数(TQI,Track Quality Index)是评价高铁线路质量状态的关键指标,TQI 数据目前主要由高铁综合检测车检测得到,包括左高低、右高低、左轨向、右轨向、水平、轨距、三角坑7 项指标,通过专业软件进行位置偏差校准后,形成以每200 m 为一个单位区段的评估数据。通过充分挖掘TQI 数据中的各类特征信息,能够较为准确且合理地预测TQI 变化趋势。目前,国内外已有大量专家学者对TQI 开展了趋势变化分析及预测研究。早期学者基于综合因子法[1]、灰色系统[2-6]、概率分布思想[7-8]对TQI 预测进行研究;近年来,Falamarzi[9]、Hakan Guler[10]、彭丽宇[11]等人通过建立人工神经网络模型对轨道不平顺或轨道几何退化进行预测,这些模型相比于传统预测方法具有更高的准确度。
目前基于神经网络的TQI 预测模型已取得较佳效果,但各专家学者研究的方法及数据仍存在时间短、范围小、数据特征单一等弊端。这些算法在铁路TQI 预测场景中,无法满足高铁线路车辆密度大、影响因素繁多、运行状态复杂、地质与周边环境多样的实际情况,对于TQI 的预测研究还存在较多不足。
本文基于高速铁路工务设备大数据应用平台[12],利用TQI 检测数据,结合时间、空间等维度的变化特征,构建用来预测TQI 的3D 卷积神经网络模型。同时,为了验证模型的准确性与有效性,将3D 卷积神经网络模型与BP 神经网络、卷积神经网络进行了对比试验。试验结果表明,结合了时间、空间等多种特征的3D 卷积神经网络对TQI 的预测精度较高,为高铁轨道质量评估和预测提供新的思路。
3D 卷积神经网络构建的TQI 预测模型整体流程主要包括数据选取、数据集构建、训练模型、模型评估4 部分,如图1 所示。
图1 TQI 预测模型流程
其中,m 为当前检测数据的月份;k 为当前检测数据的里程。
用于模型训练的TQI 数据分别以检测项、时间、空间3 个不同维度,对数据进行整合处理。
(1)检测项:在3D 卷积神经网络中不仅利用7 项检测指标的标准差之和,且将每项检测指标都作为模型的特征参数,利用原始特征提高模型的预测能力。
(2)时间:时间维度通常反应某区段的轨道状态的连续变化情况。通过对时间维度的提取,可以更好的挖掘设备在不同月份、不同维修周期、不同运营状态下的变化情况,提高模型预测的准确度。以某高铁线上行K100 处2018 年数据为例,7 项检测项与TQI 变化情况如图2 所示。
图2 K100 区段2018 年7 项检测指标变化
(3)空间:由于单个区间的数据变化难以反应整体情况,故本文引入空间特征。通过邻近的多区段检测数据,挖掘预测区段受周边环境、地质变化等特征的影响。某线路上行5 个相邻区段TQI 变化情况如图3 所示。
通过多维特征的整合,将某高铁线的K100 ~K100.8 区段5 个月份7 项检测指标数据形成的特征矩阵可视化至三维散点图中,如图4 所示。
图3 2018 年1 月K100~K100.8 区段7 项检测指标变化
图4 三维数据集模型散点
其中,x轴为检测项;y轴为检测时间;z轴为检测区段;散点大小代表对应监测项的检测值大小。
本文用于构建TQI 预测模型的3D 卷积神经网络共8 层,包括1 层输入层、2 层3D 卷积层、2 层3D池化层、1 层2D 卷积层、1 层2D 池化层、1 层全连接层。具体网络模型结构如表1 所示。
表1 3D 卷积神经网络结构
神经网络内部卷积及池化层模型如图5 所示。图中最上方为卷积或池化层数,下方为输入到下一层卷积的数据集矩阵特征形状。
图5 3D 卷积神经网络内部结构
为更好地进行TQI 预测,除使用L1 正则化防止过拟合之外,本文在模型参数初始化、学习速率、激活函数、损失函数、Dropout 方法等方面,对传统的3D 卷积神经网络进行了优化。
若仅将训练模型全部初始化为0,则可能导致在反向传播时,参数无法减小,依然全部为0,从而导致大量节点失效。为更好地预测TQI,本文采用了Xavier 方法[13],其初始化公式如下:
其中,nin、nout分别为输入层和输出层神经元个数;初始化参数矩阵w中每个神经元的分布范围应该处于U之间,并随机产生,从而消除梯度弥散或梯度爆炸问题。
为在获得较快训练速率的同时,也可获得最优解,神经网络采用了公式(2)对学习速率进行设置。
其中, δ 、 α、 β为训练参数;epoch 为训练迭代次数;MAE 为平均绝对误差。当误差增加时,学习速率增大,当误差减小时,学习速率降低。通过对δ、α 、 β的调整,可获得对神经网络的最佳自适应学习速率。
每个卷积层的激活函数都用Mish 函数代替常用的ReLU 函数,Mish 计算公式如下:
Mish 函数曲线如图6 所示。
相比于ReLU 函数,Mish 函数具有两个特性:(1)可避免因封顶而饱和或过硬的0 边界;(2)较好的平滑性保证了特征信息更好的传递。
图6 Mish 函数曲线
本文选用Huber 损失函数,其结合了均方误差(MSE)和MAE 的最佳特性。对于较小的误差采用线性损失,对于较大误差则采用二次损失,其函数如下:
其中,y为真实结果;为模型预测结果;δ为超参数,且将在模型训练过程中自动优化。
为在防止训练过拟合的同时加快训练速度,本文在神经网络训练过程中在全连接层采用Dropout 方法,每次随机选取95%的神经元参与预测以防止过拟合。Dropout 在训练过程中的公式如(5)~(7)所示:
其中,Bernoulli 函数为概率随机函数,将以p的概率对全连接层所有神经元进行随机生成0 或1,若当次训练神经元被随机为0,则该神经元停止工作;r(l)为第l层激活神经概率矩阵;y(l)为第l层神经元输入向量;(l)为第l层神经网络实际输入向量;w(l+1)为权重矩阵;b(l+1)为偏移矩阵;f(x)为正向传播函数。
神经网络评估环境选用Win10 系统,CPU 为i7-8700 3.20 GHz,16 GB 内存,语言环境为Python 3.6.6,深度学习框架为TensorFlow1.3,训练可视化组件为TensorBoard,结果可视化组件为ECharts。本文利用上述环境搭建并测试基于3D 卷积神经网络的高铁TQI 预测模型。
选用某高铁线路的检测结果数据作为评估数据集。用前17 个月的11 952 条数据构建训练集,第18 个月的996 条数据组成测试集,进行模型评估。
预测未来一个月的TQI 数据是一种回归问题,对于TQI 预测的评估标准主要包含以下两点。
(1)MAE 或平均百分比绝对误差(MAPE),公式如下:
(2)MSE 或均方根误差(RMSE),具体评估公式如下:
公式(8)~(11)中,y和分别为真实TQI 与预测TQI;n为测试数据总量。
3D 卷积神经网络训练过程中,训练节点Dropout 为0.95,预测使用全部节点。训练过程整体MSE 损失变化如图7 所示。
图7 3D 卷积神经网络训练过程损失
由图7 可看出,训练次数迭代约3 500 次后,模型达到收敛,此时模型的训练MSE 约为0.006。
利用训练后的模型进行预测,预测数据与真实数据对比结果如图8 所示。
图8 预测数据与真实数据对比
图中,x轴为里程,y轴为TQI 值,蓝色折线代表TQI 预测值,黄色折线代表TQI 真实值。通过图8可看出,蓝色折线与黄色折线拟合度较高,表明该模型可较为准确地预测出TQI 的整体变化规律。
将历史月份的TQI 数据与预测结果使用3D 视图进行可视化展示,结果如图9 所示。
图9 历史数据与预测数据趋势对比
图中,X轴为时间;Y轴为里程;Z轴为TQI 数值。从图中可看出预测数据走势与历史走势具有很强的关联性,较好地表现了TQI 的发展趋势。
本文采用上述数据集,对文献[11]中双隐层BP神经网络、经典的LeNet-5 卷积神经网络和本文的3D 卷积神经网络从MAE、MAPE、MSE、RMSE 4个指标进行对比,结果如表2、表3 所示。
表2 3 类预测方法各指标列表
由表2、表3 可知,相比双隐层BP 神经网络,3D 卷积神经网络MAE 和MAPE 降低了41.48%,MSE降低了65.42%,RMSE 误差降低了41.19%。相比经典的LeNet-5 卷积神经网络,MAE 和MAPE 降低了26.32%,MSE 降低了39.93%,RMSE 降低了22.48%。对比结果表明,3D 卷积神经网络有更好的拟合能力及稳定性。
表3 3 类预测方法指标对比
为了更为准确地预测高铁线路TQI,本文提出了利用TQI 检测数据时空特征的3D 卷积神经网络模型,并以某高铁线路历史检测数据作为实验数据,进行实验验证对比并得出以下结论:(1)利用3D卷积神经网络可以更好的提取时间、空间等传统方法难以提取的数据特征;(2)与BP 神经网络、2D卷积神经网络相比,3D 卷积神经网络对TQI 预测结果的MAE、MSE 等都有显著降低。
综上,3D 卷积神经网络在大范围、长时间的TQI 变化趋势预测上取得较好的效果,但本文未完全考虑换轨、精调等维修手段对TQI 造成的影响,下一步研究应将此类影响作为特征,纳入预测模型。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!