时间:2024-07-28
郭剑峰,王卫东,刘金朝,靖稳峰
(1.中国铁道科学研究院 基础设施检测研究所,北京 100081;2.西安交通大学数学与统计学院,陕西西安 710049)
轮轨间的相互作用力可以揭示车辆的运行安全性,通过测量轮轨之间相互作用的垂向力和横向力进而可以计算出脱轨系数、轮重减载率、轮轴横向力等指标。这些指标对评价车辆运行安全与否,研究脱轨机理等起着非常重要的作用[1-2]。国内外已经研究了轮轨力的直接测量方法并成功应用在综合检测中[3-4]。但对于轮轨力的预测技术,目前国内外的研究者仅使用传统神经网络学习算法进行预测[5],存在着训练速度慢、参数调整复杂、容易搜索到局部极小解等问题。近年来,一种新的极端学习算法解决了上述问题[6],可将其用于轮轨力预测技术中。
单隐层前馈神经网络(Single-hidden Layer Feedforward Neural Network,SLFN)以其具有非常好的学习能力而在很多领域中得到了广泛应用。但传统的基于梯度下降和误差反向传播的学习算法,如BP,RBF等存在如下缺点:
1)网络训练速度慢,需要通过多次迭代修正权值和阈值,训练时间很长。
2)可能会陷入局部极小点,很容易产生局部最优解,无法搜索找到全局最优解。
3)需要人为设置大量的网络训练参数,例如学习速率等参数。若学习速率较小,则算法收敛速度慢,训练时间长;若学习速率较大,则可能破坏训练算法的收敛性。
针对SLFN传统学习算法的上述问题,需要一种训练速度快,能获得全局最优解的算法,才能使SLFN在工程上获得应用。
2004年,新加坡南洋理工大学的黄广斌教授提出了极端学习机(Extreme Learning Machine,ELM)学习算法,这种算法是一种简单易用、有效的SLFN学习算法,只需要设置神经网络中隐含层节点的个数,并且在算法的执行过程中不需要调整网络的输入权值以及隐含层的输出阈值,只要随机产生一次,就能得到唯一最优解,因此具有学习速度快、能获得全局最优解、泛化性能好的优点。
对于任意一个SLFN,其输入层、隐含层、输出层神经元节点间完全连接。设网络的输入层有m个神经元,输出层有n个神经元,隐含层有k个神经元,其神经网络模型如图1所示。
图1 SLFN模型
输入层与隐含层间的连接权值矩阵w为
式中,wij表示输入层第i个神经元与隐含层第j个神经元的连接权值。
隐含层与输出层间的连接权值矩阵β为
式中,βij表示隐含层第i个神经元与输出层第j个神经元的连接权值。
隐含层的阈值矩阵b为
输入矩阵X和输出矩阵Y具有l个样本
确定了SLFN的数学模型后,设隐含层神经元的激活函数为g(x),神经网络输出T为
式中
式(7)可以表示为如下形式
式中,H为隐含层输出矩阵,表达式为
ELM学习算法基于如下两个性质[7]:
性质1:对实数域上任意l个不同样本(xi,yi)和在任意区间上无限可微的激活函数g(x),则对有l个隐含层神经元的SLFN,对任意的输入权系数矩阵w和阈值矩阵 b,其隐含层输出矩阵 H可逆并且‖Hβ-TT‖ =0。
性质2:对实数域上任意l个不同样本(xi,yi)和在任意区间上无限可微的激活函数g(x),若给定一个任意小的误差ε(ε>0),总存在一个含有Q(Q≤l)个隐含层神经元的SLFN,对任意的输入层和隐含层连接权系数矩阵w和隐含层阈值矩阵b,有:‖Hβ-TT‖<ε。
由上述两个性质可知,ELM学习算法中隐含层神经元的个数决定着SLFN是否能以零误差逼近训练样本,并且ELM学习算法可以不调整SLFN的全部参数,输入权值矩阵w和隐含层阈值矩阵b可以随机给出,并且训练过程中始终保持不变,只需调整隐含层与输出层的连接权值矩阵β即可完成训练。即求解如下问题[8]
对于SLFN模型,由于ELM学习算法具有学习速度快、能获得全局最优解、泛化性能好的优点,因此将该算法应用于轮轨力预测问题中。
使用SLFN和ELM学习算法对轮轨力预测时,SLFN模型的输入参数为4项轨道不平顺和8项车辆的动态加速度响应数据,输出分别为轮轨垂向和横向作用力。4项轨道不平顺分别为:左高低、右高低、左轨向、右轨向;8项车辆动态加速度响应数据分别为:左、右轴箱垂向和横向加速度,构架、车体的垂向和横向加速度。取训练组样本数为1 000个,测试组样本数也为1 000个进行训练和预测,预测步骤如下:
1)首先,对训练组和测试组输入和输出数据进行归一化,因为激活函数对[-1,1]之间的数据比较敏感。
2)确定隐含层神经元节点的个数,按照性质1和性质2,一般取隐含层节点个数与样本数相同时预测的效果更好。但随着隐含层节点数的增多,同时也增加了计算量,因此根据性质2,可以选择一个较小的值,满足误差要求即可。
3)随机给出输入层与隐含层之间的输入权系数矩阵w和隐含层神经元阈值矩阵b。
4)设置隐含层神经元激活函数,一般选sigmoid函数等实数域无限可微函数即可。
5)计算隐含层输出矩阵H并求其逆矩阵。
6)求解式(12)中的最优化问题,计算隐含层与输出层之间的连接权值矩阵β的解β~=H-TT。
按上述步骤,预测轮轨力的结果如下:
1)隐含层节点数为50时,训练组预测的轮轨垂向力与实测值之间的相关系数约为0.898 6,结果如图2所示。
图2 隐含层50个节点时训练组预测轮轨垂向力与实测值对比
2)隐含层节点数为1 000时,训练组预测轮轨垂向力与实测值之间的相关系数为1,因为此时隐含层节点数等于样本数,该结论与性质1相符合。但由于隐含层的节点数较多,所以需要的训练时间很长,结果如图3所示。
图3 隐含层1 000个节点时训练组预测轮轨垂向力与实测值对比
3)隐含层节点数为50时,测试组预测的轮轨垂向力与实测值之间的相关系数约为0.891 0,结果如图4所示。
图4 隐含层50个节点时测试组预测轮轨垂向力与实测值对比
4)隐含层节点数为50时,训练组预测的轮轨横向力与实测值之间的相关系数约为0.838 6,结果如图5所示。
5)隐含层节点数为50时,测试组预测的轮轨横向力与实测值之间的相关系数约为0.812 6,接近训练组预测结果,如图6所示。可见ELM算法使SLFN有很好的泛化性能。
图5 隐含层50个节点时训练组预测轮轨横向力与实测值对比
图6 隐含层50个节点时测试组预测轮轨横向力与实测值对比
1)ELM学习算法是一种快速的学习算法,与传统基于梯度下降的误差反向传播算法不同,无需反复调整网络的参数,对上述1 000个轮轨力样本仅需1 s即可完成训练和测试。
2)试验结果表明,当隐含层节点数等于样本数时,对训练组数据有最好的预测效果,该结论从工程应用上验证了性质1。但当样本量较大时,根据性质2,选取较小的隐含层节点数亦可达到全局最优的效果。
3)利用轨道不平顺和车辆加速度预测得到轮轨的垂向力和横向力与解析解的相关系数在0.8以上,能满足工程应用的要求。相对而言,轮轨垂向力比横向力的预测精度更高,能达到0.85以上甚至0.9的精度。
[1]祖宏林,张志超,汪伟.轮轨力测量在高速铁路轨道检测中的应用研究[J].铁道机车车辆,2012,32(4):19-24.
[2]田德柱,冯毅杰.重载铁路轮轨力测试及传输系统研究[J].铁道建筑,2011(12):109-102.
[3]杨荣峰,王林栋,章亮.铁路线路动车组动力学响应检测应用研究[J].铁道机车车辆,2010,30(1):20-21,47.
[4]许贵阳.客运专线综合检测列车技术方案的研究和应用[J].铁道建筑,2008(2):95-98.
[5]LI D,MEDDAH A,HASS K,et al.Relating track geometry to vehicle performance using neural network approach[J].Rail and Rapid Transit,2006,220(6):273-281.
[6]HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine:theory and applications[J].Neuro-computing,2006,70(1):489-501.
[7]HUANG G B,LEI C,SIEW C K.Universal approximation using incremental constructive feed forward networks with random hidden nodes[J].IEEE Transactions on Neural Networks,2006,17(4):879-892.
[8]GUO R F,HUANG G B,LIN Q P.Error minimized extreme learning machine with growth of hidden nodes and incremental learning[J].IEEE Transactions on Neural Networks,2009,20(8):1352-1357.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!