时间:2024-07-28
吴文静,陈润超,马芳武,梁志康
(吉林大学a.交通学院;b.汽车学院,长春130025)
行人交通是交通系统的重要组成部分,交通事故中行人死亡人数在各类交通事故死亡人数中所占比例较大.《2015年全球道路安全现状报告》显示:在我国,行人事故伤亡率约占所有交通事故伤亡人数的20%,而行人过街时的伤亡人数占50%以上.因此,对于行人过街风险因素的识别一直受到学者们的关注.张丽霞[1]指出驾驶员的分神、疲劳和违规等行为是主要的事故原因.Eleonora研究表明行人的风险感知、冒险倾向、侵犯性、冲动性和运动协调性等都会影响行人的过街行为[2].Fu[3],Lavalette[4]分别研究了行人过街信号灯、过街通道的长度等交通设施与行人事故的相关性;Li研究了天气状况与行人过街交通事故发生的关联性[5].
从现有的研究来看,行人过街风险大多集中于人、车、路、环境这4项因素,而较少的关注行人—机动车的行为在时空的冲突耦合过程,在此将此过程称之为“事故序列”.事故序列是按照逻辑顺序,机动车与行人在交叉口可能的动作及其后果,直至最终事故发生的一系列事件.识别不同事故序列的风险,并通过防控措施消除导致产生事故的耦合因素,从而“切断”事故序列,对提高交叉口行人过街安全具有积极意义.
本文基于FARS(Fatality Analysis Reporting System)[6]、 NASS-GES(National Automotive Sampling System-General Estimates System)[7]事故数据,对事故序列进行分析.统计发现事故序列种类繁多,若分析每种类型的风险性,一是由于总的样本量有限,分配到每一类事故序列的样本量也有限,必然会影响分析结果;二是在具体管理中也不利于对过程的控制.为解决上述难题,需要识别诱发事故的主要风险事故序列.然而传统的识别方法多基于数理统计方法,例如贝叶斯方法、K-均值聚类算法,这些方法都是基于定量数据的分析,对于序列数据不适用.因此本文借鉴生物信息学中的序列比对方法对事故序列进行相似性比对,基于聚类结果识别行人过街的主要风险序列,并对其关联影响因素进行分析.研究结果对完善行人交通风险管理有一定的理论价值和实践意义.
根据《FARS NASS GES Pedestrian Bicyclists Manual》[8],行人过街事故大致可描述为6种情景,如图1所示.其中,“箭头”表示的是车辆的行驶方向 ,包括直 行 (Straight)、左转(Left Turn)、右转(Right Turn)3种情况;“×”代表的是行人,每张图中都有3个“×”,表示行人可能的3个位置,分别为人行横道内(Crosswalk Area),交叉口内(Intersection Area)及机动车车道内(Travel Lane).此外事故点的位置又可分为交叉口进口方向(Near/Approach Side of Intersection)和出口方向(Far Side of Intersection)2类.在图1中:(a)、(b)是直行车辆与分别位于出口道与进口道的行人发生的碰撞;(c)、(d)是右转车辆与分别位于出口道与进口道的行人发生的碰撞;(e)、(f)是左转车辆与位于进口道或出口道的行人发生的碰撞.
由于事故发生于十字交叉口,因此机动车共有4个行驶方向(东向西、西向东、南向北、北向南).行人的走行方向是双向的,且事故发生时行人可能位于机动车的左侧,也可能是位于右侧.因此,若考虑行人与机动车运动冲突的轨迹,那么事故发生过程的具体形态可细分为3×3×2×4×4=288种类型.
图1 6种类型的事故序列Fig.1 Six kinds of accident sequences
在生物信息学中,序列比对是识别生物间相似性或同源性一个基本的研究手段和方法.序列比对除了应用于生物领域,在其他方面也有广泛应用.例如,李燕等[9]将序列比对方法用于企业管理过程评价;王亚飞等[10]用改进的序列比对算法自动生成地层分界线,并处理复杂的地层尖灭和透镜体现象;杨文宁[11]基于序列比方法对沪深指数暴跌暴涨现象进行分析;Wu等[12]用序列比对方法分析机动车交通事故;刘昕宇[13]分析了道路交通事故影响因素序列模式.
序列比对方法的计分规则由替换矩阵和空位罚分构成.假设两条从不同生物体内提取的核苷酸或蛋白质序列A(AAAGGCC)与B(AAGGGGGC),为了比对两条序列的相似性,有2种比对方式:一是需要引入空位,二是替换,如表1和表2所示,其中,空位罚分为d,错配罚分为s.对比表1和表2可知,表1有4个空位罚分,而表2减少到2个空位罚分,但是多了一个错配.
表1 空位罚分Table 1 Gap penalty
表2 相似替代Table 2 Similar alternative
序列比对可以看作是一个优化问题,目标是寻找最优的比对方法.常用的目标函数为SP(Sum of Pairs)计分的目标函数和COFFEE(Consistency based Obeject Function)目标函数.其中SP目标函数为
式中:COST(Ai,Aj)表示比对拥有N条序列的序列集A时,第i条和第j条序列比对后的计分值;D表示两条序列相似性大小的函数,实际操作中,运用相似性计分矩阵计算D,故D(Ai[k],Aj[k])表示Ai和Aj对应残值的替换分值;G表示空位罚分;numij表示两序列的自然空位数.
若满足式(5),则A*是所求的一个最优比对.求解最优序列的算法有很多,包括适用于双序列比对的Needleman-Wunsch[13]算法,解决局部相似性问题的Smith-Waterman算法,以及多序列比对的渐进算法.本文借助于ClustalX软件对多事故序列数据进行比对并聚类分析.
借鉴序列比对方法,首先需要将行人、驾驶员的冲突过程的行为过程数据转换为符号性数据,这样每一条行人与机动车行为构成的事故序列就与生物学中的残基或碱基序列有相似的模式.以2015年FARS、NASS-GES数据作为样本数据,共得到1 083条序列数据.根据序列发生的频率对序列进行排序,从结果来看,有部分事故序列的发生频率较小,只有1条或2条,基于统计原理,这些序列的发生都属于小概率事件,因此不作为分析对象.删除小概率样本后,共形成904条序列数据.事故序列的符号转换方法及各种行为所占的比重如表3所示.
从统计结果来看,事故发生在交叉口出口方向比在进口方向的频率略高;事故发生地点有一半以上位于人行横道内;有近80%的事故是发生在驾驶员直行过程中,而车辆右转发生的交通事故不多,所占比例不到5%;此外,驾驶员与行人的走行方向上的差异性不明显.
从序列类型来看,共可得到288种事故序列,借助于ClustalX软件对序列数据进行分析,将“同源”风险进行归类.Clustal的算法原理是先将多个序列两两比对构建距离矩阵;然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进行加权;然后从最紧密的两条序列开始,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止[14].依据比对结果,最终将事故序列聚类划分为以下6种类型Seq1~Seq6,如表4所示,其进化树分枝结果如图2所示.
表3 事故序列描述Table 3 Description of accident sequences
分别对6种类型的事故序列进行分析.其中,Seq1的序列大致以V、D开头,以N结尾,表明事故是在车辆左转过程中与相邻路口的人行道上的行人发生的碰撞;Seq6的序列同样以V、D开头,以P结尾,表明事故是在车辆直行过程中与出口道的人行道上的行人发生的碰撞;在Seq1中还有以V、D开头,以P结尾的序列,但是分类时却分到了第1类而不是第6类,只能说明除了序列最后一位与分类6相似外,序列的第三位、四位都更接近于分类1.
Seq2的序列大致以A、D开头,以P结尾,表明事故是在车辆直行过程中与位于进口道的人行道上的行人发生的碰撞.
Seq3的序列大致以V、E开头,以P结尾,表明事故是在车辆直行过程中与位于出口道的车道上的行人发生的碰撞.
Seq4的序列大致以A、E开头,以P结尾,表明事故是在车辆直行过程中与位于进口道的车道上的行人发生的碰撞.
Seq5的序列大致以A、C开头,以P结尾,表明事故是在车辆直行过程中与位于进口道交叉口区域内的行人发生的碰撞.
此外,以V、C开头以P结尾的数据量少,从数据统计来看,只有12条,因此根据序列相似性归入了Seq6,以Y结尾的事故序列也较少,只有13条,把他归入了第1类.此外,从分类结果来看,基本以序列的第1、2、5位序列字母为分类依据,可见驾驶员与行人的位置关系在事故序列类型划分中并不占有重要的地位.
分析进化树,如图2所示.进化树可以检验各种类别之间的相似关系,如果每一条边都被赋予一个适当的权值,那么两个叶子结点之间的最短距离就可以表示相应的两个物种之间的差异程度.进化树中,每个叶子结点代表一种事故类型,因此进化树描述了这6种类型相互之间的相似程度.从序列的相似性可见,关系较近的有Seq3与Seq4,Seq2与Seq5.Seq6与Seq3、Seq4相似关系较近,而Seq1与其他各类相似性较差.将此分析结果用图表示,如图3所示.
由图3可知,直行车辆与位于进口道交叉口区域内的行人及出口道位于车道内的行人碰撞事故发生的机理存在相似性,如图3(a)所示;直行车辆与位于进口道车道上与人行横道上的行人碰撞事故发生的机理存在相似性,如图3(b)所示.
图3 事故序列的相似性结果Fig.3 Similarity between accident sequences
为了分析事故序列与其他风险源的耦合性,首先对人、车、路、环境等多因素进行了风险识别.FARS、NASS-GES数据对事故做了详细的记录,依据记录信息对与事故发生的影响因素进行分类.其中,从行人与驾驶员的角度出发,选取了个人属性特征、驾驶习惯、是否受外界干扰等因素;车辆,选取车型、车龄、品牌等因素;路面状况,选取路面材料、是否有积水等因素;环境,选取天气状况、可见度等因素.运用灰色关联法分析影响因素与各种类型事故发生的相关性,并基于Matlab算法实现.基于关联度大小识别出与上述6类事故发生相关联的影响因素.其中,对灰色关联法中没有明确的对关联度强弱的定义,在此借鉴较为普遍应用的皮尔逊相关系数的定义,即当相关系数大于0.8时,认为两个变量有很强的相关性,因此本文取关联度大于0.8的影响因素作为行人交通事故的风险源,结果如表5所示.
表5 事故序列关联因素分析Table 5 Analysis of the relevant influencing factors of accident sequences
由分析结果可知,Daylight只与Seq1相关,表明除了像其他类型的事故序列会发生在光线不明的黄昏或黎明的时候,Seq1也会在白天发生,可见光线不足不是Seq1事故发生的关键原因.此外,从天气来看,其他事故序列都受到异常天气(阴天、下雨)的影响,但是Seq1事故与下雨不相关,显然结果不合理,究其原因,这与样本量有关,由于样本量有限,且下雨天记录有限,导致出现这样的结果.
Seq2事故与路面条件不相关,可能Seq2是发生在进口道的人行横道上,因此驾驶员理应提前做好减速的准备,而不会出现由于路面有冰或潮湿刹不住车来不及避让行人的情况.此外,驾驶员是否经常有违章记录与Seq2、Seq5的关联度明显要高于其他类型,违章记录多的驾驶员表明其驾驶行为偏好于冒险,这两类事故序列都发生在进口道方向,表明这两类交通事故多归因于驾驶员的操作不当;而Seq3、Seq4与该因素不相关,因此可以推测发生在进口道交叉口内的事故或出口道路段内的事故多归因于行人的不当过街行为.此外,驾驶员及行人的性别、机动车的类型与事故序列的相关性并不显著.
序列分析通常应用于生物学的基因比对中,用于识别生物的相似性与同源性,本文借鉴该方法的基本思想,将其应用于行人—机动车不同交通事故的序列比对中,对行人—机动车碰撞的事故序列风险进行识别,并分析与该风险关联的影响因素.
(1)基于行人过街事故序列的相似性比对及聚类分析,得到了行人—机动车在交叉口事故的6种主要风险序列,其中直行车辆与行人的碰撞风险最大.且进化树分析结果表明,Seq2与Seq5的事故诱因,Seq3与Seq4的事故诱因存在相似性.
(2)基于不同序列的风险耦合因素的灰色关联分析,表明在车辆左转与行人的碰撞中,事实上天气不是主要原因.Seq2与Seq5的事故主要归因于驾驶员.
(3)由于数据库中对行人过街事故序列记录详细程度有限,获取不到行人—机动车碰撞发生时的轨迹信息,对于事故发生时的天气、道路等记录也较为粗略,因此要完全识别行人—机动车的序列行为的风险性需要更为详细的基础数据.
[1]张丽霞,刘涛,潘福全,等.驾驶人因素对道路交通事故指标的影响分析[J].中国安全科学学报,2014,24(5):79-84.[ZHANG L X,LIU T,PAN F Q,et al.Analysis of effects of driver factors on road traffic accident indexes[J].China Safety Science Journal,2014,24(5):79-84.]
[2]ElEONORA P,ATHANASIOS T.Patterns of pedestrian attitudes,perceptions and behavior in Europe[J].Safety Science,2013,53(2):114-122.
[3]FU L,ZOU N.The influence of pedestrian countdown signalson children'scrossing behavioratschool intersections[J]. Accident Analysis and Prevention,2016(94):73-79.
[4]LAVALETTE B,TIJUS C,POITRENAUD S,et al.Pedestrian crossing decision-making:A situational and behavioral approach[J].Safety Science,2009,47(9):1248-1253.
[5]LI Y,FERNIE G.Pedestrian behavior and safety on a two-stage crossing with a center refuge island and the effect of winter weather on pedestrian compliance rate[J].Accident Analysis and Prevention,2010,42(4):1156-1163.
[6]National Highway Traffic Safety Administration.Fatality analysis reporting system(FARS)analytical user's manual 2007-2016[R]. U.S., Department of Transportation,Washington,D.C.,2017.
[7]National Highway Traffic Safety Administration.National automotive sampling system(NASS)general estimates system(GES)analytical user's manual 1988-2015[R]. U. S., Department of Transportation,Washington,D.C.,2016.
[8]National Highway Traffic Safety Administration.2015 FARS NASS GES pedestrian bicyclists manual[R].U.S.,Department of Transportation,Washington,D.C.,2016.
[9]李燕,冯玉强.一种基于序列比对的业务过程定量化分析方法[J].系统工程理论与实践,2007,27(4):54-61.[LI Y,FENG Y Q.A quantitative analysis method of businessprocessbased on sequence alignment[J].Systems Engineering Theory&Practice,2007,27(4):54-61.]
[10]王亚飞,金人超.基于序列比对算法的地质剖面图自动生成[J].铁道勘测与设计,2010(5):68-77.[WANG Y F,JIN R C.Geologicalprofilesautomatically generated based on sequence alignment algorithm[J].Railway Survey and Design,2010(5):68-77.]
[11]杨文宁,龙文.基于序列比对的沪深指数暴涨暴跌分析[J].管理评论,2017,29(3):3-11.[YANG W N,LONG W.Analysis of extreme ups and downs of Shanghai and Shenzhen indices based on sequence alignment method[J].Management Review,2017,29(3):3-11.]
[12]WU K F,CRAIG P,THOR,et al.Identify sequence of events likely to result in severe crash outcomes[J].Accident Analysis and Prevention,2016(96):198-207.
[13]刘昕宇.基于数据挖掘的道路交通事故序列模式与严重程度预测研究[D].北京:北京交通大学,2016.[LIU X Y.Study of road traffic accident sequence pattern and severity prediction based on data mining[D].Beijing:Beijing Jiaotong University,2016.]
[14]汪浩.基因序列比对算法的优化研究[D].北京:中国农业科学院,2015.[WANG H.Study on optimization of gene sequence alignment algorithm[D].Beijing:Chinese Academy of Agricultural Sciences,2015.]
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!