当前位置:首页 期刊杂志

基于MLE-LM算法估计的交通流断面速度Weibull分布模型

时间:2024-07-28

符锌砂,郑 伟,王晓飞

(华南理工大学土木与交通学院,广州510641)

0 引 言

道路交通是一个十分复杂的系统,车辆在行驶的过程中受到驾驶员、路况环境和交通状态等多个因素的共同影响.车辆运行速度具有相对的规律性和稳定性,使其成为描述道路交通流最重要的参数之一,因此针对运行车速分布特征的研究一直是交通流领域研究的热点.研究各交通流状态下断面速度分布规律能为运行速度V85的选取、交通运行限速管理和交通状态判别等方面提供重要的理论参考.

关于交通流断面速度分布的研究,最早始于19世纪60年代,Leong[1]通过对两条双向乡村公路中31个位置的实地“自由”速度测量,分析得到速度近似呈现正态分布特征;随后Mclean[2]从乡村公路车头时距和排队模型的角度进行研究,也验证了这个观点.Haight等[3]在此基础上进一步研究认为,伽马分布或对数正态分布比正态分布能更好地拟合自由流状态下的速度分布.

早期传统的交通量研究中,因速度测量设备及分析手段的限制,大多数研究成果都基于对乡村公路或二级公路的小样本速度数据进行分析,得到交通流断面速度近似呈现正态分布特征的结论.随着交通仿真和数据分析技术的进步,近年来王琪等[4]分析了不同车头间距下的交通流速度分布,并用对数正态分布和负指数分布拟合了交通流通畅和阻塞状态下的数据.考虑其数据全部由美国NGSIM交通仿真系统得到,与现场真实实测情况可能存在差异,因而结论缺乏可靠性与准确性.徐程[5]采用非参数估计中的高斯混合模型描述了城市道路凌晨人为定义识别的自由流状态下,两种车型混合运行情况下的断面速度分布.

现有的对交通流分析的研究,多局限于特定的密度—车速假设关系和非参数估计模型,回归拟合数据多是交通仿真软件所得数据或人为定义识别的不连续观测数据,主要针对人为划分的自由流或拥挤流单个交通状态进行正态分布和负指数分布等确定性经验函数的分布拟合分析.而车辆在实际的行驶过程中,车辆会受到环境、事故等外界的诸多干扰,理想的状态几乎不存在,往往呈现自由流、稳定流和拥挤流等多种流态.该情况在现有的模型中没有得到充分的考虑,假设关系较片面,回归数据不全面,导致拟合的模型不具备普遍性和精确性.

综上所述,根据交通流速度分布特征,采用科学合理的方法对交通流不同运行状态进行划分,并研究大样本连续性观测交通流速度数据的分布特征,建立经验分布模型,显得尤为必要.

1 拟合分布模型的选取

为分析比较各拟合方法的优缺点及适用性,本文选取非参数估计中的高斯多峰拟合和参数估计中的正态分布及三参数Weibull(以下简称Weibull-3)分布模型对交通流速度进行拟合分析.其中,Weibull分布最早由瑞典工程师Waloddi Weibull于1951年提出并逐渐发展而来,根据参数个数已有一参数、二参数和三参数Weibull分布.三参数Weibull分布相比于传统的正态分布具有更强的可塑性和灵活性,能很好地拟合各类实验数据,目前广泛应用于描述风速分布、元件失效概率、材料疲劳强度和寿命分析、预测技术变革及各类可靠性分析工程中,而在交通领域鲜有应用.

Weibull-3函数表达式为

式中:x≥γ≥0,β>0,η>0

概率密度函数表达式为

式中:β为形状参数,决定了函数曲线的形状,使得Weibull-3分布具有很强的可塑性、适用性和灵活性.当β<1时,函数曲线图形与指数分布函数图形相似;当3<β<4时,图形趋近于Normal分布.η为尺度参数,决定了函数曲线的扁平度和跨度.γ为位置参数,决定了函数曲线图形沿x轴正方向的起始位置,随着γ取值的增大,函数曲线沿x轴正方向平移;当γ=0时,即是常指的二参数Weibull分布(以下简称Weibull-2).

2 Weibull-3参数估计方法

现有的Weibull-3分布的参数估计方法主要有最小二乘法、极大似然法、参数拟合割线法、Bayes统计分析法和相关系数优化法等,这些方法针对不同样本容量的适应能力和计算精度各不相同,但参数的整个求解过程或十分复杂繁琐,或难以直接适用于交通领域.例如,极大似然法(Maximum Likelihood Estimate,MLE)精度高,但Weibull-3分布的似然方程组是非线性的,结构十分复杂,需用Newton-Raphson迭代等方法求解联立的3个超越方程,常因Weibull-3分布不满足正则条件而不成立,导致极大似然估计有多个解或不存在;而最小二乘法在直接估计非线性静态模型参数时,常因初值的选择不当而导致迭代过程发散,无法得到最终结果或使得结果收敛到局部最优[6-7].

针对Weibull-3分布模型在交通流速度分布估计中的应用,本文提出一种新的算法模型,先用极大似然法精确估计Weibull-2参数,并结合Weibull分布函数的图形物理性质,为Weibull-3参数估计提供迭代初值和搜索起点,再利用基于Levenberg Marquardt迭代的非线性最小二乘法,建立MLELM算法模型,收敛得到Weibull-3分布的解.

2.1 Weibull-2极大似然估计

设x1,x2,…,xn为总体服从X~Weibull(η,β)的N个独立样本,根据极大似然估计基本原理,构造Weibull-2似然函数为

对似然函数式(3)进行取对数运算,即

再求对数似然函数式(4)关于参数β和η的偏导数,即

考虑到式(5)的复杂性,若采用常用的求解非线性方程的Newton-Raphson算法求解[8],令偏导数为0,难以直接解出Weibull-2参数的估计值,本文接着对式(5)作一系列相应变换[9].

先令式(5)中第2式为0,则有

将式(6)变形后,有

将式(7)带入式(4)后作相应变换,即

经过上述变换,式(8)简化为只与β有关的函数,可以通过数值计算直接找出使得极大似然函数取最大值的β,再代入式(7)计算出η,最后得到Weibull-2的参数值β0和η0.

2.2 基于Levenberg Marquardt迭代的非线性最小二乘法

对Weibull-3的分布函数式(1)两次取对数后,线性变换为

令b=-βlnη.则问题归结为确定一元线性回归模型y=ax+b的参数a和b,建立最小二乘法的约束准则为

考虑Weibull-3是一种非线性静态模型,本文采用Levenberg Marquardt(LM)算法进行迭代计算,将Weibull-2分布的极大似然估计得到的参数值和位置参数值γ0=0作为Weibull-3迭代搜索的初始值θ0(β0,η0,γ0),利用梯度寻找使得函数值最小的参数向量.LM迭代算法结合了高斯—牛顿法和最速下降法,同时具备前者的局部收敛性和后者的全局特性[10-11],由自适应调节的阻尼因子实现收敛,迭代次数少、迭代速度高、收敛快、拟合结果精度高,且不容易收敛于局部极值,求解步骤简单,对样本容量的适应能力大[12].

2.3 MLE-LM算法模型的建立

目标:对函数关系x=f(θ),给定f(·)与观测向量x,估计θ(β,η,γ)值.

算法步骤:

Step 1设置迭代初始点θ0(β0,η0,γ0=0),迭代停止阈值ε,计算ε0=‖x-f(θ0)‖,k=0,λ0=10-3,v=10(也可以是其他大于1的数).

Step 2计算 Jacobi矩阵Jk和和,构造增量正规方程

Step 3求解增量正规方程得到δk.

(1)如果‖x-f(θk+δk) ‖<δk,则令θk+1=θk+δk,若‖δk‖<ε,停止迭代,输出结果;否则令λk+1=v⋅λk,返回Step2.

(2)如果‖x-f(θk+δk)‖≥δk,则令λk+1=v⋅λk,重新解正规方程得到δk,返回(1).

2.4 分布拟合检验

对概率密度函数分布拟合结果常采用误差平方和(SSE)、确定系数(R-square)、残差平方和自由度(DFE)、调整自由度以后的残差的平方(Adj R-square)和标准差(RMSE)等指标进行检验.

(1)SSE,拟合数据和原始数据对应点的误差的平方和.

因而,SSE越接近于0,说明模型选择和拟合得越好.

(2)R-square,SSR和SST的比值.

式中:SSR为预测数据与原始数据均值之差的平方和,;SST为原始数据和均值之

差的平方和

“确定系数”是通过数据的变化来表征一个拟合的好坏,通过表达式可知其正常取值范围为[0,1],越接近1,方程的变量对y的解释能力越强,模型对数据拟合得也越好.

(3)DFE,计算某一统计量时,取值不受限制的变量个数.

DFE=数据点个数n-被限制的变量个数k-1

(4)Adj R-square,数值越接近1,说明曲线的拟合效果越好.

式中:总体平方和自由度DFT=数据点个数n-1.

(5)RMSE,方差(MSE)的平方根,而MSE是预测数据和原始数据对应点误差的平方和的均值,因而RMSE越接近0,拟合效果越好.

3 实例分析

本文实例分析数据来源于广东省某高速公路微波检测器于2016年2月收集的数据,数据间隔为1 min,原始交通参数数据主要包括交通流量、平均速度和占有率3个参数及车流方向、车道数、大型车数量等相关信息.对原始数据中的丢失数据和故障数据处理后,本文最终分析数据39 696组.使用SPSS软件对速度数据做描述性统计并作频率直方图,如表1和图1所示.

表1 速度数据描述性统计表Table 1 The descriptive statistics of velocity data

图1 速度数据频率分布直方图Fig.1 The histogram of velocity frequency distribution

分析图1可以发现,速度总体的分布在0~30km/h、30~60 km/h及60~120 km/h之间呈现3个明显波峰,本文假设实测速度可能在同一个交通状态下呈现如正态分布或Weibull分布特征.用二分K-FCM结合算法对速度、流量和占有率3个参数的数据进行聚类处理,将运行车速分为自由流、稳定流和拥挤流3种交通状态.为消除变量间量纲关系的影响,已将各维数据按比例归一化处理对应,聚类结果和各交通流状态数据描述性统计特征如图2和表2所示.

图2 二分K-FCM算法交通流状态聚类三维结果Fig.2 The 3D view of bisecting K-FCM clustering algorithm results for traffic flow

表2 各交通流状态下速度数据描述性统计表Table 2 Descriptive statistics of velocity data in each traffic flow (km/h)

从表2中可以看出,自由流、稳定流和拥挤流数据众数分别为94 km/h、45 km/h和15 km/h,恰好近似对应图1中3个速度频率分布波峰速度值.再考虑3个交通流状态速度数据峰度和偏度值均接近于0,故初步估计各交通流状态下速度分布均呈现正态分布或Weibull-3分布.对各交通流状态车速数据用MLE-LM算法模型进行Weibull-3分布拟合,并进行正态分布拟合和高斯多峰拟合,在95%的置信水平下,其结果如图3和表3所示.

图3 各交通流状态车速分布拟合结果Fig.3 Fitting results of vehocity distribution in each traffic flow

拟合结果表明:

(1)高斯多峰非参数估计的自由度均小于参数估计的自由度,表明非参数估计拟合被限制的变量个数更多.考虑非参数估计过程只是运用核密度函数和窗宽逐步逼近,找出模型,对所解释变量的分布状况不做具体规定,没有固定的模型形式,因而难以反映数据的分布特征.

表3 各交通流状态车速分布拟合结果Table 3 Fitting results of vehocity distribution in each traffic flow

(2)Weibull-3分布、正态分布和高斯多峰非参数估计均能很好地拟合各个交通流状态下的车速分布.其中,高斯多峰非参数估计的拟合结果Adj R-square值均达到了0.999以上,拟合效果非常好;而Weibull-3分布的拟合效果均比正态分布好,表明相比于正态分布,各交通流状态下的速度分布更服从Weibull-3分布模型.

(3)自由流和拥挤流状态下的车速Weibull-3分布拟合结果Adj R-square分别为0.997 4和0.970 9,拟合效果非常好,而稳定流状态下拟合结果Adj R-square值为0.712 5,也大于0.7,可总体认为不同交通流状态下速度分布基本服从Weibull-3分布.

综合上述分析,可认为自由流、稳定流和拥挤流状态下车速分布均服从Weibull-3分布模型,其概率密度函数表达式如下:

①自由流.

②稳定流.

③拥挤流.

4 结 论

本文根据运行车速总体分布特征,将交通流状态聚类划分为自由流、稳定流和拥挤流3种交通状态,并对各交通流状态速度数据拟合发现,Weibull-3分布比正态分布能更好地拟合各交通流状态下的速度分布,且比高斯多峰非参数估计法更能体现速度数据的分布特征.因而总体认为,自由流、稳定流和拥挤流均服从Weibull-3分布,为道路交通设计及安全评价提供理论参考.

针对复杂的Weibull-3分布参数估计求解问题,本文设计的MLE-LM算法综合利用了Weibull-3函数图形的物理特征、极大似然法精度高和LM迭代收敛快的优点,迭代次数少,拟合结果精度高,且不容易收敛于局部极值,求解步骤简单,对样本容量的适应能力大.一方面,避免了Weibull-3直接用极大似然法求解时常由于不满足通常正则条件而不存在或出现多个解的问题或使得结果收敛到局部最优的问题;另一方面由Weibull-2极大似然估计给定的精确初值,解决了最小二乘法初值选取问题,避免了最小二乘迭代发散的情况.未来还需要在以下两个方面进一步开展研究:①完善交通流状态划分情况,使数据的划分更符合实际情况;②进一步研究稳定流状态下的速度分布特征.

[1]LEONG H J W.The distribution and trend of free speeds on two-lane two-way rural highways in New South Wales[C]//Australian Road Research Board(ARRB)Conference,4th,1968,Melbourne,1900.

[2]MCLEAN J R.Observed speed distributions and rural road traffic operations[C]//Proc 9th Australian Road Research Board Conference,1979:235-244.

[3]HAIGHT F A,MOSHER W W.A practical method for improving the accuracy of vehicular speed distribution measurements[J].Highway Research Board Bulletin,1962.

[4]王祺,李力,胡坚明,等.不同车头间距下交通流的速度分布[J].清华大学学报(自然科学版),2011(3):309-312.[WANG Q,LI L,HU J M,et al.Traffic velocity distributions for different spacings[J].Journal of Tsinghua University(Science and Technology),2011(3):309-312.]

[5]徐程.基于高斯混合模型的车辆自由流速度分布[J].公路交通科技,2012,29(8):132-135.[XU C,Distribution of vehicle free flow speeds based on gaussian mixture model[J].Journal of Highway and Transportation Research and Development,2012,29(8):132-135.]

[6]GLEN H LEMON.Maximum likelihood estimation for the three parameter weibull distribution based on censored samples[J].Technometrics,1975,17(2):247-254.

[7]杨谋存,聂宏.三参数Weibull分布参数的极大似然估计数值解法[J].南京航空航天大学学报,2007,39(1):22-25.[YANG M C,NIE H.Advanced algorithm for maximum likelihood estimation of three parameter weibull distribution[J].Journal of Nanjing University of Aeronautics& Astronautics,2007,39(1):22-25.]

[8]衣俸君.基于威布尔分布模拟法的高压直流输电系统可靠性分析[D].济南:山东大学,2016.[YI F J.Reliability analysis of HVDC system based on weibull distribution simulation method[D].Jinan:Shandong University,2016.]

[9]邹争,董从林,袁成清,等.基于二参数威布尔分布的水润滑橡胶尾轴承可靠性寿命分析[J].舰船科学技术,2015(2):48-52.[ZOU Z,DONG C L,YUAN C Q,et al.Analysis reliability life of water lubricated rubber stern tube bearing based on two-parameter weibull distribution[J].Ship Science and Technology,2015(2):48-52.]

[10]CHAN K Y,DILLON T S,SINGH J,et al.Neuralnetwork-based models forshort-term traffic flow forecasting using a hybrid exponential smoothing and levenberg-marquardt algorithm[J].IEEE Transactions on Intelligent Transportation Systems,2012,13(2):644-654.

[11]沈旻宇.随机用户均衡下考虑学习行为的逐日动态模型研究[D].成都:西南交通大学,2016.[SHEN M Y.Day-to-day flow dynamics with user learning under stochastic user equilibrium[D].Chengdu:Southwest Jiaotong University,2016.]

[12]李芳,陆安祥,王纪华.基于列文伯格-马夸尔特-反向传播人工神经网络的X射线荧光光谱定量分析方法[J].食品安全质量检测学报,2016(3):1152-1158.[LIF,LU A X,WANG J H.Quantitative analysis method based on levenberg-marquardt back-propagation artificial neural network for X-ray fluorescence spectrometry[J].Journal of Food Safety and Quality,2016(3):1152-1158.]

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!