当前位置:首页 期刊杂志

基于Apriori 算法的电动自行车危险驾驶行为特征分析

时间:2024-07-28

■李妙梅 业梦辉 林文强 黄海南*

(福建农林大学交通与土木工程学院, 福州 350002)

电动自行车由于其灵活性和不拥堵等特点近年来备受青睐。 由于现有交通法规对电动自行车违章约束力度较低,其危险驾驶行为频繁出现,甚至引发了许多交通事故。于昊等[1]基于电动自行车交通事故数据进行分析, 发现造成电动自行车肇事事故及死亡事故的主要原因是逆行、 违反交通信号通行等危险驾驶行为;王涛等[2]通过弹性分析发现,驾驶人的违规行为对电动自行车交通事故严重程度的影响最为显著;覃国峰等[3]构建了结构方程模型,模型表明电动自行车驾驶员的风险性驾驶行为主要受交通安全态度的影响。目前,鲜有研究者对电动自行车危险驾驶行为的关联因素展开深入研究, 在此将通过对典型断面的电动自行车驾驶行为抽样调查, 深入剖析电动自行车危险驾驶行为的特征, 并进一步分析其行为的相关影响因素,进而提供合理的干预建议,以期降低与电动自行车相关的交通伤害。

1 电动自行车行为调查与分析

1.1 调查内容

根据预调查及数据分析需求,研究选取了驾驶员年龄、驾驶行为类别、承载情况等3 个方面开展电动自行车行为调查。 其中,驾驶员年龄属于驾驶人属性调查,将驾驶员年龄大致分为青年、中年和老年3 个层次;驾驶行为类别属于驾驶行为属性调查,将常见危险驾驶行为划分为驾驶员危险类和驾驶行为危险类,驾驶员危险类涵盖未戴头盔、车辆安装遮阳伞,驾驶行为危险类涵盖闯红灯、逆行、在机动车道行驶、单手行驶等;承载情况属于驾驶类型调查,可区分载人或载货属性,如图1 所示。

图1 电动自行车行为调查内容

1.2 调查数据基本特征

在福州市鼓楼区、仓山区和闽侯县随机选取7 个电动自行车断面流量较大的路段展开调查工作,共获取2250 个样本信息,其中36 个样本由于部分数据缺失被剔除,共获取有效数据2214 项,见表1。

表1 样本主要特征信息

本研究对不同属性电动自行车驾驶人员的情况做出统计,见表2。 笔者在调查过程中得知,在所选择的各调查地点中均有交通制度监察驾驶人员及乘客是否佩戴头盔,但不戴头盔的危险驾驶行为依然随处可见。根据数据显示,70.22%的青年群体、65.77%的中年群体及38.60%的老年群体均无佩戴头盔的习惯,而且电动自行车驾驶员在空载、载儿童、 载成人状态时不佩戴头盔占比也分别高达67.94%、61.72%及81.17%,可见电动自行车驾驶人员对佩戴头盔等安全驾驶条例不够重视。 对比各项危险驾驶行为的比例可知,在机动车道行驶、不佩戴头盔是危险驾驶行为中占比较高的现象。

表2 电动自行车危险驾驶行为的相关特征信息

针对不同年龄驾驶者的驾驶行为展开对比分析,可发现:老年群体在机动车道驾驶的比例明显偏低;青年、中年、老年群体安全驾驶电动自行车的比例依次为20.22%、20.29%、40.35%, 其中老年群体安全驾驶电动自行车的比例约为青年群体、中年群体的2 倍, 老年群体的安全驾驶意识相对较高;青年驾驶员在电动自行车上安装遮阳伞的比例明显偏低。 针对不同承载属性的电动自行车驾驶者展开驾驶行为分析,可发现:外卖车驾驶员闯红灯、逆行的占比明显较高,但大多数外卖车驾驶员在驾驶时选择佩戴安全头盔, 且安全驾驶的比例明显较高;电动自行车空载时,驾驶员在机动车道驾驶的比例明显偏低;载儿童的电动自行车安装遮阳伞的比例明显较高。

2 关联规则理论

常用的数据挖掘分析方法有回归分析、 聚类、关联规则、偏差分析等[4],关联规则因其与实际情况贴合度高等优点,成为数据挖掘的一项重要分支。传统分析方法在调查时需事先设定好自变量与因变量,调查后再进行单一变量分析[5],而关联规则的优势在于可对某一个样本的多个特征同时进行关联性分析。 频繁项集的计算是关联规则中的一项重要问题[6]。 频繁项集即符合最小支持度阈值的项集。目前在计算频繁项集方面, 广泛使用R.Agrawal 等人提出的Apriori 关联算法。 关联规则中主要包含了3 个重要概念,即支持度、置信度和提升度[7]。

(1)支持度:数据集中包含A 项集的数据占总数据集的比例;用于筛除出现频率较小的项集。

(2) 置信度: 在A 发生的条件下,B 发生的概率,即条件概率;置信度也称作可信度,用于评判该项集预测结果的准确度。

(3)提升度:在A 发生的条件下,B 发生的概率是否有明显的提升;提升度>1,则表明两个前后项之间呈正相关;提升度=1,则表明两个前后项之间没有关联性;提升度<1,则表明两个前后项之间呈负相关[8]。

本研究基于Python 编程语言, 采用Apriori 算法对所收集的数据进行关联分析。Apriori 关联算法主要通过不断迭代的方式,寻找数据集中具有强关联性的频繁项集。 算法流程大致为:首先设置算法的最小支持度阈值min_sup 及最小置信度阈值min_con。在数据集中寻找支持度不低于min_sup的项集,即频繁项集,记为L1;频繁项集L1与自身连接得到候选项集, 筛选掉候选项集中低于min_sup 的项集,得到频繁项集L2,继续重复以上步骤,直至无法再找到频繁项集[9],如图2 所示。

图2 Apriori 关联算法流程

3 危险驾驶行为特征分析

3.1 关联规则分析

最小支持度阈值和最小置信度阈值对实验结果影响极大,若阈值过小,会导致大量低频偶然数据也被包含在内,且加长运行时间;若阈值过大,则会导致强关联规则数量过少, 无法进行有效分析。本研究根据数据特征,采取不同的最小支持度阈值和最小置信度阈值进行测试,以求得到的强关联规则数量适宜且有效信息量充足;最终确定最小支持度阈值为20%,最小置信度阈值为60%,过滤掉频率小于20%的项集,同时保证项集预测结果的准确度均在60%以上。 通过Apriori 关联算法分析,以电动自行车驾驶员的年龄属性及电动车承载情况作为前项,以危险驾驶行为类别作为后项,得到电动自行车危险驾驶行为的频繁项集及强关联规则,见表3。

表3 电动自行车危险驾驶行为强关联规则

3.2 实验结果分析

对表3 中的强关联规则进行分析,可挖掘出电动自行车的驾驶员年龄属性、车辆承载属性与发生危险驾驶行为之间是否存在关联性,结果见表4。其中提升度>1 的项集则表明,前项发生时,后项发生的概率比一般水平高,提升度越高则代表后项发生的可能性越大。 主要潜在规律如下:

表4 强关联规则结果分析

(1)规则#1、#2、#3 中项集提升度均>1,可知当电动自行车驾驶员为青年时,易发生逆行、在机动车道驾驶、乘客未带头盔的危险驾驶行为;

(2)规则#4、#5、#6 中项集提升度均>1,表明当电动自行车驾驶员为中年时,易发生在机动车道驾驶、闯红灯、安装遮阳伞的危险行为;

(3)规则#7、#8 表明,电动自行车的承载属性为载成人或载儿童时,乘客未佩戴头盔的概率大大提升,特别是在载成人的情况下,未佩戴头盔的概率更高;

(4)由规则#9、#10 可知,相比空载情况,电动自行车驾驶员承载成人时,更易产生未佩戴头盔的情况;

(5)由规则#11、#12 可得,从驾驶员年龄属性的角度分析,青年驾驶员和中年驾驶员均易发生未佩戴安全头盔的危险驾驶行为。

为减少电动自行车危险驾驶行为的发生,提高社会交通环境的安全性,基于调查数据特征及以上潜在规律,提出如下建议:

(1)对调查数据进行对比分析可知,外卖车驾驶员群体极易产生逆行、 闯红灯等危险驾驶行为。其原因在于, 人们对外卖配送的服务质量要求不断提升,尤其是对配送的准时性极为重视,若外卖员配送超时极可能收到差评,甚至需要赔付费用。 另外,部分外卖配送员时常接过多的订单, 导致部分外卖无法准时送达,于是其不惜违反交通法规,以提高外卖的配送速度。因此,应适当限制外卖配送员的接单数量,同时减轻对配送超时行为的处罚力度。

(2)电动自行车承载儿童时,为避免儿童晒太阳时间过长,其安装遮阳伞的占比显著提升。 但电动自行车上安装遮阳伞, 会导致驾驶员的视野受限,尤其是在交叉口或拐弯处,极易导致交通事故。应加强对电动自行车安装遮阳伞行为的管制力度,倡导通过使用儿童防晒衣等方式达到遮阳效果。

(3)可针对不同年龄段的人群,在不同地点开展电动自行车危险驾驶行为相关知识的普及。 在学校或商场等青年群体聚集区域,可针对逆行、在机动车道驾驶、 未佩戴头盔等危险驾驶行为的危害性,进行重点宣传教育;在社区等中年群体常活动区域,可重点开展机动车道驾驶、安装遮阳伞、闯红灯等电动自行车危险驾驶行为的知识普及活动。

(4)目前对于电动自行车的约束有限,相关法律法规的完善及落实还有待加强。 建议加强对电动自行车危险驾驶行为的法律约束,加大对电动自行车的监察、监管力度,对电动自行车驾驶员开展一定的培训和考核。

(5)应尽量避免电动自行车的载人行为。 电动自行车载人时, 驾驶员倾向于不佩戴安全头盔,且各年龄段的乘客也不愿佩戴头盔。 另外,电动自行车载人时车辆由于重量增加更难以控制,危险系数更高。 目前,我国电动自行车载人由各省自行制定,电动自行车能否载人因地而异。 国内部分地区已明确规定电动自行车禁止载人,并出台了相应的监察措施。

4 结论

基于现今电动自行车的社会历史环境及其发展状况, 研究通过预调研制定了电动自行车危险驾驶行为调查表, 并在福州典型道路断面开展了电动自行车危险驾驶行为抽样调查和分析。 通过数据挖掘的方式, 可知电动自行车属性与电动自行车危险驾驶行为之间的潜在联系,即:不同年龄段的电动自行车驾驶人员与危险驾驶行为之间的联系, 以及不同承载情况的电动自行车与危险驾驶行为之间的联系。 由此了解电动自行车危险驾驶行为产生的内在机理,为制定交通环境安全措施提供科学依据,同时为相关部门实施针对性管理策略提供有益参考。

由于本研究采用了抽样调查数据,数据具有一定的区域性和局限性,无法表征全国各地电动自行车行为差异,后续研究将进一步采集和分析不同区域特色的电动自行车驾驶行为, 扩大数据样本,同时深入分析不同危险驾驶行为的危险程度。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!