当前位置:首页 期刊杂志

基于相似度匹配的城市燃气事故案例库

时间:2024-05-04

张蕾侠,方廷勇

(安徽建筑大学 环境与能源学院,安徽 合肥 230601)

0 引 言

城市燃气事故是影响城市安全的重要因素,在全国范围内,燃气事故平均超过900起/年,而其中燃气泄漏的占比达到46%,值得一提的是在燃气泄漏事故中74%为微小泄漏[1]。据统计,近5年内,国内媒体报道的燃气事故超过3 473起,受伤人数5 043人,死亡人数609人,然而这些事故多由燃气的微小泄漏引发[2]。因此,当燃气事件突发时,早发现、早报告、早处置、早解决[3],第一时间组织应急处置工作是快速有效管控燃气泄漏事态,防止燃气突发事件进一步扩大的关键一步,也是降低燃气事故损失的关键性因素。而历史燃气事故数据中的应急措施和经验教训具有很高的学习价值,若能从历史燃气事故数据中吸取有益的教训、经验,将对燃气事故的防范和快速处置具有积极意义[4]。目前,世界上多数油气储运业发达的国家均建立了管道失效或事故数据库,用于指导本国油气管道的设计、建设和风险管理,并取得了良好的应用效果;然而,国内目前在管道定量风险评价方面尚处于起步阶段,发展的瓶颈正是缺少一套基于国内管道历史数据的失效数据库。因此,建立失效数据库是提高我国管道风险管理水平、保证管道安全可靠运行,亟需开展的一项基础工作[5]。城市燃气事故案例库是将城市燃气体系运行中实际发生的突发事件集合在一起,采用统计与推理的方式对历史案例进行统计与分析,以此形成能够统计管道事故的历史案例,为新发生的事故提供一个相似度匹配,快速知晓历史相似案例,从历史相似案例中获取有效的应对措施,从而提高应急响应效率。

耶鲁大学Roger Schank教授对动态记忆的描述是案例推理技术的起源,案例推理作为人工智能领域技术研究中的重要一项,其基本原理是参照人类大脑思考问题的方式,若是历史相似情景问题,用历史案例的解决办法来解决新增案例[6]。在案例推理技术的实际应用中,其解决问题的基本过程包括4个步骤:案例标准化输入、案例关键词检索、案例相似度匹配和案例保存。目前其在医疗诊断、法律系统以及事故预测等领域具有广泛而深刻的作用[7]。案例间的相似度匹配是案例推理技术的核心所在,众多科研人员在此领域上提供了一系列的计算模型与方法,如向量空间模型、神经网络模型、主题模型,以及KNN算法、句法分析法、搜索引擎法等。如文献[8]利用公共字符串的信息熵评价文本相似度,从公共字符串来考虑文本的相似度;文献[9]通过采用已处理文本、语义特征提取和语义相似度计算方法,建立了公共安全事故案例语义相似度计算模型;文献[10]针对维基百科中历史人物的词条和标签描述,将有关历史人物信息的维基百科页面转换为矢量表示,从而能够量化信息相似度;文献[11]提出使用词向量计算文档相似度的新方法,即在词向量空间里计算将文档中所有的词移动到另一文档对应的词需要的最小移动距离(Word Mover’s Distance, WMD),求解出来的WMD则是2个文档的相似度。

1 构建城市燃气事故案例库信息指标体系

本文的城市燃气事故源信息取自燃气事故报告以及博燃网等,由于事故案例的相似度的计算需要,本文根据燃气事故发生的时间、位置信息与类型、致灾源概况及事发原因对城市燃气事故信息指标体系进行具体分类[12]。城市燃气事故案例信息指标体系见表1所列。

表1 城市燃气事故案例信息指标体系

在城市燃气事故信息指标体系中,事发信息指标由3个二级信息指标构成,其主要用于统计事故发生时的状态信息。根据事发信息指标,采用相似度匹配计算的方法可得出新增案例与历史案例集合之间的初步相似度匹配。事后信息指标主要用于描述燃气事故的严重程度以及事故造成的危害程度。再者其进一步的作用是通过该指标能清晰了解到新增案例与匹配到的历史案例之间的后果差异,并通过此差异进一步分析新增案例与相似历史案例之间产生分歧的原因,为当前事故的应急措施提供借鉴,以提高事故应急响应效率。

由于案例相似度计算是标准化数值之间的运算,所以在此之前需对各项信息指标做标准化处理以方便运算。城市燃气事故信息各类指标统计值如图1所示。

图1 城市燃气事故信息指标分类值

在地理位置指标中,为扩大案例库的地理位置收录范围,特在实际指标值中增添了国外位置信息。室内外事故直接原因指标项因室内与室外燃气承载体不同,两者事发的空间场所不同,以及事故造成的后果也大不相同,故分开详细探讨了事故原因。在室内外事故直接原因中,前5个实际指标值仅仅是室内事发原因的具体指标值,而后5项则是室外事发原因的具体指标值,当事发原因都不满足前10项指标值时,才选择列为最后一项指标值:其他因素。城市燃气事故等级分级分为一般事故、较大事故、重大事故、特别重大事故及其他事故五类[13]。表1中的事发信息指标与事后信息指标的各项具体分类值均可直接从事故报道或者事故报告中获取。

2 建立城市燃气安全事故案例库

本文共搜集了2012—2019年发生在国内外不同类型的243起大小不一的城市燃气安全事故案例,每个城市燃气事故案例将按照“事故概述+事故描述”的固定文本格式进行输入编辑,详情见表2所列,其主要目的是对本文搜集好的243起案例能够进行清晰汇总并可快速找到表1和图1中的相关具体指标以及分类值,而得到的相关具体指标与分类值便构成了城市燃气事故案例库。表3便是最终构建好的城市燃气安全事故案例库。一个独立的城市燃气事故文本直接按照表2中的事故标题进行命名,例如:温州燃气管道泄漏事故。另外本文截取了一部分按照3个表格整理出的城市燃气安全事故案例库,详情见表3所列。

表2 案例文本固定形式

3 城市燃气安全事故案例相似度匹配具体计算

3.1 指标权重计算

根据熵值法计算指标权重。权重系数是表示在其他指标不变的情况下,某一确定指标的变化对结果产生的影响[14]。在已建立的信息指标体系中,由于各个指标量纲不同,必须根据实际情况合理确定各指标的权重系数,故无法轻易通过专家打分法来主观地确定各项指标的权重系数大小。熵值法是度量不确定性的一种客观赋值法。当信息熵越大(小)时,该指标的不确定性就越大(小),权重系数就越小(大)[15]。熵值法计算指标权重的具体方法如下:

(1)若在案例库中总共有n个案例、k个信息指标,那么Xij为第i个案例的第j个信息指标属性值(i=1, 2, ...,n;j=1, 2, ...,k),对各个信息指标的数据进行标准化处理,各信息指标属性值的计算公式为:

网络时代的到来为人工智能的研发提供了机遇与驱动力。计算机网络,尤其是互联网,是理想的人工智能实验床,因为整个互联网就可以看成是一个传感器密集、大规模并行的自治、虚拟机器人系统。

式中:Xij为第i个案例的第j个信息指标属性值(i=1, 2, ...,n;j=1, 2, ...,k);Yij为各Xij数据标准化处理后的值;maxXij为第j个信息指标属性的最大值;minXij为第j个信息指标属性的最小值。

(2)根据信息熵的定义,计算第j个信息指标属性值的信息熵,那么第j个信息指标属性值的熵值Ej按式(2)进行计算,其中pij按式(3)进行计算:

式中:Ej为第j个信息指标属性值的熵值;pij为在该信息指标总属性值中,第i个案例的第j个信息指标属性值的所占比重。

(3)计算各项信息指标属性值的权重,根据熵值公式(3)得出各个指标的信息熵为E1,E2, ...,Ek,而后第j个信息指标属性值所占权重按式(4)计算:

式中,Wj为第j个信息指标属性值的权重。

3.2 城市燃气安全事故案例相似度计算

本文基于熵值法确定各项信息指标权重后,那么各信息指标权重集合便为W=(ϖ1,ϖ2, ...,ϖk),采用向量空间相似度计算方法,建立城市燃气事故案例相似度计算模型。假设历史案例构成集合为T=(T1,T2, ...,Tn),新增案例为Z,那么历史案例中的任意一个Ti都是由k个信息指标构成的,故历史案例Ti的信息指标属性向量可写成Ti=(A1,A2, ...,Ak),新增案例Z的信息指标属性向量可写成Z=(B1,B2, ...,Bk),则历史案例Ti与新增案例Z之间的相似度计算公式为:式中:Aj与Bj分别为历史案例Ti与新增案例Z的第j个信息指标数据标准化后的值;ϖj为第j个指标的权重。

本文根据相似度计算公式可计算出案例库中n个历史案例与新增案例之间的向量空间相似度集合,也就能进一步得出案例之间的相似度集合。

4 城市燃气安全事故具体案例分析

本文将从网络上搜集到的一起案例作为新增案例,用于计算与案例库中历史案例进行匹配和具体分析。该新增案例为2012年6月30日16:06发生在湖北省恩施土家族苗族自治州利川市南坪乡某工地上的一起天然气管道泄漏燃烧事故。将该新增案例以案例文本固定形式表达,以便对各个指标信息的分析统计。对各个指标信息统计完全之后,将该案例按照各统计信息指标分类值输入保存至案例库中,对新增案例与各个历史案例进行相似度计算,得出最高相似度案例。并对相似案例与新增案例进行差异分析,得出造成该结果差异的有效结论,对新增案例提出有效的防范与应急措施。

4.1 计算各项信息指标权重

本文采用熵值法计算出各项信息指标权重,对表1中的事发信息指标,也就是前14个具体三级指标进行相似度匹配的初步计算,而事后信息指标中剩余的6项三级指标是用来对匹配结果与相似案例之间进行差异分析的。各项信息指标的权重计算结果见表4所列。

表4 各项信息指标权重计算结果

4.2 案例相似度计算与匹配分析

根据案例文本固定形式对新增案例进行规范性表示,再根据案例信息指标体系对新增案例各信息指标轮流进行统计,并按照表2的指标统计分类值确定新增案例的信息指标属性向量,详情见表5所列。

表5 新增案例信息指标属性向量

在计算出指标权重的基础上,结合相似度计算模型,利用MATLAB计算出新增案例信息指标属性向量与历史案例信息指标属性向量之间的相似度,并选取排名前几位的相似案例,就该结果对新增案例与相似案例间的事后信息指标差异进行详细剖析。新增案例与历史案例相似度排名前8的案例见表6所列。

表6 案例库中排名前8的相似历史案例

在上述匹配结果中,排名前8位的相似案例的事故发生地全部集中在乡镇郊区等城市边缘地带,而事故的直接原因均为人为造成的第三方破坏因素,具体都是由于施工人员在施工过程中不慎对燃气管道造成破坏,使得中高压管道天然气泄漏。并且,在上述相似案例中,第229号案例和第25号案例事发时造成的事故类型结果均为火灾事故类型。针对同样为由第三方破坏因素而导致火灾事故的新增案例,本文只对排名前2位的相似案例与新增案例进行事后结果差异分析,为新增案例的事故应急措施提供借鉴以提高事故应急响应效率。相似度最高的2个历史案例与新增案例间的指标差异见表7所列。其中第244号案例为新增案例,添置案例库最末尾放置。根据表7可明显看出,229号和25号2个历史案例与新增案例相比较,虽然在事故的所在区域以及发生时间上有所区别,但其都是在当日的下午工作时间段,在工地上发生的天然气管道由施工破坏引发中高压天然气管道泄漏,继而引发火灾的燃气事故,而这2起历史案例的名称分别为2015年的遵义燃气管道火灾一般事故和2012年的马鞍山燃气管道火灾一般事故。另外,本文的新增案例在事故原因、事故地理信息、致灾源各项信息、泄漏部位以及事故造成的首要危害上与上述2起案例都十分相似,但同样是火灾事故,3起事故造成的事故严重程度以及事故后果和财产损失有所差异,这也正是本文要讨论的重点。

表7 相似度最高的2个案例与新增案例的指标差异

新增案例是因一名施工人员在使用电锤钻破水泥地面时,不慎钻破埋设在地下的天然气管道,导致管道天然气泄漏,而泄漏的天然气遇上高速旋转的电锤产生的电火花,瞬间被引燃,火焰高达3 m,致使该名施工人员被严重烧伤,而此时由于出事管道两端阀门间的距离近10 km,管道里有大量余气,仍在继续泄漏、燃烧,火情愈演愈烈,有逐渐向外蔓延的趋势,而后引燃了路边的农作物,造成部分农作物和树木受损。最终该事故造成一人受重伤,周边居民用气受到较长时间的影响,以及4万元以上的经济损失。相比上述2起最相似历史案例未造成人员伤亡及财产损失,只造成周边居民用气受到影响,新增案例的伤亡损失情况着实有些严重。

4.3 新增案例的防范与应急措施

事故发生的原因主要是现场施工单位对地下管线走向的不清楚、不熟悉而造成的野蛮施工致使管道破裂,天然气发生泄漏。根据历史相似案例同样的火灾类型事发情景以及火灾事故应对措施对新增案例提出一些有效应急措施:

(1)燃气企业应加强天然气管道的运营管理安全,特别是要加强乡镇地区人员密度高的后果严重区域以及地质情况不明区域管段的管理安全,强化巡查力度,必要时应进行管道监测,进一步完善应急预案,加强应急能力建设,开展应急演练。

(2)现场施工企业应切实加强施工现场管理,加强监督检查,清楚地下管线走向后谨慎施工,履行好现场施工管理职责,坚决防范类似事故发生,切实履行安全生产责任与社会责任。

(3)现场人员应及时报警并通知燃气公司现场情况,疏散管道附近群众至安全区域,对过往车辆实施交通管制,及时送伤者前往医院救治。

(4) 燃气企业要完善险要情况处置措施,鉴于天然气管道发生破裂泄漏后的严重危害,今后在处置此类管道事故时,要根据实际情况采取有效的即时安全措施,比如:停止输气和减小压力,但要确保处置过程安全有效。

5 结 语

本文通过构建城市燃气事故案例信息指标体系,对各项信息指标进行详细分类和取值,以此在搜集好的、按标准文本格式整理好的243起城市燃气事故案例的基础上来构建城市燃气安全事故案例库。用熵值法计算得出各个信息指标权重,通过MATLAB计算案例相似度,构建城市燃气事故案例相似度计算模型。然后将构建好的模型运用到实际分析中,可以从构建好的案例库中快速匹配到与新增案例相似的历史案例,详细分析与相似案例之间的指标信息相似性,可得出该相似度匹配模型是真实有效的。通过采纳历史相似案例的防范与应急措施,结合新增案例自身的实际事故情况,得出企业应加强管道的运营安全管理,进一步完善应急预案,加强应急建设、施工现场管理、监督检查,以及事发时应立即采取有效的即时安全措施,减小事故危害程度。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!