时间:2024-05-04
杨宸,何元清
(中国民用航空飞行学院,广汉 618307)
随着社会经济的快速发展,各国都加强了对航空产业的推进与发展,其中航空安全一直是各个国家不断追求和探索的重要主题,故必须提高数据利用率,将多源数据整合分析,为了解决这一问题并降低事故发生率,可以选择借助知识图谱进行知识组合,以确保数据的充分利用。
国外早在上世纪便已经对民航安全监管做了大量理论研究,并且也一直应用于实践之中[1]。如美国早在1938年就通过了航空安全法案开始用法律约束安全监管工作[2],因此美国安全监管也逐渐从法规监管阶段发展到如今的系统安全监管[3],并逐渐形成现如今较为健全的安全监管体系[4]。
当前国内主要是针对集中风险评估、分析和预测等信息进行研究,提出的利用贝叶斯网络对民航突发事件因果关系进行分析[5]、对面向民航运营的组合安全进行评估[6]和对稀疏降噪自编码神经网路的通用航空风险进行预测[7]等方法,缺少对航空安全监管态势量化表示、多源航空安全数据的关联以及对航空安全监管态势的分析。民航安全监管态势的量化表示是指针对现有的基于监察结果初步统计的态势评判存在的全面性不够、区分度不强的问题,提出基于监管事项指数的量化表示方法;多源民航安全数据关联是指分析航空安全事故报告数据,构建航空安全知识图谱,建立基于知识图谱的多源航空数据关联方法;而航空安全监管态势的分析及可视化指的是面向事项、时间、地区、监管对象等不同维度,研究基于监管事项指数的分析方法。
从本质上来讲,知识图谱可以被视为能够展示其实体之间关系的语义网络,亦可将其视为一个结构化的语义知识库。此处要明确“信息”和“知识”的区别。“信息”指的是对外部客观事实的描述;“知识”是对外部客观规律的归纳和总结,实现这个目标并不简单。但是换一种思路来想,如果能够在一定信息的基础上,尝试把各实体联系起来,那么所得到的结果便是“知识”。我们所要研究的知识图谱便是由这样一条一条的知识组成,而每条知识都可以简单的被视为一个SPO三元组,即主谓宾三元组。如图1所示。
图1 主谓宾(SPO)三元组
目前大多数知识图谱工作原理相比过去已经有了很大区别,其构建方式基本可以分为两类:“自底向上”和“自顶向下”。曾经知识图谱采用的是“自顶向下,先定义,后加入”的工作模式,具体是指在获得较高质量数据的基础之上,提取出相关的文本与模式信息,随后将提取出的信息导入数据库。若其应用范围不是某个特定领域(如民航、金融、医学等),则数据的来源一般是维基百科等百科类网站。然而目前知识图谱主要是采用“自底向上”的构建方式,采用适当的技术手段,从数据集中提取相应的模式,在所提取的模式之中再选取置信度较高的新模式,在导入数据库之前,还要进行一定的人工审核,使得结果更为精确和完善,可以理解为是对从前“自顶向下”构建方式的进一步优化,这其中包含对原始数据的区分、信息抽取、实体对齐、知识融合、本体抽取、质量评估、形成知识图谱等环节。其总体构建思路如图2所示。
图2 知识图谱总体构建流程
图注:
原始数据包含:结构化数据,半结构化数据,非结构化数据;
信息抽取包含:实体抽取,关系抽取,属性抽取;
实体对齐包含:指代消解,实体消歧
现阶段,我国民航业对于飞行安全监管存在全面性不够、区分度不强、前瞻性不足、信息碎片化等问题。主要是对信息的利用不够充分。在民航飞行安全信息分析(主要分析方法是以文献[4]中的REASON模型为基础)方面,最终所得到的评估指标体系,主要是基于人、飞行器、所处研究环境、管理而建立,成果也绝大部分都集中在航空公司的安全运行领域。另外,在确定指标权重之时,不可避免的会掺入相关专家的主观因素,这便会导致结果没有较强的客观性。并且以上都是基于监察结果初步统计所得出的态势评判,不难看出其中存在一定的局限性。
除此之外我国当前传统的监管体系还存在监管力度不够,没有较为全面的法律法规做支撑等问题。
新一代民航监管引入了监管事项指数来刻画民航安全监管态势,为其分析、监管提供了新的方法,并且能够突破上述所提到的监察结果全面性不够、区分度不强等难题。同时由于目前民航监管还存在粗放监管、对数据利用不充分的情况,所以在新一代民航监管体系研究中提出了将知识图谱应用于多源航空安全数据分析中,目的是为了对实现差异化的行政监察计划管理提供技术指导。其技术路线如图3所示。
图3 新一代民航安全监管技术路线
基于知识图谱的新一代民航监管体系可以解决的关键问题有:
(1)通过构建航空安全知识图谱使得多元数据可视化,充分展示数据细节,方便管理与分析数据。
(2)增强各类数据对航空监管态势影响权重的确定性并且可以更为全面的分析航空安全监管事项指数走势。
(3)通过完善监管事项指数的内涵、特性,做到对航空安全事故的深层次分析。
主要研究方法有:
(1)数据分析法。数据分析法是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程[9]。
(2)特征关联性分析法。用来研究各个现象之间是否存在某种联系,并对相互存在联系的事件及现象进行探讨,归纳总结后得出结论。常用到的分析方法有图表法与相关系数法。
(3)知识图谱可视化。用来展示各个实体之间的关系,将错综复杂的关系清晰化。最常用的可视化方法是三元组显示方法,图中的节点表示实体,节点间的线段表示实体之间的关系,即用关系来连接两个实体。其中实体和关系均要进行清晰的标注以实现对已有信息的快速精准查询。
(4)主成分分析法。一种多元统计方法,通过对少数主要成分的推算得出多个变量的研究方法。
(5)层次分析法(analytic hierarchy process,AHP)。一种定性与定量分析相结合的多目标决策方法,主要思想是将复杂问题分解,使其层次化,并通过建立各要素的层级,清楚的实现各层、各要素及各准则之间的关系。
“监管事项指数”是监管部门整合了一定民航安全事故数据之后,形成的在一定时间之内“关键词”的动态指数变化,目的是方便监管人员直观的看出所发生的高频事故原因等相关信息。实际上知识图谱主要是依据数据库进行存储且可将其视为一种图数据库,故对于知识图谱的标准查询语言为SPARQL(simple protocol and RDF query language)。如想查询在某一环境发生的飞行事故,可以使用命令“select”从图谱中获取有效数据。随后可以根据已有的数据进行分析,推测未来是否会在相同的环境下发生事故,以达到在未来降低风险的效果。
监管事项指数可以量化表示地区、监管对象在某个监管业务或监察项目方面的相对状态,同时也可以探索基于知识图谱的航空安全事故报告各实体之间及实体间关系的方法,实现多个开源的航空安全数据与监管态势之间映射关系,最终制定面向精准的监管计划,为实现差异化的行政监察计划管理提供更为合理的科学依据。因此,多源数据驱动的航空安全态势分析是民航精准监管的一项重要基础性工作,也是以状态感知为前提的民航智慧监管建设的基础之一。
知识图谱应用于民航安全信息监管的好处是可以充分展示数据细节,使抽象数据可视化、文本数据图示化,方便空管部门查询管理。本案例中所采用的数据为航空事故的文本描述,包含大量的SPO三元组,如对于保加利亚的维亚航空公司所发生的事故描述为:
2013年5月24日,一架保加利亚维亚(VIA)航空公司空客A320-200客机(注册号LZ-MDR),执行从德国莱比锡飞往保加利亚瓦尔纳的VL-502航班。当地时间10:19(世界协调时07:19)飞机在瓦尔纳机场的09号跑到着陆,但冲出跑道约270 m,冲过航向标天线,撞到机场围栏后停了下来。机组实施紧急撤离,两位年长女乘客(分别为71岁和81岁)在车里过程中脚踝骨折。最终保加利亚航空事故调查局将事故原因归因于气象预测过程中对气象条件的分析不够深入,以及瓦尔纳机场的气象部门等低估了气象观测对飞机下降的影响。在飞机触地前风俗和风向的动态急剧变化导致了这场事故。
表1 实体属性描述
知识图谱是由各个实体以及实体之间的关系所构成,其中实心圆代表事件本身,四周与其相连的实体为事件属性,节点之间边上的文字代表关系属性。本实例中数据来源于中国民用航空信息网,挑选了其中2012—2014年的部分国际航空事故调查跟踪报告。具体可视化结果如图4所示。
图4 民航事故知识图谱部分展示
保证民航飞行作业持续安全稳定是一项极其艰巨的任务,为了实现这一目标,必须不断完善现有航空安全监管体系。
作为目前大数据时代重要技术之一,知识图谱在各行各业均得到广泛应用。但该项技术在民航领域中还处于探索阶段,其构建过程也需要大量的专家学者支持。因此如何将知识图谱充分的应用于未来民航大数据领域,制定更加完善的行业规范,从而提升飞行安全效率,将成为今后主要研究方向之一。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!