时间:2024-05-04
王 健,于万钧
(上海应用技术大学,上海 201418)
煤矿企业在瓦斯隐患安全检查中积累了海量的数据,这些多参数、多维度、结构化与半结构化的数据随着时间呈指数型增长,急需得到有效的分析和利用[1]。传统的数据管理方案无法应对这些体量大、类型多、价值密度低、关系复杂的隐患数据,且传统的隐患数据分析只注重物的不安全状态,却忽略了其中人的不安全行为。由此提出将大数据技术和行为安全理论相结合。将瓦斯安全隐患依据行为安全理论分为人的不安全行为和物的不安全状态,利用Hadoop 平台存储瓦斯行为安全隐患大数据,并从中分析、找出反复发生的不安全行为及物态,指导安全管理者有针对性地进行安全教育,从而改变作业人员的安全思维模式,纠正不安全习惯以及改正不安全行为,预防瓦斯事故的发生。
随着煤矿企业信息化程度日益提高,瓦斯安全隐患的大数据特征越来越明显:一是体量大,指的是安全隐患数据持续采集,构成了海量的历史数据;二是速度快,指的是随着传感器的增多,数据生成速度快速增长;三是模态多,既包含安全检查人员记录的结构化安全隐患,也包括各种监测设备记录的半结构化和非结构化数据;四是价值大密度低,海量的隐患数据中能为安全管理提供指导的数据量极少[2]。所以用大数据技术处理瓦斯隐患是可行的。
行为安全理论是一套事故预防的理论和方法,根据行为安全理论,可以把事故致因分为人的不安全行为和物的不安全状态[3]。其中,物的不安全状态可以分为两类:第一类是由于人的不安全行为造成的,如随意操作通风设备导致通风量低、瓦斯聚积;第二类是既成事实的不安全物态,作业人员没有引起足够重视,如作业人员在不检查瓦斯量的情况下,随意操作设备,如更换矿灯。由于作业人员安全习惯、安全意识、安全理念等缘故,不安全的行为在日常作业中具有普遍性、多发性的特征。传统的安全管理方法只注重结果不重视过程,容易使作业人员产生侥幸心理。行为安全理论不仅关注不安全物态,也关注作业人员的不安全行为,旨在通过对作业人员的安全教育减少工人冒险行为,避免不安全的行为重复发生,最终防止事故发生。
Hadoop 是一个可靠且可扩展的存储和分析平台,对结构化和非结构化数据的处理非常有效,具有扩容能力高、成本低、效率高及可靠性强的特点。为此,提出基于Hadoop 的瓦斯行为安全管理模型,如图1 所示。该模型通过行为观察员手工录入或监测设备自动录入等方式,将瓦斯行为安全隐患大数据存入Hadoop 中的HDFS中。通过批处理技术MapReduce 并行框架处理,最后将处理结果反馈给安全管理人员,安全管理人员根据处理结果有针对性地开展瓦斯行为安全教育。
HDFS 是Hadoop 生态圈的重要组件,可以解决瓦斯行为安全隐患数据的存储问题,HDFS 采用主从架构,有一个主节点和多个从节点。数据被分块存储在从节点中,每份数据默认存储3 个副本。根据行为安全理论,将瓦斯隐患数据分为人的不安全行为和物的不安全状态。其中,人的不安全行为又可分为未穿戴防护用品、作业前未检查工作场所安全状况、疲劳上岗、不安全的操作设备、吸烟、其他;而物的不安全状态分为瓦斯浓度不安全、氧气含量低、通风量低、温度高、其他。其中人的不安全行为主要靠行为观察员记录并存储到HDFS 中,而物的不安全状态则由传感器等监测设备自动传入HDFS 中。基于HDFS 的瓦斯行为安全隐患数据存储模型如图2 所示。
图2 基于HDFS 的瓦斯行为安全隐患数据存储模型Fig.2 Data storage model of gas behavior safety hidden danger based on HDFS
MapReduce 是一种分布式并行计算框架,是大数据处理的关键技术,能够解决瓦斯隐患安全大数据的分析问题。基于MapReduce 的瓦斯隐患分析模型如图3 所示。MapReduce 由Map 阶段和Reduce 阶段组成,Map 阶段读取数据内容,并解析{key1,value1}键值对,通过自定义的函数处理产生{key2,value2}键值对,并把输出结果进行分区,然后发送给Reduce。Reduce 阶段对Map阶段的输出结果进行合并、排序,通过自定义的函数处理产生{key3,value3}键值对,并将其作为结果输出回HDFS 中。
图3 基于MapReduce 的瓦斯隐患分析模型Fig.3 Analysis model of gas hidden danger based on MapReduce
根据某矿在一段时间内5 次行为安全检查记录,从中筛选出与瓦斯安全隐患相关的不安全行为及不安全物态并编号,且进行数据预处理,结果如表1 所示。
表1 中,i1~i9分别表示作业人员未穿戴防护用品、作业时未检查工作场所安全状况、疲劳上岗、不安全操作机电设备、吸烟、瓦斯浓度高、氧气含量低、通风量不足、温度高。
表1 安全检查记录预处理后的结果Table 1 The result of preprocessing of security check records
1)执行第一个MapReduce 任务,用于统计元素项出现的次数,以此找出频繁项。Map的输入为<tid,items>键值对,表示一次检查中不安全行为与不安全物态的集合。Map 的输出为<item,1>键值对,表示某个不安全行为或不安全物态出现了1 次。Reducer 的输入为<item,{1,1,...}>键值对,表示某一不安全行为或不安全物态与出现次数的序列,Reduce 对出现次数的序列做求和操作。Reduce 输出为<item,sum>,即某一不安全行为或不安全物态总的出现次数。设置最小支持度support=2,移除表1 中不满足最小支持度的元素项,得到频繁项列表F-List。将每次记录中的元素项按支持度排序,结果如表2 所示。
表2 移除非频繁项并重新排序后的结果Table 2 The result of removing infrequent items and reordering
2)执行第二个MapReduce 任务,用于完成FP-Tree的构建。把频繁项目列表F-List 分组,形成G-List,如按照元素项出现频率大小分组。如支持度大于2 的为一组,支持度等于2的为一组。Map的输入为<tid,items>,表示一次检查中不安全行为与不安全物态的集合,Map的输出为<group,tid>,把属于同一个组的记录发送到一个处理节点上形成完备数据集。Reducer 根据分到同一个分组中的元素项创建FP-Tree。
3)根据FP-Tree抽取条件模式基、构建条件FP-Tree。
4)重复步骤3)直到构建的FP-Tree只包含一个元素。
经过筛选后,得到用的频繁项集为{i4,i6},{i4,i6,i2},{i2,i6}。通过对结果分析,表明该矿在瓦斯浓度不安全时经常有不安全操作机电设备的情况发生,不安全的机电操作易产生电火花,有发生瓦斯爆炸的风险。此外,也应关注作业人员疲劳上岗与不安全操作机电设备可能发生的危险和作业人员因疲惫在瓦斯浓度不安全的地方休息可能发生的危险。据此,安全管理者可以有针对性地对作业人员的这些不安全行为进行教育,防止事故的发生。
本文针对瓦斯安全隐患数据无法充分利用的问题,提出建立基于Hadoop 的瓦斯行为安全大数据存储分析模型,该模型可以充分解决瓦斯安全隐患数据的存储和分析问题。把行为安全管理理论引入到瓦斯安全管理中。将瓦斯安全隐患分为人的不安全行为和物的不安全状态。利于针对性的实施行为安全教育。运用基于MapReduce 的并行化FP-growth 算法挖掘分析瓦斯行为安全隐患大数据,为煤矿企业安全管理提供指导。从而有针对性地实施行为安全教育,改善企业的安全文化,最终减免事故的发生。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!