当前位置:首页 期刊杂志

矿业安全生产事故时间序列的模糊区间预测

时间:2024-07-28

黄 悦,幸福堂,2,石癸鑫,吴孟龙

(1.武汉科技大学 资源与环境工程学院,湖北 武汉 430081;2.武汉科技大学 冶金矿产资源高效利用与造块重点实验室,湖北 武汉 430081)

近年来,随着采矿业的发展,矿业安全生产事故数量和伤亡人数居高不下,给社会发展带来了负面影响。据近年来我国矿山事故统计显示,2005年至2019年,全国共发生矿业安全生产事故3 826起[1],死亡人数达到14 251人[1],事故起数和死亡人数超过发达国家,安全问题严重制约了我国矿山企业的发展。因此,准确预测矿业安全生产事故对制订合理的矿业安全决策,以及提高矿业安全管理水平具有重要的意义。

矿业安全系统是一个复杂的循环系统[2],矿业安全生产受自然条件、作业环境等诸多因素影响[3]。目前,国内外众多学者对矿业安全生产事故预测的方法展开了研究[4]。刘素兵等[5]将GM(1,1)与支持向量机融合,建立了灰色支持向量机组合预测模型;李怀俊等[6]通过参数寻优改进了ARMA模型,提高了ARMA模型的预测精度;Barman等[7]通过萤火虫算法(Firefly Algorithm,FA)优化SVM的参数,提高了SVM模型的预测精度;刘俊娥等[8]提出了一种模糊信息粒化与SVM相结合的方法,对瓦斯涌出量进行了预测;JANG Y J等[9]使用长短期记忆(LSTM)递归神经网络(RNN)的深度学习模型来预测业务失败;WU Menglong等[10]对经验模态分解后的序列单独分析,建立预测模型来预测矿山安全生产形势。然而上述方法预测效果的鲁棒性较差,并且只能得到矿业安全生产事故的点预测结果,目前关于矿业安全区间预测的研究还较少。区间预测是一类既含有确定性又含有不确定性的预测[11]。为此,考虑将模糊信息粒化引入到矿业安全生产事故预测中,得到矿业安全生产事故时间序列的模糊区间预测结果。区间预测能够提供对应某一期望概率的区间预测结果,获取比确定性预测结果更多的信息,有利于决策者评估矿业安全生产事故的不确定性和风险因素,做出更为合理的决策[12]。因此,准确预测矿业安全生产态势的变化趋势和变化空间,在实际应用中具有重要的参考价值和指导意义。

笔者先将矿业安全生产态势时间序列进行小波变换,然后采用样本熵将子序列重组,将重组的分量按照一定窗口进行模糊信息粒化,得到能够反映原始数据特点的信息粒;最后基于FCM对窗口化的 3个参数序列进行预测,以实现矿业安全生产事故时间序列的模糊区间预测。

1 模型的建立

通过小波变换和样本熵(SE)算法将矿业安全生产事故的时间序列分解并重组,然后采用模糊信息粒化的方法,将矿业安全生产事故时间序列模糊粒化,得到Low、R、Up共3个粒化参数时间序列;最后依据模糊C均值聚类算法对窗口化的时间序列进行预测,建立矿业安全生产事故时间序列预测模型。

1.1 时间序列的分解与重组

原始时间序列x(t)的小波变换可以表示为[13]:

(1)

式中:s为伸缩因子;t为时间;τ为平移因子;φ*为小波基函数φs,τ的复共轭。

小波基基于以下2个原则确定:

1)能—熵比准则

将能量与熵结合起来形成一个新准则,即能—熵比准则[14],见下式:

R(j)=Eenergy(j)/Eentropy(j)

(2)

式中:Eenergy(j)为原始时间序列在第j分解水平时小波系数序列包含的能量;Eentropy(j)为原始时间序列在第j分解水平时小波系数序列的Shannon熵。

由式(2)可以看出,能量越大,熵越小,则能—熵比越大,小波基[15]越优。

2)相关性准则

在处理和分析时间序列时,相关性分析[16]是一种在时域中对序列特性进行描述的重要方法。

矿业安全生产事故时间序列的细节和近似部分可通过低通和高通滤波器获得,通过对第(j-1)分解水平的近似系数与低通滤波器系数进行卷积,可以获得第j分解水平的近似系数:

(3)

式中:aj,k为近似系数;dj,k为细节系数;h、g分别为所选取的小波函数对应的低通和高通滤波器的抽头系数序列;m为维度;k=1,2,…,m。

经过小波变换后的时间序列具有一定重复性和复杂性,故采用样本熵算法对各分量时间序列进行重组。

样本熵的计算过程如下[17]:

1)将小波变换后的序列按序号形成n维的向量组Xm(1),…,Xm(N-m+1),其中Xm(i)={x(i),x(i+1),…,x(i-m+1)},1≤i≤N-m+1。

(4)

3)定义B(m)(r)为:

(5)

4)将维数m增加至m+1维,对m+1维向量重复步骤1)~3)得到B(m+1)(r)。

5)该序列的样本熵值为:

(6)

式中:m为重构维数,一般取m=2;r为相似容限,一般为原始数据标准差的0.10~0.25;n为数据长度。

1.2 重组序列的模糊信息粒化

根据一定的窗口w将原始时间序列分割成一些子序列。原始时间序列窗口以1个季度为1个单元,然后进行模糊信息粒化,得到窗口化后的3个粒化参数时间序列[18]。模糊信息粒化后模糊粒子的隶属函数为[19]:

(7)

式中:x为论域中的变量;a、m、b为参数,对应窗口模糊化后得到的3个变量Low、R、Up;Low为窗口变化的最小值,R为窗口变化的平均值,Up为窗口变化的最大值。

1.3 基于FCM的窗口化序列模糊预测

基于FCM对窗口化的时间序列进行预测,FCM的建模过程如下[20]:

1)确定聚类中心数。设原始矿业安全生产事故时间序列为Xt,t=1,2,…,N;待预测值为XN+1。首先对原始序列进行聚类,通过下式确定原始序列的聚类中心数:

(8)

式中:c为聚类中心数;Xmax、Xmin为原始序列中的最大值和最小值;[]为取整运算。

2)初始化聚类中心。根据式(8)计算得到聚类中心数,随机选定初始聚类中心Ck。Ck是一个长度为c的向量,k=1,2…,c。

3)计算目标化函数。FCM的目标化函数为:

(9)

式中:Ck为模糊组i的聚类中心;uij为属于第i个聚类的隶属度,介于0~1;dij为第i个聚类中心与第j个数据点间的欧几里得距离。

2 模型应用

以2005—2019年矿业单位从业人员事故的万人死亡率为研究对象,统计得到全国矿业事故万人死亡率时间序列,如图1所示。

图1 2005—2019年全国矿业事故万人死亡率时间序列

2.1 小波变换

采用能—熵比准则及相关性准则选取最优小波基,并依据相关性准则确定临界分解水平。

笔者采用较为常用的dbN(1~10)、coifN(1~5)、symN(2~10)3种小波系选取最优小波基。

2.1.1 能—熵比准则的计算结果

基于能—熵比准则的计算结果如表1所示。

表1 基于能—熵比准则R(j)的计算结果

将表1中数据依据时间序列比值高低排序,结果如表2所示。

表2 基于能—熵比准则R(j)对小波基的排序

2.1.2 相关性准则的计算结果

基于相关性准则的计算结果如表3所示。

表3 基于相关性准则的计算结果

将表3中数据依据相关性系数大小进行排序,排序结果如表4所示。

表4 基于相关性准则对小波基的排序结果

2.1.3 小波基优选结果

计算表2、表4中小波基的得分,根据其对应的分值进行排序,排序结果如表5所示。

表5 小波基排序结果

由表5可知,小波基coif5得分最高,coif5为最优小波基。

2.1.4 临界分解水平的确定

基于临界分解水平判别准则,对曲线的临界分解水平进行分析判断,得到各分解水平趋势序列与原始矿业安全生产事故时间序列的相关性系数,结果如图2所示。

图2 各分解水平的相关性系数

由图2可知,矿业安全生产事故时间序列曲线分解水平大于5时,相关性系数发生显著变化,故确定临界分解水平为5。

2.1.5 时间序列的分解

在确定最优小波基和临界分解水平后,利用MATLAB小波工具箱对其进行小波变换。矿业安全生产事故时间序列5分解水平小波变换后的结果如图3所示(图中S代表原始序列,ai代表近似部分,di代表细节部分)。

(a)细节部分 (b)近似部分

由图3可知,随着分解水平的增加,细节部分逐渐被提取出来。经过5分解水平小波变换后,可以满足矿业安全生产事故时间序列分解的要求。

2.2 分量重组

基于矿业安全生产事故时间序列进行小波变换后的子序列,计算给定序列与子序列的样本熵值,各分量的样本熵如图4所示。

图4 各分量的样本熵

根据子序列样本熵的分布情况,取λ=0.2。d1为随机分量;d2~d4重组为细节分量s;d5、a5重组为趋势分量r。重组后各分量结果如图5所示。

图5 重组后各分量

2.3 重组分量的信息粒化

由图5可知,样本熵重组后的序列具有随机性、波动性等特点。为此,先将原始数据按照一定窗口进行模糊信息粒化,将矿业安全生产态势时间序列的万人死亡率模糊信息粒化为Low、R、Up共3个参数,3个子序列的模糊信息粒化结果如图6所示。该例中Low具体为窗口化子序列每月变化的最小值,R具体为矿业安全生产态势万人死亡率每月变化的平均值,Up具体为矿业安全生产态势万人死亡率每月变化的最大值。

(a)d2序列粒化

(b)d3序列粒化

(c)d4序列粒化

2.4 基于FCM的窗口化子序列模糊预测

对于窗口化的时间序列,按照窗口模糊信息粒化结果将其分成6个数据集,根据每年数据情况确定讨论区间的上下界计算模型的论域。基于样本数据求得的隶属度值见表6,样本模糊化后的结果如表7 所示。

表6 样本隶属度

表7 样本模糊关系

由表6和表7并结合式(9)计算,求得测试集预测结果,如表8所示。

表8 测试集预测结果

合并窗口化后,矿业安全生产事故时间序列的模糊区间预测结果如图7所示。

图7 窗口化区间预测结果

3 模型的验证

利用训练集150组样本建立的模型,对2018年7月至2019年10月测试集的21组数据进行预测,并计算区间上下边界值与中值的预测值,结果如表9 所示。

表9 测试集预测误差对比

由表9可知:R值的平均相对误差为17.737 1%,Up值的平均相对误差为8.771 2%。Up值的预测精度明显高于R值的预测精度,表明模糊信息粒化后的上下边界值能够较为准确地描述矿业安全生产事故的变化范围。

将矿业安全生产事故时间序列的模糊区间预测模型与小波-SVM(支持向量机)、小波-ARMA(自回归滑动平均模型)和小波神经网络的预测效果进行对比,各模型的预测误差分析如表10所示。其中,MAE为预测值和实际值之间的平均绝对误差;MRE为绝对误差与真实值的比率,即平均相对误差;RMSE为均方根误差,其对异常值更为敏感。

表10 各模型预测误差对比分析结果

由表10可知,本文预测模型的MAE、MRE、RMSE分别为0.445 7%、13.254 1%、0.372 3%,各项指标均低于对比模型,表明本文模型预测效果较为稳定,精度较高。

4 结论

1)提出一种矿业安全生产事故时间序列的模糊区间预测模型,能够将矿业系统中的随机因素等考虑进去,相较于定量值的点预测,区间预测的结果更为可靠,更具有实用价值。

2)R、Up值时间序列预测的平均相对误差分别为17.737 1%、8.771 2%。边界值的预测精度较高,表明模型的区间范围较为可靠,也进一步地说明了模糊信息粒化后的边界值结果的合理性。

3)相对于小波-支持向量机、小波-自回归滑动平均模型和小波神经网络的预测结果,本文的预测模型平均绝对误差(MAE)、平均相对误差(MRE)、均方根误差(RMSE)3个指标均为最小,表明训练得到的模型具有较高的可靠性,对矿业安全决策具有一定的指导意义。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!