当前位置:首页 期刊杂志

煤与瓦斯突出预测的Bayes-逐步判别分析模型及应用

时间:2024-07-28

李长兴,关金锋,李回贵,辛程鹏

(1.贵州工程应用技术学院矿业工程学院,贵州 毕节 551700;2.中国矿业大学(北京)应急管理与安全工程学院,北京 100083)

煤与瓦斯突出是煤体中储藏的应力能和瓦斯能在极短的时间内失稳释放并向生产空间抛出大量瓦斯和煤岩的现象,是煤矿生产过程中最严重的灾害之一[1]。随着我国煤矿开采机械化水平的提高和开采深度的加深,煤与瓦斯突出矿井的数量和突出强度都呈逐年加大的趋势[2]。国内外学者在煤与瓦斯突出预测工作中进行了大量探索,提出了神经网络法、模糊数学法、电磁辐射法、灰色理论法、混沌时间序列法、免疫遗传法、灾变级数法等[3-11],这些方法在突出预测中取得了很大成效,但也存在一些不足,如灰色理论法中灰数的白化和模糊数学法中的隶属度确定均很困难,电磁辐射法的电磁辐射信号和混沌时间序列法的现场监测数据易受到干扰,免疫遗传法和灾变级数法计算复杂且丢失信息较多等,这些都会造成预测的结果失准。由于煤与瓦斯突出极其复杂且机理尚未可知,突出预测的敏感指标和临界值又很难确定,因此如何准确地对煤与瓦斯突出进行预测是煤矿安全开采中遇到的最大困难之一。笔者基于数理统计分析理论,采用逐步判别法对影响煤与瓦斯突出的指标进行筛选,建立煤与瓦斯突出的Bayes-判别分析模型。从杂乱无章的突出实例数据中寻求各因素与突出之间的内在联系,用直观的数学方法来反映总体间的类别差异,从而有效地对煤与瓦斯突出进行预测。

1 Bayes判别分析法

1.1 Bayes判别分析法基本原理

判别分析法近年来在社会学、经济管理学及自然科学中得到了广泛应用,Bayes判别分析法是其中最具代表性的一种。Bayes判别分析法的基本思想[12]是假设对所要研究的事物已经有了一定程度的认识,常用先验概率来对这种认识进行描述;然后抽取其中一个样本对已有的这种认识(先验概率分布)进行修正,进而得到后验概率分布。各种推断统计都是基于后验概率分布来进行的。

设有k个总体G1,G2,…,Gk,其密度分布函数分别为f1(x),f2(x),…,fk(x),各总体的先验概率分布为q1,q2,…,qk。在对样品x判定归属哪一总体时,可以根据贝叶斯公式计算样品x来自Gi总体的后验概率,见式(1)。

(1)

(2)

式中,L(j/i)为损失函数,它表示把属于总体Gi的样品错判为总体Gj的损失。显然式(2)是错判的平均损失。

当j=i时,L(Gj/x)=0;当j≠i时,L(Gj/x)>0。建立的判别准则见式(3)。

(3)

若满足式(3),则判定样品x归属总体Gj。由于L(Gj/x)不易确定,故常假设各种错判的损失均相等,见式(4)。

(4)

因此,使后验概率P(Gj/x)最大和使错判的平均损失E(Gj/x)最小是等价的,见式(5)。

(5)

1.2 多元正态总体的Bayes判别分析法

在实际中往往遇到的总体服从正态分布,因此下面给出n元正态总体的Bayes判别分析法[13]。

1) 判别函数的导出。由Bayes判别分析法原理可知,使用Bayes判别分析法作判别分析时,首先要知道待判总体的密度分布函数和先验概率分布。一般可用待判样品频率qi=mi/m来代替先验概率,或令各总体先验概率相同,即Σ=Σ1=Σ2=…=Σk,那么n元正态分布密度函数见式(6)。

(6)

式中,Σ(i)和μ(i)分别为总体Gi的协方差阵和均值向量。把fi(x)代入P(Gi/x)的函数表达式中,在计算使P(Gi/x)最大的i时,由于不论i取值为何式中分母都是常数,故有式(7)。

(7)

取对数并将与i无关项去掉后,则判别函数可简化为式(8)。

(8)

式中,i=1,2,…,k,那么判别规则变为式(9)。

(9)

(10)

(11)

合并后的样本协方差阵为式(12)。

(12)

3) 计算后验概率。在进行判别分类计算时,主要根据y(Gi/x)的大小,其次是根据后验概率P(Gi/x)。但知道y(Gi/x)的大小后,便可计算出P(Gi/x),见式(13)。

(13)

因y(Gi/x)=ln(qifi(x))-Δ(x),其中Δ(x)是ln(qifi(x))中与i无关的项。故有式(14)。

(14)

根据式(14)可知,使y(Gj/x)最大的j必然也会使P(Gi/x)为最大。因此,只需将样本x代入到判别函数式中,分别计算y(Gi/x),i=1,2,…,k。其判别规则即为式(15)。

(15)

若满足式(15),则把样本x归属到Gj总体中。

1.3 Bayes判别准则显著性检验

为了考察上述所建立的判别准则与判别函数的准确度,可采用计算误判率的检验方法。通常以样本数据回代估计的方法来计算误判率,具体计算方法如下所述。

通过挖掘整合行业内外资源,开发形成“油气技术”专题,涉及勘探、开发、炼化、管道、工程及销售等专业领域,涵盖油气行业上下游业务。

(16)

2 煤与瓦斯突出预测的Bayes-逐步判别模型

2.1 判别因子的选取

在判别分析问题中,影响判别能力的变量很多,且影响程度大小不一。如果把主要的变量误剔除,那么建立的判别函数其判别效果一定不佳。但判别变量很多而又不加剔除地全部被选入所构建的判别函数,不仅会造成计算量大的后果,还会因变量间的相关度低而使得在求解逆矩阵时计算精度下降,反而会因对判别不起作用的指标过多而干扰判别结果。因此,在进行煤与瓦斯突出预测判别时需对判别因子进行筛选。笔者搜集选取国内某一典型突出矿区的28个突出实例(收集自不同矿井的同一组煤层,该层煤的变质程度为1/3焦煤,且工程地质条件类似),其中20个作为训练样本(表1),另外8个作为待判样本(表4)。采用逐步判别分析法[14-15]对影响煤与瓦斯突出的敏感指标进行逐步判别筛选,由于收集到的突出实例中常用的敏感指标S、K1和Δh2等数据缺失,故采用其他8个敏感指标(瓦斯压力、放散初速度、坚固性系数、煤体破坏类型、开采深度、软分层厚度、瓦斯含量、煤层倾角,分别用x1、x2、x3、x4、x5、x6、x7、x8表示)作为逐步判别因子,其中煤体破坏类型分为5类:非破坏煤、破坏煤、强烈破坏煤、粉碎煤和全粉煤。逐步判别分析法筛选判别因子的方法如下所述。

根据多元统计方差分析原理,定义A为样本数据点的组内离差平方和,T为样本数据点的总离差平方和,此时有:Λ=|A|/|T|,要对某一变量的判别能力的显著性进行分析,操作步骤如下所述。

判别函数中假设已有q个变量,记X*,若考虑是否有必要添加变量Xj,可通过计算偏威尔克斯统计量,见式(17)。

(17)

式中,Λ(X*,Xj)为X*与Xj的威尔克斯统计量。可以证明式(18)。

Fα(k-1,n-k-q)

(18)

表1 训练样本数据及判别结果Table 1 Training sample data and discriminant results

即F进=Fα(k-1,n-k-q),如果有F>F进,则表明变量Xj判别能力显著,在判别函数中相应地有必要增加变量Xj。针对判别函数中已有的q个变量X*,如若存在有对判别能力不显著的变量,则需将其剔除出判别函数。如考虑变量Xk是否可从判别函数中剔除,记剔除Xk的变量组为X*(k),见式(19)。

(19)

此时,若有F

根据以上计算公式,取F进=3.84,F出=2.71作为逐步判别停止的判据。若某一变量F≥3.84时,则表明该变量判别能力显著,需将其加入到判别模型中;若某一变量F≤2.71时,则表明该变量判别能力微弱,应将其剔除出判别模型。重复以上过程,直至计算到既没有变量加入也无变量被剔除,逐步判别分析过程才算结束。最终利用逐步判别法经过4步计算从给定的8个变量指标中将瓦斯压力x1、放散初速度x2、软分层厚度x6选入作为突出判别因子,将坚固性系数x3、煤体破坏类型x4、开采深度x5、瓦斯含量x7、煤层倾角x8剔除出判别模型。由于篇幅所限,对逐步判别筛选判别因子的具体计算步骤不再详述。

2.2 Bayes判别函数的建立

根据上面所述建模过程,选取表1中所列的20个煤与瓦斯突出实例数据作为训练学习样本建立Bayes判别模型。《防治煤与瓦斯突出规定》指出[16],在进行煤与瓦斯突出危险性鉴定时,给出的矿井鉴定结果只有是否为突出矿井,而对突出矿井的突出类别大小没有给出。另外研究表明[7],对于有些矿井其各项突出指标值并没有超过临界值,但也有可能会发生煤与瓦斯突出。根据突出时抛出煤的重量不同将突出分为4类:Ⅰ-无突出、Ⅱ-小型突出(50 t以下)、Ⅲ-中型突出(50~100 t)、Ⅳ-大型突出(100 t以上)。将这4个突出类别分别作为Bayes判别函数的4个正态总体G1,G2,G3,G4。根据上述Bayes判别函数求解的过程,经训练学习便可得出Bayes判别函数,判别函数各项系数见表2。因此,所建立的煤与瓦斯突出预测Bayes判别函数分别见式(20)~(23)。

y1=6.661x1+0.556x2+1.817x6-9.951

(20)

y2=9.12x1+1.667x2+1.245x6-24.252

(21)

y3=3.86x1+0.954x2+3.729x6-13.987

(22)

y4=15.954x1+0.886x2+3.608x6-41.887

(23)

表2 Bayes判别函数分类系数Table 2 Classification coefficient of Bayes discriminant function

2.3 Bayes判别效果显著性检验

对20个训练样本进行回代估计检验,分别根据Bayes函数值y和后验概率值P(Gi/x)确定训练样本的回判结果,见表3。由表3可知,20个突出训练样本回判后的判别结果与实际情况完全相符,其误判率为0。从误判率来看,Bayes-逐步判别分析方法能够有效地对煤与瓦斯突出进行判别预测,而且方法简单可靠,准确率高。

表3 训练样本回判结果Table 3 Feedback results for training sample

3 工程应用

利用上述建立的Bayes判别分析模型对该典型突出矿区的另外8个突出实例进行突出类型判别预测,判别结果见表4。为了便于对比分析,表4同时列出了对判别因子不进行筛选而全部引入判别函数的判别分类结果。由表4可知,利用Bayes-逐步判别法得到的判别结果与实际情况完全吻合,判别正确率达100%;而单纯利用Bayes判别法得到的判别结果中有2个是错误的,误判率为25%。为进一步考察Bayes-逐步判别法判识结果的准确性和可靠性,对8个突出实例进行了回代估计,结果见表5。由表5可知,根据Bayes函数值和后验概率回判的结果与实际情况完全一致,误判率为0。由此说明,建立的Bayes-逐步判别分析模型可以有效、准确地对煤与瓦斯突出进行预测。

Bayes-逐步判别分析模型用于煤与瓦斯突出预测,是建立在对已有煤与瓦斯类型特征规律训练学习的基础上,训练学习样本的代表性及数量对煤与瓦斯突出的准确判别预测极其重要。因此利用该判别模型进行煤与瓦斯突出预测时需注意以下问题:①在对学习样本进行筛选时应优先考虑常用的突出预测敏感指标;②所建立的判别模型适用于煤层地质条件和采煤技术工艺类似的待预测区域,在实际工程应用过程中,可根据现场工程地质情况,尽可能选取具有代表性的实例和判别能力显著的指标;③在不增加计算负担的前提下,应尽可能增加样本数量以提高判别模型的准确性。

表4 待判样本数据及判别结果Table 4 Sample data to be determined and classification results

表5 待判样本回判结果检验Table 5 Test of the feedback results to be determined

4 结 论

1) 为减弱非敏感判别指标对煤与瓦斯突出预测结果的干扰,利用逐步判别法对影响突出的8个变量指标进行筛选,选取出对突出判别能力影响显著的瓦斯压力、瓦斯放散初速度和软分层厚度3个敏感指标作为判别因子。通过筛选,最大限度地避免了非显著性指标加入判别模型而影响计算精度和判别结果,同时,也削弱了评价不同指标对煤与瓦斯突出影响程度的随意性和主观性,一定程度上反映了各指标对突出影响的差异性。

2) 基于多元统计分析理论,建立了煤与瓦斯突出预测的Bayes-判别分析模型。利用所构建的判别模型对20个煤与瓦斯突出实例数据进行训练学习得出相应的Bayes判别函数,用回代估计的方法进行逐一验证,结果误判率为0。将建立的判别模型对8个突出实例进行判别预测,判别结果与实际情况完全吻合,正确率达100%。因此,所建立的Bayes-逐步判别分析模型判别准确度高,是一种有效的煤与瓦斯突出预测方法。

3) 构建的Bayes-逐步判别分析模型有一定的适用范围,在实际应用过程中需综合考虑待预测区域的煤层地质条件及开采技术工艺等。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!