当前位置:首页 期刊杂志

基于PCA-SVM的岩爆预测

时间:2024-07-28

刘晓悦,张雪梅,杨 伟

(华北理工大学电气工程学院,河北 唐山 063000)

岩爆是深部岩体工程开挖中常见的一种动态、自发、不受控制的地质灾害。开挖围岩在高地应力条件下应力场重新分配,导致岩石破裂并产生的一系列不利的影响,如破裂、剥离排出、突然释放了硬脆性围岩储存的弹性应变能量。因为岩爆过程是突发的、强烈的,而且岩石颗粒可以以8~50 m/s的速度喷射出来,威胁地下工作人员和设备的安全,影响作业的进度,进而导致整个工程被阻碍。由于越来越深的开挖和越来越高的应力水平,岩爆的发生越来越频繁,岩爆问题也日益突出[1]。然而,受模型和参数不确定性影响的岩爆预测分类是一个非常复杂的非线性过程,岩爆分类仍是一个巨大的挑战。因此,引入一种新的智能方法来研究岩爆和强度分级预测仍然十分必要。

本文通过主成分分析方法对文献中选取的岩爆预测指标进行分析,解决了数据之间的相关性问题,将提取出的指标用于SVM模型。最后通过支持向量机用于岩爆预测数据的训练并建立相应的预测模型,有效解决了复杂影响因素情况下模型难以确定的问题,为岩爆预测研究提供了一种新的方法。

1 方 法

1.1 主成分分析(PCA)

主成分分析方法的核心是线性组合原始指标,使之成为一组包含大部分原始信息的独立的、新的、综合的指标集。具体步骤如下所述[2-3]。

步骤1:将原始数据进行标准化。假设原始评价指标数据矩阵为X=(xij)m×p,见式(1)。

(1)

标准化处理数据,见式(2)。

(i=1,2,…,m;j=1,2,…,p)

(2)

式中:xj为均值;sj为标准差。

步骤2:计算相关系数矩阵R,即:R=(rkl)m×p(k,l=1,2,…,p),其中,rkl(rkl=rlk)的计算公式见式(3)。

(3)

步骤3:计算R的特征值λ1,λ2,…,λp和特征值对应的单位化特征向量p1,p2,…,pp。

步骤4:选取主成分数,计算主要成分的累计贡献率,通常取大于1的特征值且在85%以上的累积贡献率[4]。

(4)

(5)

式中:vh为第h个主成分的方差贡献率;vs为前k个主成分的累计贡献率。

步骤5:计算提取主成分的对应得分。主成分系数矩阵为:U=(p1,p2,…,pp),若从原指标中提取了前k个主成分,则有式(6)。

(s=1,2,…,k)

(6)

1.2 粒子群优化支持向量机理论(PSO-SVM算法)

1.2.1 支持向量机理论

支持向量机(SVM)是在20世纪90年代中期开始发展的一种机器学习方法,是借助于最优化方法解决机器学习的问题的新工具。它通过寻求最小的结构化风险以最小化经验风险和置信范围来提高学习机的泛化能力,以便在统计样本量较小时,可以得到比较好的统计。经过国内外研究者的不断努力,支持向量机在回归预测和密度估计中的重要性日益提高,其应用领域也在不断扩大[5]。其中支持向量机示意图如图1所示。

图1 支持向量机示意图Fig.1 Support vector machine schematic

1) 线性支持向量机。要想把两种样本正确的分开,则需要超平面w×x+b=0。为了保证分类间隔最大,那么优化方法则表示为式(7)。

(7)

拉格朗日函数可用于将原始问题转换为对偶问题,得到式(8)。

(8)

由式(8)求解之后,得到了最优分类函数,见式(9)。

f(x)=sgn(wTx+b)=

(9)

但是,在实际情况中存在许多线性不可分的情况,因此使用线性可分方法会引起很大的误差。 应对这种情况,在引入松弛变量后问题就变成了式(10)。

(10)

式中,C为惩罚因子。

引入拉格朗日算法求解该问题,可得到式(11)。

(11)

通过求解各类系数ai后,得到分类决策函数,见式(12)。

(12)

(13)

分类决策函数变为式(14)。

(14)

实际上,映射后仍然不可分的情况也是存在的。

3) 核函数。核函数对于支持向量机的训练算法具有决定性的作用,常用的核函数有四种:线性核函数、多项式核函数、最常用的径向基函数(RBF)、Sigmoid核函数。 本文选用最常用的径向基函数。

1.2.2 基于粒子群算法的支持向量机参数优化

粒子群优化(PSO)是EBERHART等专家提出的基于种群的随机优化算法。在粒子群算法中,每个优化问题的解决方案都是搜索空间中的一个粒子。在粒子群算法中,每个优化问题的解决方案都是搜索空间中的粒子。所有粒子都具有通过优化函数确定的适应度值,并且每个粒子还具有确定其飞行方向和距离的速度v。 粒子优化算法过程为:①初始化粒子的位置和速度;②计算粒子适应度(本文以训练样本的输出值与实际值的误差作为适应度函数);③寻找个体极值和群体极值;④更新位置和速度;⑤计算更新后粒子的适应度;⑥更新个体极值和群体极值。看是否满足条件,若不能满足条件,则重复步骤③、步骤④、步骤⑤和步骤⑥,直到满足条件则可以结束优化过程,得到最终优化后的支持向量机参数。

粒子群优化算法一般需要比较少的调整参数,不仅算法简单而且容易达到优化目标,适合在动态、多目标环境中寻优。与传统算法相比,它不仅能够使计算速度更快,而且能使全面的搜索能力变得更好。因此本文采用粒子群算法去优化支持向量机的参数,这样才能提高岩爆预测模型的准确性,进而建立性能良好的岩爆预测模型。

2 岩爆预测模型的建立

2.1 选取岩爆预测标准

建立岩爆评价指标体系的原则是评价指标应能反映岩爆的主要特征和围岩的性质,并能方便地获取数据,本文选取了6个最具有代表性的指标:围岩切向应力σθ、单轴抗拉强度σt、单轴抗压强度σc、应力系数σθ/σc、脆性系数σc/σt以及冲击倾向性指数Wet。

岩爆烈度等级通常分为四级:Ⅰ级(无岩爆活动)、Ⅱ级(轻度岩爆活动)、Ⅲ级(中度岩爆活动)、Ⅳ级(剧烈岩爆活动)。岩爆等级分类标准见表1[6]。

表1 岩爆等级分类标准表Table 1 Rockburst classification

2.2 PCA预处理

本文通过资料查阅[7],获得了30组国内外地下工程实例,训练样本数据25组,预测样本数据5组,对从文献中查到的岩爆案例原始数据,首先根据标准化公式对数据进行标准化处理,然后将得出的结果进行主成分分析,本文采用Matlab程序对数据进行主成分分析,最终提取出主成分F1、F2和F3。由于篇幅关系无法将数据列出来,因此本文并未将岩爆案例原始数据与主成分数据列出来,但重要分析过程已将列出。各指标间的相关系数和主成分特征值及贡献率见表2和表3。

表2 相关系数矩阵Table 2 Correlation coefficient matrix

从表3中找出特征值大于1且累计贡献率在85%以上的前K个主成分,因此本文选取了前3个主成分作为支持向量机模型的输入。

表3 主成分特征值及贡献率Table 3 Principal component eigenvalue and contribution rate

表4为主成分载荷(即主成分系数矩阵),得到3个主成分F1、F2、F3与6个指标变量之间的关系为式(15)~式(17)。

表4 主成分载荷Table 4 Principal component load

F1=0.873x1+0.781x2+0.318x3+

0.802x4-0.451x5+0.131x6

(15)

F2=-0.337x1+0.059x2-0.891x3+

0.181x4-0.847x5+0.033x6

(16)

F3=-0.294x1+0.450x2+0.237x3-

0.487x4-0.170x5+0.816x6

(17)

将标准化之后的指标数据代入式(15)~式(17),可以得到3个主成分数据综合指标F1、F2、F3,将三个指标作为支持向量机模型的输入,消除了冗余数据和因维数不同而造成的影响,有效降低了变量维数与数据之间的相关性,大大提高了模型的运算效率,从而提供了更为合理的解释。

2.3 预测模型的建立

粒子群优化支持向量机的岩爆预测模型流程图如图2所示。

图2 岩爆预测流程图Fig.2 Rockburst prediction flowchart

本文为了满足岩爆预测模型支持向量机(SVM)的精度要求,核函数选择了径向基函数,优化惩罚参数c和核函数g选择了粒子群算法(PSO)。PSO算法的初始化的参数为:加速度C1=1.6,C2=1.5,终止代数=300,种群数N=5,并在多次迭代之后进行优化,最后得到的SVM参数最优值c=9.876,g=2.234,参数优化过程如图3所示。

图3 参数优化的适应度收敛曲线Fig.3 Adaptive curve of parameter optimizaion

上文根据主成分分析对数据进行处理之后,得到主成分F1、F2和F3,因此从样本数据中随机抽取25组训练样本,剩下的5组作为了预测样本,由优化之后的预测模型PSOSVM对5组样本进行预测,得出的预测结果见表5。

由表5可知,选择5组预测样本结果与实际预测等级相符,说明本文建立的PCA-PSOSVM岩爆预测模型具有一定的可行性。

表5 PCA-PSOSVM模型岩爆预测等级Table 5 PCA-PSOSVM model rockburst prediction level

2.4 不同模型比较

为了进一步验证岩爆预测模型PCA-PSOSVM模型的准确性,必须与不同的岩爆预测模型对同样的岩爆数据进行预测,因此本文进行了不同模型的对比。其中,表6当中其他模型的预测结果数据选自文献[8],比较以上三种模型对11个测试样本的测试结果,发现三种模型预测正确率分别为90.9%、 72.7%和81.8%, 说明PCA-PSOSVM模型相对于SVM模型和ANN模型而言,具有更高的准确率,因此PCA-PSOSVM模型具有一定的可行性。

表6 不同预测模型预测结果对比Table 6 Comparison of prediction results of different prediction models

3 结 论

1) 选用主成分分析对原始数据处理,可以消除指标间的相关性,并选出3个主成分达到了降维的目的,这样支持向量机的模型输入就会变成3个,大大简化了计算过程。

2) 对SVM模型来说,对模型性能影响较大的是惩罚参数c和核函数g,所以本文使用粒子群算法(PSO)去优化惩罚参数c和核函数g,这样一来就提高了SVM岩爆预测模型的准确性。

3) 为了验证准确性,用本文建立的PCA-PSOSVM模型与支持向量机(SVM)模型和人工神经网络(ANN)模型的预测结果进行对比,发现PCA-PSOSVM模型具有更高的岩爆预测准确率。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!