时间:2024-09-03
陈钢花,梁莎莎,王军,隋淑玲
(1.中国石油大学(华东)地球科学与技术学院,山东青岛266580;2.中国石油化工股份有限公司胜利油田分公司勘探开发研究院,山东东营257000)
20世纪80年代中期RuMelhart和Hinton[1]提出了训练多层神经网络的BP算法,利用多层非线性映射学习数据的中层表达。刘争平等[2]利用神经网络对储层岩性进行识别及储层参数计算,解决了传统测井解释方法中面临的高度复杂非线性建模问题。杨辉等[3]利用传统BP神经网络算法对致密复杂储层进行岩性识别。但是,神经网络模型收敛速度比较慢且在训练过程中极易陷入局部极小及受到过拟合的影响,尤其是陷入局部最小值的概率会由于隐含层数不断增加而极大地增加,限制了其层数的发展。
20世纪60年代,Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现了一种独特的神经网络结构,它可以有效降低反馈神经网络的复杂性,继而提出了卷积神经网络[4]。Lecun等[5]在BP算法提出3年之后,提出了将神经网络算法用于训练多层卷积神经网络的方法,并利用该方法手写数字识别,卷积神经网络的雏形初步形成。1998年LeCun在此前基础上提出了LeNet-5模型,它利用空间相对关系来减少参数数目以提高模型训练性能,卷积神经网络的雏形正式完成[6]。Hinton等[7]以深度置信网络(DBN)为基础提出了非监督贪心逐层训练算法。本文提出一种将卷积和神经网络应用于储层岩性判别,构建了一个双层的卷积神经网络模型,为测井解释奠定了基础。
图1 卷积神经网络示意图
卷积神经网络是深度学习的一个重要分支。卷积神经网络区别于普通神经网络在于它在普通神经网络之前添加了一个由卷积层和池化层组合,即特征抽取器。卷积神经网络主要由输入层、特征提取器、全连接多层感知机分类器和输出层4个部分组成。图1为典型的卷积神经网络。图1为手写字母识别,第1部分是输入层,输入图像为32像素×32像素。第2部分是2个卷积层和池化层组合,输入图像通过6个5×5的卷积核进行特征提取并形成6个28像素×28像素的特征图。随后进行下采样得到6个池化层,图像变为14像素×14像素。池化结果再通过16个5×5的卷积核进行特征提取并形成16个为10像素×10像素的特征图,再经过下采样得到16个池化层,图像变为5像素×5像素。第3部分为全连接多层感知机分类器。第4部分为输出层。
普通神经网络输入层与隐含层之间为全连接。通过全连接的方法提取整幅图像上的特征时计算量大、耗时长,尤其是在原始图像较大的情况下。卷积神经网络为解决这类问题提出了局部连接的方法,即对层与层之间的连接加以限制:每个隐含层并不与输入单元进行全连接,而是与其中的一部分进行相连。隐含层只与输入层中的一部分进行连接,在更高层将局部信息进行综合,就会得到全局信息。
共享权值就是多个连接使用同一权值。在卷积神经网络中是指卷积核的内容。权值共享的点在于使得在不考虑位置的情况下,重复单元能够对特征进行提取。另外,权值共享大大减少了网络自由参数数量,提高了特征抽取效率。
卷积核也叫过滤器。卷积核作为一种特征提取方式。每个卷积核跟上一层图像进行卷积后,都会形成新的图像,即特征图。不同特征图像是使用不同卷积核与原图像卷积后得到的结果,当有多个卷积核时就可以学到多个特征。上一层中的特征图卷积后,加偏置再经过激活函数得到的输出结果组成。
计算公式为
(1)
式中,l为卷积神经网络结构的层数(一般l>3);K为卷积核;Nj为输入特征图的选择集合;bc为附加偏置。
一般情况下,卷积神经网络层数越高,网络结构越复杂,提取特征就越全面,越能代表对象的共有特征,泛化能力越强。
池化也叫下采样,它进一步降低了特征的维度,减少了计算量,并且解决了训练过程中易出现过拟合的问题。一般有4种池化方式,分别为平均池化、最大值池化、最小值池化和随机池化。池化过程其实也是一种滤波,卷积所形成的特征图通过下采样的过程极大地简化了模型复杂度,减少了模型的参数。计算公式为
(2)
式中,l为卷积神经网络结构的层数(一般l>3);pooling为池化(下采样)操作过程;w为池化权值;bs为附加偏置。
卷积神经网络的训练过程与传统神经网络类似,遵循前向传输、逆向反馈的原则。即向前传递输出值,向后反馈来不断调整权值和偏重。传统神经网络训练在于得到神经元间传递的权重和偏置。而卷积神经网络训练与传统神经网络的区别在于,它是为了获取神经元间卷积核的形式和偏置。卷积神经网络与传统神经网络相同,在计算l层的每个神经元对应的权值之前,需要先计算l层的每个神经元的误差灵敏度。池化层和卷积层的灵敏度计算公式为
(3)
(4)
式中,f′为激活函数导数;unp为反池化过程;conv为反卷积过程。
进行更新的卷积核梯度和偏置梯度计算公式为
(5)
(6)
池化层l层对应的权值梯度和偏置梯度为
(7)
(8)
渤南洼陷位于沾化凹陷中部,是一个北陡南缓、东陡西缓的三级负向构造单元。东接孤西断层、孤北洼陷和孤岛凸起,南邻陈家庄凸起斜坡带,东南与垦西地金和三合村洼陷、孤南洼陷相连,北与埕南断裂和埕子口凸起连接[9]。在勘探开发过程中已证实渤南洼陷沙四段具有良好的含油性。
对研究区5口井55块岩样的碎屑含量作统计(见表1)。研究区岩石矿物成分复杂多样,岩石类型主要为长石岩屑砂岩和岩屑长石砂岩。石英类型主要由单品石英组成,碎屑岩颗粒磨圆度中—差,以次棱角状为主。长石类型主要为钾长石和斜长石。支撑方式主要为颗粒支撑,接触关系以点线、线式为主。胶结类型以孔隙胶结为主,胶结物为泥质、方解石和白云岩。
研究区矿物成分复杂,岩性多样。根据9口井岩心物性分析、岩屑录井等,研究区岩性为泥岩、膏值泥岩、泥质粉砂岩、粉砂岩、粉细砂岩、细砂岩、中砂岩、泥质砂岩、白云质砂岩、粗砂岩、含砾细砂岩、石灰岩、白云岩、膏岩等25种岩性,岩性中既存在泥质、灰质,又存在膏质、白云质等。这给测井岩性识别带来了困难。
根据岩心分析、岩屑录井、井壁取心和测井曲线等,将研究区岩性共划分了9种,分别为泥岩、 粉砂岩、细砂岩、灰质砂岩、泥质砂岩、含砾砂岩、白云岩、石灰岩和膏岩。图2为不同岩性常规测井曲线交会图。可以看出单凭借1条或多条常规测井曲线交会无法有效区分岩性,因此,通过研究卷积神经网络进行岩性识别。
表1 岩石矿物成分表
图2 不同岩性常规测井曲线交会图*非法定计量单位,1 ft=12 in=0.304 8 m,下同
图3 测井曲线敏感性分析
本文的测井数据以渤南洼陷×区块4口井为关键井,以A井为例进行岩性敏感曲线分析,图3(a)为不同岩性DEN曲线直方图。可以看出DEN曲线对于膏岩较为敏感,同时对于储层岩性也可较好的分别。图3(b)、3(c)、3(g)为不同岩性CNL曲线、GR曲线、Rt曲线直方图。CNL曲线、GR曲线、Rt曲线对于不同岩性有较为明显的区分。图3(d)、3(h)为不同岩性AC曲线、SP曲线直方图。AC曲线、SP曲线对于储层的3种岩性测井响应几乎相同,无法有效区分。图3(e)、3(f)为不同岩性M曲线、N曲线直方图。M、N曲线对于岩性的敏感性较为相近,对于岩性有一定的区分。
本文的样本数据以渤南洼陷×区块4口井为样本井,以B井为标准井,其他井进行测井曲线标准化,以岩心分析、井壁取心为主、岩屑录井为辅选取岩性确定的层为样本层,共选取多个井段的地层共950个样本为训练数据,其中随机选取100个样本为预测数据。950个样本样本层岩性分布见图4。
图4 样本层岩性分布频率直方图
地层岩性测井识别方法研究在本质上就是数据分类以及预测方法的研究。两者都是通过监督学习的方法在训练样本数据的基础上建立模型来对未知数据进行预测,以此达到分类的效果。本文运用卷积神经网络方法识别地层岩性,将样本曲线在进行归一化之后变换成图像为6像素×6像素。由于其具有良好的自主学习能力,利用这一优点在训练过程提取的地层岩性特征建立模型并进行储层岩性识别。分析了下采样在地层岩性识别过程中发挥的效果。发现下采样过程在人脸检测、运动分析等领域具有一定程度的平移不变特征,然而这种特征在地层岩性识别中几乎不存在[8]。此外,由于样本输入测井曲线数量不多,也就是转换形成的像素较小,下采样过程减小特征分辨率的作用也相对较小。在此基础上设计了一个双层卷积神经网络模型,分别为输入层、2层卷积特征层和输出层。卷积神经网络训练过程:
(1)输入。样本训练数据x×x×y,训练样本岩性标签n×y,样本预测数据x×x×z预测样本岩性标签n×z。其中,x是测井曲线个数,y是训练样本个数,z是预测样本个数,n是岩性数量。
(2)网络结构构建。输入卷积层和池化层层数与个数和大小,迭代次数以及批训练中样本个数。
(3)预训练。卷积网络参数初始化时,偏置初始化为,卷积核与权值初始化计算公式见式(9)和式(10)
(9)
(10)
式中,rand为随机函数;size为卷积核大小的开平方;Hl为输入神经元个数;Hl+1为输出神经元个数。
(4)反向传播。卷积神经网络(CNN)使用反向传播将样本输入到网络中,逐层训练至输出层,得到该次的样本数据的“预测估计值”,然后根据式(3)、式(4)计算灵敏度。接着根据式(5)至式(8)计算梯度和权值,调整模型参数,使预测结果向优化目标(即岩性标签)接近。
(5)运用训练模型进行数据预测。
将选取的6条岩性敏感参数设置成6像素×6像素,并且将GR、DEN、CNL、Rt、M、N这6个岩性敏感参数随机分配到像素点内。首先用带岩性识别标志的950组样本数据进行训练并建立地层岩性识别模型,然后以建立的模型来预测100组的岩性识别结果。模型训练过程中950个样本数据以10个样本数据为1组来训练模型,也就是每计算10个样本数据的误差调整1次权值,训练次数为300次。通过样本均方差得出模型收敛速度较快,当训练次数为12次时,样本数据均方差趋于稳定。当训练次数为300时,样本回判准确率为99%。由此看出,卷积神经网络来预测岩性精度较高,效果较好,收敛较快。
利用同样的样本数据进行岩石物理相分析以及支持向量机2种方法进行岩性判别,并与卷积神经网络进行对比,3种方法的样本判别准确率见表2。
表2 3种岩性识别方法回判准确率对比表
通过3种岩性识别方法对比发现,卷积神经网络具有:①卷积神经网络岩性精度高、效果好、收敛快;②卷积神经网络预测岩性具有实时性,即岩性识别神经网络模型训练完成后预测岩性工作几乎是瞬时完成。卷积神经网络属于深度学习,对于大量数据的样本时具有更大的优势。本文的训练样本数据量还相对较少,如果能够获得更多训练样本,那么深度神经网络模型将更具鲁棒性,准确性也能得到提高。
(1)深度学习通过对原始数据进行逐层特征变换,将样本在原空间的特征表示变换到新的特征空间,自主学习得到层次化的特征表示[10]。一方面提高了特征提取效果;另一方面减少了参数数量,从而更有利于数据分类或特征的可视化。因此,卷积神经网络的自主学习能力能够较好地解决地层岩性识别问题。
(2)将卷积神经网络应用于地层岩性识别中,通过曲线敏感性分析优先选取了GR、DEN、CNL、Rt、M以及N共6种地层岩性敏感性参数,并在4口关键井中共选取了950个样本数据对卷积神经网络模型进行训练,从中随机选取100个样本为预测数据。
(3)通过对随机的100个样本数据的回判结果表明:利用卷积神经网络模型对样本回判准确率达到99%,表明卷积神经网络预测地层岩性精度较高、收敛较快,且效果好,且通过3种岩性识别方法对比,卷积神经网络岩性精度高,速度快,且预测岩性具有实时性。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!