当前位置:首页 期刊杂志

利用卷积神经网络模型预测致密储层微观孔隙结构

时间:2024-07-28

廖广志 ,李远征 ,肖立志 ,秦志军,胡向阳,胡法龙

1 中国石油大学(北京)油气资源与探测国家重点实验室,北京 102249 2 中国石油大学(北京)教育部非常规油气国际合作联合实验室,北京 102249 3 中国石油大学(北京)地球探测与信息技术北京市重点实验室,北京 102249 4 中国石油新疆油田勘探开发研究院,克拉玛依 834000 5 中海石油(中国)有限公司湛江分公司,湛江 524057 6 中国石油勘探开发研究院测井与遥感技术研究所,北京 100083

0 引言

在中低渗油气藏中,毛管压力是油气自吸的主要作用力,也是油气排驱的主要阻力,并在很多油气藏中影响着油气的分布。而影响毛管压力的一个主要因素是储层的孔隙结构[1-2]。由于储层孔隙结构的差异,孔渗条件相同的中低渗油气藏的烃饱和特性可能完全不同[3]。储层孔隙结构表征与预测对地质作用分析与油气分布等方面的新认识具有重要意义。造成储层孔隙结构差异的因素较多,比如岩石类型、分选、粒度等。成岩作用对储层的微观孔隙结构有着正反两方面的影响。压实作用减小了一些原生孔隙,而由胶结作用形成的胶结物使得孔隙结构变得更加复杂;溶蚀作用可以形成均质性较好的次生孔;由地质构造作用产生的下降和隆升使地层受到沉陷和剥蚀,亦能部分重构储层的孔隙结构[4-6]。

压汞毛管压力数据(MICP)是间接识别储层孔隙结构的常用数据之一。目前在实验室有许多关于储层岩石孔隙结构的研究方法,如使用岩心切片和MICP数据对岩心数据进行统计分析[7],利用核磁T2谱拟合拟毛管压力曲线来表征微观孔隙结构[8],利用岩心CT和数字岩心相结合的多维成像技术来指示宏观参数和微观参数之间的关系等[9-12]。这些方法对孔隙结构的表征在响应机理、分辨率、响应范围等方面各不相同,存在较大差异,有时候甚至存在矛盾之处。目前,大部分方法只能通过岩心取样在实验室进行测量分析,由于成本原因难以在井下推广应用。储层微观孔隙结构表征和预测的主要重点是:1)如何正确认识储层不同的孔隙结构以及不同的孔隙结构对油气分布的控制作用;2)如何建立一个经济有效的孔隙结构分类方法;3)如何构建微观孔隙结构与宏观表征参数之间的关系。

以数据为驱动的深度学习算法可以充分整合不同类型数据中的有效信息,对多源数据进行特征描述[12]。深度学习技术可以自主学习特征,避免复杂的前期预处理,根据学习模型获得无序的、非线性的调节,使其无限逼近目标[13-14]。本研究以新疆某地区砂砾岩地层为例,在深入分析MICP数据特征的基础上,提取11个特征参数中的敏感性参数来表征储层孔隙结构。利用灰色关联分析、主成分分析、因子分析和智能聚类等数据挖掘技术解决数据之间的共线问题和孔隙结构分类问题,然后将常规测井资料作为输入层,提出了一种应用卷积神经网络预测储层微观孔隙结构的方法。

1 孔隙结构分类

1.1 孔隙结构参数提取

利用MICP数据特征可以表征不同的孔隙结构参数,如孔喉半径、分选、孔喉分布的均匀性、连通性等[15-16]。孔隙结构参数可以用分布函数模型来计算。表1为计算得到的孔隙结构参数及其物理意义。

表中,Pd为排驱压力,Di为进汞饱和度为i时所对应的喉道半径,Smax为最大进汞饱和度,Vk为孔隙体积,Vh为喉道体积,R为平均孔隙半径,P50为进汞饱和度为50%时的压力。

1.2 孔隙结构敏感性参数选择

灰色关联分析是一种多因素统计分析方法,是根据因素之间发展趋势的相似或相异程度,即灰色关联度,作为衡量因素间关联程度的一种方法[17-18]。这里将岩心渗透率作为灰色关联分析中的参考数列,各个孔隙结构参数作为比较数列,进而确定孔隙结构的敏感性参数。

灰色关联分析的结果如表2所示,选取关联度较大的Ra、Dm、We、Kp、Skp、K和α为孔隙结构的敏感性参数,所选参数具有很强的相关性,为解决参数间的共线性问题,需对所选参数做进一步的分析。

1.3 孔隙结构敏感参数降维

主成分分析和因子分析是高维数据降维的两种常用方法,将两种方法用于孔隙结构参数的压缩,解决共性线问题。表3是主成分分析的结果,第一列是提取的主成分,第二列每个主成分对应的特征值,其大小表示包含原始变量各主成分的能力,第三列和第四列表示每个主成分的贡献率及累计贡献率。从表中可以看出,前3个主成分包含原始数据90%以上的信息,提取前3个主成分可达到数据压缩的效果。由主分析分析的碎石图(图1)的结果也可以看到,前3个主成分所对应的平台陡峭,包含原始数据的大部分信息。

表1 孔隙结构参数及物理意义Table 1 Pore structure parameters and physical significance

表2 灰色关联分析Table 2 Grey relational analysis

主成分分析主要用于数据压缩,消除共线性,但难以解释每个主成分的实际意义,基于参数矩阵的因子分析可以对提取的因子做因子旋转,使得因子与组分之间的关系得到重新分布,从而使孔隙结构类型更易于解释[18]。图2为提取的主因子与孔隙结构参数的三维交汇图,表4是因子旋转之后的结果。由表可知,Skp、Kp和α的因子1的得分分别为0.962、-0.783和0.612,说明因子1主要反映的而是孔喉分选及分布的信息。We和K的因子2的得分分别为0.880和-0.979,说明因子2主要反映孔喉渗流及连通性的信息。而Ra和Dm因子3的因子得分分别为0.983和0.910,说明因子3主要反映孔喉大小信息。由此推断出孔隙结构可以从孔喉分选及分布、孔喉渗流及连通、孔喉大小三方面来描述。

表3 主成分分析Table 3 Principal component analysis

1.4 孔隙结构分类

对经过主成分分析之后的孔隙结构数据进行聚类分析,以确定孔隙结构的类型。首先引入层次聚类的方法。层次聚类试图在不同层次上对数据集进行划分,从而形成树形的聚类结构。有“自底向上”的聚合策略,也有“自顶向下”的分拆策略。“自底向上”聚合策略首先将每个对象作为一个簇,然后合并这些簇为越来越大的簇,直到所有的对象都在一个簇中。计算簇与簇之间距离的方法有三种,包括最短距离法,最长距离法,类平均法[19]。

图1 主成分分析碎石图Fig. 1 Scree plot of principal component analysis

图2 孔隙结构参数因子分析得分图Fig. 2 Factor analysis score chart of pore structure parameters

表4 因子分析旋转成分矩阵Table 4 Factor analysis rotation component matrix

原始孔隙结构数据经过主成分分析之后,每个样本得到3个主成分,将这3个主成分组成三维向量进行凝聚层次聚类分析。采用类平均法计算两个簇中的每个数据点与其它簇中所有数据点的距离,然后将所有距离的均值作为两个簇间的距离。其综合考虑到了所有的数据点,结果较最短距离法和最长距离法更为合理。图3是凝聚层次聚类的结果示意图。

由凝聚层次聚类结果可知,以1.0作为类间距离划分的标准值,孔隙结构可以分为5类。同时引入K均值聚类的方法和谱聚类的方法进行对比分析。

图3 凝聚层次聚类结果Fig. 3 The results of aggregation hierarchical clustering

图4 K均值聚类流程Fig. 4 K-means clustering process

表5 K值聚类的聚类中心Table 5 The center of the K-means clustering

原始孔隙结构数据经过主成分分析之后,每个样本得到3个主成分,将这3个主成分组成三维向量,进行K均值聚类分析,由凝聚层次聚类的结果可知,孔隙结构可以分成5类,故进行K均值聚类分析时,随机选择5个聚类中心,其聚类流程如图4所示,最终得到的5类孔隙结构,聚类中心如表5所示。

谱聚类是一种基于图论的聚类方法,通过对样本数据的拉普拉斯特征向量进行聚类,从而达到对样本数据进行聚类的目的[20]。将每个样本的3个主成分组成三维向量,依次计算样本数据的相似度矩阵、度矩阵、拉普拉斯矩阵,然后对拉普拉斯矩阵进行标准化,计算特征值,最后进行聚类,其算法流程如图5所示。

综合凝聚层次聚类、K均值聚类、谱聚类的聚类结果,结合孔隙结构特征参数,最终孔隙结构的分类如表6所示。

根据孔隙结构的最终分类结果,分别绘制5类毛管压力曲线,如图6所示。

由各类毛管压力曲线形态可知,第一类毛管压力曲线对应的孔隙结构最好,第五类毛管压力曲线对应的孔隙结构最差。同时将提取的主成分与各类孔隙结构做三维交汇图(图7)。

图5 谱聚类流程Fig. 5 Spectral clustering process

从三维分布上(图7)看,第一类孔隙结构的第一主成分主要分布范围为0.91~4.55,第二主成分主要分布范围为0.81~1.07,第三主成分主要分布范围为-0.64~1.19;第二类孔隙结构的第一主成分主要分布范围为-0.78~0.75,第二主成分主要分布范围为0.22~1.06,第三主成分主要分布范围为-1.23~-0.09;第三类孔隙结构的第一主成分主要分布范围为-1.52~0.05,第二主成分主要分布范围为0.08~0.35,第三主成分主要分布范围为0.76~1.31;第四类孔隙结构的第一主成分主要分布范围为-1.86~-0.35,第二主成分主要分布范围为-1.36~-0.06,第三主成分主要分布范围为-1.07~0.21;第五类孔隙结构的第一主成分主要分布范围为-1.89~0.13,第二主成分主要分布范围为-4.38~-2.07,第三主成分主要分布范围为-0.74~-0.52;各类孔隙结构与提取的主成分之间有比较明显的界限,说明孔隙结构数据经过挖掘之后,其分类是有效的。

2 基于测井数据的孔隙结构预测

测井资料能够反映储层孔隙结构信息,但在实际应用中存在较大困难,原因是孔隙结构与测井资料的定量关系是一个十分复杂的非线性系统。用常规的物理模型难以准确表达两者之间的定量关系。孔隙结构类型的预测需要提取特征,解决MICP数据与测井资料之间的尺度问题。

表6 部分样本孔隙分类结果Table 6 Part of pore structure classification results

人工神经网络虽然具有良好的智能特性,但不具备自主地学习特征。卷积神经网络(CNN)是近年来快速发展的一种高效模式识别方法。该网络避免了复杂的前期预处理,可以直接输入原始信息[21]。其示意图如图8所示。

图6 各类孔隙结构毛管压力曲线Fig. 6 Capillary pressure curves of various pore structures

相比于人工神经网络,CNN具有以下优势:

1)局部感知:每个神经元不是对全部测井曲线进行感知,而是对局部信息进行感知,然后在更高层将局部信息综合起来获得全局信息。从而有效地减少训练参数,降低网络规模,如图9所示。

2)权值共享:将卷积操作看成是与位置无关的特征提取方式,测井曲线的一部分统计特性与其他部分是一样的,这意味着学习的某一部分也能用在另一部分上。所以对于这条曲线上的所有位置,都能使用同样的学习特征。这将减少网络各层之间的连接,同时又降低过拟合的风险。

图7 各类孔隙结构与主成分三维交汇图Fig. 7 Three-dimensional intersection diagrams of various pore structures and principal components

图8 卷积神经网络示意图Fig. 8 Schematic diagram of convolutional neural network

3)子采样:子采样也叫做池化,池化层夹在连续的卷积层中间,用于压缩数据和参数的量,减小过拟合(图10)。

2.1 单层卷积神经网络识别孔隙结构类型

孔隙结构类型预测问题与大部分分类预测问题相似,是通过监督学习的方法训练模型来预测未知数据。然而,测井数据不同于常规的图像、文字等数据,其特征难以用深度学习的方法进行表达。这里将测井数据模拟成图片的像素点数据,将前文聚类分析得到的孔隙结构类别作为标签,利用卷积神经网络良好的特征学习能力自主训练储层特征,基于此设计了单层卷积神经网络模型和双层卷积神经网络模型。

单层卷积神经网络模型的网络结构如图11所示。

单层卷积神经网络模型由4部分组成,分别为测井信息输入层、卷积特征层、池化层、全连接层。输入层为自然伽马、自然电位、井径、三电阻率、声波、中子、密度9种测井数据模拟成的3×3像素点,卷积特征层由4个卷积核组成,大小为2×2×1,步长为1,池化层采用的是2×2最大值池化,步长为1,接着连接两个全连接层,网络的输出层后加上一个softmax层,将网络输出的得分值转化为各个孔隙结构的概率分布,权重初始化采用高斯初始化,偏置用0.1初始化。激活函数采用relu激活函数,损失函数采用交叉熵损失函数。采用梯度下降法进行批量训练,每4个样本组成一个batch,所有batch完成一次训练为一次迭代过程,训练过程使损失函数不断减小,直到到达设定的阈值或迭代次数达到设定的次数,完成训练后,保存权重和偏置参数,得到训练好的神经网络模型。

图9 神经元局部连接Fig. 9 Local connection of neurons

图10 池化过程Fig. 10 Pooling process

2.2 预测效果分析

网络在训练10 000次左右达到收敛,在训练集上能达到85%左右的准确率,在测试集上的准确率为78.6%,如图12所示。

2.3 双层卷积神经网络识别孔隙结构类型

双层卷积网络模型如图13所示,将常规测井数据模拟成9×9的像素矩阵作为网络的输入,第一层卷积采用4个卷积核,大小为3×3×1,步长为1;池化层采用的是2×2最大值池化,步长为1;第二层卷积采用8个卷积核,大小为3×3×4,步长为1,最后采用两个全连接层。网络的输出层后加上一个softmax层,将网络输出的得分值转化为各个孔隙结构的概率分布,权重初始化采用高斯初始化,偏置用0.1初始化。激活函数采用relu激活函数,损失函数采用交叉熵损失函数。采用梯度下降法进行批量训练,每4个样本组成一个batch,所有batch完成一次训练为一次迭代过程,训练过程使损失函数不断减小,直到到达设定的阈值或迭代次数达到设定的次数,完成训练后,保存权重和偏置参数,得到训练好的神经网络模型。

2.4 预测效果分析

双层卷积神经网络在迭代10 000次左右就收敛了,如图14所示,在训练集上,其训练的准确率可以达到90%,而在测试集上,最终预测的准确率的可达到82.1%,比单层卷积神经网络模型的准确率提升3.5%。这是因为原始数据经过两次卷积操作后,其特征被一步步抽象化,由低维到高维,最终送入全连接层的是一些相对很纯净的特征。测试集上的预测结果如图15所示,左图中勾表示预测正确,叉表示预测错误,右图中最后一道为测试结果。从图15可以看到,双层卷积神经网络模型预测准确性较高。

图11 单层卷积神经网络结构Fig. 11 The structure of single-layer convolutional neural network

图12 单层卷积神经网络训练和测试误差曲线Fig. 12 Training and test error curves of single layer convolutional neural network

图13 双层卷积神经网络网络结构Fig. 13 The structure of double-layer convolutional neural network

图14 双层卷积神经网络训练和测试误差曲线Fig. 14 Training and testing error curves of double-layer convolutional neural network

图15 双层卷积神经网络预测结果Fig. 15 Prediction results of double-layer convolutional neural network

3 模型的实际应用

将单层卷积神经网络模型和双层卷积神经网络模型应用于未取心井,其应用效果如图16所示,表7为测井资料综合解释成果表。

可以看到,单层和双层卷积神经网络在油层和干层的预测结果差异不大,但在差油层和含油层,双层卷积神经网络的预测结果比单层卷积神经网络预测结果相比,与测井解释结果更相符。

图16 模型的实际应用Fig. 16 Practical application of the model

表7 测试井测井资料综合解释成果表Table 7 Results of comprehensive interpretation of test well logging data

4 结论

深度学习作为一种快速发展人工智能技术在各个领域都开始了广泛的应用,围绕深度神经网络的研究也与日俱增,然而目前深度学习在油气储层预测中的应用研究还较少。本研究基于岩心毛管压力数据,利用灰色关联分析、主成分分析、因子分析和智能聚类等数据挖掘技术,选取孔隙结构敏感性参数,解决数据之间的共线问题,利用智能聚类技术对孔隙结构进行聚类分析,确定储层孔隙结构的分类;在借鉴卷积神经网络在图像识别和音频分析领域应用方法的基础上,将其用于储层微观孔隙结构预测;提出了测井曲线单层卷积模型和双层卷积模型,将常规测井数据模拟成图像像素点作为网络的输入,以便更好地表达储层特征。研究结果表明:卷积神经网络可用于储层微观孔隙结构预测,且预测精度较高;同时双层卷积神经网络不仅可以达到更好的预测效果,而且通过卷积运算可以提取更深层次、更抽象的储层特征,为测井资料综合解释提供重要的支持。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!