时间:2024-05-22
陆智卿, 李忠伟
(中国石油大学(华东) 计算机与通信工程学院,青岛 266580)
沉积相是油气储层研究的基础,对预测砂体分布及储层物性差异具有指导意义。单井相分析是沉积相研究的关键环节之一,而利用岩心标定的典型测井相识别沉积微相是单井相分析的最常用方法。但是依靠人工识别测井相并解释沉积微相,存在两个问题:①工作量大;②对研究人员的经验要求高,结果的主观性强。
笔者以辫状河三角洲为例,将本体和语义识别的方法应用于测井相识别及沉积微相解释,探讨基于本体信息量的单井辫状河三角洲沉积微相语义识别方法,建立沉积微相的自动解释方法,在东海凹陷X气田的辫状河三角洲沉积中实验验证应用,取得了良好效果,从而验证方法的有效性。
随着沉积学和岩相古地理学的发展,沉积相研究也不断完善,形成了一套成熟的沉积相划分体系。该体系按照“相-亚相-微相”划分三个不同的级次。辫状河三角洲可细分为三个亚相:①辫状河三角洲平原;②辫状河三角洲前缘;③前辫状河三角洲亚相[1-2]。辫状河三角洲的沉积物较粗,砂和含砾砂为主,砂/泥比高,通常大于1。辫状河三角洲平原主要发育辫状河道和泛滥平原。辫状河道主要发育砂岩,也常见砾岩或含砾砂岩。辫状河道内部往往发育多个砂坝及其复合体。辫状河三角洲前缘与正常三角洲一样,水下分流河道活跃,其沉积物在前缘亚相中往往占总量的90%以上。前三角洲沉积物一般粒度较细,以泥质沉积物为主。
岩性和测井曲线是地下储层沉积相研究中最常用的资料[3]。其中岩性信息主要来自于岩心和岩屑录井等,包含了反映沉积环境及其产物的最直接信息,包括颜色、粒度、结构等信息[4-5]。在利用测井信息进行沉积相研究中,测井相发挥着重要的作用,在常用自然伽马、电阻率、自然电位等测井曲线上,不同的沉积体及其组合被模式化为几种典型的形态类型,也就是所谓的“测井相”,这些典型的曲线形态类型包括箱形、钟形、漏斗形、齿形、指形、复合形以及直线形等[6]。在区域沉积相背景和岩心分析的基础上,利用常见的岩石粒度和自然伽马、电阻率及自然电位等测井曲线形态可以确定沉积相类型[7]。在辫状河三角洲中,三角洲前缘亚相的水下分流河道沉积微相,岩性往往以砂岩为主,而且电阻率、自然伽马和自然电位的曲线形态以箱形与钟形的复合形态为主,在沉积环境背景确定的基础上,通过岩性和测井相可以直接识别沉积微相类型。
在实际单井沉积相划分工作中,前面所述的岩性信息以及三种常用曲线常存在资料不齐全或者某一项特征不典型的情况,尤其是在沉积相自动识别中,制约了沉积相识别结果的可靠性。另外,在实际测井工作中,每种测井方法的成本代价都不低,不可能对每口井测量使用每一种测井技术。通过缺项实验(实际作用是降维),可以实现减少对单井的一种测井方法的测量,从而节约实际工程中的成本。所以,笔者提出一种基于本体信息量的单井辫状河三角洲沉积微相语义推理方法。首先,根据辫状河三角洲相划分体系以及上述特征,建立辫状河三角洲相本体。在此基础上,将每种沉积微相的上述四项特征依次计算概率、信息量,得到每种微相的四维信息量矢量。最后,在缺项实验中,通过设计的语义距离公式,得到沉积相语义推理结果。该方法提供了一种单井沉积相自动识别的有效途径。
本体是一种能在语义和知识层次上描述信息系统的概念模型建模工具[8]。OWL2 Web本体语言于2009年10月成为一项W3C(World Wide Web Consortium)的推荐标准。通过本体的无歧义性(用特定的形式化语言对本体模型进行描述),使机器和用户都能达到统一的理解[9]。
领域本体是用于描述指定领域知识的一种专门本体[10]。它明确了领域内共同认可的概念术语,利用领域知识的语义模型表达了概念含义,并在内部层次当中规定了这些概念之间的关系,为知识获取以及表示奠定了基础。领域本体是一个五元组,记作O={C,A,R,I,M}[11]。其中,C是概念集,指特定领域中属于概念的集合;A是属性集,主要用来表现概念自身的特征;R是关系,指领域中概念间的相互作用;I为实例集;M是实例与概念之间的映射关系集合。
辫状河三角洲相本体是包含辫状河三角洲相在识别分类的总结与知识的经验性模型。在沉积相本体中,C即是各种沉积微相,A为包括岩性和测井响应特征的在内各种属性,R即为各种沉积相之间的关系集合,I为实际油气田中的划分的地层或沉积相,M为I集合中各类划分的地层的岩性和测井响应参数。
根据斯坦福大学开发的七步法[12],利用Protégé工具,结合沉积相领域知识和知识体系的特点,构建辫状河三角洲相本体。实现过程如下:
1)确定辫状河三角洲相本体的知识范畴,划分出一个能够清楚表达和解释沉积相内各类现象与专业术语的知识范围。
2)根据相关搜索与考查,没有可以复用的现有的辫状河三角洲相本体。
3)列出沉积相中的重要术语,主要包括:相、相标志、沉积类型、沉积岩类型以及各类测井方法和特征。
4)定义各类相和相之间的等级体系,采用目前公认度最高的“相-亚相-微相”三级体系。首先,以辫状河三角洲相为相级别的沉积相类型。其次,根据地形相对位置,划分前三角洲亚相、三角洲平原亚相和三角洲前缘亚相,建立亚相级别的沉积相类型。最后,建立对应亚相下所有可能存在的微相级别的沉积相类型。如图1所示,本体中辫状河三角洲前缘亚相下的席状砂微相、水下分流河道、水下分流间湾、远砂坝和河口坝。其中,箭头代表分属关系。
5)定义沉积相的属性,包括岩性特征,测井响应特征(自然伽马、电阻率、自然电位)等。
图1 辫状河三角洲相及其亚相微相
6)定义属性之间的关系和分面,各个特征之间的相互独立,且规定属性特征取值范围。
7)加入实例,将实际油田中已知划分好的沉积相实例加入到辫状河三角洲相本体。
语义识别是以事物的描述逻辑为基础,根据事物相关属性特征以及之间的关联规则,得到事物的判断结果即分类结果的一个过程。其中,语义相似度和语义距离是主要的衡量标准。语义相似度表示相同真实对象或想法的两个文本表达式之间的相似度[13]。语义相似度和语义距离之间成反比关系:两个概念的语义距离越大,其相似度越低;反之,两个概念的语义距离越小,其相似度越大。
目前,基于本体的语义相似度计算方法主要划分为3类:①基于结构距离的计算方法;②基于内容的计算方法;③基于属性的计算方法[14-16]。其中,基于结构距离的计算方法的基本思想是通过两个概念在本体树状分类体系中的路径长度量化它们之间的语义距离,从而得到相似度。基于内容的计算方法的基本思想是如果两个概念词共享的信息越多,两者之间的语义相似度也越大;反之,共享的信息越少,相似度也越小。基于属性的计算方法的基本思想是事物之间的关联程度与其所具有的公共属性数相关。事物由其属性特征反映其本身,人们用以辨识或区分该事物的标志就是属性特征。对于两个被比较概念而言,公共属性项越多,相似度越大[17]。
笔者提出的基于本体信息量的语义识别方法是上述方法的结合,其基本思想是根据每个结点上对应相同属性特征里的内容,统计概率,进而,引入信息量公式[18,19],计算其信息量,用信息量代表其属性,通过语义距离公式得到语义相似度。同样,语义距离越小,代表相似度越大。相似度最大的沉积相类型即为语义识别的分类结果[20-21]。
这里提出的语义识别方法分为四个个步骤:
1)根据之前对沉积特征的描述,岩石粒度可划分为砾、砂、粉砂和泥四个级别,自然伽马、电阻率和自然电位曲线形态有箱形、钟形和漏斗形等共七种形状。建立的辫状河三角洲相本体中包含每种沉积相所对应的岩性特征和测井响应特征。因此,结合沉积相本体,统计实际油田数据中每种形状和粒度级别在每个属性特征中出现的频率,得到相应的出现概率Pi(i=1,2,3,4),其中,i代表用到的四种特征。
2)由信息量公式可知,事件发生的概率可以转换为该事件含有的信息量,并且一个事件发生的概率越小,代表其信息量越大。因此,将所得到的概率Pi代入信息量公式,得到每种形状和粒度级别所对应的信息量Ii(i=1,2,3,4),公式中a为底数,通常取为自然数e。
Ii=-loga(Pi)i=1,2,3,4
(1)
3)用得到的信息量Ii代替沉积特征,结合辫状河三角洲相本体,进而,每种沉积相得到一个以信息量为坐标的四维向量So={I1,I2,I3,I4}。在计算两个沉积相向量之间的语义相似度时,比如Sp={Ip1,Ip2,Ip3,Ip4}和Sp={Iq1,Iq2,Iq3,Iq4},将其带入语义距离计算公式(2),从而,得到两者之间的语义距离Lw。公式中k为语义参数,通常k取为0.5。该公式在语义识别测试数据时,取Sp为未知的测试数据相,依次将该未知相的四维向量Sp与已知沉积微相类型相的四维向量Sp带入语义距离公式(2)。
(2)
逐次计算,依次得到该未知相与每种沉积微相之间的语义距离Lw,其中语义距离最小者,即语义相似度最大者,即为最终的语义识别的沉积相类型。
为了验证方法和本体模型的有效性,取东海凹陷X气田的砂质辫状河三角洲的相关岩性和测井数据,对提出的沉积微相语义识别方法,进行缺项实验验证和交叉缺项实验验证。
实验所用的数据是该气田花岗组地层中约700 m长度,共4口井的岩性和测井相关数据。经过专家和工作人员的勘探分析,对这些数据进行了沉积相类型划分。其中,主要以辫状河三角洲前缘亚相下的各种水下沉积微相为主,详细统计见表1。其中,数字代表该种微相在每口井中出现的次数,总共101条数据。
根据语义识别方法的前两步,统计频率,得到概率Pi(i=1,2,3,4),计算信息量Ii(i=1,2,3,4),可以得到四种特征出现频率、概率和信息量表,见表2。在此基础上,结合建立的辫状河三角洲相本体,进行第三步,得到辫状河三角洲前缘亚相下的所有存在的沉积微相的四维信息量向量,见表3。在此基础上,进行缺项实验验证。缺项实验是指随机在上述101条数据中抽取一条,作为测试相So。随机将So的一个沉积特征设为未知,比如,将自然伽马曲线形态设为未知,即得到一条测试数据So={I1,未知,I3,I4}。将So与表3中的各种沉积微相类型Si(i=a,b,c,d,e)依次通过语义距离公式,计算语义距离Lw,取语义距离最小者,即作为语义识别的沉积相类型结果。
TOP-1代表着方法计算出分数最高的对象A是实际所需要对象的概率统计,是一种准确率。在本文中,准确率来自于缺项验证实验。取已有地质认识的沉积相的岩性和测井响应数据,每组数据都对应一个沉积微相类型。以该划分的沉积相结果作为正确的标签。然后,每组数据中随机丢弃一个特征,通过文中提出的语义识别方法,得到与每种沉积微相之间的语义距离。默认语义距离最小的沉积微相为得到的TOP-1结果,默认语义距离最小和第二小的沉积微相为得到的TOP-2结果。图2展示了一条测试相So={砂,箱形,未知,箱形}与辫状河三角洲前缘亚相下各个微相之间的语义距离。由图可知,席状砂沉积微相为TOP-1结果,水下分流
表1 实验数据统计表
表2 沉积特征出现频率、概率与信息量表
表3三角洲前缘微相的四维信息量表
Tab. 3 Four-dimensional information scale table of delta front microfacies
沉积微相类型岩性GRSPRS水下分流间湾0.9260.9020.9260.902水下分流河道0.5210.7440.7440.765席状砂0.5210.9260.9020.765远砂坝0.9262.0480.7650.765河口坝0.5212.0482.0482.130
河道沉积微相与席状砂沉积微相为TOP-2结果。
在上述基础上,遍历101条数据,进行缺项实验验证。最终,语义识别TOP-1准确率为91.1%,语义识别TOP-2准确率为100%。
图2 测试相So与各种沉积微相之间的语义距离
表4 交叉验证与交叉缺项验证准确率结果表
图3 部分实验验证结果
为了进一步证明语义推理方法的有效性,在上述实验数据上进行交叉验证和交叉缺项验证。由于数据取自同一地层且长度规格一致。所以交叉验证时,采用3口井的数据,通过语义识别方法,结合辫状河三角洲本体,得到三角洲前缘亚相下各种沉积微相的四维信息量向量。然后去语义识别预测另一口井的沉积微相类型。
在此基础上,进行交叉缺项验证,任意在测试井数据中取So为测试相,随机将一个沉积特征设为未知,即得到测试数据So。通过语义距离计算公式,计算So与每个沉积相之间的语义距离Lw,取距离最小者,即相似度最大者,即推理结果。重复上述验证过程,部分实验结果如图3所示。
经交叉验证和交叉缺项验证的沉积相语义推理分类预测实验,实验结果准确率如表4所示。由表4中结果分析可知,在4维特征都知道的情况下,交叉验证的语义识别预测结果为100%,也就是说每个特征结点的信息量都没有丢失,从而证明了用4维信息量向量表示某一种沉积微相类型是可行的。然后,进一步的交叉缺项验证实验的平均准确率为83.3%。
但是存在某一口井准确率波动较大的情况。可能的原因是,整体语义识别实验环境和条件是一致的。在一个工区的沉积环境可能由于短时间内发生沉积过程突变(地震、泥石流等),导致在某一小块横向区域内同一深度区段内测井响应特征上发生突变,从而影响了某一口井的语义推理预测准确率。
笔者针对单井辫状河三角洲环境下的沉积微相识别问题,尤其是测井资料不完整(缺少一项特征)情况下的识别问题,利用本体和语义距离计算的相关技术,并将两者结合,提出了基于本体信息量的单井辫状河三角洲沉积微相语义识别方法。经过缺项实验验证,识别结果与已有的地质认识的对比准确率为91.1%,交叉缺项实验验证的平均准确率为83.3%,基本满足单井沉积相研究工作中的需要,方便且较为准确的为相关研究人员提供一定的参考。
在适用性方面上,该方法对同一地层下发育比较稳定且单一沉积体系下的沉积微相识别效果较好。在应用该方法时,仿照本文对辫状河三角洲的实验为例,只需对所研究的数据,划分出合适的分类体系,进而建立相对应的本体,最终进行沉积相语义识别工作。对于多种沉积相与亚相频繁更换的情况,该方法具有一定的局限性。总之,该工作为进一步的连井沉积相研究打下基础,对实际地质勘探与研究有一定的意义。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!