当前位置:首页 期刊杂志

一种基于深度学习的油藏年度规划储量预测方法研究*

时间:2024-05-04

赫俊民 李亚传

(1.中石化胜利油田物探院 东营 257100)(2.中国石油大学(华东) 青岛 266580)

1 引言

油藏资源是油田企业发展的基础,油气储量的分析与预测是油气企业发展中不可或缺的基础工作。只有通过科学分析,量化投入产出关系,才能尽可能在有限的资源下创造最大收益。因此,在勘探数据分析的基础上,准确预测油藏年度规划储量,对优化勘探规划结构、提高油藏发现效率都具有重大意义。在油气开采的过程中,相关专家一直在探索一种准确、高效的资源预测方法。然而由于对不确定因素难以准确地量化,预测结果与实际产出之间存在较大误差。本文在勘探规划数据分析的基础上,提出了一种基于深度学习的储量预测方法——基于RNNs(Recurrent Neural Networks)的油藏年度规划储量预测网络,是利用RNNs在油藏年度规划储量预测方面的第一次尝试。通过建立不同级别地质单元的的预测模型,利用近几十年的历史数据,实现对不同地质单元不同勘探阶段的中短期年份油气储量的预测。实验证明,基于RNNs的油藏年度规划储量预测网络在油藏年度规划储量预测上的效果明显优于传统的预测方法[1~2],而且计算效率有大幅提高。

2 相关工作

2.1 传统的储量预测方法

油气田年度规划储量预测的结果准确度,取决于预测方法和所建立的数学模型。总地来讲,规划储量预测方法分为数学模型法、历史拟合法、时间序列预测分析法等几大类[3~4]。

数学模型法从模型的理论思想、数学表达式、求解方法、适用范围、应用效果等方面进行分析,并实际应用于油田的年度规划储量预测[5]。

历史拟合法[6]基本原理为:构建一个反映油藏模型计算值与实际观测值偏差的目标函数,通过优化算法,自动寻找最优油藏参数,最小化目标函数[7]。自动历史拟合利用少量的动态观测数据,求解模型中的参数,从而得到完整的预测模型,用来预测将来的数据[8]。

时间序列预测分析法是根据事物发展的连续性原理,应用数理统计方法将过去的历史数据按时间顺序排列,然后再运用一定的数字模型来预计未来的一种预测方法[9]。

然而,传统油藏年度规划储量预测方法预测精度低、人工要求高、难以复现、效率低[10]。因此,亟需一种新的方法,在提高储量预测的速度和精度的同时降低预测成本。

2.2 深度学习方法

深度学习的概念由Hinton等于2006年提出。基于深度置信网络提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,深度学习是机器学习中一种基于对数据进行表征学习的方法[11]。近年来,深度学习方法在数据挖掘、数据预测等领域表现出卓越的性能,目前以深度学习为核心的某些机器学习应用在某些应用场景下性能已经远超传统算法[12]。

循环神经网络(RNNs)是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为。RNN可以利用它内部的记忆来处理任意时序的输入序列,当前时刻的输出结果跟输入和上一时刻的输出有关[13]。这让它可以更容易处理与时间序列有关的任务。

3 勘探基础数据处理

响预测结果的数据多种多样,只有抓住关键因素,才能准确预测。经过数据分析,发现了影响预测模型建立的关键因素:探井勘探程度、资源探明程度、累计油藏个数。以东营凹陷为例,图1分别为东营凹陷地区年累计资源探明程度、年累计探井勘探程度以及年累计油藏个数,通过分析发现,三项数据大体呈现增长趋势。这是油田工作者在数十年的工作中总结出来的对油藏年度规划储量影响较大的因素,具有较强的指导意义。因此在该方法中,也主要关注这三个数据指标[14]。

图1 处理后的数据结果

对勘探基础数据的处理主要包括三部分:整理基础数据、排除干扰因素、规范数据格式。

1)整理基础数据:由上一节勘探数据分析可知,整个预测过程要用到的数据有探井勘探程度、资源探明程度、累计油藏个数这三组数据,计算这些数据还需要包括探井完钻日期、区域面积在内的一系列辅助数据。首先要从油田数据库中将数据整理出来,选择出其中可用的年份(1964-2013)来准备建模。

2)排除干扰因素:在勘探基础数据统计过程中,遇到了小油藏(即油藏储量小于15万t的油藏)的问题。在油藏年度规划储量问题中小油藏问题不可避免,由于其产量较小,对未来储量预测指导意义不大,如果不进行单独处理,会对预测模型产生较大的影响,进而影响模型的预测结果。处理方法是将小油藏进行相互合并,合并的规则是如果若干油藏具有相同的油田名、时间和断块区名,并且这若干油藏中有小油藏,则将这若干油藏进行合并,将其作为一个油藏来处理。

3)规范数据格式:其中主要工作是将数据库中的数据类型和精度调整成适应模型需要的形式。将数值类型数据统一保存成浮点数(小数点后保留八位有效数字)。不规范形式的数据会在计算过程中产生较大计算误差,因此规范化输入数据在建模过程必不可少[14]。

4 深度学习储量建模研究

根据对油田储量序列的实际分析,可以将油田储量序列的预测问题看作是一个时间序列建模的问题。影响油藏年度规划储量预测的主要因素有年累计资源探明程度、年累计探井勘测程度、年累计油藏个数。

时间序列是按时间顺序的一组油田的相关信息。时间序列分析就是利用这组油田数列,应用数理统计方法加以处理,以预测未来油藏年度规划储量,考虑到油藏年度规划储量探测过程中的随机性,需要利用统计分析中加权平均法对之前获取的油田数据进行处理。时间序列预测反映油藏年度规划储量勘探的趋势变化和随机性变化[15]。

RNNs将前一个状态的输出当作当前状态的输入,体现了模型数据的时间先后顺序以及互相的影响。理论上,RNNs能够对任意长度的序列数据进行处理。但是在实际的应用过程中,由于GPU、显存等条件限制,需要减少参数降低问题的复杂性,往往假设当前的状态只与前面的几个状态有关。理论上,时间上距离当前数据越远的数据对当前数据的影响就越小,因此该假设是符合实际使用需求的。

建立的RNNs模型如图2所示,深度模型包含输入单元,用于接收油田的历史数据(年累计资源探明程度、年累计探井勘测程度、年累计油藏个数),图中可视层即为即为接受历史数据输入的节点,每个节点接受一维数据。图中可视层共9个节点,故输入的向量为长度为9维的特征向量。图中输出层即为网络的预测结果输出单元,共有一个节点,输出一个关于储量的预测结果;特征映射层从这些历史数据中提取出数据之间内在的规律,并进行下一步的输出预测,图中的中间部分的三层即为特征映射层。网络的输入向量维度比较低(相比更复杂的多维数据输入来说)而且训练数据较少,限制了网络节点数。由于输出节点数小于输入节点数(只有一个),因此网络整体呈金字塔形状。

图2 深度学网络结构

5 模型训练

用勘探基础数据处理一节中的方法整理好的数据应该是[x,y]的数据对形式,其中x是一个9维向量,包含了要输入的信息,y是与x数据同年的油藏年度规划储量结果,将x输入到网络中,会得到一个输出结果out,利用交叉熵损失函数:

来训练网络模型,最小化out和y之间的误差。利用深度学习中的反向传播机制,对模型进行迭代训练,自动调整权值参数,直至损失函数收敛,完成模型训练。

实验的数据是油田1964年到2013年的实测数据。模型的训练过程就是参数调整的过程,当模型训练完成,参数固定,在使用预测过程中不会改变,但是这与油田的实际情况不相符。油田产量至少存在一个增长-稳定-衰减过程。如果只用增长过程的数据预测整个周期的储量,误差势必会逐渐增大,因此,模型只能预测短时间内的油藏年度规划储量,如果继续使用该模型,需要用每年新增的数据重新训练网络模型,更新权重参数。

6 实验结果

众所周知,学习率的大小对实验结果影响巨大,学习率过小损失函数收敛过慢,并且容易陷入局部最优化;学习率过大,使得损失值产生震荡。实验学习率对模型误差的影响结果见表1。

表1 学习率对模型误差的影响

由表1分析可得,学习率在6以内时误差呈先下降再上升的整体趋势,在3时模型的精度达到最佳(在所有选择的学习率中)。但是,在实际建模过程中,还要考虑到模型的效率问题,一定范围内,学习率越大,模型的效率就越低,在误差不大幅上升的情况下要选取较小的学习率,经过进一步的实验,最终确定学习率为2.1,在不损失太多精度的情况下,尽可能提高效率。

为评价本深度学习模型的效果,以东营凹陷的年累计探明储量序列数据为例,对深度模型的效果进行评估,实验结果见图3。

图3 模型效果评价曲线

由图3(a)可知,该模型能够学习到年累计储量的总体变化趋势,在数据变化不剧烈的时模型能够达到较高的准确度,误差曲线图3(b)所示,对于每一个年份的油藏年度规划储量预测,该模型的误差都在10%以内。

同时,为了更直观表现本深度模型在储量预测上的效果,本文对东营凹陷的储量增长曲线作了对比,对比情况如图4所示。从图中可以观察到,该模型的预测曲线(图4(a))在储量的变化趋势上与实际的储量(图4(b))基本吻合,在局部储量变化比较剧烈的年份(如1983年),预测效果稍差。

图4 东营凹陷真实储量变化曲线与预测储量变化曲线对比

7 结语

据所知,目前基于深度模型的油田发现储量增长趋势预测是深度学习在油田勘探规划分析决策过程中的首次尝试。实验证明,该模型效果显著,相比传统方法在预测的精度、速度上都有大幅提高。该模型对今后深度学习在油藏年度规划储量预测方面的研究与应用有一定的参考意义。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!