地球物理学报  2018, Vol. 61 Issue (10): 4110-4125   PDF    
地震油气储层的小样本卷积神经网络学习与预测
林年添1,3, 张栋2, 张凯1, 王守进4, 付超5, 张建彬6, 张冲1     
1. 山东省沉积成矿作用与沉积矿产重点实验室, 山东科技大学地球科学与工程学院, 山东青岛 266590;
2. 海底科学与探测技术教育部重点实验室, 中国海洋大学海洋地球科学学院, 山东青岛 266100;
3. 海洋国家实验室海洋矿产资源评价与探测技术功能实验室, 山东青岛 266071;
4. 中国石化石油物探技术研究院, 南京 211103;
5. 山东大学 岩土与结构工程研究中心, 济南 250061;
6. 山东正元建设工程有限责任公司潍坊分公司, 山东潍坊 261000
摘要:地震储层预测是油气勘探的重要组成部分,但完成该项工作往往需要经历多个环节,而多工序或长周期的研究分析降低了勘探效率.基于油气藏分布规律及其在地震响应上所具有的特点,本文引入卷积神经网络深度学习方法,用于智能提取、分类并识别地震油气特征.卷积神经网络所具有的强适用性、强泛化能力,使之可以在小样本条件下,对未解释地震数据体进行全局优化提取特征并加以分类,即利用有限的已知含油气井段信息构建卷积核,以地震数据为驱动,借助卷积神经网络提取、识别蕴藏其中的地震油气特征.将本方案应用于模型数据及实际数据的验算,取得了预期效果.通过与实际钻井信息及基于多波地震数据机器学习所预测结果对比,本方案利用实际数据所演算结果与实际情况有较高的吻合度.表明本方案具有一定的可行性,为缩短相关环节的周期提供了一种新的途径.
关键词: 人工智能      深度学习      卷积神经网络      卷积核      地震数据驱动      油气藏识别     
Predicting distribution of hydrocarbon reservoirs with seismic data based on learning of the small-sample convolution neural network
LIN NianTian1,3, ZHANG Dong2, ZHANG Kai1, WANG ShouJin4, FU Chao5, ZHANG JianBin6, ZHANG Chong1     
1. College of Geological Sciences & Engineering, Shandong University of Science and Technology, Shandong Qingdao 266590, China;
2. Key Lab of Submarine Geosciences and Prospecting Techniques, MOE and College of Marine Geosciences, Ocean University of China, Shandong Qingdao 266100, China;
3. Laboratory for Marine Mineral Resources, Qingdao National Laboratory for Marine Science and Technology, Shandong Qingdao 266071, China;
4. Institute of Geophysical Prospecting, SINOPEC Research Institute of Petroleum Exploration and Development, Nanjing 211103, China;
5. Geotechnical and Structural Engineering Research Center, Shandong University, Jinan 250061, China;
6. The Shandong Zhengyuan Construction Engineering, Shandong Weifang 261000, China
Abstract: Prediction of reservoirs with seismic data plays an important role in oil and gas explorations. However, multiple stages or long periods of work are often required to complete prediction processes, which can lower the efficiency of exploration. To solve this problem, based on features of distribution of hydrocarbon reservoirs and their seismic response, this work introduces a convolution neural network depth learning to intelligently extract, classify and identify characteristics of oil and gas from seismic data. It makes it possible to globally extract and classify features from unexplained seismic data under small sample conditions with strong applicability and generalization of the convolutional neural network. That is, the convolution kernels are obtained from the known drilling data, and then which are used to recognize hydrocarbon characteristics from seismic data driven based on the convolution neural network. This scheme is applied to the checking of model data and actual data, and the expected results are achieved. It can be seen that the calculation results of this scheme have a high degree of agreement with the actual situation by comparing the actual drilling data and the predicted results with multi-component seismic data by machine learning. It shows that the scheme has certain feasibility and provides a new way to shorten the periods of relevant steps.
Keywords: Artificial intelligence    Deep learning    Convolution neural network    Convolution kernel    Seismic data driven    Oil and gas reservoir identification    
0 引言

以原始地震数据为基础进行油气储层预测,至今仍是油气勘探开发研究的热点(Gholami et al., 2014).井震联合反演无疑有助于提高地震油气储层预测的精度.然而,由于勘探程度和成本等原因,尤其对于一个新区而言,钻井数据往往很有限,容易造成样本的不足.从统计学角度看,这就是如何解决小样本的问题.即小样本甚至无样本情况下,如何有效实现特征识别的问题,如地震油气特征识别.钻井资料,特别是含油气井样本的获取、收集,往往是十分昂贵的,与语音、图像完全不是一个量级.在这种条件下,我们如何利用少量含油气井,并借助于机器学习方法,去识别一类特征是否属于含油气藏?

基于统计学理论的地震储层预测方法主要有聚类分析(Meng et al., 2015)、遗传算法(Li et al., 2016)、模糊理论(Masoudi et al., 2012; 印兴耀等, 2012)、支持向量机(Sebtosheikh and Salehi, 2015)、深度学习(付超等, 2018)等.机器学习在其他领域的快速发展,也促进了该方法在地球物理相关领域的研究与应用(Mohebbi et al., 2012; 林年添等, 2013; Cersósimo et al., 2016; Ouadfeul and Aliouane, 2016; Nwachukwu et al., 2018).人们从监督学习和无监督学习(Lee et al., 2017)角度出发,以各类神经网络算法对油气特征进行分类,获得了良好的应用效果(刘瑞林和马在田,1995陆文凯和牟永光,1996张向君等,2002Cudjoe et al., 2016Ebrahimi and Khamehchi, 2016).

多年来,国内外众多学者针对地震储层预测问题,发展了很多新技术、新方法,极大推动了油气勘探进程.然而,完成这些工作往往需要经历多个环节,长周期的勘探与研究工作降低了勘探效率,增加了成本.

深度学习作为机器学习领域一个新的研究方向,对降低、甚至解决上述长周期、低效率所带来的高成本问题提供了新思路、新方法.深度学习的概念最早由多伦多大学的Hinton等(2006)提出,为解决传统神经网络易收敛到局部最小值等问题,Hinton提出使用无监督预训练方法优化网络权值的初值,再进行权值微调,由此拉开了深度学习的序幕.Krizhevsky等(2012)将CNN构造成深度卷积神经网络,在ILSVRC-2012数据集上获得了top-5测试错误率为15.3%的好结果.由此,卷及神经网络作为深度学习的模型逐渐成为研究的热点.

卷积神经网络经过多年的发展,已从最初较为简单的手写字符识别(Lecun et al., 1998)的应用逐渐扩展到行人检测(Sermanet et al., 2013)、图像处理(Martínez-Alvarez et al., 2015)、语音识别(Abdel-Hamid et al., 2014)等领域.特别是最近,由Google开发的人工智能围棋程序AlphaGo(Silver et al., 2016)使用蒙特卡洛树搜索结合深度神经网络的方式进行围棋决策,引起了广泛的关注.张繁昌等(2014)将其应用于地震储层的预测,也取得了一定效果.

卷积神经网络因其具有适用性强、泛化能力强、可自适应提取、分类并识别特征等优点,我们在进行大量调查研究后,结合油气藏分布规律及其在地震响应上所具有的特点,设计一套适用于小样本,甚至于极小样本条件下地震油气储层预测的卷积神经网络框架,应用地震数据驱动其中蕴藏的油气特征,最终实现直接预测油气藏分布的目标.

1 理论基础

卷积神经网络是本研究所引入的核心框架.卷积神经网络的基本结构包括两种特殊的神经元层(Krizhevsky et al., 2012),其一为卷积层,每个神经元的输入与前一层的局部相连,并提取该局部的特征;其二是池化层,用来求局部敏感性与二次特征提取的计算层.卷积神经网络结构如图 1所示,整个网络由输入层、一对或多对交替相连的卷积层和池化层、全连接层以及输出层组成.由于该网络避免了前期复杂的预处理,可以直接输入原始信息,同时它的权值共享网络结构更类似于生物神经网络,大大降低了网络模型的复杂度.经典的卷积神经网络学习架构如图 1所示.该网络除了输入和输出,中间层可以由多个卷积和池化层对组成,层数越多表示学习深度越深.图 1C1(大小为m1×n1)表示第一卷积层,S2(大小为m2×n2)表示第二降采样层,后者以C1作为输入;Cl-1(大小为ml-1×nl-1)表示第l-1卷积层,Sl(大小为ml×nl)表示第l降采样层,它是以Cl-1作为输入.卷积神经网络基本模型概述如下.

图 1 卷积神经网络架构 Fig. 1 Architecture of convolution neural network
1.1 卷积

卷积是卷积神经网络最基本也是最重要的操作.卷积层,又叫特征提取层,它是由前一层的特征图与一个可学习的核进行卷积后,加偏置再经过激活函数得到的输出结果组成.因此该层的每个神经元输入与前一层的局部感受野相连,通过卷积核提取该局部的特征,一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来(段友祥等,2016).卷积计算的维度往往与解决不同的实际问题有关.

(1) 一维卷积

一维(1D)卷积神经网络中的输入是一维向量,所以网络内部的卷积核、特征图也都是一维的,如语音记录、测井曲线、地震单道记录等.一维卷积计算公式为

(1)

式中:ailail-1分别为第l层和第l-1层的第i个特征映射;Wkil为全连接ail-1ail的卷积核,u为卷积核长度大小;ail(x)、ail-1(xp)、Wkil(p)分别为ail在坐标x上的元素值、ail-1在卷积核Wkil(u)计算后在x上的元素值和卷积核Wkil本身在坐标p上的元素值,f(·)为非线性激活函数.

(2) 二维卷积

二维卷积神经网络中的输入是二维向量,所以网络内部的卷积核、特征图也都是二维的,如平面图像、CT或核磁共振图像、二维地震剖面等.二维卷积映射过程如图 2所示,二维卷积计算公式为

(2)

图 2 二维卷积映射过程 Fig. 2 Sketch of two-dimensional convolution mapping

式中:ailail-1分别为第l层和第l-1层的第i个特征图;WkilR2为全连接ail-1ail的卷积核,uv分别为卷积核的空间维度大小;ail(x, y)、ail-1(xp, yq)、Wkil(p, q)分别为ail在坐标(x, y)上的元素值、ail-1在卷积核Wkil(u, v)计算后在(x, y)上的元素值和2D卷积核Wkil本身在坐标(p, q)上的元素值;f(·)为非线性激活函数.

(3) 三维卷积

三维卷积神经网络中的输入是三维向量,所以网络内部的卷积核、特征图也都是三维的,如医学三维影像、三维地震剖面等.三维卷积映射过程如图 3所示,三维卷积计算公式为

(3)

图 3 三维卷积映射过程 Fig. 3 Sketch of three-dimensional convolution mapping

式中:ailail-1分别为第l层和第l-1层的第i个3D特征块;WkilR3为全连接ail-1ail的3D卷积核,uvw分别为卷积核的空间维度大小;ail(x, y, z)、ail-1(xp, yq, zs)、Wkil(p, q, s)分别为ail在坐标(x, y, z)上的元素值、ail-1在经过三维卷积核Wkil(u, v, w)计算后在(x, y, z)上的元素值和3D卷积核Wkil本身在坐标(p, q, s)上的元素值;f(·)为非线性激活函数.

1.2 池化

池化是对卷积层的优化过程.池化层,又叫采样层或特征映射层,是为了对不同位置的特征进行统计的一种方法,这种方法可以通过采样的方式对卷积层进行更低分辨率的统计表示.常用的方法有平均池化(Mean-pooling)、最大池化(Max-pooling)等.池化层是由卷积层经过池化加偏置再经过激活得到的,这种池化的方法对卷积的特征图进行了二次采样,大大减小了特征分辨率,降低了网络规模.

池化计算对应于前述卷积计算.假设第l层为池化层,第l-1层为卷积层,则l层不同维度的池化计算公式分别为:

一维池化计算:

(4)

二维池化计算:

(5)

三维池化计算:

(6)

式(4)、(5)、(6)中,l表示层数,pooling为池化操作,β为池化权值,b表示附加偏置,f(·)为非线性激活函数,其他符号含义同上(1.1卷积).

池化层的引入是仿照人的视觉系统对视觉输入对象进行降维(降采样)和抽象.在卷积神经网络过去的工作中,研究者普遍认为池化层有如下三种功效:(1)特征不变性,(2)特征降维,(3)在一定程度防止过拟合,更方便优化(魏秀参,2018).

1.3 激活

激活函数(Activation function)层又称非线性映射(Non-linearity mapping)层,顾名思义,激活函数f(·)的引入,是为增加整个网络的非线性表达能力.否则,若干线性操作层的堆叠仍然只能起到线性映射的作用,无法形成复杂的函数.ReLU函数是目前卷积神经网络中最为常用的激活函数之一.

ReLU函数实际上是一个分段函数,其定义为

(7)

(8)

ReLU函数的梯度在x≥0时为1,反之为0.

2 卷积神经网络学习与预测网络模型

本研究的目的是力图借助于卷积神经网络的强适应性和强泛化能力,以实现在有限样本(井孔信息)条件下能对地震解释不充分甚或未解释情况下,通过地震数据驱动、挖掘蕴藏其中的地震油气特征,从而实现直接识别并预测油气藏的分布.为此,需要针对油气藏分布的地球物理响应(如地震、测井)特点,设计一套网络模型并制定相关实施策略.

2.1 模型设计

卷积神经网络有多种多样的网络结构,但最常见的还是LeCun提出的经典的卷积神经网络,其网络结构如图 1所示.它一般主要由一个输入层、多个卷积层、多个采样层、全连接层和一个输出层组成,每层都含有多个神经元.在神经认知机当中包含两类神经元,一类是承担特征抽取的神经元,一类是承担抗变形的神经元.在卷积神经网络当中也包含两种神经元,即所设计卷积神经网络的基本网络结构包括两层:特征提取层(卷积层)和特征映射层(池化层).

(1) 全局优化特征提取.特征提取层(图 1中的C层)即卷积层,它的每个神经元与上层对应的局部感受域相连,通过卷积核和非线性变换来提取局部感受域的特征,如图 2图 3所示.一幅原始图像直接输入网络进入卷积层后,卷积层中有若干个卷积核函数,这些卷积核函数作用于输入图像提取图像的局部特征,如边缘、线和角落等.对于地震油气储层而言,针对地震油气勘探的特点,本研究将卷积核表征为具有地震油气特征的井孔信息,而感受野域可以是地震数据,或是测井数据等.前述的局部特征(感受野)即是我们期望提取的油气藏特征,其空间关系即油气藏的空间分布,当然这只是初步获得的地震油气藏分布情况.要达到全局优化特征提取目的,对于井孔信息有限情况,训练样本的提取,即卷积核的构建至关重要,表征地震油气特征的卷积核位置、大小都直接影响到特征提取的有效性,即地震油气储层分布预测可靠性.

(2) 保真特征映射.特征映射层(图 1中的S层)即采样层(池化层),它特征映射的主要功能是对卷积层内的特征图进行子采样,使其减小分辨率从而减小模型的复杂度,经过子采样后的特征也具有一定的缩放不变的能力.在特征提取层所提取的特征极有可能是冗余的,根据图像的局部相关性原理,一个图像区域有用的特征在另一个区域同样适用.通过亚采样的方法对特征向量进行降维,同时可以增加模型的抗畸变能力.对于本研究而言,通过该环节,可以提高获取地震油气特征的效率.但鉴于地震数据的特点,如果一味追求降采,极有可能使地震数据体边缘道信息丢失,也可能会使地震的含油气信息丢失.因此,为了保真,降采样的步幅不宜过大,同时还要实施充零处理,以保证地震数据的完整性,图 2图 3中的输出层(图中卷积特征映射层的虚框)即为本研究为达上述目的,而采取保真措施的结果.

卷积层和采样层交叉出现在网络中,一个卷积层和一个子采样层合起来称为一个特征提取过程.在卷积神经网络的末层是若干全连接层,它把最后产生的特征图连接在一起,根据需要产生的分类数调整最后的输出节点数并得到最后的分类结果,如图 4所示.

图 4 卷积神经网络分类模型 Fig. 4 Sketch of classification model of convolution neural network
2.2 实施策略

根据前文所设计网络模型框架,本研究制定技术实现的策略或基本步骤如下:

(1) 学习集数据标准化处理:由于原始地震数据其数值范围存在较大变化(如图 12图 13图 16),故首先需要对原始地震数据进行标准化处理,以便于随后的卷积计算等.

图 5 二维地质模型及其模拟地震剖面 (a)二维地质模型;(b)加入随机噪声的二维模拟地震剖面. Fig. 5 Two-dimensional geological model and its simulated seismic profile (a) Two-dimensional geological model; (b) Two-dimensional simulated seismic section with random noise.
图 6 单道地震记录及其卷积特征图 (a) 图 5b第79道地震记录;(b)基于卷积核CK1的第79道卷积特征图. Fig. 6 Single-trace seismic data and its convolution features (a) 79th trace of Fig. 5b; (b) Convolution features of 79th trace with convolution kernel CK1.
图 7 基于不同卷积核的单道地震卷积特征图 (a) 图 5b第420道地震记录;(b)基于卷积核CK1的第420道卷积特征图;(c)基于卷积核CK2的第420道卷积特征图;(d)基于卷积核CK3的第420道卷积特征图. Fig. 7 Convolution features of single trace with different convolution kernels (a) 420th trace of Fig. 5b; (b) Convolution feature of the 420th trace with convolution kernel CK1; (c) Convolution features of the 420th trace with convolution kernel CK2; (d) Convolution feature of the 420th trace with convolution kernel CK3.
图 8 基于不同卷积核的图 5b二维模拟地震卷积特征剖面 (a)基于卷积核CK1的卷积特征剖面;(b)基于卷积核CK2的卷积特征剖面;(c)基于卷积核CK3的卷积特征剖面. Fig. 8 Convolution features of 2D seismic data of Fig. 5b with different convolution kernels (a) Convolution feature of 2D seismic with convolution kernel CK1; (b) Convolution feature of 2D seismic with convolution kernel CK2; (c) Convolution feature of 2D seismic with convolution kernel CK3.
图 9 “油-气-水-油”地质模型及其地震剖面 (a)地质模型;(b)叠前逆时深度偏移地震记录. Fig. 9 Geological model of "oil-gas-water-oil" and its simulated seismic profile (a) Geological model of "oil-gas-water-oil"; (b) Prestack inverse-time depth migrated seismic record.
图 10 基于不同卷积核的图 9二维模拟地震卷积特征剖面 (a)基于卷积核CKgas的卷积特征图;(b)基于卷积核CKoil的卷积特征图. Fig. 10 Convolution features of 2D seismic data of Fig. 9 with different convolution kernels (a) Convolution features of 2D seismic with convolution kernel CKgas; (b) Convolution features of 2D seismic with convolution kernel CKoil.
图 11 丰谷构造及其区域构造位置 (a)孝泉—丰谷构造带及其区域构造纲要图(据林小兵修编),图中黑色矩形框为(b)图位置;(b)丰谷Tx46层沉积相与构造叠合图(据林熠等修编). Fig. 11 FG structure and its regional tectonic location (a) Xiaoquan-Fenggu tectonic belt and its regional structural outline map (modified from Lin X B); (b) Superposition diagram of the sedimentary facies of the Tx46 layer and the structure (modified from Lin Y et al).
图 12 研究区原始地震剖面 (a)纵波地震时间剖面; (b)转换横波地震时间剖面. Fig. 12 Original seismic profiles in the study area (a) P-wave seismic profile; (b) Converted S-wave seismic profile.
图 13 研究区原始纵、横波同深度地震时间切片 (a)纵波地震时间切片(1960 ms); (b)转换横波地震时间切片(2999 ms). Fig. 13 Seismic time slices of original P- and S-waves at the same depth (a) P-wave seismic time slice at 1960 ms; (b) S-wave seismic time slice at 2999 ms.
图 14 多波地震油气储层的机器学习与预测网络架构 Fig. 14 Network architecture for machine learning and prediction of multi-component seismic hydrocarbon reservoirs
图 15 基于无监督学习与监督学习预测的多波地震油气储层分布 (a)单一纵波无监督学习与监督学习预测的地震油气储层分布;(b)聚类分析预测的地震油气储层分布;(c)支持向量机预测的地震油气储层分布;(d)支持向量机预测的地震油气储层分布与构造叠合图. Fig. 15 Prediction of hydrocarbon reservoir distribution with multi-component seismic data based on unsupervised learning and supervised learning (a) Prediction with P-wave seismic data based on unsupervised learning and supervised learning; (b) Prediction with multi-component seismic data based on cluster analysis; (c) Prediction with multi-component seismic data based on support vector machine; (d) Hydrocarbon reservoir distribution of Fig. 15b superimposed on the structural map.
图 16 纵波地震原始剖面及卷积核提取位置 (a) P波Inline802地震原始剖面;(b) P波Xline500地震原始剖面. Fig. 16 P-wave seismic profiles and location of convolution kernel extraction (a) P-wave seismic profile of Inline802; (b) P-wave seismic profile of Xline500.

(2) 训练样本的提取:即含油或气特征卷积核的构建.这是本研究的关键,也是制作有效标签的重要环节,所提取油气特征鲁棒性强与弱,直接影响到卷积层特征能否有效反映油气层的分布.含油气层特征卷积核可以表征为含油或含气井孔的储层参数、地震属性等等.本研究主要以含油或气层段地震波形特征为例进行验算,这是考虑到波形特征包含了地震的振幅、频率、相位等综合信息.为了增强泛化能力和学习的鲁棒性,卷积核的构建通常融合了井孔地震道及相邻地震道信息.

(3) 卷积层生成:利用所提取的卷积核或训练样本,与输入集(原始地震数据)中的感受野一一对应卷积生成卷积层,即利用已知含油气井段信息获取卷积核,借助卷积神经网络驱动地震数据中蕴藏的地震油气特征.

在该环节及卷积层池化环节,为了保真,对步幅进行针对性的设置,同时进行充填处理.步幅(stride)控制着卷积核围绕输入内容进行卷积计算的方式,卷积核通过每次移动一个单元的方式对输入内容进行卷积,本研究设置的步幅为1;针对地震数据特点,为了尽可能多地保留原始输入内容的信息,即我们想要使输出维持原始维度,本研究对卷积层进行了零填充(zero padding),如图 2图 3所示的虚框.

(4) 降低网络变体数量:即莱特准则下卷积层异常值剔除.上述所生成的卷积层难免会受到相关因数的影响或噪声的干扰,会造成局部异常值的存在,为此,本研究引入莱特准则法进行剔除.莱特准则主要为:假设地震属性数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除(付超等,2018).

(5) 卷积特征层标准化处理:由于所生成的特征层是卷积核与输入学习集中不同感受野卷积生成,可能导致数量级差别大,这势必会影响到定量分析的效果和可靠性.为此,对数据进行分析时,需要对卷积层进行标准化处理.

(6) 卷积层池化:针对地震数据特点及本研究所采用小样本(实际为单卷积核)获取卷积层情况,为高保真保留地震信息,本研究未对卷积层进行传统意义上的池化(降维),而是采用了p-范数方法,压制非油气特征,以突出或增强含油气层特征.

(7) 激活输出:最后利用ReLU激活函数对卷积池化层进行激活以增强整个网络的表达能力,并输出结果.

此即完成了基于具有强适用性、强泛化能力的卷积神经网络在未解释地震数据体中全局优化提取油气特征并加以分类的工作.分类模型如图 4所示.

3 算例及讨论

为验证本研究方案的可行性和有效性,本研究依照上述所设计网络模型开展了模拟数据与实际数据的验算.

3.1 地震模型数据的验算

本环节,首先讨论反映地层起伏但具有连续性变化模型的单道、多道地震记录的地震反射特征层的识别,然后,以具有局部分布特征的油气藏模型为例,讨论不具连续性分布特征体的识别情况.

3.1.1 二维地震层特征模型数据的验算

为了能够更加直观的说明基于卷积神经网络法在地震数据相关特征的识别、分类中的能力或作用,建立了如图 5a所示的二维地质模型.该模型有四层均匀各向同性介质,四层各向同性介质依次充填P波速度为1508 m·s-1、2500 m·s-1、3536 m·s-1、3780 m·s-1,尖灭处速度3333 m·s-1.通过正演模拟(李桂花等,2011)获得如图 5b所示的二维地震剖面,这是一张加入了随机噪声的二维地震剖面.以此二维地震剖面为例,进行单道及多道的卷积特征分析.

(1) 单道理论计算

从如图 5b所示地震数据中抽取第79和第420地震道作为待学习特征时间序列(如图 6a图 7a所示).首先,提取训练样本,本研究选择第79道的目标层1(如图 6a箭头am1所指)为训练样本,记为卷积核CK1(Convolution Kernel 1).然后,利用式(1)进行一维卷积计算,其中以CK1为卷积核,第79地震单道记录为输入,由此,卷积计算得到如图 6b所示的卷积特征道.不难看出,与图 6a目标层1所对应位置处的特征明显突出(如图 6b箭头bm1所指).这是因为卷积核CK1即取自该层段,故而,相同特征得以突出.同为79道的其他特征段(如图 6a箭头am2所指目标层2,箭头am3所指目标层3),经卷积计算后,特征明显被削弱,如图 6b箭头bm2和箭头bm3所指相应的卷积特征段.图 7b所示为利用卷积核CK1与第420地震道(图 7a)进行卷积所得单道特征图,不难看出,与卷积核CK1特征相似的层段,其卷积层特征得以突出(如图 7b箭头bn1所指),反之,与卷积核CK1特征不相似的层段,其卷积层特征被削弱,如图 7b箭头bn2和箭头bn3所指相应的卷积特征段.此即表明:相似特征序列得以加强或突出,反之,不相似的特征被压制.

以上选择第79道目标层1作为卷积核CK1或1号标签,其所表征的反射波能量较强,进行特征对比时,强特征较容易被突出显示.但对于有效储层的地震响应而言,其往往并非能量较强层段或区域.由于不同研究区,储层性质差异较大,地震信号能量强弱分布不均,因此,利用能量相对较弱的区域进行特征对比,应更具有说服力,具有实际意义.仍然以第79道地震数据为例,选择能量相对较弱的第79道目标层2及能量更弱的目标层3作为训练样本,分别标记为卷积核CK2和卷积核CK3.依此,分别与第420地震道数据(即为待学习输入)进行卷积计算得到如图 7所示结果,图 7a为第420原始地震道记录.从图 7c中,可以看到,由表征地震反射较弱的卷积核CK2卷积所得的卷积特征序列中,与之相近特征得到了突出,如图 7c箭头cn2所指.而无论表征能量强的反射特征层1(图 7a箭头an1所指),还是表征能量更弱的反射特征层3和4(图 7a箭头an3和箭头an4所指),都因为与卷积核CK2特征不相似,而被压制了.同样地,从图 7d中,可以看到,由表征地震反射较弱的卷积核CK3卷积所得的卷积特征序列中,与之相近特征得到了一定突出,如图 7d箭头dn4所指.而无论表征能量强的反射特征层1和反射特征层2(图 7a箭头an1和箭头an2所指),还是表征能量更弱的反射特征层3(图 7a箭头an3所指),都因为与卷积核CK3特征不相似,而被压制了.

上述结果表明:卷积神经网络具有自适应提取、分类并识别特征的作用.

(2) 多道理论计算

多道即指二维地震.下面以前文所标记的卷积核CK1、CK2、CK3作为训练样本,对如图 5b所示的加入随机噪声的二维地震数据,即输入的学习集,利用式(2)进行二维卷积计算,由此获得如图 8所示的不同卷积核条件下的多道地震卷积特征剖面.

图 8a为卷积核CK1与输入学习集,即二维地震数据进行卷积计算得到的卷积特征剖面.不难看出,由于卷积核CK1表征的该地震剖面中最强的地震反射特征层,由此,卷积得到的特征剖面上,其所学习、识别得到的特征层也是最突出的.

图 8b为卷积核CK2与二维地震数据进行卷积计算得到的卷积特征剖面.尽管卷积核CK2表征的该地震剖面中相对较弱的地震反射特征层,但由此卷积得到的特征剖面上,其所学习、识别得到的特征层也得到较好的突出.

图 8c为卷积核CK3与二维地震数据进行卷积计算得到的卷积特征剖面.虽然卷积核CK3表征的该地震剖面中最弱的地震反射特征层,但由此卷积得到的特征剖面上,其所学习、识别得到的特征层也同样有较好的突出.不仅如此,本方案所得到的特征图,还很好地压制了噪声干扰,更好地突出了与卷积核CK3特征相似的特征层.如图 5b所示,在强噪声背景下,对应的反射层信息基本被掩盖了.

上述结果表明:卷积神经网络不仅具有自适应提取、分类并识别特征的作用,而且具有强适用性、强泛化能力.

3.1.2 二维地震油气藏特征模型数据的验算

前文应用卷积神经网络学习和识别具有连续性分布的特征层,效果是明显的.那么对于具有局部分布特征的油气藏而言,是否也具备自适应提取、分类并识别特征呢?为此,本研究建立了如图 9a的油、气、水、油地质模型(其中①油、②气、③水、④油),并通过逆时深度偏移处理获得如图 9b所示的原始地震剖面.

图 9b所示的油、气、水、油地震特征看,气藏②的特征最明显.现提取图 9b中气藏②作为卷积核,标记为卷积核CKgas.把图 9b所示地震数据作为输入,以Ckgas为卷积核,利用式(2)进行二维卷积计算得到如图 10a所示的表征气藏的卷积特征图.不难看出,对于气藏②而言,特征相似度最高,得到了很好得突出,而其他①油、③水、④油等明显被压制,不仅如此,其他的强地震反射也得到了很好地压制.

图 9b所示的油、气、水、油地震特征看,油藏①或油藏④的特征相对明显.现提取图 9b中油藏①作为卷积核,标记为卷积核CKoil.把图 9b所示地震数据作为输入,利用卷积核CKoil对其进行卷积计算得到如图 10b所示的表征油藏的卷积特征图.不难看出,虽然原始数据中气藏②特征最明显,但在此也明显被压制,原始数据中地震特征相对不是最明显的油藏①、④却被突出了,同样地,其他的强地震反射也得到了很好地压制.

上述结果进一步表明:卷积神经网络不仅具有自适应提取、分类并识别特征的作用,而且具有强适用性、强泛化能力.

3.2 实际数据的验算及效果分析

本研究应用丰谷构造区包括纵波和转换横波的实际三维地震数据进行本方案的验算.

3.2.1 三维地震数据及工区概况

(1) 工区地质概况:川西坳陷位于四川盆地西部,北东走向,丰谷构造位于川西坳陷西段孝泉—丰谷构造带(如图 11a实粗线矩形框所示).上三叠统须家河组埋深3500~5150 m,储层具有低—特低孔渗特征,地层异常高压,气水关系复杂,属于超深致密砂岩气藏.超致密、岩相变化快、埋藏深度大等问题极大地增加了储层预测的难度.近些年,多波地震勘探等技术的相继应用,使研究区地震油气勘探取得了突破,如在丰谷构造须四段M3、N2、M4等井中获得工业气.图 11b所示为丰谷Tx46层沉积相与构造叠合图(据林熠等修编).

目前还有太多有关影响该地区储层发育的问题尚未解决,如有效储层分布、含油气特征、气水分布等.因此,分析须家河组有效储层分布规律、气藏分布对寻找勘探目标至关重要.

(2) 地震数据概况:研究区多波地震数据包括纵波与转换横波,该两种数据的基本情况如下:

① 纵波:面积550 km2;主测线起始道inline87,总道数1148道,道间距25 m,联络测线起始道crossline80,总道数770道,道间距25 m;采样间隔2 ms,最大时间深度7 s.

② 转换横波:面积550 km2;主测线起始道inline87,总道数1148道,道间距25 m,联络测线起始道crossline80,总道数770道,道间距25 m;采样间隔2 ms,最大时间深度7 s.

该数据体其时间剖面和时间切片如图 12图 13所示.

3.2.2 地震油气储层的卷积神经网络学习与预测

为了评估本研究方案的有效性和可行性,首先简要讨论利用多波地震数据通过非监督学习与监督学习两大环节的机器学习与预测的地震油气储层分布情况,然后讨论、分析本方案的实施效果.

(1) 利用机器学习法预测多波地震气藏分布情况(付超等,2018林年添等,2018).图 14为用于预测多波地震含气储层所构建的无监督与监督学习网络.图 15b为我们应用多波地震数据(如图 12图 13所示,其工区位置及沉积相、局部构造及井孔信息见图 11),通过无监督学习得到的研究区地震含气储层分布图,其主要经历如图 14C1(卷积升维)、S2(聚类降维)及C3(聚合降维)三个环节.该三个环节具体为:①卷积升维(C1)获得纵、横波各36种地震属性特征图;②聚类分析优选地震属性(S2),获得对油气储层敏感的属性;③然后利用纵、横波对油气的敏感度不同,通过聚合降维(C3),使纵、横波属性融合在一起生成新属性体.此时聚合属性有多种,进一步的,通过聚类分析获得如图 15b所示的无监督学习下的多波地震油气储层分布图.图 15c则是在前面三个主要环节基础上,进一步地执行池化降维(S4)及支持向量机监督学习并预测得到的多波地震油气储层分布情况(付超等,2018林年添等,2018).该两环节具体为:④通过主成分分析以降低原数据集间的相关性,使输出的属性集中尽可能的保留原始变量中最具代表性的属性;⑤把主成分属性作为学习集,选取测试区的10口井点样本作为支持向量机回归器的输入,利用训练好的回归器将运算推广到全区,最终得到的多波地震气藏分布的预测结果.图 15c所表征的地震气藏分布与实际情况基本吻合(与井孔对比).将图 11b的局部构造叠合于图 15c,得气藏分布区与局部构造叠合图,如图 15d所示,不难看出,研究区主要气藏分布于局部构造部位,这完全符合气藏总体分布规律.图 15a为仅利用纵波数据,经历了如图 15c同样过程的结果,不难看出,相比于图 15b图 15c,其所刻画的气藏边界相对模糊.

(2) 利用本方案预测的纵波地震气藏分布情况.如前所述,基于多波地震数据与机器学习的地震含气储层的预测取得了良好效果.但是,实际生产工作由于成本问题,多波地震勘探应用往往受到制约.此外,当井孔信息很少,如只有一口含油或气井时(这是一个极小样本的问题),可否利用纵波数据直接且有效预测地震油气储层?

本研究引入卷积神经网络技术,发展出小样本卷积核神经网络学习方法,其网络框架如图 1所示,具体实施网络如图 4所示.本研究依此对如图 12或13所示纵波地震数据体进行相关验算.图 16为过井纵波地震测线剖面和联络测线剖面(剖面位置如图 18a红线和黄线所示).我们选择M3井作为样本井,以须46含气层段为样本段,即以此构建卷积核(图 16黑色箭头所指),标记为卷积核CKx46,以纵波地震数据作为卷积输入,利用式(3)进行三维卷积计算,结果如图 17(卷积特征剖面)和图 18(卷积特征层).

图 17 纵波地震卷积特征剖面 (a) P波Inline802地震卷积特征剖面;(b) P波Xline500地震卷积特征剖面. Fig. 17 Convolutional feature profiles of P-wave seismic data (a) Convolutional feature profile of P-wave seismic Inline802; (b) Convolutional feature profile of P-wave seismic Xline500.
图 18 卷积神经网络学习预测的地震油气储层分布 (a)卷积神经网络学习预测的地震油气储层分布;(b)卷积神经网络学习预测的地震油气储层分布与构造叠合图. Fig. 18 Prediction of hydrocarbon reservoir distribution with P-wave seismic data based on convolutional neural network (a) Prediction of hydrocarbon reservoir distribution with P-wave seismic data based on convolutional neural network; (b) Hydrocarbon reservoir distribution superimposed on the structural map.

首先考察一下与井孔信息吻合情况.虽然,上述验算仅利用了一个极小样本(单井)卷积核卷积得到卷积特征层,但不难看出,其所表征的地震油气储层分布的轮廓与图 15c基本吻合,主要含气井如M1、M3、M4、N2等井都落在了图 18b红圈区及P1井落在粉蓝圈所指示的区域内,该区域即被认为是含气区,只有N3含气井未落在含气区内,通过查阅相关资料得知,该井虽然含气但其气层很薄,且含气量较小.

其次,讨论所预测含气区与局部构造关系.从图 18a所示的所预测气藏区可以看出,相比于图 15c,其所刻画的地震含气层的分布边界更加清晰.不过,白椭圆区所圈区域似乎也比图 15c图 15d所指示的区域更清晰,但该区域不是含气区,O1、N4井落在该区域,但却是干井.从图 11b图 18b构造叠合图看,好的储层不一定是气藏区(图 18a白椭圆区).表明本研究区有利气藏主要还是受控于局部构造,如图 18中的红圈区,即主要含气区与局部构造基本重合,与图 15d情况一样.

4 结论

本文引入卷积神经网络作为预测或识别地震油气特征的机器学习方法,通过理论分析及模型与实际数据的演算,取得如下认识:

利用模型数据所进行的特征(油和气)提取、分类及识别的演算结果表明:根据本方案的设计模型所提取的特征与依此进行分类和识别的特征(卷积核以外的)具有很高的相关度,即卷积演算结果符合预期.而将相同方案应用于实际纵波地震数据演算,其所预测结果与实际钻井信息所揭示的气藏分布情况具有较高的吻合度,即6口含气井的5口都落在所预测气藏分布区内.与应用纵、横波数据联合反演所预测的地震油气储层分布的轮廓也基本吻合,且其所刻画的地震含气层的分布边界更加清晰.从计算效能看,后者利用了纵、横波地震数据,且经历了无监督与监督学习的多阶段机器学习操作,从低维到高维,再从高维到低维的数据变换过程,是一个通过多次映射取得良好预测结果的过程,却也是一个增加计算成本的过程.相比于此,本方案具有更高效能且较低成本,主要特点有:(1)仅利用了单纵波地震数据;(2)仅利用了单井信息(极小样本),即低维计算;(3)可以在无解释地震数据体进行相关演算.因此,卷积神经网络所具有的强适用性、强泛化能力,使之可实现在未解释地震数据体中全局优化提取特征并加以分类.即利用已知含油气井段信息获取卷积核,借助卷积神经网络驱动地震数据可获取其所蕴藏的地震油气特征.

综上所述,本方案的有效实施,可实现快速预测地震油气储层分布,为缩短相关环节的周期提供了一种新的途径.

本论文工作是一项探索性研究工作,虽然取得了重要进展,但在该过程中发现存在如下两个方面的问题亟待进一步的探讨研究:(1)如何有效制作标签问题.卷积神经网络深度学习属于强监督学习,这就涉及标签制作问题,即卷积核构建问题.地下介质复杂多变,不同地区不同深度不同层位,其所含油、含气特征是千变万化的,因此,标签的制作成为一个难题,如以含气层作为构建卷积核或制作标签对象,卷积核大小如何确定才能更有效?目前没有可利用的学习样本库,故需要进一步探索有效制作适于油气特征识别的标签制作方法;(2)如何提高泛化能力问题.学习的目的是学到隐含在数据背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出.针对含油、含气特征的多样性、复杂性,如何有效构建机器学习模型,使之提高对新鲜样本(未知油气层)的适应能力,通过有效学习、分类分析,最终实现对未知区域未知层段油气特征的直接识别,并对油气藏的分布进行勾画.

致谢  感谢审稿专家和编辑老师对本文提出的宝贵意见和建议,感谢中石化勘探开发研究院提供的资料,感谢中石化勘探开发研究院的魏修成老师、季玉新总工、陈天胜高工、刘春园高工及刘韬博士在本文完成过程中提供的支持和帮助.特别感谢中科院地质与地球物理研究所李幼铭研究员在本成果最后总结、提升阶段所赠与的宝贵意见!此外,研究团队中文博、魏乾乾、赵传伟、杨修超、彭杰、田高鹏等成员先后接力棒式地参与了本论文的相关研究工作,在此一并表示感谢.
References
Abdel-Hamid O, Mohamed A, Jiang H, et al. 2014. Convolutional neural networks for speech recognition. IEEE/ACM Transactions on Audio, Speech and Language Processing, 22(10): 1533-1545. DOI:10.1109/TASLP.2014.2339736
Cersósimo D S, Ravazzoli C L, Martínez R G. 2016. Prediction of lateral variations in reservoir properties throughout an interpreted seismic horizon using an artificial neural network. The Leading Edge, 35(3): 265-269. DOI:10.1190/tle35030265.1
Cudjoe S, Vinassa M, Gomes J H B, et al. 2016. A comprehensive approach to sweet-spot mapping for hydraulic fracturing and CO2 huff-n-puff injection in Chattanooga shale formation. Journal of Natural Gas Science and Engineering, 33: 1201-1218. DOI:10.1016/j.jngse.2016.03.042
Duan Y X, Li G T, Sun Q F. 2016. Research on convolutional neural network for reservoir parameter prediction. Journal on Communications (in Chinese), 37(S1): 1-9.
Ebrahimi A, Khamehchi E. 2016. Developing a novel workflow for natural gas lift optimization using advanced support vector machine. Journal of Natural Gas Science and Engineering, 28: 626-638. DOI:10.1016/j.jngse.2015.12.031
Fu C, Lin N T, Zhang D, et al. 2018. Prediction of reservoirs using multi-component seismic data and the deep learning method. Chinese Journal of Geophysics (in Chinese), 61(1): 293-303. DOI:10.6038/cjg2018L0193
Gholami R, Moradzadeh A, Rasouli V, et al. 2014. Shear wave velocity prediction using seismic attributes and well log data. Acta Geophysica, 62(4): 818-848. DOI:10.2478/s11600-013-0200-7
Hinton G E, Osindero S, Teh Y W. 2006. A fast learning algorithm for deep belief nets. Neural Computation, 18(7): 1527-1554. DOI:10.1162/neco.2006.18.7.1527
Krizhevsky A, Sutskever I, Hinton G E. 2012. Imagenet classification with deep convolutional neural networks.//Proceeding of 26th Annual Conference on Neural Information Processing Systems. Lake Tahoe: Neural Information Processing System Foundation, 1097-1105.
Lecun Y, Bottou L, Bengio Y, et al. 1998. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11): 2278-2324. DOI:10.1109/5.726791
Lee J, Byun J, Kim B, et al. 2017. Delineation of gas hydrate reservoirs in the Ulleung Basin using unsupervised multi-attribute clustering without well log data. Journal of Natural Gas Science and Engineering, 46: 326-337. DOI:10.1016/j.jngse.2017.08.007
Li G H, Feng J G, Zhu G M. 2011. Quasi-P wave forward modeling in viscoelastic VTI media in frequency-space domain. Chinese Journal of Geophysics (in Chinese), 54(1): 200-207. DOI:10.3969/j.issn.0001-5733.2011.01.021
Li Q, Zhong H Q, Wang Y, et al. 2016. Integrated development optimization model and its solving method of multiple gas fields. Petroleum Exploration and Development, 43(2): 293-300. DOI:10.1016/S1876-3804(16)30033-7
Lin N T, Fu C, Zhang D, et al. 2018. Supervised learning and unsupervised learning for hydrocarbon prediction using multiwave seismic data. Geophysical Prospecting for Petroleum (in Chinese), 57(4): 601-610.
Lin N T, Liu H, Li G H, et al. 2013. Auto-picking velocity by path-integral optimization and surface fairing. Chinese Journal of Geophysics (in Chinese), 56(1): 246-254. DOI:10.6038/cjg20130125
Liu R L, Ma Z T. 1995. The current studies on application of neural networks to oil and gas evaluation and predication. Progress in Geophysics (in Chinese), 10(2): 75-84.
Lu W K, Mou Y G. 1996. Logging data extrapolation using BP neural net-work. Oil Geophysical Prospecting (in Chinese), 31(5): 712-715.
Martínez-Alvarez J J, Garrigós J, Toledo J, et al. 2015. A scalable CNN architecture and its application to short exposure stellar images processing on a HPRC. Neurocomputing, 151: 91-100. DOI:10.1016/j.neucom.2014.09.071
Masoudi P, Tokhmechi B, Jafari M A, et al. 2012. Application of fuzzy classifier fusion in determining productive zones in oil wells. Energy, Exploration & Exploitation, 30(3): 403-415.
Meng F D, Chen S Y, Zhang Y C, et al. 2015. Characterization of motor oil by laser-induced fluorescence. Analytical Letters, 48(13): 2090-2095. DOI:10.1080/00032719.2015.1015073
Mohebbi A, Kamalpour R, Keyvanloo K, et al. 2012. The prediction of permeability from well logging data based on reservoir zoning, using artificial neural networks in one of an Iranian heterogeneous oil reservoir. Petroleum Science and Technology, 30(19): 1998-2007. DOI:10.1080/10916466.2010.518187
Nwachukwu A, Jeong H, Pyrcz M, et al. 2018. Fast evaluation of well placements in heterogeneous reservoir models using machine learning. Journal of Petroleum Science and Engineering, 163: 463-475. DOI:10.1016/j.petrol.2018.01.019
Ouadfeul S A, Aliouane L. 2016. Total organic carbon estimation in shale-gas reservoirs using seismic genetic inversion with an example from the Barnett Shale. The Leading Edge, 35(9): 790-794. DOI:10.1190/tle35090790.1
Sebtosheikh M A, Salehi A. 2015. Lithology prediction by support vector classifiers using inverted seismic attributes data and petrophysical logs as a new approach and investigation of training data set size effect on its performance in a heterogeneous carbonate reservoir. Journal of Petroleum Science and Engineering, 134: 143-149. DOI:10.1016/j.petrol.2015.08.001
Sermanet P, Kavukcuoglu K, Chintala S, et al. 2013. Pedestrian detection with unsupervised multi-stage feature learning.//Proceedings of the 2013 IEEE Conference on Computer Vision and Pattern Recognition. Portland, OR: IEEE, 3626-3633.
Silver D, Huang A, Maddison C J, et al. 2016. Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587): 484-489. DOI:10.1038/nature16961
Wei X C. 2018. Analytic convolutional neural network-Deep learning practice manual. http://lamda.nju.edu.cn/weixs/book/CNN_book.pdf.
Yin X Y, Ye D N, Zhang G Z. 2012. Application of kernel fuzzy C-means method to reservoir prediction. Journal of China University of Petroleum (Edition of Natural Science) (in Chinese), 36(1): 53-59.
Zhang F C, Liu H Q, Niu X M, et al. 2014. High resolution seismic inversion by convolutional neural network. Oil Geophysical Prospecting (in Chinese), 49(6): 1165-1169.
Zhang X J, Li Y M, Liu H. 2002. Oil and gas prediction by neural networks with structure-risk-minimum. Oil Geophysical Prospecting (in Chinese), 37(1): 73-76.
段友祥, 李根田, 孙歧峰. 2016. 卷积神经网络在储层预测中的应用研究. 通信学报, 37(S1): 1-9.
付超, 林年添, 张栋, 等. 2018. 多波地震深度学习的油气储层分布预测案例. 地球物理学报, 61(1): 293-303. DOI:10.6038/cjg2018L0193
李桂花, 冯建国, 朱光明. 2011. 黏弹性VTI介质频率空间域准P波正演模拟. 地球物理学报, 54(1): 200-207. DOI:10.3969/j.issn.0001-5733.2011.01.021
林年添, 付超, 张栋, 等. 2018. 无监督与监督学习下的含油气储层预测. 石油物探, 57(4): 601-610. DOI:10.3969/j.issn.1000-1441.2018.04.015
林年添, 刘洪, 李桂花, 等. 2013. 用于速度自动拾取的路径积分优化法与光顺处理技术. 地球物理学报, 56(1): 246-254. DOI:10.6038/cjg20130125
刘瑞林, 马在田. 1995. 神经网络在油气评价和预测方面的研究现状. 地球物理学进展, 10(2): 75-84.
陆文凯, 牟永光. 1996. 利用BP神经网络进行测井资料外推. 石油地球物理勘探, 31(5): 712-715.
魏秀参. 2018.解析卷积神经网络-深度学习实践手册. http://lamda.nju.edu.cn/weixs/book/CNN_book.pdf.
印兴耀, 叶端南, 张广智. 2012. 基于核空间的模糊聚类方法在储层预测中的应用. 中国石油大学学报(自然科学版), 36(1): 53-59. DOI:10.3969/j.issn.1673-5005.2012.01.009
张繁昌, 刘汉卿, 钮学民, 等. 2014. 褶积神经网络高分辨率地震反演. 石油地球物理勘探, 49(6): 1165-1169.
张向君, 李幼铭, 刘洪. 2002. 神经网络结构风险最小油气预测. 石油地球物理勘探, 37(1): 73-76. DOI:10.3321/j.issn:1000-7210.2002.01.015