2. 北京师范大学 统计学院, 北京 100875;
3. 北京中地润德石油科技有限公司, 北京 100083
2. School of Statistics, Beijing Normal University, Beijing 100875, China;
3. Beijing Zhongdirunde Petroleum Technology Co., Ltd., Beijing 100083, China
岩性的准确识别是复杂碳酸盐岩储层精细表征和综合评价的基础和前提。地层岩性信息获取的方式主要有钻井取心、岩屑录井及井壁取心等手段,钻井取心成本的高昂和岩屑录井的不精确,使得测井岩性识别方法的研究备受关注[1-3]。测井岩性识别主要是通过建立测井参数与岩石类型之间的映射关系,并利用该映射去识别未取样井段的岩石类型。随着模式识别、统计学习和机器学习等方法的发展,越来越多的数学理论和计算机算法被应用到岩性识别模型的建立过程中,如主成分分析[4]、决策树[5-6]、支持向量机(SVM)[7]、朴素贝叶斯[8],SOM模糊识别[9]和神经网络[10]等方法。这些方法假定岩性及其与测井参数之间的关系在深度上是彼此独立的,忽略了岩石在沉积和成岩过程中存在的空间上的序列相关性问题。其识别结果常出现深度序列上无法精确表征岩石地质特征的情况或出现地层中不存在的岩石序列组合等现象。
对岩石序列特征的早期表征是由Elfeki[11]等以马尔科夫链理论为基础,采用不同岩石类型之间的转移概率矩阵形式进行表达。后来袁照威等[8]在综合岩石类型与测井参数之间的关系时,结合了混合高斯模型和最大期望算法进行了参数的学习。其中,隐马尔科夫(HMM)[1, 12]较为常用,可以融合岩性在深度上的序列相关性及其与测井参数之间的关系,但是在岩石类型转移阶次的确定、不同阶次序列相关性的精确学习等方面依然存在不足。深度学习中的循环神经网络(RNN)模型可以通过自循环结构的学习,使序列相关信息得到很好地保留。该方法应用到岩性识别过程中能够充分表征岩性内在的沉积模式以及不同测井参数对岩性测量和表征方面的承载尺度问题。长短期记忆神经网络(LSTM)是常用的循环神经网络之一,解决了RNN梯度爆炸和梯度消失的问题[13]。通过在自循环单元中引入门结构,使测井参数信息能够在LSTM中长期传递下去,从而使得LSTM在综合考虑数据的邻域信息和历史信息后,有效提取到数据的序列变化信息。
1 方法原理 1.1 RNN原理人工神经网络通过构建分层结构,自动提取出输入输出之间的非线性函数关系。BP神经网络是最常见的人工神经网络,具有典型的分层结构,通常包括输入层、隐含层和输出层(图 1)。BP神经网络中的基本单元是神经元,每一层的每一个神经元只与相邻层的所有神经元相连接,而同层的神经元则互不连接。隐含层的每个神经元对上一层的所有神经元输出进行线性求和,然后经过激活函数输出到下一层的每个神经元,作为下一层的输入。随着BP神经网络不断进行正向传递和反向传播,网络权重也不断进行调整,最终达到较优的预测效果。
![]() |
下载原图 图 1 BP神经网络结构示意图 Fig. 1 Structure diagram of BP neural network |
传统的BP神经网络隐含层神经元互不相连,且使用固定数量的计算步骤产生固定大小的输出,在处理可变大小的序列数据上限制较大。RNN通过递归连接的每一层网络的内部节点,使得数据在时间维度上传递,实现了数据序列性的有效学习(图 2)[14-17]。
![]() |
下载原图 图 2 RNN及其展开示意图 Fig. 2 RNN and its development diagram |
由RNN中循环单元的计算式[式(1)]可知,RNN在所有时间维度上实现参数共享,使得网络模型得到简化,同时能够学习任意长度的序列数据。
$ h_{t}=\tanh \left(w_{i h} x_{t}+b_{i h}+w_{h h} h_{t-1}+b_{h h}\right) $ | (1) |
式(1)中:xt是t时刻的输入;ht为t时刻的隐状态;wih,bih是输入层与隐状态间的权重和偏置;whh,bhh是隐状态与隐状态之间的权重和偏置。
1.2 LSTM基本原理常规的RNN容易发生梯度爆炸和梯度消失[18],导致网络预测效果不佳。为此,Hochreiter等[13]提出LSTM,并由Graves等[19]对其进行了改良。相较于RNN较为简单的循环单元,LSTM通过添加3个门层来控制不同时序对后续信息的影响,同时使用隐状态和细胞状态传递信息,使得LSTM能够综合局部信息和序列信息。图 3是常见的LSTM网络重复单元,主要包含3个门层:遗忘门、输入门、输出门。在LSTM神经元的每个时刻,神经元的输入包括前一时刻的细胞状态和隐状态以及当前时刻的输入。首先是当前时刻输入和前一时刻隐状态,依次通过遗忘门和输入门,完成细胞状态的更新,然后根据更新后的细胞状态和输出门,完成隐状态的更新。
![]() |
下载原图 图 3 LSTM重复单元结构 Fig. 3 LSTM recurrent unit structure |
遗忘门:根据当前时刻的输入和前一时刻的隐状态决定细胞状态中要忘记的信息
$ f_{t}=\sigma\left[W_{f}\left(h_{t-1}, x_{t}\right)+b_{f}\right] $ | (2) |
输入门:根据当前时刻的输入和前一时刻的隐状态决定哪些新信息要添加到细胞状态
$ i_{t}=\sigma\left[W_{i}\left(h_{t-1}, x_{t}\right)+b_{i}\right] $ | (3) |
根据遗忘门和输入门的输出,对细胞状态进行更新
$ C_{t}=f_{t} C_{t-1}+i_{t} \tilde{C}_{t} $ | (4) |
输出门:根据当前时刻输入信息和前一时刻隐状态的合并以及更新后的细胞状态,对隐状态进行更新
$ O_{t}=\sigma\left[W_{o}\left(h_{t-1}, x_{t}\right)+b_{o}\right] \tanh C_{t} $ | (5) |
式中:ft是t时刻遗忘门的输出;Ot是t时刻输入门的输出;
在LSTM中,由于序列维度的存在,使得网络结构本身比较复杂,因此不需要过分堆叠循环层。如图 4所示,首先通过对测井资料的分析选择出对岩性敏感的测井参数,并对其进行均值方差标准化预处理,去除量纲的影响,同时使用One-Hot编码将岩性数据数字化,然后构建包含LSTM层和全连接层的岩性识别模型。
![]() |
下载原图 图 4 岩性识别模型 Fig. 4 Lithology identification model |
由于岩性识别是多分类问题,网络使用交叉熵作为损失函数对网络学习进行评估。同时使用Adam优化器进行网络学习,不同于常用的随机梯度下降,Adam优化器能够在迭代过程中自适应调整学习率从而显著提升网络学习速度。为防止网络发生过拟合,使用dropout学习策略提升其泛化能力。
2 应用实例分析本次研究数据为苏里格气田东部地区奥陶系马沟组马五段复杂碳酸盐岩储层,属于海相沉积地层,因受沉积和成岩等因素的影响,岩石类型复杂多样。钻井取心和岩屑录井显示,主要岩石类型有石灰岩、白云质灰岩、泥质灰岩、白云岩、灰质白云岩和泥质白云岩等6种,其中灰质白云岩和白云质灰岩是主要的含气储层。
2.1 测井参数敏感性分析通过对岩性和测井资料的分析[20-21],选取对岩性较为敏感的声波时差、自然伽马、光电吸收截面指数、密度、深侧向电阻率和补偿中子等6种测井参数。以55-010井为例,对石灰岩、白云质灰岩、泥质灰岩、白云岩、灰质白云岩和泥质白云岩等6种岩性的箱形图进行分析。由图 5可知,不同测井属性对岩性的响应特征存在明显差异。总体来说,泥质岩性的自然伽马较高[图 5(a)],而非泥质岩性的自然伽马较低且重合在一起,因此通过自然伽马可以有效划分出含泥质较多的泥质灰岩和泥质白云岩。同时泥质灰岩的声波时差[图 5(b)]和光电吸收截面指数[图 5(c)]均较高,则可以进一步通过声波时差和光电吸收截面指数来划分泥质灰岩和泥质白云岩,而光电吸收截面指数对于白云岩和灰质岩的区分则更为明显。白云岩的光电吸收截面指数基本小于3.2 b/e,而灰质岩则相反。从图 5可以看出,由于数据中一些噪声点的影响,导致个别岩性测井参数取值区间较大,甚至超出正常值,该情况主要影响了箱形图的极值情况,对中位数及上下四分位数影响均较小,因此为进一步统计有实际意义的测井参数响应特征,将第90百分位数及第10百分位数作为实际岩性响应范围的上下限(表 1)。
![]() |
下载原图 图 5 苏里格气田苏东地区55-010井岩性及其测井参数箱形图 Fig. 5 Box diagram of lithology and logging parameters of well 55-010 in eastern block of Sulige gas field |
![]() |
下载CSV 表 1 苏里格气田苏东地区不同岩性测井参数响应特征(10%~90%) Table 1 Response characteristics of different lithology logging parameters in eastern block of Sulige gas field |
综合测井参数箱线图(图 5)、岩性测井参数统计表(表 1)和岩性间高区分度敏感参数统计表(表 2),得出以下结论:①不同岩性的各测井参数响应特征虽各不相同,但存在一定程度的重叠,即测井参数对不同岩性响应的敏感性差异较大。②各测井参数对石灰岩响应特征的变化范围较小,其光电吸收截面指数较高,补偿中子和自然伽马则较小;白云质灰岩和泥质灰岩的光电吸收截面指数取值范围差异较大,其他参数变化范围则相近;泥质灰岩和泥质白云岩的自然伽马值均高于25 API,且声波时差的变化范围较大;各岩性的深侧向电阻率变化范围较为接近;白云岩的光电吸收截面指数较低,且密度取值较高。③由表 2可知,不同岩性对应着不同的高敏感性参数,单一的测井参数只能粗略实现部分特定岩性的划分,只有综合考虑岩性对所有测井参数的响应特征,才能实现所有岩性的有效识别。
![]() |
下载CSV 表 2 苏里格气田苏东地区不同岩性之间高区分度敏感参数 Table 2 High-sensitivity parameters between lithologies in eastern block of Sulige gas field |
本次研究网络模型运行平台如下:Windows10 64位操作系统,Intel Core i7-8700 CPU @3.2 GHz,16 GB内存,Nvidia GeForce GTX 1050显卡,运行环境为python3.6,keras(tensorflow后台)框架。在LSTM网络模型建立过程中,对岩性识别效果影响较大的网络参数主要有迭代次数(epoch)、批样本个数(batch)和时间步长(time-step)等。为此,在建模过程中先分析这3个网络参数的影响。
epoch是网络使用全部训练集训练所用的次数,其对网络的最终训练结果有很大影响。训练次数过少,网络就不能完全提取出数据的特征信息,即网络欠拟合,从而导致网络的预测结果较差。epoch过多,则网络可记住训练集中个别样本的特征,即网络过拟合,从而导致网络在训练集中预测效果较好而在测试集上预测效果较差,即网络的泛化性较差。通过控制其他变量不变而改变训练次数,并通过交叉熵损失函数评估网络。可以看出:随着epoch增加,网络模型的损失值迅速下降,表明网络在快速学习,当epoch达到1 000时,损失曲线已基本稳定,表明网络已经充分学习。
batch是指每次进行网络训练时所传入的训练集样本个数。由于深度学习中的数据量较大,一般要采取小批量处理的方法。由于每次传入数据后都会更新网络权重,所以相较一次传入全部数据,小批量训练网络的速度更快。但是,过小的batch则会使网络学习变得过于随机,过大的batch则需要更多的epoch。本次在固定其他参数的前提下,调节batch,并通过岩性识别准确率评估batch对网络训练的影响效果,可以看出,当batch小于32时,准确率较高,而随着batch的进一步增大,准确率迅速下降,因此选择batch为32。
time-step是指使用多少组测井曲线数据来预测当前时刻的岩性。如果time-step过小,则由于输入信息过少,使得网络只能根据附近时刻的信息来预测当前时刻,忽视了序列信息的连续性。如果time-step过大,由于不同测井段的岩性特征和孔隙特征变化,导致训练集中包含与当前时刻无关的信息,从而既加大了网络的训练时间,又影响了预测效果。于是,在保证其他各参数不变的前提下,调节time-step,通过岩性识别准确率来评估time-step对网络训练的影响。由图 6可看出,当time-step为4时,准确率较高,而随着time-step的增大,准确率则在96% 左右波动,因此选择time-step为4。
![]() |
下载原图 图 6 网络模型参数选择 Fig. 6 Parameter selection of network model |
从苏里格气田苏东地区选取42-12井、44-7井、49-13井共计3 122个样本点和57-04井共计1 355个样本点作为训练数据,其中前3口井的石灰岩、白云质灰岩、泥质灰岩、白云岩、灰质白云岩和泥质白云岩的样品个数分别为272个、314个、335个、590个、596个、1 015个。分别采用KNN、朴素贝叶斯、决策树、SVM,HMM和LSTM进行训练学习,并在测试集上进行分类预测,从而评估模型的岩性识别效果。
表 3为KNN,朴素贝叶斯、决策树、SVM,HMM,LSTM这6种算法的岩性识别效果,传统模式识别方法KNN和朴素贝叶斯的岩性识别准确率平均值低于90.00%,决策树、SVM和HMM相比之均有显著提高,而采用LSTM的平均岩性识别准确率可达97.12%,岩性识别效果优异。从岩性识别效果来看,传统机器学习方法对不同岩性的识别效果差异较大,尤其对石灰岩及其过渡岩性的识别效果较差,导致整体正确率较低。而LSTM的识别准确率则相对平稳,仅对石灰岩的识别准确率为80.95%,对其他岩性的识别准确率均在97.00% 以上。相较于传统的机器学习方法,LSTM模型更好地学习到了岩性数据的空间结构特征,从而有效提升了岩性识别效果。
![]() |
下载CSV 表 3 苏里格气田苏东地区57-04井不同方法的岩性识别准确率 Table 3 Lithology identification effect by different methods in well 57-04 in eastern block of Sulige gas field |
图 7为部分实际录井岩性与不同岩性识别模型预测对比图,表 4采用混淆矩阵定量分析准确率及召回率,并以此对比LSTM算法的改进效果。可以看出,LSTM的预测结果与录井岩性基本一致。召回率较低的白云岩样本数目较少,导致其错分的样本对召回率影响较大,除白云岩外整体召回率在93.00% 左右,实现了各岩性的有效召回。误分岩性基本为相邻的过渡岩性,且白云岩主要被误分为灰质白云岩,这2种岩性转换较为频繁,导致LSTM在岩性转换过程中容易发生误分。
![]() |
下载原图 图 7 苏里格气田苏东地区57-04井不同方法的岩性识别结果 Fig. 7 Lithology identification results of well 57-04 in eastern block of Sulige gas field |
![]() |
下载CSV 表 4 苏里格气田苏东地区57-04井LSTM岩性识别混淆矩阵 Table 4 LSTM lithology identification confusion matrix of well 57-04 in eastern block of Sulige gas field |
为了进一步展示LSTM模型对于岩性数据的序列特征学习能力,表 5为不同岩性识别方法的一阶状态转移数目矩阵。可以看出:KNN的识别结果中石灰岩发生了过多的自转移,同时大量的白云质灰岩和泥质灰岩的自转移没有被预测到,从而导致岩性识别效果较差,这也说明了KNN这类传统方法局限于点对点的识别,忽略了岩性序列的局部信息和序列的整体变化情况;传统的序列统计方法HMM虽然能够考虑到岩性数据的序列性,但同时也假定岩性序列相互独立,从而使得预测结果有所偏差,使得在泥质灰岩的预测误差较大。LSTM与钻井数据的转移基本一致,表明LSTM模型预测岩性时充分考虑到岩性序列的沉积模式,使得岩性预测结果与实际地质情况相符。
![]() |
下载CSV 表 5 苏里格气田苏东地区57-04井不同岩性识别方法一阶状态转移数目 Table 5 Number of first-order state transitions for different lithology identification methods in eastern block of Sulige gas field |
为进一步说明该方法的泛化能力,基于上述过程,选择55-010井开展岩性识别,其识别结果如表 6所列。从表 6可看出,LSTM模型仍然具有较高的识别精度,也体现了LSTM模型具有较强的泛化性。
![]() |
下载CSV 表 6 苏里格气田苏东地区55-010井不同方法的岩性识别准确率 Table 6 Lithology identification accuracy of different methods of well 55-010 in eastern block of Sulige gas field |
(1)LSTM模型有效地反映了岩性序列的时序空间特征,有助于岩性识别效果的提升。相对于传统方法无序点集的学习识别,LSTM算法的岩性识别模型从测井数据的序列出发,有效捕捉到了岩性沉积模式和测井参数承载尺度信息,实现了测井序列和岩性序列的整体匹配。
(2)与决策树、朴素贝叶斯、KNN,SVM,BP神经网络等方法对比显示,基于LSTM模型的岩性识别方法更加精确,准确率可提高1.40%~12.25%,并对白云岩及其过渡岩性识别效果更好,同时对主要含气储层灰质白云岩和白云质灰岩的召回率和准确率均达到93.00% 以上,解决了实际生产需求。
(3)LSTM模型对于测井数据具有良好的适用性,通过引入3个门层,保证了信息传递的持续性,实现了自动提取测井数据的序列特征,挖掘空间结构,进而有效提升了岩性识别的精度,对于数据挖掘具有重要意义。
[1] |
袁照威, 段正军, 张春雨, 等. 基于马尔科夫概率模型的碳酸盐岩储集层测井岩性解释. 新疆石油地质, 2017, 38(1): 96-102. YUAN Z W, DUAN Z J, ZHANG C Y, et al. Interpretation of logging lithology in carbonate reservoirs based on Markov Chain probability model. Xinjiang Petroleum Geology, 2017, 38(1): 96-102. |
[2] |
成大伟, 袁选俊, 周川闽, 等. 测井岩性识别方法及应用: 以鄂尔多斯盆地中西部长7油层组为例. 中国石油勘探, 2016, 21(5): 117-126. CHENG D W, YUAN X J, ZHOU C M, et al. Logging lithology identification methods and their application: A case study on Chang 7 member in central-western Ordos Basin, NW China. China Petroleum Exploration, 2016, 21(5): 117-126. DOI:10.3969/j.issn.1672-7703.2016.05.0016 |
[3] |
王泽华, 朱筱敏, 孙中春, 等. 测井资料用于盆地中火成岩岩性识别及岩相划分: 以准噶尔盆地为例. 地学前缘, 2015, 22(3): 254-268. WANG Z H, ZHU X M, SUN Z C, et al. Igneous lithology identification and lithofacies classification in the basin using logging data: Taking Junggar Basin as an example. Earth Science Frontiers, 2015, 22(3): 254-268. |
[4] |
马峥, 张春雷, 高世臣. 主成分分析与模糊识别在岩性识别中的应用. 岩性油气藏, 2017, 29(5): 127-133. MA Z, ZHANG C L, GAO S C. Lithology identification based on principal component analysis and fuzzy recognition. Lithologic Reservoirs, 2017, 29(5): 127-133. DOI:10.3969/j.issn.1673-8926.2017.05.015 |
[5] |
王振洲, 张春雷, 高世臣. 利用决策树方法识别复杂碳酸盐岩岩性: 以苏里格气田苏东41-33区块为例. 油气地质与采收率, 2017, 24(6): 25-33. WANG Z Z, ZHANG C L, GAO S C. Lithology identification of complex carbonate rocks based on decision tree method: An example from block Sudong 41-33 in Sulige gas field. Petroleum Geology and Recovery Efficiency, 2017, 24(6): 25-33. DOI:10.3969/j.issn.1009-9603.2017.06.004 |
[6] |
孙予舒, 黄芸, 梁婷, 等. 基于XGBoost算法的复杂碳酸盐岩岩性测井识别. 岩性油气藏, 2020, 32(4): 98-106. SUN Y S, HUANG Y, LIANG T, et al. Identification of complex carbonate lithology by logging based on XGBoost algorithm. Lithologic Reservoirs, 2020, 32(4): 98-106. |
[7] |
AL-ANAZI A, GATES I D. A support vector machine algorithm to classify lithofacies and model permeability in heterogeneous reservoirs. Engineering Geology, 2010, 114(3/4): 267-277. |
[8] |
袁照威, 陈龙, 高世臣, 等. 基于马尔科夫-贝叶斯模拟算法的多地震属性沉积相建模方法: 以苏里格气田苏10区块为例. 油气地质与采收率, 2017, 24(3): 37-43. YUAN Z W, CHEN L, GAO S C, et al. A method of sedimentary facies modeling through integration of multi-seismic attributes based on Markov-Bayes model: An example from Su10 area in the north of Sulige gas field. Petroleum Geology and Recovery Efficiency, 2017, 24(3): 37-43. |
[9] |
仲鸿儒, 成育红, 林孟雄, 等. 基于SOM和模糊识别的复杂碳酸盐岩岩性识别. 岩性油气藏, 2019, 31(5): 84-91. ZHONG H R, CHENG Y H, LIN M X, et al. Lithology identification of complex carbonate based on SOM and fuzzy recognition. Lithologic Reservoirs, 2019, 31(5): 84-91. |
[10] |
刘跃杰, 刘书强, 马强, 等. BP神经网络法在三塘湖盆地芦草沟组页岩岩相识别中的应用. 岩性油气藏, 2019, 31(4): 101-111. LIU Y J, LIU S Q, MA Q, et al. Application of BP neutral network method to identification of shale lithofacies of Lucaogou Formation in Santanghu Basin. Lithologic Reservoirs, 2019, 31(4): 101-111. |
[11] |
ELFEKI A, DEKKING M. A Markov Chain model for subsurface characterization: Theory and applications. Mathematical Geology, 2001, 33(5): 569-589. DOI:10.1023/A:1011044812133 |
[12] |
LINDBERG D V, GRANA D. Petro-elastic log-facies classification using the expectation maximization algorithm and hidden markov models. Math Geosciences, 2015, 47(6): 719-752. DOI:10.1007/s11004-015-9604-z |
[13] |
HOCHREITER S, SCHMIDHUBER J. Long short-term memory. Neural Computation, 1997, 9(8): 1735-1780. DOI:10.1162/neco.1997.9.8.1735 |
[14] |
张东晓, 陈云天, 孟晋. 基于循环神经网络的测井曲线生成方法. 石油勘探与开发, 2018, 45(4): 598-607. ZHANG D X, CHEN Y T, MENG J. Synthetic well logs generation via recurrent neural networks. Petroleum Exploration and Development, 2018, 45(4): 598-607. |
[15] |
ZHANG J F, ZHU Y, ZHANG X P, et al. Developing a long short-term memory(LSTM)based model for predicting water table depth in agricultural areas. Journal of Hydrology, 2018, 6(561): 918-929. |
[16] |
BAO W, YUE J L, RAO Y L. A deep learning framework for financial time series using stacked autoencoders and long-short term memory. Plos One, 2017, 12(7): e0180944. |
[17] |
SCHUSTER M, PALIWAL K K. Bidirectional recurrent neural networks. IEEE Transactions on Signal Processing, 1997, 45(11): 2673-2681. |
[18] |
BENGIO Y, SIMARD P, FRASCONI P. Learning long-term dependencies with Gradient Descent is difficult. IEEE Trans Neural Network, 2002, 5(2): 157-166. |
[19] |
GRAVES A, JAITLY N, Mohamed A R. Hybrid speech recognition with deep bidirectional LSTM. Automatic Speech Recognition and Understanding(ASRU), 2013 IEEE Workshop on. IEEE, 2013.
|
[20] |
罗群, 吴安彬, 王井伶, 等. 中国北方页岩气成因类型、成气模式与勘探方向. 岩性油气藏, 2019, 31(1): 1-11. LUO Q, WU A B, WANG J L, et al. Genetic types, generation models, and exploration direction of shale gas in northern China. Lithologic Reservoirs, 2019, 31(1): 1-11. |
[21] |
靳军, 王剑, 杨召, 等. 准噶尔盆地克-百断裂带石炭系内幕储层测井岩性识别. 岩性油气藏, 2018, 30(2): 85-92. JIN J, WANG J, YANG Z, et al. Welling logging identification of Carboniferous volcanic inner buried-hill reservoirs in Ke-Bai fault zone in Junggar Basin. Lithologic Reservoirs, 2018, 30(2): 85-92. |