地球物理学进展  2016, Vol. 31 Issue (5): 2128-2132   PDF    
面向复杂储层的非均衡测井数据的岩性识别
瞿晓婷1, 张蕾1, 冯宏伟1, 王惠亚2, 张涛3, 冯筠1     
1. 西北大学信息科学与技术学院, 西安 710127
2. 西北大学数学学院, 西安 710127
3. 西北大学地质系, 西安 710127
摘要: 针对常规岩性识别方法在复杂储层的非均衡测井数据准确率不高的问题,本文提出了一种面向复杂储层非均衡测井数据的多层BP神经网络的岩性识别算法.根据测井数据的特点及测井数据间的非线性关系,对测井数据进行均衡化处理,利用多层BP神经网络进行逐层岩性识别.在13个含油气盆地的7793个地层元素测井数据中测试表明,本文提出的方法在数据非均衡比达到1:6的情况下,岩性识别的符合率仍能达到92%以上,在复杂储层的岩性识别方面具有很好的应用前景.
关键词岩性识别     非均衡测井数据     多层BP神经网络     复杂储层    
Lithology identification for imbalanced logging data on complex reservoirs
QU Xiao-ting1 , ZHANG Lei1 , FENG Hong-wei1 , WANG Hui-ya2 , ZHANG Tao3 , FENG Jun1     
1. School of Information Science and Technology, Northwest University, Xian 710127, China
2. School of Mathematics, Northwest University, Xian 710127, China
3. Geology Department, Northwest University, Xian 710127, China
Abstract: Traditional lithology identification method for imbalanced logging data of complex reservoirs often suffer from low accuracy. In this paper, we propose a multi-layer BP neural network specially for imbalanced logging data on complex reservoirs. Firstly, according to the characteristics and the non-linear mapping of the logging data, equalization processing is performed, and then multi-layer BP neural network is employed to do the lithology identification in the way of layer by layer. The experimental results in 7793 ECS data of 9 Oil and gas basins demonstrated that the average compliance rates of the proposed methods achieve 92% even in 1:6 imbalanced ratio of the logging data. In the future, the proposed algorithm has a good prospect and give the valuable data for basis geology research work.
Key words: lithology identification     an imbalanced logging data     multilayer BP neural network     complex reservoirs    
0 引言

岩性识别在测井解释工作中是非常基础和关键的一个环节,它是储层评价、油藏描述和盆地评估等工作的基础.准确、清楚的了解地层岩石的特点,对于石油勘探和其他研究工作具有重要意义.在对未知的评价井进行勘探或对复杂储层进行解释时,由于储层岩性复杂、储层空间分布认识不清及评价井距大等难点,常规方法难以清楚地得到复杂储层中的具体岩性;因此近年来,随着计算机技术和信息化的发展,越来越多的人尝试利用计算机解决复杂储层的岩性识别问题(刘明军,2013).

神经网络擅长利用大量样本的学习和迭代解决复杂的非线性映射关系,因此基于神经网络的复杂储层中的岩性识别被广泛应用.1999年卢新卫、范训礼、侯俊胜、2007年纪福全等人利用BP神经网络对测井岩性进行自动识别的准确率达到86%左右(张洪等,2002张治国等,2005纪福全等,2007).2010年李继安也采用BP神经网络在十红滩地区进行岩性识别、孔隙度和渗透率预测,其中岩性识别符合率达到了84.6%(李继安,2010柯丹等,2010). 2015年单敬福利用BP神经网络法对致密砂岩气藏储集层复杂岩性的识别,通过改变神经网络输入向量的个数,减少网络的复杂度,提高整个网络的性能,使识别准确率达到89%以上(单敬福等,2015).然而,以上针对复杂储层的岩性识别方法多是针对均衡的岩石数据,在实际工作中, 我们经常会遇到在某个区域集中出现一种岩性的岩石, 这就会造成收集到的测井数据出现样本不均衡现象,而一旦测井数据出现不均衡,例如数据中某两类样本数量比超过1:2时,仍旧使用传统的单层BP神经网络会使复杂储层的岩性识别效果变差.因为使用传统的单层BP神经网络在训练时为了照顾到数量大的样本,算法更容易把大类别的样本分类正确,小样本分类出错率较高,这时虽然整体的岩性符合率较高,但是实际上的岩性识别效果较差.

针对以上问题,本文提出了一种面向复杂储层非均衡测井数据的多层BP神经网络的岩性识别方法.我们假设这个多层BP神经网络的总层数有m层,首先通过把非均衡数据合并均衡化,用前m-1层BP神经网络对其逐层进行岩性识别.最后通过第m层BP神经网络对最后无法合并的两类非均衡数据进行最后的岩性识别.本文提出的多层BP神经网络算法,避免了采用单层BP神经网络进行岩性识别时,无法有效对小数量类别岩性进行准确判断的问题.并且由于在非均衡样本中,整体识别准确率不能有效说明岩性识别的结果,因此本文通过准确率和精确率综合评判岩性识别的效果.

使用本文提出的多层BP神经网络算法对非均衡数据进行岩性识别,即使在不同种类样本数量比超过6:1的情况下准确率仍能达到92.04%,精确率达到84.63%.在针对复杂储层的不均衡测井数据的岩性识别方面具有较好的应用前景.

1 实验数据

本文所用的地层元素测井数据采集自中国大部分含油气盆地,共有测井数据样本7793个,具体样本数量及来源见图 1.通过ECS测井得到的Si、Al、K、Ca、Mg、Fe、S这7种元素的百分比含量来进行岩性识别,最终将岩性划分为石英砂岩、长石砂岩、粘土岩、碳酸盐岩和杂岩五大类.

图 1 岩石数量及分布来源示意图 Figure 1 Rock data distribution and amount in different regions
2 面向非均衡岩石数据的岩性识别 2.1 多层BP神经网络算法

本文提出的面向非均衡数据的多层BP神经网络算法的主要思想是:首先把非均衡测井数据根据其自身特点进行合并,使整个测井数据样本数量达到均衡,用第一层BP神经网络对合并后的均衡样本进行岩石大类的划分,然后针对合并的数据进行进一步的岩性识别,如果某个合并的数据中仍存在样本不均衡现象且类别数大于二时,我们仍旧采取合并数据的方式,用第二层BP神经网络对这个合并的数据进行第二次的岩性识别,直到某个合并数据中样本的类别数等于二时,不再进行合并直接采用第m层BP神经网络进行岩性识别.通过这种改变测井数据不均衡现象和多层BP神经网络的方式达到无论大数量样本还是小数量样本都可以有较好的岩性识别结果.

我们假设多层BP神经网络的层数为m,不均衡样本集为S,不同种类样本用xi表示,用|xi|表示此类样本的数量,共有n个不同种类样本,则S={x1, x2, …xn},用j表示此时神经网络的层数,初始化为1,由于S为不均衡样本数据集,因此必然存在某几种样本数量比超过1:2的情况,本文提出的方法步骤如下:

1) 合并样本数量少的几个种类的样本,或者把种类少的样本和某个种类多的样本进行合并,合并后的新样本用yk表示,则样本集S={y1, x3, x5, y2, …xi, yk}.

2) 用第j层BP神经网络对合并后的样本集S进行岩性识别后,针对合并的样本数据集yk进行进一步的岩性识别.

3) 如果yk中仍旧存在样本不均衡现象且类别个数大于2,神经网络层数j增加1,并且跳转至步骤1).

4) 如果yk中存在样本不均衡现象且类别个数等于2或yk中不存在样本不均衡现象则跳转至步骤5).

5) 用第m层BP神经网络对yk进行岩性识别.

整个算法结束,最终得到n类岩石的岩性识别结果.

表 1 符号说明 Table 1 Symbol description
2.2 多层BP神经网络算法在本文数据中的应用

本文需要把实验所用的岩石样本划分为石英砂岩、长石砂岩、碳酸盐岩、粘土岩和杂岩五大类,在整个岩石样本中,各岩石所占数量之比为:N1:N2:Nca:Ncl:Nf ≈ 6:1:4:3:4,由此可以看出长石砂岩数量较少,数据分布存在不均衡现象;根据多层BP神经网络算法,我们把样本量少的长石砂岩和样本量多的石英砂岩样本进行合并,统称为砂岩样本后,可以看到,砂岩、碳酸盐岩、粘土岩和杂岩的数量之比为Ns:Nca:Ncl:Nf ≈ 1.5:1:1:1,样本数据呈现均衡的状态.所以使用第一层BP神经网络把均衡样本识别为砂岩、碳酸盐岩、粘土岩和杂岩四大类后,再对合并的数据砂岩样本进行进一步分类,砂岩样本中虽然存在N1:N2=6:1样本不均衡的现象,但是由于类别数只有两类,因此不用再对非均衡样本进行合并,此时多层BP神经网络的层数m取2,用第二层BP神经网络对砂岩的非均衡数据进行进一步岩性识别,识别为石英砂岩和长石砂岩两类.图二所示为本文提出的面向非均衡岩石数据的多层BP神经网络在本文所用数据上的结构示意图.

图 2 多层BP神经网络算法在本文所用数据上的结构示意图 Figure 2 Schematic of the multilayer BP neural network on the logging data in this article

在使用BP神经网络进行大量均衡样本的岩性识别时,把Si、Al、K、Ca、Mg、Fe、S这7种元素的含量作为BP神经网络的输入变量,并分别选取四种岩性的岩石样本各1000个(共4000个),作为训练神经网络的学习样本,在对所有数据数据进行归一化的处理后把各元素含量的取值范围固定在[-1, 1].

本文所建立的多层BP神经网络中每一层网络的隐藏层个数为两层,每个隐藏层的神经元个数确定为10个,采用双曲正切S形函数tansig函数作为两个隐藏层的转移函数,我们设置整个神经网络的最大迭代次数为10000次,学习率为0.1,权系数修正常数为0.7,神经网络训练的目标误差为0.0000001.通过我们训练好的神经网络,我们可以把7793个岩石样本分为石英砂岩、长石砂岩和碳酸盐岩、粘土岩和杂岩五大类.

3 应用效果验证

我们把收集于中国13个含油气盆地的7793个地层元素测井数据,分别用传统的单层BP神经网络算法和本文提到的面向非均衡岩石数据的多层BP神经网络算法来进行岩性识别检验,并使用精确率和准确率作为识别的效果判断标准.

我们假设总共有P个类别为1的样本,假设类别1为正例,总共有N个类别为0的样本,假设类别0为负例,经过分类后有TP个类别为1的样本被系统正确判定为类别1,FN个类别为1的样本被系统误判定为类别0,显然有P=TP+FN,有FP个类别为0的样本被系统误判断定为类别1,TN个类别为0的样本被系统正确判为类别0,显然有N=FP+TN.其中精确率=TP/(TP+FP); 准确率=(TP + TN)/(P+N).

表 2所示是使用传统的BP神经网络和多层BP神经网络对地层元素测井数据进行实验,把岩石的岩性分为石英砂岩、长石砂岩、碳酸盐岩、粘土岩和杂岩这五大类,由于五种岩石数据量不均衡,可以看到使用传统方法进行的岩性识别长石砂岩准确率过低,只能达到68%左右.

表 2 传统BP神经网络和多层BP神经网络的岩性识别符合率 Table 2 lithology identification compliance rate of traditional BP neural network and multilayer BP neural network

用本文所提的面向非均衡数据的多层BP神经网络算法进行分类,可以看出,各类别分类的准确率较高,尤其是长石砂岩的准确率达到了91%以上.

为了证明多层BP神经网路算法在针对样本不均衡情况下的岩性识别时具有较好的符合率,我们分别取石英砂岩和长石砂岩不同比值数量的样本数据进行实验验证,表 3所示为采用传统单层BP神经网络方法和本文提出的多层BP神经网络方法下,在N1:N2:Nca:Ncl:Nf=1:1:1.5:1.7:1.5、N1:N2:Nca:Ncl:Nf=:2:1:1.5:1.7:1.5、N1:N2:Nca:Ncl:Nf=3:1:1.5:1.7:1.5、N1:N2:Nca:Ncl:Nf=4:1:1.5:1.7:1.5、N1:N2:Nca:Ncl:Nf=5:1:1.5:1.7:1.5、N1:N2:Nca:Ncl:Nf=6:1:1.5:1.7:1.5的情况下得到的岩性识别准确率结果;表 4所示是在这些比值的情况下分类精确率结果.可以看出,当数据在均衡情况下,本文提出的多层BP神经网络和单层BP神经网络同样具有较好的识别准确率和精确率,但是当数据逐渐变得越来越不均衡时,本文提出的方法的识别准确率和精确率明显高于单层BP神经网络,在复杂储层的非均衡岩石数据的岩性识别方面具有较好的鲁棒性.

图 3 传统BP神经网络和多层BP神经网络在不同非均衡比值下的准确率 Figure 3 The lithology identification accuracy of different imbalanced ratio in traditional BP neural network and multilayer BP neural netwrok

图 4 传统BP神经网络和多层BP神经网络在不同非均衡比值下的精确率 Figure 4 The lithology identification precession of different imbalanced ratio in traditional BP neural network and multilayer BP neural network
4 结论

本文提出了面向复杂储层的非均衡数据的多层BP神经网络的岩性识别算法,充分利用了BP神经网络算法简单,且可以通过大量样本学习很好的预测数据与岩性间的非线性映射关系的特点,最终解决了传统岩性识别算法无法有效针对非均衡岩石数据样本进行分类的问题,实验结果表明,多层BP神经网络的岩性识别算法即使在样本不均衡比达到1 6的情况下进行岩性识别时准确率可以达到92.04%,精确率达到84.63%.能有效的解决岩性识别问题,在复杂储层解释方面具有很好的应用前景.

致谢 感谢审稿专家提出的修改意见和编辑部的大力支持!
参考文献
[] Fan X L, Dai H, Zhang X J, et al .1999. Applications of neural network in lithology identification[J]. Well Logging Technology, 23 (1) : 50–52.
[] Guan T .2013. Method of lithologic identification based on crossplot and bayesian cluster analysis algorithm[J]. Science Technology and Engineering, 13 (4) : 976–979.
[] Ji F Q, Cheng G J, Wang X X, et al .2007. Constructive neural networks for well-log lithology identification[J]. Oil Field Equipment, 36 (4) : 52–55.
[] Ke D, Zhao D, Hou H Q, et al .2010. Application of BP neural network in the prediction of granite type uranium deposit[J]. World Nuclear Geoscience, 27 (1) : 37–40.
[] Li J A .2010. Application of artificial intelligence neural networks in lithology identification and porosity and permeability prediction--an example from Shihongtan uranium deposit[J]. Northwestern Geology, 43 (2) : 32–37.
[] Liu M J .2013. Development and application of lithology identification software system by logging data[J]. Progress in Geophysics, 28 (2) : 908–913. DOI:10.6038/pg20130243
[] Lu X W, Jin Z D .1999. Method of lithology recognizing based on feedforward neural network[J]. Oil & Gas Geology, 20 (1) : 82–84.
[] Mou D, Wang Z W, Huang Y L, et al .2015. Lithological identification of volcanic rocks from SVM well logging data:Case study in the eastern depression of Liaohe Basin[J]. Chinese J. Geophys., 58 (5) : 1785–1793. DOI:10.6038/cjg20150528
[] Shan J F, Chen X X, Zhao Z J, et al .2015. Identification of complex lithology for tight sandstone gas reservoirs base on BP neural net[J]. Progress in Geophysics, 30 (3) : 1257–1263. DOI:10.6038/pg20150335
[] Shi N, Li H Q, Luo W P .2013. Lithology identification of reservoir containing anhydrite based on independent component analysis and Naive Bayes algorithm[J]. Journal of Xi'an Shiyou University (Natural Science Edition), 28 (5) : 39–42.
[] Tian Y K, Zhou H, Yuan S Y .2013. Lithologic discrimination method based on Markov random-field[J]. Chinese J. Geophys., 56 (4) : 1360–1368. DOI:10.6038/cjg20130430
[] Wang H, Li M B, Tang Y, et al .2014. The lithology prediction of ODP hole 1148A based on the wavelet neural network[J]. Progress in Geophysics, 29 (1) : 392–399. DOI:10.6038/pg20140156
[] Xie G, Hu Z P, Luo L, et al .2007. Logging identification of complicated lithology with constrained least square algorithm[J]. Well Logging Technology, 31 (4) : 354–356.
[] Zhang H, Zou L J, Shen X H .2002. He application of BP neural network in well lithology identification[J]. Geology and Prospecting, 38 (6) : 63–65.
[] Zhang Z G, Yang Y H, Xia L X .2005. The application of self-organizing feature map neural network to logging lithological identification[J]. Progress in Geophysics, 20 (2) : 332–336. DOI:10.3969/j.issn.1004-2903.2005.02.013
[] Zhao J, Gao F H .2003. Application of crossplots based on well log data in identifying volcanic lithology[J]. Global Geology, 22 (2) : 136–140.
[] Zhao J, Yang Y, Chen W Z, et al .2015. New method for well logging lithologic identification based on elemental capture spectroscopy[J]. Progress in Geophysics, 30 (5) : 2342–2348. DOI:10.6038/pg20150548
[] Zhong Y H, Li R .2009. Application of principal component analysis and least square support vector machine to lithology identification[J]. Well Logging Technology, 33 (5) : 425–429.
[] 范训礼, 戴航, 张新家, 等.1999. 神经网络在岩性识别中的应用[J]. 测井技术, 23 (1) : 50–52.
[] 关涛.2013. 基于交会图和贝叶斯聚类分析法的岩性识别方法[J]. 科学技术与工程, 13 (4) : 976–979.
[] 纪福全, 程国建, 王潇潇, 等.2007. 构造性神经网络在测井岩性识别中的应用[J]. 石油矿场机械, 36 (4) : 52–55.
[] 柯丹, 赵丹, 侯惠群, 等.2010. BP神经网络在花岗岩型铀矿预测中的应用[J]. 世界核地质科学, 27 (1) : 37–40.
[] 李继安.2010. 人工智能神经网络在岩性识别、孔隙度和渗透率预测中的应用--以十红滩铀矿床为例[J]. 西北地质, 43 (2) : 32–37.
[] 刘明军.2013. 测井数据岩性识别软件系统的开发与应用[J]. 地球物理学进展, 28 (2) : 908–913. DOI:10.6038/pg20130243
[] 卢新卫, 金章东.1999. 前馈神经网络的岩性识别方法[J]. 石油与天然气地质, 20 (1) : 82–84.
[] 牟丹, 王祝文, 黄玉龙, 等.2015. 基于SVM测井数据的火山岩岩性识别--以辽河盆地东部坳陷为例[J]. 地球物理学报, 58 (5) : 1785–1793. DOI:10.6038/cjg20150528
[] 单敬福, 陈欣欣, 赵忠军, 等.2015. 利用BP神经网络法对致密砂岩气藏储集层复杂岩性的识别[J]. 地球物理学进展, 30 (3) : 1257–1263. DOI:10.6038/pg20150335
[] 石宁, 李洪奇, 罗伟平.2013. 利用独立成分分析和朴素贝叶斯算法识别含硬石膏储层的岩性[J]. 西安石油大学学报(自然科学版), 28 (5) : 39–42.
[] 田玉昆, 周辉, 袁三一.2013. 基于马尔科夫随机场的岩性识别方法[J]. 地球物理学报, 56 (4) : 1360–1368. DOI:10.6038/cjg20130430
[] 王辉, 黎明碧, 唐勇, 等.2014. 基于小波神经网络的ODP1148A井岩性预测[J]. 地球物理学进展, 29 (1) : 392–399. DOI:10.6038/pg20140156
[] 谢刚, 胡振平, 罗利, 等.2007. 基于约束最小二乘理论的复杂岩性测井识别方法[J]. 测井技术, 31 (4) : 354–356.
[] 张洪, 邹乐君, 沈晓华.2002. BP神经网络在测井岩性识别中的应用[J]. 地质与勘探, 38 (6) : 63–65.
[] 张治国, 杨毅恒, 夏立显.2005. 自组织特征映射神经网络在测井岩性识别中的应用[J]. 地球物理学进展, 20 (2) : 332–336. DOI:10.3969/j.issn.1004-2903.2005.02.013
[] 赵建, 高福红.2003. 测井资料交会图法在火山岩岩性识别中的应用[J]. 世界地质, 22 (2) : 136–140.
[] 赵军, 杨阳, 陈伟中, 等.2015. 基于ECS测井的岩性识别方法[J]. 地球物理学进展, 30 (5) : 2342–2348. DOI:10.6038/pg20150548
[] 钟仪华, 李榕.2009. 基于主成分分析的最小二乘支持向量机岩性识别方法[J]. 测井技术, 33 (5) : 425–429.