文章快速检索     高级检索
  地质与资源 2022, Vol. 31 Issue (6): 784-789, 836  
0
引用本文
刘凯, 朱建新, 戴慧敏, 刘国栋, 许江, 宋运红, 杜守营. 利用土壤地球化学数据和BP神经网络预测松嫩平原油气资源[J]. 地质与资源, 2022, 31(6): 784-789, 836.  
LIU Kai, ZHU Jian-xin, DAI Hui-min, LIU Guo-dong, XU Jiang, SONG Yun-hong, DU Shou-ying. PREDICTION OF OIL-GAS RESOURCES IN SONGNEN PLAIN BASED ON SOIL GEOCHEMICAL DATA AND BACK-PROPAGATION NEURAL NETWORK[J]. Geology and Resources, 2022, 31(6): 784-789, 836.  

利用土壤地球化学数据和BP神经网络预测松嫩平原油气资源
刘凯1,2 , 朱建新3 , 戴慧敏1,2 , 刘国栋1,2 , 许江1,2 , 宋运红1,2 , 杜守营4     
1. 中国地质调查局 沈阳地质调查中心, 辽宁 沈阳 110034;
2. 中国地质调查局 黑土地演化与生态效应重点实验室, 辽宁 沈阳 110034;
3. 辽宁省物测勘查院有限责任公司, 辽宁 沈阳 110031;
4. 沈阳市鹏德环境科技有限公司, 辽宁 沈阳 110034
摘要:基于东北地区多目标区域地球化学调查获得的海量土壤地球化学数据, 利用BP神经网络模型, 在土壤地球化学性质与油气田空间位置之间建立模型, 构造最优的油气资源预测模型. 以土壤54项地球化学指标以及XY坐标值共同作为模型输入层, 以样本是否在油气田内(1代表油气田内, 0代表油气田外)作为模型输出层, 基于随机抽取的油气田内和油气田外各500个土壤样本数据进行模型训练. 结果显示, 多次训练后识别准确率保持在90%左右, 说明该模型分类效果较好, 可用于油气资源预测. 利用该模型获得了松嫩平原11 291个土壤样本的含油气概率, 并绘制了油气资源预测图. 研究表明, 神经网络对于解决复杂的非线性地质问题可以发挥重要作用.
关键词神经网络    预测模型    土壤地球化学    油气资源    大数据    松嫩平原    
中图分类号:P596;P628            文献标志码:A            文章编号:1671-1947(2022)06-0784-04
PREDICTION OF OIL-GAS RESOURCES IN SONGNEN PLAIN BASED ON SOIL GEOCHEMICAL DATA AND BACK-PROPAGATION NEURAL NETWORK
LIU Kai1,2 , ZHU Jian-xin3 , DAI Hui-min1,2 , LIU Guo-dong1,2 , XU Jiang1,2 , SONG Yun-hong1,2 , DU Shou-ying4     
1. Shenyang Center of China Geological Survey, Shenyang 110034, China;
2. Key Laboratory of Black Land Evolution and Ecological Effects, CGS, Shenyang 110034, China;
3. Geophysical Measuring Exploration Institute of Liaoning Province, Shenyang 110031, China;
4. Shenyang Pengde Environmental Technology Co., Ltd., Shenyang 110034, China
Abstract: Based on the massive data obtained from the multi-target regional geochemical survey in Northeast China, the back-propagation(BP) neural network is used to establish the model between soil geochemical property and spatial location of oil-gas fields, and construct the optimal prediction model of oil-gas resources. Taking both the 54 soil geochemical indexes and XY coordinate values as input layer of the model and whether the samples are inside the oil-gas fields (1 for inside, 0 for outside) as output layer, the study carries out the model training based on the data of each 500 soil samples randomly selected from inside and outside the oil-gas fields. The results show that the recognition accuracy remains at about 90% after repeated training, indicating that the model has good classification effect and can be used for prediction of oil-gas resources. The hydrocarbon-bearing probability of 11 291 soil samples from Songnen Plain is obtained by using the model, and then the prediction map of oil-gas resources is drawn. The study shows that neural network can play an important role in solving complex nonlinear geological problems.
Key words: neural network    prediction model    soil geochemistry    oil-gas resources    big data    Songnen Plain    

0 前言

20世纪80年代以来,众多学者利用土壤中常量、微量等全量元素特征对油气资源进行预测,并取得了一系列成果[1]. 近年来,地质数据量的爆发式增长为油气资源预测带来了新的机遇. 截至2018年,中国地质调查局已在中国平原区完成区域多目标地球化学调查250×104 km2以上[2],获得了海量的高精度土壤地球化学数据. 这些数据中蕴含着丰富的基础地质、生态地质、矿产地质等信息,覆盖了中国中东部大型、中小型含油盆地,为利用该数据进行油气资源前景预测提供了可能[3-4]. 但正是由于样本数量庞大,元素种类多,且地表土壤元素特征与深层油气资源的关系复杂,数据的处理方法显得尤为关键.

近年来,大数据方法在地学中的应用得到了快速发展,尤其在矿产资源预测方面表现出明显优势[5-6]. 陈坤等[7]以1∶25万水系沉积物数据为基础,利用神经网络模型对湖南白马山-龙山地区金矿成矿远景进行了预测,并划定了4个成矿远景区. 也有众多学者将神经网络应用于油气资源预测,取得了较好的预测效果[8-12].

利用大数据计算方法进行矿产资源预测是勘查地球化学的发展趋势,但目前仍处于起步探索阶段[13]. 本文基于东北地区松嫩平原多目标地球化学调查数据,尝试利用BP神经网络的模式识别技术,通过训练学习获得土壤元素特征与油气田空间位置之间的判别模型,并利用模型进行油气资源前景预测.

1 研究区概况

松嫩平原是东北三大平原之一,行政区跨黑龙江、吉林两省和内蒙古自治区一小部分,北自黑龙江省嫩江县,南至吉林省长岭县南部的松辽分水岭,西侧以大兴安岭低山丘陵区与山前倾斜平原分界线为界,东侧边界至小兴安岭-长白山西缘山麓台地,总体呈南北长、东西窄的椭圆形(图 1). 松嫩平原内油气资源丰富,北部为大庆油田探区,面积为11.6×104 km2,南部为吉林油田探区,面积6.9×104 km2[14].

图 1 松嫩平原多目标地球化学数据范围及油气开采区分布图 Fig.1 Distribution map of multi-target geochemical data and oil-gas fields in Songnen Plain 1—油气开采区(oil-gas field);2—多目标区域地球化学数据范围(multi-target regional geochemical data area)
2 数据及处理 2.1 数据来源

本次研究采用的土壤地球化学数据全部来源于多目标区域地球化学调查,样品采集及测试分析方法参考《多目标区域地球化学调查规范(1∶250000)》 [15]和文献[3]. 多目标区域地球化学调查采用双层网格采样方式,分别采集了表层(0~20 cm)和深层(150~200 cm)土壤样品. 本研究采用的数据为松嫩平原深层土壤样本,样本密度为1个/16 km2. 每个样品属性包括54个元素或氧化物含量,具体指标为Ag、Au、As、B、Ba、Be、Bi、Br、Cd、Cr、Cl、Co、Ce、Cu、F、Ga、Ge、Hg、I、La、Li、Mn、Mo、N、Ni、Nb、P、Pb、Rb、S、Sb、Sc、Se、Sn、Sr、Th、Ti、Tl、U、V、W、Y、Zn、Zr、SiO2、Al2O3、TFe2O3、K2O、Na2O、CaO、MgO、TC、Corg、pH.

2.2 数据预处理

本次研究共使用松嫩平原土壤样本11 291个,样本在地图上均匀分布,每个样本可代表 4 km × 4 km的网格范围. 由于土壤属性在空间上存在连续性和变异性,因此将土壤样本的空间坐标XY值也作为两个属性赋予样本属性中. 同时在样本属性中增加含油性字段,将样本点与油气田分布图在ArcGIS中进行空间叠加,若样本落在油气田范围内,则定义该字段为1,否则定义为0. 经统计,油气田内样本数量为972个,油气田外样本数量为10 319个. 经处理后,该数据属性中共含有56个字段作为自变量,含油性字段为因变量,为下一步建立模型做准备.

3 BP神经网络预测 3.1 BP神经网络建立

BP(Back Propagation)神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,是最常用且有效的人工神经网络之一,具有高度非线性映射能力. BP神经网络通常具有3层或3层以上的神经元,包括输入层、中间层(隐层)和输出层,上下层实现全连接,而每层神经元之间无连接. 当一对学习样本提供给网络后,神经元的激活值从输入层经各中间层向输出层传播,在输出层的各神经元获得网络的输入响应. 接下来,按照减少目标输出与实际输出之间的误差方向,从输出层反向经过各中间层回到输入层,从而逐层修正各连接权值,这种算法称为“误差反向传播算法”. 随着误差逆向传播修正不断进行,网络对输入模式响应的正确率也不断上升.

本研究利用Matlab 2018b软件实现神经网络模型的建立、训练和仿真,建立的网络结构如图 2. Lippmannn等[16]研究发现,3层神经网络(只含有1个隐层)可以解决任意复杂的分类问题,隐层过多会造成误差方向传播过程计算过于复杂,并容易陷入局部最小误差. 因此本次研究采用3层神经网络结构,输入层神经元数量为样本的地球化学指标等属性,共56个. 因为判别目标为两类,分别为0(油气田外)和1(油气田内),因此输出层神经元为2个,传递函数为S型的对数函数(logsig). 隐层神经元数量没有明确通用的公式,一般根据经验及多次试验结果来确定. 隐层神经元个数太少会造成网络的学习容量有限,个数太多会造成输入过多的无关细节,造成模型的泛化能力较弱. 使用传递函数为S型的正切函数(tansig). 设置最大训练步数为1000,训练的目标误差为0.01,训练方法为梯度下降动量BP算法,该算法的优点是运行收敛速度较快.

图 2 本研究采用的BP神经网络结构 Fig.2 The BP neural network structure adopted in this study
3.2 网络模型训练

网络模型的训练仅需要少量典型样本即可. 本次研究利用Rand函数随机从油气田内和油气田外的样本中各抽取500个加载入模型中,并将样本的70%作为训练样本,15%作为检验样本,15%作为测试样本. 这样可以防止网络模型学习过程中发生“过拟合”现象,并可评价网络模型的性能和泛化能力. 为了消除训练过程中的随机性对判别结果的影响,对网络进行20次训练,并将20次训练得到的网络输出取平均值.

3.3 网络模型检验

训练后,利用交叉熵(CE)、混淆矩阵图和误差柱状图来评价网络的准确性. CE能够刻画两个概率分布之间的距离,是分类问题中使用比较广的一种损失函数,CE越低表明两者间的误差越小. 而判断BP神经网络推广能力的好坏,不仅要关注测试样本CE大小,还要看检验样本的CE是否接近于训练样本,检验样本CE明显低于训练样本则可能出现了过拟合现象. 如图 3,本模型在第41次训练时,CE达到稳定值0.235,测试样本CE接近于训练样本和检验样本,且变化趋势较为一致,说明该BP神经网络模型泛化能力较好.

图 3 BP神经网络性能评价图 Fig.3 BP neural network performance evaluation 1—训练样本(training data);2—验证样本(validation data);3—测试样本(test data);4—最优位置(optimal position)

混淆矩阵是通过每个目标输入值与模型的实际输出值进行比较,以验证模型的模式识别和分类效果. 它分为训练混淆矩阵、验证混淆矩阵、测试混淆矩阵和总混淆矩阵. 从图 4来看,训练数据的准确率为92.6%,验证数据的准确率为90.0%,测试数据的准确率为88.7%,总准确率为91.6%,说明分类效果比较理想.

图 4 混淆矩阵图 Fig.4 The confusion matrix diagram
图 5 预测误差柱状图 Fig.5 The error prediction histogram 1—训练样本(training data);2—验证样本(validation data);3—测试样本(test data);4—零误差线(zero error line)

BP神经网络的误差柱状图可以直观看到网络模型训练的误差分布状况. 图 5显示,该BP神经网络训练样本、检验样本和测试样本的误差大部分接近于零误差线(Zero Error),可用来进行模式识别和分类.

3.4 网络模型预测

将训练获得的神经网络模型保存成代码,并将松嫩平原全部数据输入模型,得到各样本的含油概率预测结果,统计结果见表 1. 为了更直观反映预测情况,利用样本的含油概率(大于0.5)绘制样本含油气概率预测图(图 6). 图中所示,油气概率大于90%的区域与已有油气田范围吻合度较好,说明了模型的可行性. 同时,在油气田外围局部地区也显示出了较好的油气概率. 其中松原市东部油气概率普遍大于90%,长岭县周围油气资源概率大于60%的区域较集中,有资料显示两个区域内目前已有油气田开采[17-19],反映出该模型的准确性,也预示该区具有很好的油气资源前景. 预测结果显示,农安县西南部、齐齐哈尔市东部等油气开采空白区显示出较高的油气资源概率,可作为油气资源勘查的依据.

表 1 样本含油气概率预测结果统计表 Table 1 Prediction results for the hydrocarbon-bearing probability of samples
图 6 松嫩平原含油气概率预测图 Fig.6 Prediction map of hydrocarbon-bearing probability in Songnen Plain 1—油气资源概率>90%(hydrocarbon-bearing probability>90%);2—油气资源概率80%~90%(hydrocarbon-bearing probability of 80%-90%);3—油气资源概率70%~80%(hydrocarbon-bearing probability of 70%-80%);4—油气资源概率60%~70%(hydrocarbon-bearing probability of 60%-70%);5—油气资源概率50%~60%(hydrocarbon-bearing probability of 50%-60%);6—油气资源概率≤50%(hydrocarbon-bearing probability ≤50%);7—油气开采区(oil-gas field)
4 结论

当前,地质调查正不断获取到海量的地学数据,随着数据量的增加、数据类型的多元化、解决问题的复杂化,传统的统计方法已显得力不从心,神经网络等大数据算法在矿产资源预测、生态风险评价等地学领域正发挥越来越重要的作用[20-21].

本次研究基于多目标区域地球化学数据,利用BP神经网络对松嫩平原油气资源进行预测,结果显示预测区与油田开采区吻合度较高,并在农安县西南部、齐齐哈尔市东部等油气开采空白区显示出较高的油气资源概率,可为划定油气资源远景区提供依据. 同时,该BP神经网络模型可在大比例尺油气勘查区推广应用.

参考文献
[1]
吴传璧. 中国油气化探50年[J]. 地质通报, 2009, 28(11): 1572-1604.
Wu C B. Fifty years history of Chinese oil and gas geochemical exploration[J]. Geological Bulletin of China, 2009, 28(11): 1572-1604. DOI:10.3969/j.issn.1671-2552.2009.11.007
[2]
李括, 彭敏, 赵传冬, 等. 全国土地质量地球化学调查二十年[J]. 地学前缘, 2019, 26(6): 128-158.
Li K, Peng M, Zhao C D, et al. Vicennial implementation of geochemical survey of land quality in China[J]. Earth Science Frontiers, 2019, 26(6): 128-158.
[3]
赵君, 汪月华, 张哲寰. 多目标地球化学调查数据在松嫩平原油气藏远景预测的应用[J]. 地质与资源, 2020, 29(6): 635-640, 626.
Zhao J, Wang Y H, Zhang Z H. Application of multi-target geochemical survey data in prospect prediction of the oil-gas reservoirs in Songnen Plain[J]. Geology and Resources, 2020, 29(6): 635-640, 626.
[4]
周亚龙, 孙忠军, 杨志斌, 等. 多目标化探数据与油气藏指标特征的相关性研究[J]. 物探与化探, 2015, 39(3): 466-472.
Zhou Y L, Sun Z J, Yang Z B, et al. The correlation study of multi-objective geochemical data and index characteristics of the oil and gas reservoir[J]. Geophysical and Geochemical Exploration, 2015, 39(3): 466-472.
[5]
刘艳鹏, 朱立新, 周永章. 卷积神经网络及其在矿床找矿预测中的应用——以安徽省兆吉口铅锌矿床为例[J]. 岩石学报, 2018, 34 (11): 3217-3224.
Liu Y P, Zhu L X, Zhou Y Z. Application of convolutional neural network in prospecting prediction of ore deposits: Taking the Zhaojikou Pb-Zn ore deposit in Anhui Province as a case[J]. Acta Petrologica Sinica, 34(11): 2018, 34(11): 3217-3224.
[6]
翟明国, 杨树锋, 陈宁华, 等. 大数据时代: 地质学的挑战与机遇[J]. 中国科学院院刊, 2018, 33(8): 825-831.
Zhai M G, Yang S F, Chen N H, et al. Big data epoch: Challenges and opportunities for geology[J]. Bulletin of Chinese Academy of Sciences, 2018, 33(8): 825-831.
[7]
陈坤, 张建新. 基于神经网络模型的金矿成矿远景预测——以白马山-龙山地区为例[J]. 地质与资源, 2015, 24(2): 160-163.
Chen K, Zhang J X. Prediction of gold metallogenic prospect based on the neural network model: A case study of the Baimashan-Longshan area in Hunan Province[J]. Geology and Resources, 2015, 24(2): 160-163. DOI:10.3969/j.issn.1671-1947.2015.02.015
[8]
赵健, 刘展, 樊彦国, 等. BP神经网络精度估计及其在海洋油气资源预测中的应用[J]. 海洋科学, 2018, 42(11): 59-63.
Zhao J, Liu Z, Fan Y G, et al. Precision estimation of BP neural network and its application in ocean oil and gas resources prediction[J]. Marine Sciences, 2018, 42(11): 59-63.
[9]
陈剑平. 基于MATLAB的神经网络模式识别技术在油气化探中的研究及应用[D]. 北京: 中国地质大学, 2008.
Chen J P. The research and application of neural network pattern recognition technique for oil and gas[D]. Beijing: China University of Geosciences, 2008.
[10]
郑春雷, 史忠科. 基于神经网络的油气预测方法[J]. 西北工业大学学报, 2003, 21(5): 574-577.
Zheng C L, Shi Z K. Neural network prediction method and its application to oil and gas forecast[J]. Journal of Northwestern Polytechnical University, 2003, 21(5): 574-577.
[11]
王焕弟, 李明, 赵一民. 有监督的人工神经网络油气预测[J]. 铀矿地质, 2001, 17(1): 33, 48-55.
Li H D, Li M, Zhao Y M. Research on supervised artificial neural network oil and gas prediction[J]. Uranium Geology, 2001, 17(1): 33, 48-55.
[12]
杨丽娜, 解国军. 油气资源丰度预测的人工神经网络方法——以济阳坳陷为例[J]. 石油天然气学报(江汉石油学院学报), 2007, 29(1): 4, 55-58.
Yang L N, Xie G J. Artificial neural network method for oil and gas resource prediction-a case study of Jiyang depression[J]. Journal of Oil and Gas Technology(Journal of Jianghan Petroleum Institute), 2007, 29(1): 4, 55-58.
[13]
奚小环. 大数据与地球系统科学——再论全面发展时期的勘查地球化学[J]. 物探与化探, 2019, 43(3): 449-460.
Xi X H. Natural resources period: Big data and systematic science of the earth-more on exploration geochemistry during the overall development period[J]. Geophysical and Geochemical Exploration, 2019, 43(3): 449-460.
[14]
郭昂青. 松辽盆地油田开发建设对地质环境的负面影响——以大庆油田为例[J]. 地质与资源, 2016, 25(2): 176-180.
Guo A Q. Negative effect of the development and construction in the oilfield in Songliao Basin on geological environment: A case study of Daqing Oilfield[J]. Geology and Resources, 2016, 25(2): 176-180.
[15]
中华人民共和国国土资源部. DZ/T 0258—2014多目标区域地球化学调查规范(1∶250 000)[S]. 北京: 中国标准出版社, 2014: 1-42.
Ministry of Land and Resources of the People's Republic of China. DZ/T 0258—2014 Specification of multi-purpose regional geochemical survey(1∶250 000)[S]. Beijing: Standard Press of China, 2014: 1-42.
[16]
Lappmann R P. An introduction to computing with neural nets[J]. IEEE ASSP Magazine, 1987, 4(42): 4-22.
[17]
白静, 徐兴友, 陈珊, 等. 松辽盆地长岭凹陷乾安地区青山口组一段沉积相特征与古环境恢复——以吉页油1井为例[J]. 中国地质, 2020, 47(1): 220-235.
Bai J, Xu X Y, Chen S, et al. Sedimentary characteristics and paleo-environment restoration of the First Member of Qingshankou Formation in Qian'an area, Changling sag, Songliao Basin: A case study of Jiyeyou 1 Well[J]. Geology in China, 2020, 47(1): 220-235.
[18]
孙圆辉, 沈平平, 阮宝涛, 等. 松辽盆地长岭断陷长深1号气田火山岩岩性及储渗特征研究[J]. 天然气地球科学, 2008, 19(5): 630-633.
Sun Y H, Shen P P, Yuan B T, et al. Lithologic and storage-permeation characteristics of Changshen 1 volcanic gas reservoirs in Jilin[J]. Natural Gas Geoscience, 2008, 19(5): 630-633.
[19]
张庆国, 鲍志东, 郭雅君, 等. 扶余油田扶余油层的浅水三角洲沉积特征及模式[J]. 大庆石油学院学报, 2007, 31(3): 4-7, 14.
Zhang Q G, Bao Z D, Guo Y J, et al. Sedimentary characteristics and model of the Fuyu oil bearing reservoir in Fuyu Oil Field[J]. Journal of Daqing petroleum institute, 2007, 31(3): 4-7, 14.
[20]
Li S, Chen J, Xiang J. Applications of deep convolutional neural networks in prospecting prediction based on two-dimensional geological big data[J]. Neural Computing and Applications, 2020, 32(7): 2037-2053.
[21]
Chen J P, Xiang J, Hu Q, et al. Quantitative geoscience and geological big data development: a review[J]. Acta Geologica Sinica, 2016, 90(4): 1490-1515.