Processing math: 0%
  石油物探  2023, Vol. 62 Issue (1): 68-79  DOI: 10.3969/j.issn.1000-1441.2023.01.005
0
文章快速检索     高级检索

引用本文 

秦瑞宝, 叶建平, 李利, 等. 基于机器学习的煤层含气量测井评价方法——以沁水盆地柿庄南区块为例[J]. 石油物探, 2023, 62(1): 68-79. DOI: 10.3969/j.issn.1000-1441.2023.01.005.
QIN Ruibao, YE Jianping, LI Li, et al. Artificial-intelligence and machine-learning models of coalbed methane content based on geophysical logging data: A case study in Shizhuang South Block of Qinshui Basin, China[J]. Geophysical Prospecting for Petroleum, 2023, 62(1): 68-79. DOI: 10.3969/j.issn.1000-1441.2023.01.005.

第一作者简介

秦瑞宝(1964—), 男, 本科, 教授级高级工程师, 主要从事测井资料处理、解释及研究工作。Email: qinrb@cnooc.com.cn

通信作者

李利(1981—), 女, 硕士, 工程师, 主要从事非常规储层测井评价工作。Email: lili70@cnooc.com.cn

文章历史

收稿日期:2022-01-17
基于机器学习的煤层含气量测井评价方法——以沁水盆地柿庄南区块为例
秦瑞宝1, 叶建平2, 李利1, 余杰1, 黄涛1, 李铭宇1    
1. 中海油研究总院有限责任公司勘探开发研究院, 北京 100028;
2. 中海石油(中国)有限公司勘探部, 北京 100016
摘要:由于煤层含气量受控因素多且成因机理复杂, 其评价的准确性和泛化性问题一直是研究的热点与难点。为了提高煤层含气量评价的准确性和泛化性, 基于沁水盆地柿庄南区块的测井资料、煤心分析资料、排采生产数据等, 将地球物理测井数据作为输入, 利用BP神经网络、支持向量机及随机森林3种机器学习方法, 对训练集数据采用交叉验证与网格寻优方法确定各机器学习模型超参数, 得到煤层含气量评价模型。引入盲井验证模型, 对比了3种机器学习方法的优缺点和适用条件。结果表明, 应用此3种机器学习方法能有效评价煤层含气量, 随机森林模型在此区块应用效果最好, 该模型能有效评价煤层含气量, 为今后此方法的应用提供了选择依据, 同时也提高了模型的泛化能力; 进一步对沁水盆地柿庄南区块3号煤层开发井进行含气量评价预测, 并将预测结果与实际排采生产数据进行对比, 发现二者误差较小。研究结果对煤层气勘探开发、"甜点"找寻具有指导意义, 实际应用价值突出。
关键词煤层含气量    BP神经网络    支持向量机    随机森林    柿庄南区块    沁水盆地    
Artificial-intelligence and machine-learning models of coalbed methane content based on geophysical logging data: A case study in Shizhuang South Block of Qinshui Basin, China
QIN Ruibao1, YE Jianping2, LI Li1, YU Jie1, HUANG Tao1, LI Mingyu1    
1. Exploration and Development Research Institute of CNOOC Research Institute Co., Ltd., Beijing 100028, China;
2. Exploration Department of CNOOC China Limited, Beijing 100016, China
Abstract: An effective and accurate quantification of coalbed methane (CBM) content plays an important role in the exploration and development of CBM.Due to the effects of many factors on the CBM content and the complicated mechanism of its formation, the quality and generalizability of models of the CBM content have been a research focus and challenge.Derived from geophysical logs, data for core analysis and production were used as inputs in back propagation neural network (BNN), support vector machine (SVM), and random forest (RF) in order to predict the CBM content.Hyper-parameters of each of the artificial-intelligence and machine-learning algorithms were determined using cross-validation and grid optimization.To validate the models, the entire data were randomly partitioned into training and testing data.Although all three models predicted the CBM content with a high accuracy, RF outperformed the others.The best-fit model of the CBM content was validated against the coal seam production data of Shizhuang South Block wells of Qinshui Basin and led to a high predictive power.Given the above results, the model provides actionable insights into the exploration and development of CBM, in particular, in deserts.
Keywords: coalbed methane content    back propagation neural network    support vector machine    random forest    Shizhuang South Block    Qinshui Basin    

煤层气开发利用的最主要价值是其环境效益[1-2]。中国的煤矿众多, 但煤矿瓦斯事故频发, 而瓦斯的抽取不仅可以减少煤矿事故的发生, 还可以防止资源浪费, 降低瓦斯排放对大气臭氧层的污染破坏。煤层气与常规天然气不同, 其主要成分是甲烷, 燃烧只生成水和二氧化碳, 不产生灰渣、二氧化硫或其它重金属有害物质, 因此煤层气是清洁能源。其次, 我国煤层气资源储量丰富, 是良好的天然气后备资源[3-4], 能缓解我国能源短缺的问题。煤层含气量是评价煤储层的关键参数, 如何准确评价煤层含气量直接影响煤层气勘探开发, 因此煤层含气量是煤层气勘探开发中研究的热点与重难点[5-6]

煤层气为非常规油气资源, 其储集与渗流机理与常规天然气相比差异明显[7], 煤层含气量受控于煤层储层厚度、煤体结构分布、煤岩变质程度、煤层储层埋深及储层温度压力等多类型因素[8-12]。目前用于测定或评价煤层含气量的方法从数据来源分为实验法和地球物理测井方法。实验法中有通过井壁取心后对煤样进行解吸校正后得到煤层样品含气量的方法, 这一方法最为准确且直接, 但煤层机械强度差、易碎, 使得煤层取心完整率低进而导致对应实验资料数量受限[13-14]; 另一种方法则是通过等温吸附曲线等实验公式法求取, 这些方法都受制于实验数据, 不适用于实验数据缺乏的区块。地球物理测井资料因具有性价比高, 连续性强及可靠性高的特点被广泛应用于煤层气含量评价中。随着对煤层含气量评价精度要求的不断提高, 加之煤层问题的特殊性, 机器学习方法被逐渐应用于煤层气勘探开发中[15]。机器学习方法能挖掘数据间的非线性关系[16], 尤其面对地球物理测井资料响应与煤层含气量间的复杂关系, 侯俊胜等[17]、孟召平等[5]将BP神经网络、支持向量机[18]等方法用于煤层含气量预测, 证明了这类方法在该领域的可行性; 李泽辰等[19]建立了煤层含气量的支持向量机、神经网络、随机森林和梯度提升树模型, 重点介绍了训练模型的过程, 分析了4种模型的性能; 郭建宏等[20]基于地球物理测井资料运用随机森林方法预测了煤层气含量, 详细介绍了超参数的选择等问题, 且该方法在实际区块得到了验证。以上方法主要集中在机器学习方法的研究上, 但在实际应用中超参数如何选择, 实际井应用效果如何, 样品数据的多少对模型有何影响等没有明确结论, 很难在新区块中得到推广应用。

基于上述问题, 结合前人的研究, 将BP神经网络、支持向量机与随机森林3种机器学习方法应用于沁水盆地柿庄南区块煤层含气量的评价预测。训练集数据利用交叉验证与网格寻优方法确定各机器学习模型超参数, 对3种模型进行盲井检验, 根据盲井检验结果对3种方法进行对比分析, 以确定3种模型的优劣及适用条件, 并将模型运用于生产井中, 与实际生产数据进行对比, 以检验模型的实用性和可推广性。

1 机器学习所用模型 1.1 BP神经网络模型

BP(Back Propagation)神经网络是一种函数信号前向传播、误差信号反向传播的多层神经网络, 是一种通过网络自适应映射进行反向传播的多层前馈网络, 可完成输入至输出的非线性运算。整个BP神经网络结构由输入层、隐含层和输出层构成, 其中隐含层的结构相对复杂, 为多层复合层, 层与层之间仅相邻的神经元间可产生反馈连接。BP神经网络模型的本质是基于求解目标结果最理想时对应的网络权值并将其返回至输入层进行计算, 重复这一过程直至网络误差值减小至满足要求后输出结果。

理论上这一网络可对任何复杂非线性关系进行逼近求解, 信息由输入层向输出层方向传递, 网络权值与偏置值的修正与信息传递的方向相反。

BP神经网络模型通过输出层逐层计算各神经元的输出误差, 并根据梯度下降的方式对权值与偏置值进行调整, 在训练中不断调试、修改使得误差降低至期望误差内, 该模式即是误差反向传播。

1.2 支持向量机模型

支持向量机(support vector machine, SVM)模型具有通用性、鲁棒性、计算简单等优点, 这一模型在解决小样本、高维模式识别及非线性问题时优势明显。以模式分类的二分类问题为例, 其主要思想为: 对于给定训练样本, 采用核函数方法, 让支持向量机建立一个使正例和反例之间的隔离边缘最大化的最优超平面。

对于由输入值x和相应输出值y组成的训练样本, 该样本在低维空间中的线性回归函数为:

\boldsymbol{y}=\boldsymbol{wx}+b (1)

式中: w是权重向量; b是偏置量。该样本在高维特征空间的回归函数为:

\boldsymbol{f}(\boldsymbol{x})=\boldsymbol{w} \phi(\boldsymbol{x})+b (2)

(2) 式中的非线性变换ϕ(x)为低维空间到高维空间的映射。

1.3 随机森林模型

随机森林模型是一种以决策树为基础的集成类模型, 以单一决策树对目标建立的模型进行组合得到新的模型。随机森林模型预测的结果为各单棵决策树结果的平均值。随机森林模型中为防止模型出现过拟合或训练不充分导致的精度过低问题, 将套袋和随机子空间思想引入至模型中。套袋思想指的是对原始n个样本进行有放回n次抽取以生成训练样本, 并基于每个训练样本生成回归决策树K

套袋思想一则可以保证决策树建立的多样化与随机化, 二则还可以保证各决策树间的相互独立性。随机子空间思想与套袋思想类似, 即在构建单棵决策树时, 各分裂节点的特征数选取多为从总特征空间F中随机抽取f个特征, 并依照基尼指数作为指标选取最优特征进行分支生长, 这一思想可以保证不同树节点与其节点间的特征子集的差异性, 进而促进各决策树的独立性与多样性。因而在随机森林回归中, 决策树K与特征数f对模型预测性能存在显著影响。

2 研究区块概况与含气量预测模型 2.1 研究区块概况

柿庄南区块位于沁水盆地东南部, 构造带对应东南部向西北倾的斜坡带, 西部发育NE向展布的寺头断层, 该区块经历印支期、燕山期和喜山期等多期构造运动[21]。柿庄南区块自下而上发育奥陶统峰峰组(O2f), 中石炭统本溪组(C2b), 上石炭统太原组(C3t), 下二叠统山西组(P1s)、下石盒子组(P1x), 上二叠统上石盒子组(P2s)、石千峰组(P3sh)以及新生界新近系等地层。山西组3号煤层在区块内广泛展布, 煤层平均厚度5.95m, 平均埋深816m, 厚度较大且埋深适中, 是本文主要研究的层位(图 1)[22]

图 1 研究区区域位置及柱状地层
2.2 原始数据情况 2.2.1 测井原始数据

本文用于评价煤层含气量的井为22口参数井, 它们在柿庄南区块中分布较均匀。参数井测井曲线主要包括井径、自然伽马、自然电位、电阻率(深、浅侧向)与三孔隙度(补偿密度, 声波时差与补偿中子)测井曲线, 参数井共8条常规测井曲线, 无特殊测井资料。

2.2.2 含气量原始测试数据

以SZN-1井为例, 展示其含气量数据来源, 该样品含气量测定遵照GB/T19559-2004《煤层气含量测定方法》。SZN-1井中3号煤层共采集11个解吸样(表 1所示), 各参数井在3号煤层采集样品个数平均为8个, 共收集到柿庄南区块煤层含气量实验数据185组, 总含气量主要在5~25cm3/g, 含气量值的分布如图 2所示。由图 2可见, 含气量数据分布合理。

表 1 SZN-1井3号煤层含气量测试结果
图 2 实验含气量数据分布
2.3 煤层含气量预测模型 2.3.1 煤层含气量评价步骤

1) 数据预处理。包括岩心数据深度归位、测井数据标准化、扩径校正、数据清洗等。

2) 针对样本数据, 进行机器学习方法建模。为了保证模型的正确性与泛化性, 将数据按照7:3的比例分开, 对70%的数据进行模型训练, 为保证模型训练的有效性, 利用K折交叉验证(K-Cross Validation)和网格寻优进行超参数选择及模型正确性验证, 具体操作是将参与训练的数据分为k组子集, 针对每组子集使其成为一次测试集, 其它k-1组子集为训练集, 重复这一步骤可得到k个模型, 利用这k个模型对k个测试集进行预测而得到结果误差, 计算误差平均值得到k折交叉验证结果, 在交叉验证的基础上, 通过网格寻优的方式对超参数进行遍历求解, 找出最优组合建立煤层含气量评价模型。

3) 评价各方法在煤层含气量预测中的效果。针对测试集进行分析, 并利用完全未参与训练和测试的新井检验模型的泛化性。

2.3.2 煤层测井响应特征分析

柿庄南区块于2007年开始勘探开发, 地球物理测井曲线资料较少, 仅有常规测井曲线资料, 这也是该区块煤层参数评价的制约因素之一。共收集到8条测井曲线, 分析认为煤层含气量的变化与地球物理测井资料响应存在密切关系[23-25], 例如, 煤层产气能力随着煤化作用的增强而增加, 煤层气密度较低使得随着煤层含气量的增加, 补偿密度减小, 这也表明了利用地球物理测井资料建立含气量评价模型的可行性, 且地球物理测井资料相对实验资料在数量上更加丰富, 具有更好的推广性。基于此, 选取自然伽马测井曲线、补偿密度测井曲线、声波时差测井曲线、补偿中子测井曲线和深浅侧向电阻率曲线为特征向量, 建立煤层含气量评价模型。

2.3.3 煤层含气量评价模型的建立 2.3.3.1 BP神经网络模型

将样本数据划分为训练集与测试集, 利用BP神经网络结合训练集数据建立含气量评价模型, 当隐含层个数为1, 隐含层神经元个数为7, 学习率为0.1, 迭代1000次时, 传递误差达到目标设置值, 其对应权值分布如表 2所示。

表 2 BP神经网络权值及阈值

基于BP神经网络模型超参数建立训练模型。图 3a为训练集回判结果, 其中平均绝对误差为1.27cm3/g, 平均相对误差为11.6%, 结合交会图及零误差线分析发现该模型训练结果针对高值与低值预测效果不佳, 存在一定有偏现象; 图 3b为测试集预测结果, 测试集预测结果平均绝对误差为1.58cm3/g, 平均相对误差为15.6%。

图 3 BP神经网络模型评价煤层含气量 a BP神经网络模型训练集回判结果; b BP神经网络模型测试集预测结果
2.3.3.2 支持向量机模型

利用支持向量机模型评价煤层含气量时, 需要确定核函数(Kernel Function)与惩罚因子(C), 其中核函数包括: 多项式内积函数、高斯径向基(RBF)核函数与Sigmoid核函数。结合前人经验[26-27], 本文选用高斯径向基(RBF)核函数, 该核函数应用准确率高且受控参数少, 如(3)式所示。

K\left(x_i, x\right)=\exp \left(-\frac{\left|x-x_i\right|^2}{\sigma^2}\right) (3)

式中: σ为核函数参数; K(xi, x)为核函数。在建模过程中, 需对核函数参数σ与惩罚因子C进行网格寻优, 在给定的范围内根据每个组合参数预测误差率的高低进行判断, 选择最优参数。为了初步确定核函数与惩罚因子的范围, 利用粒子群优化(PSO)进行初寻使其快速收敛, 后得到核函数与惩罚因子的适应范围, 结合交叉验证与网格寻优进行超参数计算, 最终确定核函数σ为12.59, 惩罚因子C为3.15。

基于支持向量机模型超参数, 建立训练模型。图 4a为训练集回判结果, 其中平均绝对误差为0.78cm3/g, 平均相对误差为7.2%, 结合交会图及零误差线分析发现该模型训练结果无偏; 图 4b为测试集预测结果, 其平均绝对误差为1.24cm3/g, 平均相对误差为12.2%。

图 4 支持向量机模型评价煤层含气量 a 支持向量机模型训练集回判结果; b 支持向量机模型测试集预测结果
2.3.3.3 随机森林模型

利用随机森林模型评价煤层含气量时, 结合算法原理及李泽辰等[19]在小样本数据下的研究结果, 需要确定分裂特征数与决策树的棵数, 选择的测井曲线为6条, 因而确定分裂特征数为1~5, 将决策树棵树寻优步长设置为50, 从1棵模型树寻至600棵。在网格寻优的基础上, 再利用每棵决策树未参与建模的袋外数据误差进行评价, 其计算公式为:

\operatorname{MSE}_{\text {ООB }}=\frac{1}{M} \sum\limits_{i=1}^M\left(y_i-y_i^{\text {ООB }}\right)^2 (4)

式中: MSEOOB为误差数; yiyiOOB分别为目标实际值与模型对袋外误差数据的预测值; M为决策树棵数。

利用交叉验证与网格寻优, 确定分裂特征树为3, 模型树棵数为500时, 评价得分最高, 如图 5a所示; 对应袋外误差曲线如图 5b所示。结合袋外误差曲线图, 当特征分裂数为3时, 模型树棵数在500时袋外误差已经收敛且稳定, 证明了超参数的有效性。

图 5 随机森林模型建立过程 a 随机森林模型网格寻优结果; b 随机森林袋外误差曲线

基于随机森林模型超参数建立训练模型。图 6a为训练集回判结果, 其中平均绝对误差为0.56cm3/g, 平均相对误差为5.2%, 结合交会图及零误差线分析发现该模型训练结果无偏; 图 6b为测试集预测结果, 其平均绝对误差为1.44cm3/g, 平均相对误差为13.4%。

图 6 随机森林模型评价煤层含气量 a 随机森林模型训练集回判结果; b 随机森林模型测试集预测结果
2.3.4 盲井检验及有效性分析

利用机器学习方法结合柿庄南区块数据资料中的训练集建立了煤层含气量评价模型, 并用测试集对模型的正确性进行了检验, 结合测试集误差(表 3)证明了模型的有效性。但由于测试集与训练集数据可能为同井同层数据, 无法验证模型的泛化性, 因此在完成煤层含气量评价模型的基础上, 通过引入同地质构造背景下的新参数井作为验证集进行泛化性检验, 即用未参与模型建立的数据进行验证, 结果如图 7所示。共有20个岩心实验样本, 其中支持向量机模型和随机森林模型计算的含气量与实验室煤层解吸含气量吻合度高, 随机森林模型在低含气量预测中效果最好。同时展示了验证集盲井SZN-013井的预测效果(图 8), 并结合表 3实际误差数据进行分析。统计各类方法在不同数据集上的表现并进行评价, 3种机器学习模型在训练集与测试集中平均误差均较低, 但BP神经网络模型评价会将高值预测偏低, 将低值预测偏高, 对含气量相对高值与低值预测效果差, 对含气量数据集中段具有较好的评价效果, 这也导致BP神经网络模型泛化性差, 在盲井验证集上误差最高且在SZN-013井含气量预测中出现异常现象, 在扩径段与夹矸段出现异常波动预测结果, 这也表明了该方法抗干扰能力差, 不适用于不均衡数据训练。支持向量机模型与随机森林模型整体表现效果好, 但随机森林模型在盲井验证集上表现最好, 各类误差均为最低。误差数据也表明了3种机器学习方法的有效性与泛化性, BP神经网络模型训练难度大且对数据质量要求高, 只能有效预测数据分布集中段范围的含气量; 支持向量机模型适用于小样本数据, 且具有泛化性, 但在含气量低值区预测能力相对较弱; 随机森林模型由于采用重采样模式建模, 因此, 能平衡数据分布不均的问题, 在含气量低值数据较少的情况下也能有效训练模型, 模型准确性高且具有泛化性。

表 3 机器学习方法评价煤层含气量误差
图 7 验证集煤层含气量评价效果
图 8 验证井SZN-013井煤层含气量评价
3 开发井应用效果

煤层气产量受地质和工程等多种因素影响, 含气量是地质因素中的一个因素, 是产气量高的基础, 含气量的准确预测在一定程度上可以指导煤层气开发。我们利用优选评价模型对柿庄南区块62口开发井进行煤层含气量评价, 得到各开发井含气量曲线。为了呈现平面效果, 计算3号煤层含气量均值, 对含气量进行了平面绘制, 绘制3号煤层含气量等值线热图如图 9a所示; 并根据开发井排采生产数据, 计算出对应62口开发井平均有效日产气量, 绘制等值线热图如图 9b所示。由图 9可见, 除了个别区域存在含气量预测误差外(如研究区西南部), 含气量高值区基本对应平均有效日产气量高值区, 整体分布趋势相近, 即可以通过评价煤层含气量指示出开发有利区块。将开发井3号煤层含气量均值与3号煤层平均有效日产气量进行交会分析(图 10), 两者皮尔逊(Pearson)指数达到0.76, 拟合优度为0.57, 从数据上也表明了两者相关性强, 但从样本点分布分析, 煤层含气量评价的准确性与排采制度及压裂改造等施工因素制约着两者的相关性, 与实际生产情况相符, 这也进一步验证了开发井煤层含气量评价的正确性。开发井应用效果表明了煤层含气量对煤层气勘探开发具有重要的指导作用, 也进一步证实了机器学习方法在煤层含气量评价中的可靠性与可推广性。

图 9 柿庄南区块3号煤层含气量评价与排采生产数据分析 a 3号煤层含气量等值线; b 3号煤层平均有效日产气量等值线
图 10 柿庄南区块3号煤层含气量评价与排采生产数据交会分析结果
4 结论

1) 利用BP神经网络模型、支持向量机模型和随机森林模型可以有效评价煤层含气量, 但是在实际应用中这3种模型的评价效果有所不同。其中BP神经网络模型受制于原理与实际数据质量, 评价效果差; 支持向量机模型与随机森林模型因适用于小样本数据, 评价效果良好; 随机森林模型因重采样抽取方式能平衡数据样本分布不均的问题, 使得这一模型在含气量低值区的评价效果更为可靠。这为今后含气量评价提供了方法选择的依据。

2) 为了验证模型的泛化能力, 应用盲井对3种模型进行检验, 3种方法平均相对误差分别为17.6%、11.7%和10.4%, 误差数据表明3种机器学习方法评价煤层含气量的有效性与泛化性存在差异。

3) 将最终形成的煤层气评价方法直接应用于实际开发井含气量预测, 与实际生产数据对比符合率较高, 说明优选出的模型的适用性和可推广性更强; 对实际煤层气勘探开发具有指导意义。

参考文献
[1]
张宝生, 罗东坤, 平洋. 中国煤层气开发社会效益的评价[J]. 统计与决策, 2008(18): 53-56.
ZHANG B S, LUO D K, PING Y. Evaluation of social benefits of coalbed methane development in China[J]. Statistics & Decision, 2008(18): 53-56.
[2]
冯明, 陈力, 徐承科, 等. 中国煤层气资源与可持续发展战略[J]. 资源科学, 2007, 29(3): 100-104.
FENG M, CHEN L, XU C K, et al. Coal-bed methane resources and sustainable development in China[J]. Resources Science, 2007, 29(3): 100-104.
[3]
邵龙义, 侯海海, 唐跃, 等. 中国煤层气勘探开发战略接替区优选[J]. 天然气工业, 2015, 35(3): 1-11.
SHAO L Y, HOU H H, TANG Y, et al. Selection of strategic relay areas of CBM exploration and development in China[J]. Natural Gas Industry, 2015, 35(3): 1-11.
[4]
张道勇, 朱杰, 赵先良, 等. 全国煤层气资源动态评价与可利用性分析[J]. 煤炭学报, 2018, 43(6): 1598-1604.
ZHANG D Y, ZHU J, ZHAO X L, et al. Dynamic assessment of coalbed methane resources and availability in China[J]. Journal of China Coal Societ, 2018, 43(6): 1598-1604.
[5]
孟召平, 田永东, 雷旸. 煤层含气量预测的BP神经网络模型与应用[J]. 中国矿业大学学报, 2008, 37(4): 28-33.
MENG Z P, TIAN Y D, LEI Y. Prediction models of coal bed gas content based on BP neural networks and its applications[J]. Journal of China University of Mining & Technology, 2008, 37(4): 28-33.
[6]
连承波, 赵永军, 李汉林, 等. 煤层含气量的主控因素及定量预测[J]. 煤炭学报, 2005, 30(6): 726-729.
LIAN C B, ZHAO Y J, LI H L, et al. Main controlling factors analysis and prediction of coal bed gas content[J]. Journal of China Coal Societ, 2005, 30(6): 726-729.
[7]
娄剑青. 影响煤层气井产量的因素分析[J]. 天然气工业, 2004, 24(4): 62-64.
LOU J Q. Factors of influencing production of coal bed gas wells[J]. Natrual Gas Industry, 2004, 24(4): 62-64.
[8]
张胜利, 陈晓东. 控制煤层气含量及可采性的主要地质因素[J]. 天然气工业, 1997, 17(4): 15-19.
ZHANG S L, CHEN X D. Geological controls on content and producibility of coal seam gas[J]. Natural Gas Industry, 1997, 17(4): 15-19.
[9]
高波, 马玉贞, 陶明信, 等. 煤层气富集高产的主控因素[J]. 沉积学报, 2003, 21(2): 345-349.
GAO B, MA Y Z, TAO M X, et al. Main controlling factors analysis of enrichment condition of coalbed methane[J]. Acta Sedimentologica Sinica, 2003, 21(2): 345-349.
[10]
吴永平, 李仲东, 王允诚. 煤层气储层异常压力的成因机理及受控因素[J]. 煤炭学报, 2006, 31(4): 475-479.
WU Y P, LI Z D, WANG Y C. The formation mechanisms of abnormal pressure and factor in control of the coal bed gas in Qinshui Basin[J]. Journal of China Coal Society, 2006, 31(4): 475-479.
[11]
叶建平, 武强, 王子和. 水文地质条件对煤层气赋存的控制作用[J]. 煤炭学报, 2001, 26(5): 63-67.
YE J P, WU Q, WANG Z H. Controlled characteristics of hydrogeological conditions on the coalbed methane migration and accumulation[J]. Journal of China Coal Society, 2001, 26(5): 63-67.
[12]
董红, 侯俊胜, 李能根, 等. 煤层煤质和含气量的测井评价方法及其应用[J]. 物探与化探, 2001, 25(2): 138-143.
DONG H, HOU J S, LI N G, et al. The logging evaluation method for coal quality and methane[J]. Geophysical & Geochemical Exploration, 2001, 25(2): 138-143.
[13]
陈跃, 汤达祯, 许浩, 等. 基于测井信息的韩城地区煤体结构的分布规律[J]. 煤炭学报, 2013, 38(8): 1435-1442.
CHEN Y, TANG D Z, XU H, et al. The distribution of coal structure in Hancheng based on well logging data[J]. Journal of China Coal Society, 2013, 38(8): 1435-1442.
[14]
赵立明, 崔若飞, 彭刘亚. 基于测井曲线重构的岩性反演方法圈定构造煤发育带[J]. 煤矿安全, 2013, 44(8): 8-10.
ZHAO L M, CUI R F, PENG L Y. Delineating deformed coal development zones with lithological inversion methods based on logging curve reconstruction[J]. Safety in Coal Mines, 2013, 44(8): 8-10.
[15]
吴东平, 吴春萍, 岳晓燕. 煤层气测井评价的神经网络技术[J]. 天然气勘探与开发, 2001, 24(1): 31-34.
WU D P, WU C P, YUE X Y. Neural network of coal bed gas logging evaluation[J]. Natural Gas Exploration & Development, 2001, 24(1): 31-34.
[16]
曹军涛, 赵军龙, 王轶平, 等. 煤层气含量影响因素及预测方法[J]. 西安石油大学学报(自然科学版), 2013, 28(4): 28-34.
CAO J T, ZHAO J L, WANG Y P, et al. Review of influencing factors and prediction methods of gas content in coal seams and prospect of prediction methods[J]. Journal of Xi'an Shiyou University(Natural Science Edition), 2013, 28(4): 29-34.
[17]
侯俊胜, 王颖. 神经网络方法在煤层气测井资料解释中的应用[J]. 地质与勘探, 1999, 35(3): 41-45.
HOU J S, WANG Y. Interpretation of well logging data for coalbed methane using BP neural network[J]. Geology and Prospecting, 1999, 35(3): 41-45.
[18]
连承波, 赵永军, 李汉林, 等. 基于支持向量机回归的煤层含气量预测[J]. 西安科技大学学报, 2008, 28(4): 707-709.
LIAN C B, ZHAO Y J, LI H L, et al. Prediction of coal bed gas content based on support vector machine regression[J]. Journal Center of Xi'an University of Science and Technology, 2008, 28(4): 707-709.
[19]
李泽辰, 杜文凤, 胡进奎, 等. 鄂尔多斯盆地临兴区块测井含气量解释方法[J]. 煤炭学报, 2018, 43(2): 490-498.
LI Z C, DU W F, HU J K, et al. Interpretation method of gas content in logging of Linxing block in Ordos Basin[J]. Journal of China Coal Society, 2018, 43(2): 490-498.
[20]
郭建宏, 张占松, 张超谟, 等. 用地球物理测井资料预测煤层气含量—基于斜率关联度-随机森林方法的工作案例[J]. 物探与化探, 2021, 45(1): 18-28.
GUO J H, ZHANG Z S, ZHANG C M, et al. The exploration of predicting CBM content by geophysical logging data: A case study based on slope correlation random forest method[J]. Geophysical & Geochemical Exploration, 2021, 45(1): 18-28.
[21]
伊永祥. 沁水盆地柿庄南区块煤层气井生产特征及排采控制研究[D]. 中国地质大学(北京), 2020
YI Y X. Research on the production characteristics and drainage control of CBM wells in the Shizhuangnan block of Qinshui Basin[D]. Beijing: China University of Geosciences(Beijing), 2020
[22]
郭广山, 邢力仁. 柿庄南煤层气富集主控因素及开发潜力分析[J]. 洁净煤技术, 2015, 21(4): 117-121.
GUO G S, XING L R. Primary geological controlling factors of coalbed methane enrichment and its exploration potential in Southern Shizhuag block[J]. Clean Coal Technology, 2015, 21(4): 117-121.
[23]
郭建宏, 张占松, 张超谟, 等. 基于灰色系统与测井方法的煤层气含量预测及应用[J]. 物探与化探, 2020, 44(5): 1190-1200.
GUO J H, ZHANG Z S, ZHANG C M, et al. Prediction and application of coalbed methane content based on grey system and logging method[J]. Geophysical and Geochemical Exploration, 2020, 44(5): 1190-1200.
[24]
梁亚林, 原文涛. 测井预测煤层气含量及分布规律—以山西省沁水煤田为例[J]. 物探与化探, 2018, 42(6): 1144-1149.
LIANG Y L, YUAN W T. The prediction of the content and distribution of coalbed gas: A case study in the Qinshui coalfield based on logging[J]. Geophysical and Geochemical Exploration, 2018, 42(6): 1144-1149.
[25]
雍世和, 张超谟. 测井数据处理与综合解释[M]. 东营: 中国石油大学出版社, 2007: 134-139.
YONG S H, ZHANG C M. Logging data processing and comprehensive interpretation[M]. Dongying: China University of Petroleum Press, 2007: 134-139.
[26]
陈中杰, 蒋刚, 蔡勇. 基于SVM一对一多分类算法的二次细分法研究[J]. 传感器与微系统, 2013, 32(4): 44-47.
CHEN Z J, JIANG G, CAI Y. Research of secondary subdivision method for one-versus-one multi-classification algorithm based on SVM[J]. Transducer and Microsystem Technologies, 2013, 32(4): 44-47.
[27]
牟丹, 王祝文, 黄玉龙, 等. 基于SVM测井数据的火山岩岩性识别——以辽河盆地东部坳陷为例[J]. 地球物理学报, 2015, 58(5): 1785-1793.
MOU D, WANG Z W, HUANG Y L, et al. Lithological identification of volcanic rocks from SVM well logging data: Case study in the eastern depression of Liaohe Basin[J]. Chinese Journal of Geophysics, 2015, 58(5): 1785-1793.
图 1 研究区区域位置及柱状地层
表 1 SZN-1井3号煤层含气量测试结果
图 2 实验含气量数据分布
表 2 BP神经网络权值及阈值
图 3 BP神经网络模型评价煤层含气量 a BP神经网络模型训练集回判结果; b BP神经网络模型测试集预测结果
图 4 支持向量机模型评价煤层含气量 a 支持向量机模型训练集回判结果; b 支持向量机模型测试集预测结果
图 5 随机森林模型建立过程 a 随机森林模型网格寻优结果; b 随机森林袋外误差曲线
图 6 随机森林模型评价煤层含气量 a 随机森林模型训练集回判结果; b 随机森林模型测试集预测结果
表 3 机器学习方法评价煤层含气量误差
图 7 验证集煤层含气量评价效果
图 8 验证井SZN-013井煤层含气量评价
图 9 柿庄南区块3号煤层含气量评价与排采生产数据分析 a 3号煤层含气量等值线; b 3号煤层平均有效日产气量等值线
图 10 柿庄南区块3号煤层含气量评价与排采生产数据交会分析结果
基于机器学习的煤层含气量测井评价方法——以沁水盆地柿庄南区块为例
秦瑞宝, 叶建平, 李利, 余杰, 黄涛, 李铭宇