文章快速检索     高级检索
  中国石油勘探  2025, Vol. 30 Issue (6): 201-214  DOI:10.3969/j.issn.1672-7703.2025.06.014

引用本文 

高永涛, 李路, 郭栋, 宋晓航, 潘永帅, 徐田武. 强非均质性断陷湖盆优质烃源岩总有机碳预测及对成藏的控制作用——以东濮凹陷葛岗集地区为例[J]. 中国石油勘探, 2025, 30(6): 201-214. DOI: 10.3969/j.issn.1672-7703.2025.06.014.
Gao Yongtao, Li Lu, Guo Dong, Song Xiaohang, Pan Yongshuai, Xu Tianwu. Prediction of total organic carbon of high-quality source rocks and their control on hydrocarbon accumulation in strongly heterogeneous rift lake basin: a case study of Gegangji area, Dongpu Sag[J]. China Petroleum Exploration, 2025, 30(6): 201-214. DOI: 10.3969/j.issn.1672-7703.2025.06.014.

基金项目

国家油气重大专项“渤海湾超级盆地油气富集规律与新领域勘探技术”(2024ZD1400100)

第一作者简介

高永涛(1983-),男,河南禹州人,硕士,2014年毕业于中国石油大学(北京),高级工程师,现主要从事石油地质综合研究及油气勘探方面的工作。地址:河南省濮阳市中原路277号中国石油化工股份有限公司中原油田分公司勘探开发研究院东濮勘探研究所,邮政编码:457001。E-mail:gyt.zyyt@sinopec.com

通信作者简介

徐田武(1981-),男,山东临沂人,博士,2009年毕业于中国石油大学(北京),正高级工程师,主要从事石油地质研究工作。地址:河南省濮阳市中原东路360号勘探开发研究院,邮政编码:457001。E-mail: xutw.zyyt@sinopec.com

文章历史

收稿日期:2025-07-28
修改日期:2025-11-03
强非均质性断陷湖盆优质烃源岩总有机碳预测及对成藏的控制作用——以东濮凹陷葛岗集地区为例
高永涛1, 李路1, 郭栋1, 宋晓航1, 潘永帅2,3, 徐田武1     
1. 中国石化中原油田分公司勘探开发研究院;
2. 东北石油大学陆相页岩油气成藏及高效开发教育部重点实验室;
3. 东北石油大学多资源协同陆相页岩油绿色开采全国重点实验室
摘要: 东濮凹陷葛岗集地区沙河街组优质烃源岩分布非均质性极强,传统测井方法难以精确识别和预测,严重制约了洼陷区油气勘探成效。据此,结合地球化学数据与测井响应特征,基于随机森林算法构建了高精度TOC预测模型,实现了强非均质地质条件下烃源岩总有机碳(TOC)的有效预测,揭示了薄层优质烃源岩的分布规律及其对油气成藏的控制作用。结果表明,研究区优质烃源岩以灰黑色页岩为主,有机质丰度高、类型好,但单层厚度薄、纵横向分布变化快、测井响应复杂,导致传统方法识别精度不足。随机森林算法通过融合多类测井参数,显著提升了对复杂岩性组合中有机质非均质分布的预测能力。预测结果显示,研究区优质烃源岩主要分布于沙河街组三段下亚段(Es3)底部和沙河街组四段上亚段(Es4)中上部,且在近洼—深洼区呈现自西向东、自南向北厚度逐渐增大的趋势。优质烃源岩的分布对油气成藏具有明显控制作用,表现出典型的“近源成藏”特征,高产油气层及油气显示层段均分布于优质烃源岩附近,且油气富集程度与优质烃源岩厚度密切相关。该研究成果为东濮凹陷洼陷带的油气勘探部署提供了重要的地质依据。
关键词: 优质烃源岩    非均质性    随机森林    控藏作用    沙河街组    东濮凹陷    
Prediction of total organic carbon of high-quality source rocks and their control on hydrocarbon accumulation in strongly heterogeneous rift lake basin: a case study of Gegangji area, Dongpu Sag
Gao Yongtao1 , Li Lu1 , Guo Dong1 , Song Xiaohang1 , Pan Yongshuai2,3 , Xu Tianwu1     
1. Research Institute of Exploration and Development, Sinopec Zhongyuan Oilfield Company;
2. Key Laboratory of Continental Shale Oil and Gas Accumulation and Efficient Development, Ministry of Education, Northeast Petroleum University;
3. State Key Laboratory of Multi-resource Collaborated Green Development of Continental Shale Oil, Northeast Petroleum University
Abstract: In Gegangji area, Dongpu Sag, the distribution of high-quality source rocks in Shahejie Formation exhibits extremely strong heterogeneity, making it difficult for conventional logging methods to accurately identify and predict, which significantly hinders effective oil and gas exploration in the subsag area. By integrating geochemical data with logging response characteristics, and employing a random forest algorithm, a high-precision TOC prediction model has been developed, achieving effective prediction of total organic carbon (TOC) content of source rocks in the context of highly heterogeneous geological conditions, which reveals the distribution pattern of high-quality thin source rocks and their controlling effect on hydrocarbon accumulation. The study results indicate that the high-quality source rocks in the study area are mainly composed of gray black shale, with high organic matter abundance, and favorable kerogen types, but thin single-layer thickness, rapid vertical and lateral variations, and complex logging response, leading to insufficient identification accuracy of traditional methods. The random forest algorithm significantly improves the prediction capability for heterogeneous organic matter distribution in complex lithological associations by integrating multi-type logging parameters. The prediction results show that high-quality source rocks are mainly distributed at the base lower sub-member of the third member (Es3l) and the middle-upper part of the upper sub-member of the fourth member of Shahejie Formation (Es4u) in the study area. Moreover, their thickness gradually increases from west to east and from south to north in the near-subsag to deep-subsag areas. The distribution of high-quality source rocks had a clear control on hydrocarbon accumulation, demonstrating typical characteristics of "near-source rock hydrocarbon accumulation". The high-yield oil and gas layers as well as hydrocarbon-bearing intervals are all located near high-quality source rocks, and the degree of hydrocarbon enrichment is closely related to source rock thickness. This research provides an important geological basis for oil and gas exploration planning in the subsag area in Dongpu Sag.
Key words: high-quality source rock    heterogeneity    random forest    controlling effect on hydrocarbon accumulation    Shahejie Formation    Dongpu Sag    
0 引言

总有机碳(TOC)是评价烃源岩生烃潜力的关键参数,其精准获取对于油气资源评价至关重要[1-2]。虽然岩心实验可直接测定TOC,但其成本高、数量有限,难以获得连续的地球化学剖面[3-4]。因此,利用测井曲线与实测TOC数据建立响应关系,是目前油气勘探开发中应用最广的技术手段[5]。传统的TOC测井预测方法,如线性回归和ΔLogR[6-7],通常建立在简单的数学统计关系或经验公式之上。这些方法对于地质条件相对简单、均质性强的地层具有一定效果,但难以有效刻画测井响应与TOC之间复杂的非线性关系,导致在岩性复杂、非均质性极强的地层中预测精度显著降低,普适性较差。

近年来,机器学习算法凭借其强大的非线性拟合能力和多特征协同分析优势[8-12],为上述难题的解决提供了新的途径,其不仅能够自动学习和拟合测井参数与TOC之间复杂的非线性关系,还可以同时处理多个测井参数的组合特征,充分挖掘数据间的潜在关联。此外,机器学习方法通过数据驱动的方式建立预测模型,减少了人为经验的依赖,提高了预测的客观性和准确性。然而,已有研究多侧重于机器学习算法应用效果的横向对比,对于算法在特定强非均质地质条件下的适用性、模型构建的详细流程及其地质意义的深入解读仍显不足[13-16]

东濮凹陷葛岗集地区古近系沙河街组蕴藏着丰富的油气资源,其烃源岩品质与分布直接控制着油气的富集与成藏。历经多年勘探,目前已探明14个大型含油气构造,总探明储量可达5.9×108t。但随着近洼勘探的逐渐深入,诸多问题相继涌现。沙河街组虽发育多套厚层泥岩,但有机质丰度非均质性极强,优质烃源岩往往厚度较薄且在纵横向上相变迅速,导致传统预测方法极难准确识别,优质烃源岩的空间展布规律尚不明确,严重制约了精细勘探的进程。因此,对该类强非均质性背景下优质烃源岩TOC的高精度预测至关重要。本研究针对传统烃源岩评价方法的不足,在明确东濮凹陷葛岗集地区沉积背景及烃源岩基本特征的基础上,优选了适合于本区复杂数据结构的随机森林算法,建立了高精度TOC预测模型,明确了强非均质地层条件下优质烃源岩的展布特征及对油气成藏的控制作用,对东濮凹陷洼陷带的油气勘探具有重要的指导意义。

1 区域地质概况

东濮凹陷位于渤海湾盆地西南缘临清坳陷的南部,处于华北板块东部裂陷系的中心区域(图 1a),是在古生代克拉通基底之上发育形成的中—新生代断陷盆地[17-19]。凹陷整体呈北北东向展布,南北长约140km,东西宽20~50km,具有典型的南宽北窄特征[20-23]。作为渤海湾盆地内形成相对较晚的次级构造单元,东濮凹陷表现出独特的构造特征和地层结构。受多期构造运动影响,东濮凹陷形成了“多隆多洼”的构造格局,具有“东西分带、南北分区”的特征。自西向东可划分为5个次级构造单元:西部斜坡带、西部洼陷带、中央隆起带、东部洼陷带和东部陡坡带[24-26],本次研究区为东部洼陷带的葛岗集地区(图 1a)。

图 1 东濮凹陷构造位置(a)及古近系沙河街组地层综合柱状图(b) Fig. 1 Structural location of Dongpu Sag (a) and comprehensive stratigraphic column of the Paleogene Shahejie Formation (b)

葛岗集地区地层剥蚀较为严重,基底主要由下古生界海相碳酸盐岩、上古生界海陆交互相碎屑岩及中生界砂泥岩构成,总厚度近3000m。新生界自下而上依次发育古近系孔店组(Ek)、沙河街组(Es)和东营组(Ed),新近系馆陶组(Ng)和明化镇组(Nm),以及第四系平原组(Qp)(图 1b)。其中,东营组沉积末期受构造运动影响,遭受了不同程度的剥蚀,导致与上覆地层呈不整合接触。沙河街组作为主要的含油气层和烃源岩层,自上而下可进一步划分为沙河街组一段(沙一段,Es1)、沙河街组二段(沙二段,Es2)、沙河街组三段(沙三段,Es3)和沙河街组四段(沙四段,Es4),各段内又可划分为若干亚段。其中,沙三段和沙四段烃源岩最为发育,是本次重点关注的层段。

2 样品信息与测试条件

本研究在对葛岗集地区马东1井、马3002井、马11-7井等多口重点取心井开展系统岩心观察的基础上,依据颜色、构造和成分等宏观特征进行了细致的样品选择。为减少风化作用的影响,所有分析测试均在样品新鲜面上完成。主要开展了TOC、岩石热解、镜质组反射率(Ro)等地球化学测试,各项实验均严格遵循国家标准执行。此外,本研究还结合了中国石化中原油田分公司大量的基础资料进行综合对比与验证,进一步保证了分析结果的准确性和可靠性。在此基础上,为确保样品数据能够全面反映研究区有机质丰度的整体分布特征,并为后续TOC预测模型的构建提供可靠的数据基础,本研究系统选择了不同TOC的代表性样品进行烃源岩基本特征分析及预测模型构建。

3 烃源岩特征及传统测井TOC预测方法 3.1 烃源岩沉积相及地球化学特征

葛岗集地区古近系烃源岩具有分布广、层系多、厚度大的特点。受多沉积体系控制,东濮凹陷沉积相带变化频繁。其中,在Es3沉积时期,葛岗集地区西部斜坡带主要发育网状河三角洲前缘沉积,近洼带与洼陷带以浅湖—半深湖沉积为主,东部陡坡带则发育部分扇三角洲前缘沉积体系(图 2);至Es4沉积期,西部斜坡带仍以网状河三角洲前缘沉积为主,但其延伸范围较Es3明显缩小,近洼斜坡带和洼陷带则以浅湖沉积为主,东部陡坡带则以扇三角洲前缘沉积为主(图 2),此种多变的沉积格局导致研究区岩性组合复杂多样,有机质丰度空间非均质性极强,并对测井响应产生了复杂影响[27-29]

图 2 东濮凹陷葛岗集地区沙三段下亚段(a)与沙四段上亚段(b)沉积相图 Fig. 2 Sedimentary facies map of the lower sub-member of the third member of Shahejie Formation (a) and the upper sub-member of fourth member of Shahejie Formation (b) in Gegangji area, Dongpu Sag

研究区主要发育灰黑色页岩、灰黑色泥岩、紫红色泥岩、灰色粉砂质泥岩、灰色泥质粉砂岩、灰色粉砂岩和灰色细砂岩等岩性(图 3)。其中,灰黑色页岩的单层厚度最薄,整体介于0.2~0.5m。不同岩性的有机质丰度和生烃潜力存在显著差异(图 4)。灰黑色页岩展现出良好的烃源岩质量,大部分TOC大于1%(平均约为2%),S1+S2含量介于1.9~30.6mg/g(平均为10.8mg/g),氢指数(IH)值整体大于200mg/g(平均为466.2mg/g),以Ⅰ—Ⅱ1型干酪根为主(图 4图 5a)。灰黑色泥岩次之,仅有20%样品的TOC大于1%,S1+S2含量介于0.002~ 32.6mg/g(平均为2.1mg/g),IH值介于8.3~1151.6mg/g(平均为164.7mg/g),有机质类型以Ⅱ1—Ⅱ2型为主(图 4图 5a)。但部分泥岩具有与灰黑色页岩类似的IH值和干酪根类型,表明部分泥岩仍具有较好的有机质类型(图 5a)。其他岩性的TOC整体小于0.4%,IH值均小于100mg/g,有机质类型主要为Ⅱ2—Ⅲ型(图 4图 5a)。研究区烃源岩整体处于成熟—高成熟阶段,镜质组反射率(Ro)主要分布在0.7%~2%之间,平均为1.2%(图 5b)。因此,研究区的灰黑色页岩和部分灰黑色泥岩属于好—很好烃源岩级别,其他岩性均较差(图 4b)。

图 3 东濮凹陷葛岗集地区沙河街组不同岩性特征图 Fig. 3 Characteristics of various lithologies in Shahejie Formation in Gegangji area, Dongpu Sag
图 4 东濮凹陷葛岗集地区不同岩性烃源岩TOC占比(a)及生烃潜力特征图(b) Fig. 4 TOC frequency distribution (a) and hydrocarbon generation potential (b) of source rocks with different lithologies in Gegangji area, Dongpu Sag
图 5 东濮凹陷葛岗集地区沙河街组烃源岩有机质类型及成熟度特征 Fig. 5 Characteristics of organic matter type and maturity of Shahejie Formation source rocks in Gegangji area, Dongpu Sag
3.2 常规测井TOC预测方法 3.2.1 线性回归法

线性回归法主要利用对烃源岩有机质丰度敏感的测井参数,进而建立其与TOC之间的定量关系。本研究选取声波时差(DT)、自然伽马(GR)、自然电位(SP)和深侧向电阻率(RT)等常用测井参数,进行了系统的单变量相关性分析。结果表明,沙河街组烃源岩的DT、SP、RT分别广泛分布在40~120μs/ft、40~55mV、0~30Ω·m之间;而GR值更为分散,主要介于0~20API与50~130API两个区间。当TOC≥ 0.5%时,DT、SP及RT随TOC含量增加呈现微弱上升趋势,但相关性不显著(p > 0.05)。而GR值与TOC之间并无明显相关性,进一步表明单一测井参数难以有效表征研究区强非均质烃源岩的TOC变化(图 6)。

图 6 东濮凹陷葛岗集地区沙河街组烃源岩测井参数与TOC关系图 Fig. 6 Relationship between well-logging parameters and TOC of Shahejie Formation source rocks in Gegangji area, Dongpu Sag
3.2.2 测井ΔLogR法

ΔLogR法是目前国内外应用最为普遍的TOC预测方法[30-32]。其原理是利用GR和SP曲线排除储集层段,然后将RT和DT曲线反向对置,并让两条曲线在细粒非烃源岩处重合(重合线为基线),最终计算两条曲线在烃源岩层的分离幅度[33]。本文基于ΔLogR方法对研究区烃源岩的TOC进行了预测,预测结果普遍高于实测值。ΔLogR值与实测TOC数据的关系显示,当TOC < 0.5%时,ΔLogR值介于0~1,并无相关性;而当TOC≥0.5%时,ΔLogR随TOC增加而稍有增加,但趋势并不明显,相关性较差(相关系数仅为0.32)(图 7)。因此,ΔLogR法在本研究区的适用性同样有限。

图 7 东濮凹陷葛岗集地区沙河街组烃源岩实测TOC与ΔLogR关系图 Fig. 7 Relationship between measured TOC and ΔLogR of Shahejie Formation source rocks in Gegangji area, Dongpu Sag
3.3 不同岩性测井响应特征

研究区不同岩性的测井响应关系较为复杂,部分测井曲线甚至出现多个数值区间,且不同岩性之间的测井响应值存在广泛重叠,导致岩性区分度较低(图 8)。其中,灰黑色页岩通常具有相对较高的DT、RT和GR值;灰黑色泥岩则呈现中等幅度的DT、RT和GR响应;而砂岩和粉砂岩则呈现明显的低值趋势(图 8),这些差异为建立TOC预测模型提供了重要的基础。然而,由于不同岩性之间测井响应区分度有限,ΔLogR法等传统方法所采用的固定参数经验公式难以适应岩性变化导致的非线性响应关系,因此预测精度往往较低。

图 8 东濮凹陷葛岗集地区沙河街组不同岩相测井响应特征 Fig. 8 Logging response characteristics of various lithofacies in Shahejie Formation in Gegangji area, Dongpu Sag
4 基于随机森林算法的烃源岩TOC预测方法

近年来,随着人工智能技术的迅速发展,机器学习方法逐渐被应用于TOC的预测。其中,随机森林算法基于集成学习理念,对传统决策树方法进行了重要改进[34-37]。该方法以多种测井曲线作为特征变量,能够自动建立各类测井响应与TOC之间的复杂非线性关系,综合利用地层信息实现TOC的智能预测,并通过参数调优进一步提升模型的稳定性与泛化能力[34-37]。该算法实质上实现了“自动分岩性建模”的智能预测机制。例如,当输入样本具有灰黑色页岩特征时,模型能够自适应地选择对该岩性敏感的测井参数作为主要判别依据,从而有效克服岩性变化对TOC预测的干扰。由于其在抑制过拟合方面的优异表现,随机森林算法特别适用于处理高维数据及复杂非线性关系,在面对高度非均质的样本时依然能够保持稳健的建模性能[37]。基于以上优势,本研究选用随机森林算法,旨在建立东濮凹陷葛岗集地区沙河街组烃源岩TOC的高精度预测模型。

4.1 随机森林算法预测TOC步骤

随机森林算法是一种基于Bagging集成学习策略的机器学习算法,将其应用于烃源岩TOC预测的基本步骤如下(图 9):

图 9 随机森林方法原理图[34] Fig. 9 Principle of Random Forest algorithm [34]

(1)Bootstrap重抽样:从原始TOC数据集中有放回地随机抽取多个子训练集N,每个子集规模与原数据集相同,用于训练不同的决策树。

(2)随机特征选择:在决策树的每个节点进行分裂时,随机选取特征的一个子集(部分对烃源岩特征敏感的参数,而非全部特征)作为候选分裂属性,以增强模型多样性并抑制过拟合。

(3)集成预测:每棵决策树独立进行TOC预测,最终模型的输出为所有决策树预测结果的算术平均值。

4.2 随机森林预测模型的构建与验证 4.2.1 数据准备与预处理

本研究选取葛岗集地区18口井共计332组不同含量的TOC实测数据及与之对应的测井数据作为研究对象。每组数据包含1个实测TOC(目标变量)和其在对应深度上的多条测井曲线值(特征变量),主要包括DT、GR、SP和RT。分析之前,首先对岩心样品进行精确的深度归位,确保实测TOC值与测井数据严格对应。然后,为了消除不同测井曲线量纲差异的影响,对于明显超出标准差范围的异常值进行剔除,并对所有特征变量进行Z-score标准化处理,其计算公式为

$ x^{\prime}=\frac{x-\mu}{\sigma} $ (1)

式中x——原始数据;

μ——该特征在所有样本中的均值;

σ——标准差。

4.2.2 特征相关性分析

将上述处理后的数据按7∶3比例随机划分为训练集(232个TOC数据)和测试集(100个TOC数据),并通过设置随机种子(random_state=42),确保结果可重现。在模型训练前,首先需要分析TOC与不同测井曲线的相关性,即所使用的测井曲线对随机森林算法预测结果的贡献。本研究采用Pearson相关系数法和pandas的corr () 函数[38]计算各测井参数与TOC之间的线性相关关系(图 10)。分析结果显示,GR、SP、RT和DT与TOC之间的相关系数分别为0.24、0.12、0.21和0.05,均低于0.3,反映了强非均质地层条件导致TOC和各测井曲线之间具有复杂的非线性关系(图 10)。

图 10 东濮凹陷葛岗集地区沙河街组TOC与测井变量热力图 Fig. 10 Heatmap between TOC and well-logging variables of Shahejie Formation source rocks in Gegangji area, Dongpu Sag
4.2.3 模型训练与超参数优化

本研究采用能够有效捕捉上述非线性特征,同时具备良好抗过拟合能力和对高维数据处理能力的随机森林算法构建TOC预测模型。首先通过网格搜索结合5折交叉验证进行超参数优化,然后选择对异常值不敏感,且更适合地质数据特性的负平均绝对误差作为评估指标。每一折验证都使用不同的TOC数据子集,最终取平均性能作为参数选择的依据,有效避免了因数据划分偶然性导致的参数偏差,提高了模型的鲁棒性。在确定最优参数组合后,本研究使用全部训练集数据重新训练模型。训练过程中监测模型在训练集和验证集上的性能变化,以确保未出现过拟合。本研究最终获得的模型在训练集上达到R2=0.92的优异性能,均方根误差(RMSE)和平均绝对误差(MAE)均处于极低水平,表明模型成功捕获了数据中复杂的非线性关系。

4.2.4 特征重要性分析与模型验证

在模型训练完成后,本研究采用随机森林内置的基于基尼不纯度下降的特征重要性评估方法[34-37],定量分析了不同测井参数对TOC预测的贡献程度(图 11)。该方法通过计算每棵决策树中各特征在分裂节点时所带来的不纯度减少量,并在全部树木中求取平均值,最终经归一化处理得到各特征的重要性得分。结果显示,RT的重要性得分最高(0.3245),其次为SP(0.2805),DT(0.2050)和GR(0.1871)(图 11),说明RT为预测TOC提供了更为关键的信息。需要注意的是,RT高值既可能由高有机质含量引起,也可能源于低孔致密泥岩或低含水饱和度储层,这正是传统单变量方法在此类复杂地层中应用效果不佳的关键。而本研究所采用的随机森林算法,其优势在于能够自动识别与高TOC相关的“高RT、高DT、高GR”等综合测井响应模式,而非仅依赖RT等单一参数,从而能够有效甄别并克服由岩性、物性等因素引起的测井曲线多解性问题。模型验证结果显示,预测误差大致呈正态分布,残差随机分布于零值线上下,未出现明显的系统性偏差,表明模型容量适中且训练充分,显著优于ΔLogR法和线性回归法(图 12)。

图 11 东濮凹陷葛岗集地区沙河街组预测烃源岩测井曲线重要性(a)及TOC预测误差分布(b)图 Fig. 11 Well-logging variable importance (a) and TOC prediction error distribution (b) of Shahejie Formation source rocks in Gegangji area, Dongpu Sag
图 12 东濮凹陷葛岗集地区沙河街组随机森林算法预测TOC值与实测值对比 Fig. 12 Comparison between random forest algorithm predicted TOC and measured TOC of Shahejie Formation source rocks in Gegangji area, Dongpu Sag
4.2.5 模型应用与结果分析

本文利用上述模型对研究区50余口井进行了TOC预测(图 13)。结果显示优质烃源岩仍以灰黑色页岩为主(约占80%),但也包含部分有机质类型较好的灰黑色泥岩(约占20%)。预测值与实测值在不同岩性段均表现出一致的变化趋势,证实了模型在强非均质地质条件下的适用性和可靠性,该模型不仅准确识别出已知高TOC层段,还揭示了传统方法未能反映的TOC高值区(图 13)。另外,该模型在低TOC区间的预测结果同样较为精准,表明其对东濮凹陷不同区块的TOC预测具有一定的鲁棒性,可以很好地对测井多参数和TOC之间的非线性关系进行拟合,特别是在非均质性强且有机质丰度低的烃源岩TOC预测中有着较好的应用。因此,本研究构建的随机森林预测模型能够有效处理复杂地层条件下的TOC预测问题,为烃源岩精细评价和油气勘探决策提供了坚实的数据支撑。

图 13 东濮凹陷葛岗集地区马3002井沙河街组TOC预测柱状图 Fig. 13 Predicted TOC histogram of Shahejie Formation source rocks in Well M3002, Gegangji area, Dongpu Sag
5 优质烃源岩展布特征

受多期构造运动影响,东濮凹陷形成了“多隆多洼”的构造格局,沙河街组沉积了大套厚层泥岩。然而,高有机质丰度烃源岩的单层厚度较薄,且空间分布具有较强的非均质性。谈玉明等人[27]在卢双舫等人研究的基础上[39],采用排烃效率(HP)与TOC和S1与TOC对应关系确定了研究区的优质烃源岩下限(TOC=1.0%),通过对不同岩性的地球化学特征进行分析后发现该下限较为合理。因此,结合前人对于湖相烃源岩的评价标准,本研究综合采用TOC=1.0%作为葛岗集地区优质烃源岩的丰度下限。通过对不同层段共计330块样品的TOC数据进行统计发现,Es4烃源岩中TOC大于1.0%的样品占比最高(> 60%);其次为Es4和Es3,其余层段中高TOC样品占比相对较低(图 14)。

图 14 东濮凹陷葛岗集地区古近系沙河街组不同层段TOC大于1.0%的占比图 Fig. 14 Proportion of samples with TOC > 1.0% in various sub-members of the Paleogene Shahejie Formation in Gegangji area, Dongpu Sag

研究区优质烃源岩在纵向上具有层数多、单层厚度薄的特点,主要发育于Es4、Es3及Es4,但不同构造位置的发育程度存在明显差异(图 15图 16)。构造高部位的优质烃源岩层数较少、单层厚度较薄;向近洼区过渡,优质烃源岩的层数和单层厚度均逐渐增加(图 15)。另外,由南向北,优质烃源岩的厚度和层数也呈现规律性变化(图 16)。南部优质烃源岩发育程度相对有限,厚度较薄、层数较少,且主要分布于Es4;向北过渡,优质烃源岩层数逐渐增加,单层厚度逐渐增大,发育层系也逐渐变新,至北部Es3可见大量优质烃源岩发育(图 16)。综上,研究区优质烃源岩的分布受沉积相控制明显,主要发育于浅湖—半深湖相环境中。构造高部位的网状河三角洲前缘环境中优质烃源岩发育有限,而向斜坡带及近洼区的浅湖—半深湖相过渡过程中,优质烃源岩的厚度与层数均显著增加。同时,在同一沉积相带内,由南向北优质烃源岩的厚度和层数也呈现逐渐增大的趋势。

图 15 东濮凹陷葛岗集地区由构造高部位向近洼区方向优质烃源岩剖面图 Fig. 15 Well correlation section of high-quality source rocks from the structural high parts to the near-subsag area in Gegangji area, Dongpu Sag
图 16 东濮凹陷葛岗集地区南北向优质烃源岩剖面图 Fig. 16 N-S direction well correlation section of high-quality source rocks in Gegangji area, Dongpu Sag
6 优质烃源岩对油气成藏的控制作用

通过对典型试油层段、油气显示层段及烃源岩发育层段进行综合分析发现,研究区优质烃源岩的发育对油气成藏具有显著的控制作用。首先,空间分布上具有明显的“近源成藏”特征。油气高产层及显示良好的层段均分布于优质烃源岩附近,其距离范围主要集中在5~20m之间,超过50m的占比极低(图 17)。其次,优质烃源岩的厚度明显控制了含油性。优质烃源岩的厚度与含油层数量及厚度均呈明显正相关关系,优质烃源岩越厚,其附近的含油层数越多,单层厚度也越大(图 17)。最后,优质烃源岩的发育层系控制了油气的纵向和平面分布规律。平面上,油气显示层段自西部构造高部位向东部斜坡带—洼陷边缘过渡,并由南向北延伸,其层数增多且厚度增大;纵向上,自北向南油气显示层位逐渐变新。其中,南部三春集地区以Es4为主,至马厂东部地区扩展至Es4与Es3,到徐集东部及唐庄—桥口地区则进一步变为Es3及Es3下部(图 17)。这一分布与优质烃源岩的发育层位高度吻合,而烃源岩不发育的层段则多为水层,基本无油气显示(图 17)。实际钻探结果进一步验证了这一规律。东濮凹陷洼陷带内马3002井于优质烃源岩相邻层段试油,获日产10.47m3工业油流,表明研究区油气成藏受优质烃源岩控制作用明显,洼陷带展示出良好的勘探潜力。因此,优质烃源岩是控制研究区油气富集与分布的重要地质因素,明确其空间展布可为下一步油气勘探部署提供重要依据。

图 17 东濮凹陷不同地区优质烃源岩发育层位与油气显示层位剖面图 Fig. 17 Well correlation section with high-quality source rock intervals and oil and gas shows in different areas in Dongpu Sag
7 结论

(1)东濮凹陷葛岗集地区古近系沙河街组的优质烃源岩主要为灰黑色页岩,其TOC高(整体大于1%)且有机质类型好(以Ⅰ—Ⅱ1型为主),整体处于成熟—高成熟阶段,但单层厚度较薄(整体介于0.2~0.5m),分布非均质性较强,测井响应规律复杂,导致传统线性回归和ΔLogR法难以准确识别。

(2)基于随机森林算法构建的TOC预测模型有效克服了传统方法的局限,通过融合SP、GR、DT、RT等对有机质响应敏感的测井参数显著提升了预测精度(R2=0.92)。该方法能够自动学习不同岩性背景下测井响应与TOC之间的复杂非线性关系,有效克服了岩性变化产生的干扰,为强非均质地层烃源岩评价提供了可靠技术手段。

(3)优质烃源岩主要发育于斜坡带及近洼区沙三段下亚段中下部及沙四段上亚段顶部的浅湖—半深湖环境中,在平面上呈现出自西向东、自南向北厚度逐渐增大且层数逐渐增多的分布趋势;垂向上则由南向北层系逐渐变新。优质烃源岩的分布对油气成藏具有明显控制作用,表现出“近源成藏”特征,油气富集层段集中在距优质烃源岩5~20m范围内,且富集程度与优质烃源岩厚度密切相关。

参考文献
[1]
姜在兴, 张文昭, 梁超, 等. 页岩油储层基本特征及评价要素[J]. 石油学报, 2014, 35(1): 184-196.
Jiang Zaixing, Zhang Wenzhao, Liang Chao, et al. Characteristics and evaluation elements of shale oil reservoir[J]. Acta Petrolei Sinica, 2014, 35(1): 184-196.
[2]
潘仁芳, 伍媛, 宋争. 页岩气勘探的地球化学指标及测井分析方法初探[J]. 中国石油勘探, 2009, 14(3): 6-9, 28.
Pan Renfang, Wu Yuan, Song Zheng. Geochemical parameters for shale gas exploration and basic methods for well logging analysis[J]. China Petroleum Exploration, 2009, 14(3): 6-9, 28. DOI:10.3969/j.issn.1672-7703.2009.03.002
[3]
王贵文, 朱振宇, 朱广宇. 烃源岩测井识别与评价方法研究[J]. 石油勘探与开发, 2002, 29(4): 50-52.
Wang Guiwen, Zhu Zhenyu, Zhu Guangyu. Logging identification and evaluation of Cambrian-Ordovician source rocks in syneclise of Tarim Basin[J]. Petroleum Exploration and Development, 2002, 29(4): 50-52.
[4]
袁彩萍, 徐思煌, 薛罗. 珠江口盆地惠州凹陷主力烃源岩测井预测及评价[J]. 石油实验地质, 2014, 36(1): 110-116.
Yuan Caiping, Xu Sihuang, Xue Luo. Prediction and evaluation with logging of main source rocks in Huizhou Sag, Pearl River Mouth Basin[J]. Petroleum Geology & Experiment, 2014, 36(1): 110-116.
[5]
罗昕, 朱传庆, 张宝收, 等. 利用自然伽马测井估算塔里木盆地沉积层生热率[J]. 地质学报, 2020, 94(7): 2078-2088.
Luo Xin, Zhu Chuanqing, Zhang Baoshou, et al. Heat production rate calculation using gamma-ray logging of the sedimentary formation in the Tarim Basin, northwest China[J]. Acta Geologica Sinica, 2020, 94(7): 2078-2088.
[6]
陈瑞杰, 路俊刚, 李勇, 等. 基于NRBO-CNN-LSTM模型的陆相浅水湖盆总有机碳测井预测优选及应用[J]. 成都理工大学学报(自然科学版), 2025, 52(5): 966-985.
Chen Ruijie, Lu Jungang, Li Yong, et al. Logging prediction optimization and the application of total organic carbon in continental shallow lake basins based on the Newton-Raphson optimization convolutional neural network combined with the long short-term memory neural network[J]. Journal of Chengdu University of Technology (Science & Technology Edition), 2025, 52(5): 966-985.
[7]
张晋言. 页岩油测井评价方法及其应用[J]. 地球物理学进展, 2012, 27(3): 1154-1162.
Zhang Jinyan. Well logging evaluation method of shale oil reservoirs and its applications[J]. Progress in Geophysics, 2012, 27(3): 1154-1162.
[8]
Goliatt L, Saporetti C M, Oliveira L C, et al. Performance of evolutionary optimized machine learning for modeling total organic carbon in core samples of shale gas fields[J]. Petroleum, 2024, 10(1): 150-164. DOI:10.1016/j.petlm.2023.05.005
[9]
Beers R F. Radioactivity and organic content of some Paleozoic shales[J]. AAPG Bulletin, 1945, 29(1): 1-22.
[10]
张成龙, 陶士振, 白斌, 等. 基于支持向量机模型的烃源岩有机碳含量预测: 以鄂尔多斯盆地为例[J]. 天然气地球科学, 2019, 30(5): 761-768.
Zhang Chenglong, Tao Shizhen, Bai Bin, et al. Source rock TOC content prediction based on the support vector machine model: an application in Ordos Basin[J]. Natural Gas Geoscience, 2019, 30(5): 761-768.
[11]
Mandal P P, Rezaee R, Emelyanova I. Ensemble learning for predicting TOC from well-logs of the unconventional Goldwyer Shale[J]. Energies, 2022, 15(1): 216.
[12]
石磊. 一种基于随机森林算法的探明储量预测新方法[J]. 中国石油勘探, 2023, 28(3): 167-172.
Shi Lei. A new method for predicting proven reserves based on random forest algorithm[J]. China Petroleum Exploration, 2023, 28(3): 167-172. DOI:10.3969/j.issn.1672-7703.2023.03.014
[13]
Yan Jingwen, He Wenxiang, Gao Xiaoyang, et al. TOC prediction of source rocks based on the convolutional neural network and logging curves: a case study of Pinghu Formation in Xihu Sag[J]. Open Geosciences, 2024, 16(1): 20220632. DOI:10.1515/geo-2022-0632
[14]
唐佰强, 刘招君, 孟庆涛, 等. 松辽盆地东南隆起区上白垩统青山口组油页岩有机碳含量预测及效果评价[J]. 大庆石油地质与开发, 2021, 40(6): 124-132.
Tang Baiqiang, Liu Zhaojun, Meng Qingtao, et al. Prediction and effect evaluation of organic carbon content of oil shale in Upper Cretaceous Qingshankou Formation in southeast uplift of Songliao Basin[J]. Petroleum Geology & Oilfield Development in Daqing, 2021, 40(6): 124-132.
[15]
唐生寿, 杨斌, 靳九龙, 等. 基于机器学习的总有机碳含量测井预测方法对比研究[J]. 测井技术, 2024, 48(4): 428-437.
Tang Shengshou, Yang Bin, Jin Jiulong, et al. Comparative study on total organic carbon content logging prediction method based on machine learning[J]. Well Logging Technology, 2024, 48(4): 428-437.
[16]
张潇, 李超, 窦衍光, 等. 利用随机森林算法预测中国东部海域表层沉积物有机碳含量分布[J]. 海洋地质与第四纪地质, 2025, 45(4): 187-197.
Zhang Xiao, Li Chao, Dou Yanguang, et al. Predicting the distribution of organic carbon content in surface sediments of the eastern China seas using random forest algorithm[J]. Marine Geology & Quaternary Geology, 2025, 45(4): 187-197.
[17]
杜涛, 曲希玉, 王清斌, 等. 渤中19-6凝析气田孔店组砂砾岩储层压实成岩裂缝垂向演化特征[J]. 吉林大学学报(地球科学版), 2023, 53(1): 17-29.
Du Tao, Qu Xiyu, Wang Qingbin, et al. Vertical evolution characteristics of compaction diagenetic fractures in glutenite reservoirs of Kongdian Formation in Bozhong 19-6 condensate gas field[J]. Journal of Jilin University (Earth Science Edition), 2023, 53(1): 17-29.
[18]
仝志刚, 李友川, 何将启, 等. 渤海海域渤中凹陷渤中19-6大型凝析气田天然气来源探讨[J]. 石油实验地质, 2022, 44(2): 324-330, 336.
Tong Zhigang, Li Youchuan, He Jiangqi, et al. Gas source of BZ19-6 condensate gas field in Bozhong Sag, Bohai Sea area[J]. Petroleum Geology & Experiment, 2022, 44(2): 324-330, 336.
[19]
薛永安, 王奇, 牛成民, 等. 渤海海域渤中凹陷渤中19-6深层潜山凝析气藏的充注成藏过程[J]. 石油与天然气地质, 2020, 41(5): 891-902.
Xue Yongan, Wang Qi, Niu Chengmin, et al. Hydrocarbon charging and accumulation of BZ 19-6 gas condensate field in deep buried hills of Bozhong Depression, Bohai Sea[J]. Oil & Gas Geology, 2020, 41(5): 891-902.
[20]
程秀申, 漆家福, 陈书平, 等. 关于东濮凹陷构造单位的探讨[J]. 断块油气田, 2009, 16(4): 15-18.
Cheng Xiushen, Qi Jiafu, Chen Shuping, et al. Discussion on structural units of Dongpu Depression[J]. Fault-Block Oil & Gas Field, 2009, 16(4): 15-18.
[21]
漆家福, 杨桥, 陆克政, 等. 渤海湾盆地基岩地质图及其所包含的构造运动信息[J]. 地学前缘, 2004, 11(3): 299-307.
Qi Jiafu, Yang Qiao, Lu Kezheng, et al. Geologic map of sub-outcrop and its implied information of tectogenesis in Bohai Bay Basin province[J]. Earth Science Frontiers, 2004, 11(3): 299-307.
[22]
谈玉明, 徐田武, 张云献, 等. 东濮凹陷天然气富集规律[J]. 断块油气田, 2017, 24(4): 442-447.
Tan Yuming, Xu Tianwu, Zhang Yunxian, et al. Gas accumulation regularity of Dongpu Depression[J]. Fault-Block Oil & Gas Field, 2017, 24(4): 442-447.
[23]
周新科, 许化政. 东濮凹陷地质特征研究[J]. 石油学报, 2007, 28(5): 20-26.
Zhou Xinke, Xu Huazheng. Discussion on geological features of Dongpu Depression[J]. Acta Petrolei Sinica, 2007, 28(5): 20-26.
[24]
段金宝, 徐田武, 杨栋栋, 等. 渤海湾盆地东濮凹陷洼陷带油气地质新认识与勘探突破[J]. 石油与天然气地质, 2025, 46(2): 377-391.
Duan Jinbao, Xu Tianwu, Yang Dongdong, et al. New insights and exploration breakthroughs in hydrocarbon exploration in sub-sag zones of the Dongpu Sag, Bohai Bay Basin[J]. Oil & Gas Geology, 2025, 46(2): 377-391.
[25]
谈玉明, 程秀申, 陈书平, 等. 东濮凹陷复杂断块群及勘探潜力分析[J]. 石油与天然气地质, 2011, 32(4): 584-592.
Tan Yuming, Cheng Xiushen, Chen Shuping, et al. Complex fault-block groups in Dongpu Sag and their exploration potential[J]. Oil & Gas Geology, 2011, 32(4): 584-592.
[26]
陈发亮, 李绪涛, 朱晖, 等. 东濮凹陷下第三系沙河街组层序地层划分及盐岩成因探讨[J]. 沉积学报, 2000, 18(3): 384-388, 394.
Chen Faliang, Li Xutao, Zhu Hui, et al. Partition of sequence strata and discussion about Salt-rock resource in Shahejie Formation of Eogene, Dongpu Depression[J]. Acta Sedimentologica Sinica, 2000, 18(3): 384-388, 394.
[27]
谈玉明, 李红磊, 张云献, 等. 东濮凹陷古近系优质烃源岩特征与剩余资源潜力分析[J]. 断块油气田, 2020, 27(5): 551-555, 572.
Tan Yuming, Li Honglei, Zhang Yunxian, et al. Analysis to high quality source rock characteristics and residual resource potential in Dongpu Sag in Paleogene[J]. Fault-Block Oil & Gas Field, 2020, 27(5): 551-555, 572.
[28]
徐田武, 张成富, 吕立爽, 等. 形成规模油田成烃要素下限探讨: 以东濮凹陷马寨油田为例[J]. 断块油气田, 2019, 26(2): 137-141.
Xu Tianwu, Zhang Chengfu, Lv Lishuang, et al. Lower limit discussion of hydrocarbon generation factor for large scale oilfield: taking Mazhai Oilfield of Dongpu Depression as an example[J]. Fault-Block Oil & Gas Field, 2019, 26(2): 137-141.
[29]
潘志鸿, 庞雄奇, 郭坤章, 等. 东濮凹陷濮卫地区沙三段储层孔隙定量演化[J]. 中国石油勘探, 2018, 23(1): 91-99.
Pan Zhihong, Pang Xiongqi, Guo Kunzhang, et al. Quantitative simulation of porosity evolution in the third Member of Shahejie Formation in Puwei area in Dongpu Depression[J]. China Petroleum Exploration, 2018, 23(1): 91-99. DOI:10.3969/j.issn.1672-7703.2018.01.010
[30]
Orr F M, Yu A D, Lien C L. Phase behavior of CO2 and crude oil in low-temperature reservoirs[J]. Society of Petroleum Engineers Journal, 1985, 21(4): 480-492.
[31]
Shalaby M R, Jumat N, Lai D, et al. Integrated TOC prediction and source rock characterization using machine learning, well logs and geochemical analysis: case study from the Jurassic source rocks in Shams Field, NW Desert, Egypt[J]. Journal of Petroleum Science and Engineering, 2019, 176: 369-380. DOI:10.1016/j.petrol.2019.01.055
[32]
张志伟, 张龙海. 测井评价烃源岩的方法及其应用效果[J]. 石油勘探与开发, 2000, 27(3): 84-87.
Zhang Zhiwei, Zhang Longhai. A method of source rock evaluation by well-logging and its application result[J]. Petroleum Exploration and Development, 2000, 27(3): 84-87.
[33]
Passey Q R, Creaney S, Kulla J B, et al. A practical model for organic richness from porosity and resistivity logs[J]. AAPG Bulletin, 1990, 74(12): 1777-1794.
[34]
Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. DOI:10.1023/A:1010933404324
[35]
王民, 杨金路, 王鑫, 等. 基于随机森林算法的泥页岩岩相测井识别[J]. 地球科学, 2023, 48(1): 130-142.
Wang Min, Yang Jinlu, Wang Xin, et al. Identification of shale lithofacies by well logs based on random forest algorithm[J]. Earth Science, 2023, 48(1): 130-142.
[36]
姚登举, 杨静, 詹晓娟. 基于随机森林的特征选择算法[J]. 吉林大学学报(工学版), 2014, 44(1): 137-141.
Yao Dengju, Yang Jing, Zhan Xiaojuan. Feature selection algorithm based on random forest[J]. Journal of Jilin University (Engineering and Technology Edition), 2014, 44(1): 137-141.
[37]
黄莉莎, 闫建平, 郭伟, 等. 基于随机森林回归算法的低电阻率页岩气储层饱和度评价[J]. 测井技术, 2023, 47(1): 22-28.
Huang Lisha, Yan Jianping, Guo Wei, et al. Evaluation of low resistivity shale gas reservoir saturation based on random forest regression method[J]. Well Logging Technology, 2023, 47(1): 22-28.
[38]
韩晟, 韩坚舟, 赵璇, 等. 距离权重改进的Pearson相关系数及应用[J]. 石油地球物理勘探, 2019, 54(6): 1363-1370.
Han Sheng, Han Jianzhou, Zhao Xuan, et al. A pearson correlation coefficient improved by spatial weight[J]. Oil Geophysical Prospecting, 2019, 54(6): 1363-1370.
[39]
卢双舫, 马延伶, 曹瑞成, 等. 优质烃源岩评价标准及其应用: 以海拉尔盆地乌尔逊凹陷为例[J]. 地球科学(中国地质大学学报), 2012, 37(3): 535-544.
Lu Shuangfang, Ma Yanling, Cao Ruicheng, et al. Evaluation criteria of high-quality source rocks and its applications: taking the Wuerxun Sag in Hailaer Basin as an example[J]. Earth Science (Journal of China University of Geosciences), 2012, 37(3): 535-544.