近地表结构特征属性平衡迭代规约和层次聚类分析

引用本文

沈华, 宋炜, 唐传章, 等. 近地表结构特征属性平衡迭代规约和层次聚类分析[J]. 石油物探, 2021, 60(2): 283-294,311. DOI: 10.3969/j.issn.1000-1441.2021.02.009.

SHEN Hua, SONG Wei, TANG Chuanzhang, et al. BIRCH clustering of near-surface structural characteristics[J]. Geophysical Prospecting for Petroleum, 2021, 60(2): 283-294,311. DOI: 10.3969/j.issn.1000-1441.2021.02.009.

基金项目

中国石油天然气股份有限公司科技攻关课题“河套盆地新区新领域勘探潜力与高效勘探关键技术研究”(2019D-0815)和国家科技重大专项“致密气有效储层预测技术”(2016ZX05047002)共同资助

第一作者简介

沈华(1970—), 男, 博士, 教授级高级工程师, 主要从事地震资料采集设计及优化研究与管理工作。Email: ktb_shenhua@petrochina.com.cn

通信作者

宋炜(1966—), 男, 博士, 副教授, 主要从事储层地球物理和地震资料信号处理等领域的教学与科研工作。Email: songwei@cup.edu.cn

文章历史

收稿日期：2020-03-30
改回日期：2020-08-20

Contents Abstract Full text Figures/Tables PDF

近地表结构特征属性平衡迭代规约和层次聚类分析

沈华¹, 宋炜², 唐传章¹, 张锐锋¹, 王泽丹³, 黄新亚¹, 王会来³, 刘慧³

1. 中国石油天然气股份有限公司华北油田分公司勘探事业部, 河北任丘 062550;
2. 中国石油大学(北京)地球物理学院, 北京 102249;
3. 中国石油天然气股份有限公司华北油田分公司勘探开发研究院, 河北任丘 062550

收稿日期：2020-03-30；改回日期：2020-08-20。

基金项目：中国石油天然气股份有限公司科技攻关课题“河套盆地新区新领域勘探潜力与高效勘探关键技术研究”(2019D-0815)和国家科技重大专项“致密气有效储层预测技术”(2016ZX05047002)共同资助。

第一作者简介：沈华(1970—), 男, 博士, 教授级高级工程师, 主要从事地震资料采集设计及优化研究与管理工作。Email: ktb_shenhua@petrochina.com.cn。

通信作者：宋炜(1966—), 男, 博士, 副教授, 主要从事储层地球物理和地震资料信号处理等领域的教学与科研工作。Email: songwei@cup.edu.cn。

摘要：地震反射信号频宽变窄的主要因素是地层吸收衰减, 其中表层吸收衰减尤为严重, 是地震信号分辨率降低的主要因素之一。以华北油田冀中探区近10000km²的三维地震工区为研究目标, 结合微测井资料处理成果, 以雷克子波穿透低、降速带为例, 分析了低、降速带厚度、速度以及Q值等属性参数对地震信号吸收衰减的影响, 构建了基于上述参数的平均衰减因子, 并基于该因子将近地表结构划分为3类, 讨论了不同类别近地表条件对地震信号的能量、频谱特征、分辨率和信噪比的影响。提出了基于机器学习的多属性平衡迭代规约和层次聚类分析方法, 利用低、降速带多个特征属性参数构成特征向量, 对近地表结构特征进行聚类分析, 将华北油田冀中探区近地表结构分成9类, 为野外采集参数的合理选取和观测系统设计提供了依据, 也为后续地震资料处理提供了帮助。

关键词：近地表微测井平均衰减因子聚类分析低降速带机器学习

BIRCH clustering of near-surface structural characteristics

SHEN Hua¹, SONG Wei², TANG Chuanzhang¹, ZHANG Ruifeng¹, WANG Zedan³, HUANG Xinya¹, WANG Huilai³, LIU Hui³

1. Exploration Department of Huabei Oilfield Company, PetroChina, Renqiu 062550, China;
2. School of Geophysics, China University of Petroleum (Beijing), Beijing 102249, China;
3. Exploration and Development Research Institute of Huabei Oilfield Company, PetroChina, Renqiu 062550, China

Foundation item: This research is financially supported by the Science and Technology Research Project of CNPC (Grant No.2019D-0815) and the National Science and Technology Major Project (Grant No. 2016ZX05047002)

Abstract: Previous research results showed that absorption is the major factor narrowing the bandwidth of the reflection signal.Near-surface absorption, in particular, is one of the primary causes of low-resolution in seismic data.In this study, a three-dimensional seismic survey area of nearly 10, 000km² in the Jizhong exploration area of the North China oil field is investigated.By using processed uphole data and taking the Ricker wavelet penetrating the weathering zones as an example, the influence of attributes, such as thickness, velocity, and Q-value, of weathering zones on the absorption and attenuation of the seismic signal is analyzed.An average attenuation factor is constructed, which permits to classify the near-surface structures into several classes.The relationships between near-surface classes and energy, spectral characteristics, resolution, and signal-to-noise ratio of seismic signals are discussed.A balanced iterative reduction and clustering using a hierarchical analysis method is proposed.Using several attributes of the weathering zone, the eigenvector is constructed, based on which the clustering analysis of the near-surface structural characteristics is conducted.According to the proposed method, the near-surface structure of the Jizhong exploration area was divided into nine classes.The results of this study can aid in the selection of appropriate field acquisition parameters and in the design of the observation system.Moreover, they can facilitate the subsequent seismic data processing and interpretation.

Keywords: near-surface uphole survey average attenuation factor clustering analysis weathering zone machine learning

随着油田精细勘探的不断推进, 深层岩性油气藏和复杂潜山油气藏成为油气勘探的重要地质目标, 提高地震资料分辨率、改善目的层成像精度已深入到地震勘探的全过程。决定地震分辨率的关键是有效频带宽度, 而制约有效频带宽度的两个主要因素是反射信号的能量和频宽, 因此, 如何在地震采集和处理过程中保持有效信号的能量和频宽, 是研究的焦点问题之一。

地震波在地下介质中传播时, 波的能量吸收因素主要来自介质粘弹性引起的吸收作用^[1]。在松散的地层或裂隙发育的地层中, 地震波的吸收响应比地震波速响应更为敏感^[2-4]。华北油田冀中探区地表平缓, 但表层结构松散且复杂多变、速度低, 对地震波的吸收、衰减严重, 导致地震资料分辨率低, 尤其在表层结构复杂地区地震资料品质较差, 难以满足复杂构造、深潜山和地层岩性勘探的需求^[5-8]。岩石物理学研究结果表明, 地下介质对地震波的吸收作用与介质固结程度、孔隙度和孔隙充填物关系密切^[9-10]。因此, 固结岩层的吸收规律不能简单地应用于表层未固结低、降速带。在常规地震资料处理中, 地震波的吸收衰减补偿只针对浅、中、深层, 而表层低、降速带介质对地震子波的吸收衰减基本未进行补偿。为了更好地消除复杂近地表因素对采集、处理带来的影响, 需要对近地表结构有清晰的认识, 并获取准确的近地表结构属性参数模型, 如低、降速带厚度、速度、品质因子(Q)等。多年来, 诸多学者在复杂近地表结构特征参数调查^[2-4]、激发条件及观测方式^[5-8]、复杂近地表的吸收衰减因子求取与有效补偿^[11-21]、复杂近地表速度建模及静校正^[22-24]等方面开展了大量的研究, 并取得丰硕的研究成果。华北油田冀中探区表层结构的复杂性、介质不均匀性以及未固结低、降速带严重的吸收衰减, 使得表层地震波的衰减补偿变得十分复杂。

本文针对华北油田实际生产面临的两个问题开展研究。一个是在高吸收衰减区地震资料分辨率和信噪比低, 往往处理后, 再要求施工方补炮, 延误了数据采集的进度。另一个是基于环保的需要和对资料精度的要求, 2018年底华北油田引进自适应非线性扫描激发采集技术, 在冀中探区同口三维工区开展可控震源采集, 由于自适应非线性扫描激发需要在每个激发点先按常规线性扫描激发, 然后根据接收的单炮数据设计自适应激发参数, 导致野外施工进度缓慢, 成本增加, 当时提出了施工前将近地表分类, 再根据近地表类别分别进行常规线性扫描采集, 确定不同类别地表条件下的自适应激发因子, 具体施工时, 按分类结果实施, 但是由于时间仓促, 未能提出较好的分类算法, 主要采用平均衰减因子作为分类依据, 由于分类太粗, 在生产中并不能满足需求。

本文在前人研究的基础上, 利用冀中探区近万平方公里范围内的微测井解释成果, 在构建和分析近地表结构特征属性参数的基础上, 基于机器学习的平衡迭代规约和层次聚类分析(balanced Iterative reducing and clustering using hierarchies, BIRCH)方法^[25-28], 对华北油田冀中探区进行了多属性参数分类划分, 将不同类别勘探区域的表层吸收衰减参数用于采集参数设计优化和地震资料处理, 为深化华北油田冀中探区复杂地质目标的地震勘探提供有效的技术支撑。

1 近地表结构特征属性分析

华北油田冀中探区虽然地表平缓, 但表层结构复杂多变, 特别是人类活动对表层结构的改造, 加剧了表层结构的纵横向变化。从高程数据可以看出, 冀中探区地势总体平坦, 南、北部较高, 中间区域较低, 海拔在-1.7~36.8m, 平均海拔14.24m(图 1)。探区表层结构变化复杂, 低、降速带厚度从几米到四五十米, 横向变化剧烈。地震勘探过程中, 由于表层结构松散、速度比较低, 因而对地震波的吸收、衰减非常严重, 一些表层结构复杂的地区地震资料品质较差, 甚至得不到有效的深层反射信息。受表层和深层条件双重影响, 研究区内已有的一次和二次三维采集的地震资料信噪比低、频带窄, 深层地震波吸收衰减严重, 处理、解释结果达不到实际生产的要求。

图 1 华北油田冀中探区地表高程分布情况

通过微测井数据分析将华北油田冀中探区近地表分为低速层、降速层, 冀中探区低、降速层的厚度(h)不同, 速度横向上也有显著差别(图 2)。

图 2 低、降速层厚度及速度属性 a低速层厚度; b降速层厚度; c低速层速度; d降速层速度

球面扩散是导致反射信号能量降低的主要因素, 吸收是使反射信号频带宽度变窄的主要因素, 其中表层吸收尤为严重, 是降低分辨率的主要因素之一。描述介质吸收性质的有关参数包括吸收系数α和品质因子Q。均匀吸收介质中传播的平面波振幅方程为:

$ A(r, t)=A_{0} \mathrm{e}^{-\alpha r} \omega(t) $

(1)

在吸收介质中, 振幅随传播距离的增大而呈指数减小。其中, r为地震波的传播距离, A₀是初始振幅, A是地震波传播r后的振幅谱, ω(t)是波动函数, α为吸收系数。品质因子是用来度量介质对地震波能量吸收衰减的参量, 地震勘探中常用能量损耗因子来表达:

$ \frac{1}{Q}=\frac{1}{2 \pi} \frac{\Delta E}{E}=\frac{1}{\pi} \ln \frac{A_{0}}{A} $

(2)

其中, 在谐波激励情况下, ΔE表示每震动一个周期的能量损耗量, E表示系统中处于最大应力和应变状态下的瞬时弹性势能, 品质因子Q代表了储能与耗散能量之比, 1/Q表示能量损耗因子, 其值越大说明地层对地震波的吸收衰减作用越剧烈。由对数函数关系表可知, 品质因子是一个正数, Q值越小, 能量损耗越大。图 3是冀中探区低、降速带品质因子属性图, 可见探区内品质因子变化较大。地震波在近地表传播衰减过程可以表示为:

$ W_{N}(f)=W_{0}(f) \mathrm{e}^{-2 \pi f \sum\limits_{i=1}^{N} \frac{H i}{V_{i Q i}}} $

(3)

图 3 冀中探区低、降速带品质因子(Q) a低速层Q值; b降速层Q值

式中: H_i为第i层的厚度; V_i为第i层的速度; Q_i为第i层的Q值; W₀(f)为初始地震波的频谱; W_N(f)为地震波在近地表传播N层后的频谱; f为频率。

基于公式(3), 根据地表速度、Q值和厚度可以模拟地震信号不同频率成分经过地表传播后的相对衰减量。频率越大, 衰减量越大。图 4给出了不同主频的子波能量相对衰减量。由图 4可见, 不同频率成分有不同的衰减量, 特别是高频成分, 在穿透低、降速带时, 衰减更严重。基于公式(3), 对比分析了主频为30Hz的雷克子波经过地表传播后峰值频率和频宽的变化(图 5)。由图 5a和图 5b可见, 衰减越严重的地区, 峰值频率和频宽减小得越多。为了进一步评价子波穿过近地表后能量的变化, 通过对比分析衰减前、后子波峰值振幅比属性(图 5c)和子波总能量比属性(图 5d)来研究地表横向衰减特征的变化。由图 5c和图 5d可以看出, 在高衰减区域, 无论是子波峰值振幅比还是子波总能量比其变化都很明显, 因此低、降速带不仅对地震资料的分辨率有影响, 对信噪比也同样有影响。

图 4 不同主频的子波能量相对衰减量 a主频为10Hz; b主频为20Hz; c主频为30Hz; d主频为40Hz

图 5 30Hz雷克子波穿透低降速带后属性变化情况 a峰值频率; b频带宽度; c子波峰值振幅比; d子波总能量比

为了研究近地表本身属性的影响, 需要将与地震信号有关的物理参数消除。定义:

$ Q_{N A}=\sum\limits_{i} \frac{H_{i}}{V_{i} Q_{i}} $

(4)

式中: Q_NA为N层近地表介质的平均衰减效应因子, 其与近地表地层条件有关, 与频率和地震信号的特征无关。利用华北油田冀中探区的微测井资料计算得到的Q_NA见图 6a; 以Q_NA为基准, 以子波衰减前、后最大振幅比和能量比为参考, 将冀中探区表层条件分为3类(图 6b)和9类(图 6c)。3类表层条件的具体划分阈值细节如下。

图 6 利用华北油田冀中探区的微测井资料计算得到的平均衰减效应因子(a)以及基于衰减因子门槛值的3类(b)和9类(c)分类结果

1) 第1类: Q_NA < 0.01, 该表层表现为轻度衰减。

2) 第2类: 0.01 < Q_NA < 0.023, 该表层表现为中度衰减。

3) 第3类: Q_NA>0.023, 该表层表现为严重衰减。

9类表层条件的具体划分阈值细节这里不赘述。

基于上述分类结果, 分别就不同地表类型对地震信号的分辨率、振幅衰减、频谱特征和信噪比的影响开展讨论。图 7a给出了目的层时间厚度Δt=16ms, 对于不同地表类型, 以主频30Hz雷克子波穿透近地表, 再由目的层顶、底反射回地面, 观测到的反射波对地层的分辨能力。图 7a中蓝色线是第1类近地表条件, 属于低衰减区, 薄层可以分辨; 红色线是第2类近地表条件, 属于中等衰减区, 薄层不可分辨; 绿色线是第3类近地表条件, 属于高衰减区, 薄层不可分辨。图 7b给出了目的层时间厚度Δt=25ms, 对于不同地表类型, 以主频30Hz雷克子波穿透近地表, 再由目的层顶、底反射回地面, 观测到的反射波对地层的分辨能力。图 7b中蓝色线是第1类近地表条件, 属于低衰减区, 薄层可以分辨; 红色线是第2类近地表条件, 属于中等衰减区, 薄层可分辨; 绿色线是第3类近地表条件, 属于高衰减区, 薄层不可分辨。由图 7可见, 在地震资料的采集处理过程中需要考虑地表的影响。图 8展示的是主频30Hz雷克子波穿过不同类型的地表后子波波形和频谱变化规律。由图 8可见, 第3类区域子波振幅衰减严重(图 8a中绿色子波); 第1、2、3类区域子波频谱主频向低频方向移动, 频带变窄(图 8b)。

图 7 不同地表类型对不同目的层厚度的分辨率影响(雷克子波主频30Hz) a目的层时间厚度Δt=16ms; b目的层时间厚度Δt=25ms

图 8 主频30Hz雷克子波穿过不同类型的地表后子波波形(a)及频谱(b)变化规律

地震信号的信噪比和地表条件密切相关。在相同噪声水平下, 由于地表条件不同, 有效信号的衰减量不同, 因此反射地震数据信噪比也不同。如图 9所示, 含噪声主频30Hz雷克子波穿过第1类轻度或无衰减区域后信噪比最高(信噪比为3.20), 第2类次之(信噪比为0.90), 第3类由于信号衰减严重, 信噪比较低(信噪比为0.06), 有效信号几乎淹没在噪声中。尽管上述分类方式具有一定的指导意义, 但是这种分类方式要根据具体的地质情况确定分类门槛, 而且门槛的设定对分类结果影响较大, 将复杂地表结构简单地分成3类, 在生产实践中难以起到指导作用, 因此需要新的分类划分方法。

图 9 不同地表条件对反射地震数据信噪比的影响

2 平衡迭代规约和层次聚类方法原理 2.1 BIRCH算法核心思想

BIRCH算法是由ZHANG等^[28]提出的对大规模数据集进行聚类分析的一种非常有效的基于距离的层次聚类算法。该算法首先采用自底向上的层次聚类算法, 然后再通过迭代重定位来改进聚类结果。BIRCH算法利用聚类特征树(clustering feature tree, CF Tree)来实现快速聚类。特征树的节点由多个聚类特征(clustering feature, CF)组成。CF是一个由(N, L_S, S_S)来表示的三元组, 其中, N代表CF中拥有的样本点的数量; L_S代表CF中样本点各特征维度的和; S_S代表CF中样本点各特征维度的平方和。例如, 在CF Tree某个节点的某个CF中, 有5个样本(1, 3), (3, 5), (2, 4), (4, 6), (5, 7), 则其三元组参数N=5, L_S=(1+3+2+4+5, 3+5+4+6+7)=(15, 25), S_S=(1²+3²+2²+4²+5²+3²+5²+4²+6²+7²)=190。CF满足线性运算, 如CF₁+CF₂=(N₁+N₂, L_S₁+L_S₂, S_S₁+S_S₂)。在CF Tree上, 对于每个父节点中的CF节点, 它的(N, L_S, S_S)三元组的值等于这个CF节点所指向的所有子节点的三元组之和。CF Tree的重要参数有: ①每个内部节点的最大CF数B; ②每个叶子节点的最大CF数L; ③叶子节点每个CF的最大样本半径阈值T, 即在CF中所有样本点一定要在半径小于T的超球体内。

2.2 聚类特征树的生成

在聚类开始时, CF Tree是空的, 首先从训练集读入第1个样本点, 将它放入新的CF三元组A, 该三元组的参数N=1, 将新的CF作为根节点, 此时的CF Tree如图 10a所示。继续读入第2个样本点, 如果该样本点和第1个样本点A在半径为T的超球体范围内, 则属于同一个CF, 将该点也加入CF A, 此时A的三元组参数N=2, CF Tree如图 10b所示。继续读入第3个样本点, 如果不能融入前面的节点形成的半径为T的超球体内, 则需要新的CF三元组B来容纳这个新值。此时根节点就由两个CF三元组A和B组成, CF Tree如图 10c所示。读入第4个样本点时, 如果它和B在半径小于T的超球体内, 则更新后的CF Tree如图 10d所示。

图 10 聚类特征树生成示意 a读入第1个样本点后的CF Tree; b读入第2个样本点后的CF Tree; c读入第3个样本点后的CF Tree; d读入第4个样本点后的CF Tree

当叶子节点的最大CF数L=3时, 随着样本点的不断读入, CF Tree的节点需要分裂, 假设分裂前的CF Tree如图 11a所示, 叶子节点L_N₁有3个CF, L_N₂和L_N₃各有两个CF。当新的样本点读入时, 可发现它离L_N₁节点最近, 因此需要判断它是否在sc1, sc2, sc3这3个CF对应的超球体之内, 如果不在, 则要建立一个新的CF, 即sc8来容纳它。如果设定叶子节点的最大CF数L=3, 即L_N₁的CF个数已经达到最大值, 不能再创建新的CF, 就需要将L_N₁叶子节点分裂为二, 并从L_N₁所有CF元组中, 找到两个最远的CF作为这两个新叶子节点的种子CF, 然后将L_N₁节点里所有CF(sc1, sc2, sc3), 以及新样本点的新元组sc8划分到两个新的叶子节点上。L_N₁节点分裂后的CF Tree如图 11b所示, 如果设定内部节点的最大CF数B=3, 则此时叶子节点一分为二会导致根节点的最大CF数超出范围, 因此根节点也要分裂, 分裂的方法和叶子节点分裂一样, 分裂后的CF Tree如图 11c所示。当所有的训练集样本建立了CF Tree, 一个基本的BIRCH算法就完成了, 对应的输出就是若干个CF节点, 每个节点里的样本点就是一个聚类的簇。因此BIRCH算法的主要过程就是建立CF Tree的过程。

图 11 CF Tree节点分裂示意 a节点分裂前的CF Tree; b L_N₁节点分裂后的CF Tree; c根节点分裂后的CF Tree

BIRCH算法的主要优点有: ①节约内存, 所有的样本都保存在磁盘上, CF Tree只保存了CF节点所对应的指针, 聚类特征树概括了聚类的有用信息, 并且占用空间较元数据集合小得多, 可以存放在内存中, 从而可以提高算法在大型数据集合上的聚类速度及可伸缩性; ②只需要扫描训练集一次就可以建立CF Tree, 且CF Tree的增、删、改都很快速, 因此聚类速度快; ③可以识别噪声点, 还可以对数据集进行初步分类的预处理。BIRCH算法的主要缺点有: ①由于CF Tree对每个节点的CF个数有限制, 导致聚类结果可能和真实的类别分布不同; ②对高维特征数据聚类效果不好, 比如样本数据维度超过20, 此时可以选择Mini Batch K-Means。

图 12a为随机生成的样本数据, 共1000个样本, 每个样本2个特征, 共4个簇; 图 12b是不指定聚类类别数得到的聚类结果, 共分为8个类簇; 图 12c是指定类别数为4时得到的聚类结果。由图 12b和图 12c可见, 如果对数据的类别属性有所了解, 指定类别数可获得更好的聚类结果。图 13显示的是由两组1500个点构成的随机样本, 一组是两个圈形数据, 另一组是两个月牙形数据, 分别采用K-means和BIRCH算法进行聚类得到的结果。对比聚类结果可以看出, 传统K-means聚类方法主要依据样本点的距离关系进行聚类, 因此聚类结果和真实数据分布不一致, 如图 13a和图 13c将圈形和两个月牙形的样本簇按距离远近进行聚类, 得出了错误的聚类结果。而本文所述的BIRCH算法则是一种基于距离的层次聚类算法, 根据其树形结构的特征层次聚类思想, 得到如图 13b和图 13d的正确聚类结果。而本文所涉及的问题, 即近地表类别的变化类似于图 13所示的样本点分布, 需要基于多属性的层次关系, 寻找到正确的聚类结果, 因此最终选用了BIRCH算法。当然, 在机器学习领域, 还有很多聚类算法, 比如DBSCAN、凝聚层次聚类、谱聚类等都可以取得和BIRCH方法类似的效果, 因为本文的重点不是分析算法的差异, 因此不作详细对比分析。

图 12 随机样本不同参数BIRCH聚类结果 a随机生成的样本数据散点; b不指定聚类类别数得到的聚类结果; c指定类别数为4时得到的聚类结果

图 13 两组随机样本分别采用K-means和BIRCH聚类方法得到的结果 a圈形数据采用K-means方法得到的聚类结果; b圈形数据采用BIRCH方法得到的聚类结果; c月牙形数据采用K-means方法得到的聚类结果; d月牙形数据采用BIRCH方法得到的聚类结果

3 应用效果分析

本文以华北油田冀中探区近10000km²范围内的微测井处理解释成果资料为基础, 用于多属性聚类分析的向量由以下属性构成: 近地表高程, 低、降速带速度、厚度、Q值, 不同主频率(10Hz, 20Hz, 30Hz, 40Hz)的雷克子波能量相对衰减量, 主频30Hz雷克子波峰值振幅比属性、总能量比、峰值频率属性、频带宽度属性, 平均衰减因子属性。

BIRCH多维向量层次聚类假设特征数据为正态分布(即满足零均值且单位方差呈高斯分布), 需要对输入多属性向量数据进行标准化, 使其满足正态分布。算法实现中, 以Scikit-Learn的开源数学库为基础, 选择其中的Preprocessing.StandardScalar函数实现输入数据标准化^[25]。按上述方法, 完成了研究区近10000km²的无监督BIRCH聚类分析研究。

图 14给出了基于BIRCH多维向量层次聚类方法得到的近地表结构分类结果。图 14中将冀中探区分为9类, 与图 6b的分类结果相比, 将近地表结构的差异划分得更加细致, 图 14中划分的1、2、3类相当于图 6b中的第3类, 对应吸收衰减比较严重的区域; 4、5、6类相当于图 6b中的第2类, 对应吸收衰减中等区域; 而7、8、9类相当于图 6b中的第1类, 对应吸收衰减相对较弱的区域。对比图 14和图 6c可见, 尽管图 6c也通过门槛值将平均衰减因子属性划分成了9类, 但是分类细节还是不如多属性参数BIRCH聚类分析方法。由此可见, 两种分类方法有一定相关性, 但是BIRCH聚类分析方法无需人为设定任何门槛值, 更易于实现, 且分类更精细。例如图 14中左下角红色区域和右上角橙色区域, 按图 6采用的分类方法都归为第3类, 实际上从图 2的低、降速带厚度、速度和图 3中的Q值分布来看, 这两个区域还是有明显差异的。

图 14 基于BIRCH多维向量层次聚类方法得到的近地表结构分类结果

沿图 14中测线AA′和BB′进行吸收衰减试验来验证近地表结构对子波能量、分辨率和信噪比的影响。图 14中的a₁, b₁分别表示主频为30Hz的雷克子波穿透测线AA′和BB′所在位置的低、降速带层, 经吸收衰减后波形特征的变化, 可以明显看到, 不同类别地层对子波波形的改变。图 14中的a₂, b₂分别表示主频为30Hz的雷克子波穿透测线AA′和BB′所在位置的低、降速带层, 然后透过一个厚度为Δt=20ms的地层反射回来后的子波, 可见低衰减区域分辨率明显高于高衰减区域。图 14中的a₃, b₃分别表示主频为30Hz叠加随机噪声的雷克子波在相同信噪比情况下穿透测线AA′和BB′所在位置的低、降速带层, 经吸收衰减后的子波。可以明显看到, 低、降速带对地震资料信噪比的影响。

在实际应用中, 通常要考虑不同类别的近地表结构下激发条件对地震资料品质的影响。冀中探区的三维地震资料采集以井炮为主, 图 15给出了图 14中C点所在位置采用BIRCH聚类方法得到的1类区域不同激发深度的单炮记录, 由图 15可见, 激发深度对单炮质量的影响明显。图 16给出了图 14中D点所在位置采用BIRCH聚类方法得到的1类区域不同药量激发的单炮记录。由图 16可见, 同样在高速顶以下15m激发, 采用的炸药量不同, 单炮记录品质明显不同。小药量激发的单炮记录高频低能, 大药量激发的单炮记录低频高能, 随着药量的增加, 单炮记录质量提高。由图 16h可见, 继续增大药量, 单炮记录的质量提高有限, 但生产成本却明显提高, 因此在采用BIRCH聚类方法得到的1类区域, 激发药量达到8~9kg即可满足生产要求。

图 15 基于BIRCH多维向量层次聚类方法得到的1类区域不同激发深度的单炮记录(激发药量为8kg) a高速顶以上激发; b高速顶以下5m激发; c高速顶以下15m激发

图 16 基于BIRCH多维向量层次聚类方法得到的1类区域相同激发深度(15m)下不同药量的单炮记录 a药量为1kg; b药量为2kg; c药量为3kg; d药量为4kg; e药量为5kg; f药量为6kg; g药量为7kg; h药量为9kg; i药量为10kg; j药量为12kg

另外, 在观测系统设计时, 可采用如图 14所示的分类结果进行分区设计, 如BIRCH聚类分析的1类区域, 属于强吸收衰减区域, 可采用加密炮增加覆盖次数提高信噪比。

本文方法采用多种属性参数构成的向量作为输入进行空间聚类分析, 可有效克服基于平均衰减因子的单属性划分近地表特征的缺点, 提高分类划分的精度。当然, 输入参数的多少也值得关注。图 17a是采用12个属性参数(去掉低、降速层的速度和厚度属性)进行BIRCH聚类分析得到的近地表结构平面分布图。从图 17a可见, 分类结果大体趋势上和图 14一致, 但是缺少细节信息。图 17b是采用8个属性参数(去掉了低、降速层的Q值属性)进行BIRCH聚类分析得到的近地表结构平面分布图。从图 17b可见, 分类结果大体趋势和图 14一致, 但更加平滑。可见, 如果用来聚类的属性相关度不是太大, 保留多属性聚类分析, 可以更加精细地描述表层特征的变化。

图 17 基于BIRCH多维向量层次聚类方法得到的近地表结构平面分布 a 12个属性进行聚类分析; b 8个属性进行聚类分析

4 结论

近地表参数的变化, 对地震资料的信噪比、分辨率有直接影响, 因此无论是资料采集还是处理, 确定目标区近地表结构类别, 并合理利用, 是提高采集资料品质和处理质量的关键环节。本文引入无监督机器学习的BIRCH多属性向量层次聚类方法划分近地表结构类型, 可以有效克服基于平均衰减因子属性分类划分的缺点, 提高近地表结构分类划分精度和可靠性, 理论模型和实际资料分析结果证明了本文方法的有效性, 并得出以下结论:

1) 平均衰减因子属性可以作为近地表结构划分的参考性属性, 但是由于门槛值很难把握, 因此在实际应用中并不是好的分类依据;

2) 基于无监督机器学习的BIRCH多属性向量层次聚类分析方法, 可以很好地利用近地表多属性参数向量实现近地表结构的分类划分, 为观测系统设计和地震资料激发、接收和处理提供帮助;

3) 通过对华北油田冀中探区近地表结构的分类划分及其对地震资料信噪比和分辨率的影响因素分析, 认为基于近地表多属性参数聚类分析结果优化地震资料采集和处理参数是可行的, 为地震资料采集和处理参数优化提供了新依据。

参考文献

[1]	FUTTERMAN W I. Dispersive body waves[J]. Journal of Geophysical Research, 1962, 67(13): 5279-5291. DOI:10.1029/JZ067i013p05279
[2]	郑鸿明, 吕焕通, 娄兵, 等. 地震勘探近地表异常校正[M]. 北京: 石油工业出版社, 2009: 1-22. ZHEN H M, LV H T, LOU B, et al. Near-surface anomaly correction for seismic exploration[M]. Beijing: Petroleum Industry Press, 2009: 1-22.
[3]	沈鸿雁, 王鑫, 李欣欣. 近地表结构调查及参数反演综述[J]. 石油物探, 2019, 58(4): 471-485. SHEN H Y, WANG X, LI X X. Near-surface structure survey and parameter inversion review[J]. Geophysical Prospecting for Petroleum, 2019, 58(4): 471-485. DOI:10.3969/j.issn.1000-1441.2019.04.001
[4]	刘伊克, 常旭, 王辉, 等. 三维复杂地形近地表速度估算及地震层析静校正[J]. 地球物理学报, 2001, 44(2): 272-278. LIU Y K, CHANG X, WANG H, et al. Estimation of near-surface velocity and seismic tomographic static corrections[J]. Chinese Journal of Geophysics, 2001, 44(2): 272-278. DOI:10.3321/j.issn:0001-5733.2001.02.015
[5]	李桂林, 陶宗普, 陈春强. 陆上高分辨率地震勘探炸药震源激发条件分析[J]. 石油物探, 2005, 44(2): 183-186. LI G L, TAO Z P, CHEN C Q. Explosive energization condition analysis of high-resolution seismic exploration offshore[J]. Geophysical Prospecting for Petroleum, 2005, 44(2): 183-186. DOI:10.3969/j.issn.1000-1441.2005.02.022
[6]	曹务祥. 疏松地表对震源信号的影响与施工方法的改进[J]. 石油物探, 2007, 46(2): 170-173. CAO W X. Impact of loose surface on vibrator signal and the improvement in field operation[J]. Geophysical Prospecting for Petroleum, 2007, 46(2): 170-173. DOI:10.3969/j.issn.1000-1441.2007.02.014
[7]	张付生, 贾烈明, 王莉. 陆上地震激发因素的选择方法探讨[J]. 石油物探, 2004, 43(2): 149-152. ZHANG F S, JIA L M, WANG L. Study on selection of shooting parameters for land seismic data acquisition[J]. Geophysical Prospecting for Petroleum, 2004, 43(2): 149-152. DOI:10.3969/j.issn.1000-1441.2004.02.012
[8]	刘成斋, 刘传鹏, 张世鑫. 合肥盆地近地表结构调查和地震激发方式选择[J]. 石油物探, 2008, 47(6): 604-608. LIU C Z, LIU C P, ZHANG S X. Investigation on surface geologic structure and selection of seismic shooting mode at Hefei basin[J]. Geophysical Prospecting for Petroleum, 2008, 47(6): 604-608. DOI:10.3969/j.issn.1000-1441.2008.06.011
[9]	WINKLER K W, NUR A. Seismic attenuation: Effects of pore fluids and frictional sliding[J]. Geophysics, 1982, 47(1): 1-15. DOI:10.1190/1.1441276
[10]	TOKSOZ M N, JOHNSTON D H, TIMUR A. Attenuation of seismic waves in dry and saturated rocks: I.Laboratory measurements[J]. Geophysics, 1979, 44(4): 681-690. DOI:10.1190/1.1440969
[11]	陈志德, 王成, 刘国友, 等. 近地表Q值模型建立方法及其地震叠前补偿应用[J]. 石油学报, 2015, 36(2): 188-196. CHEN Z D, WANG C, LIU G Y, et al. Modeling method of near-surface Q value and its seismic pre-stack compensation application[J]. Acta Petrolel Sinica, 2015, 36(2): 188-196.
[12]	赵秋芳, 云美厚, 朱丽波, 等. 近地表Q值测试方法研究进展与展望[J]. 石油地球物理勘探, 2019, 54(6): 1397-1418. ZHAO Q F, YUN M H, ZHU L B, et al. Progress and outlook of near-surface quality factor Q measurement and inversion[J]. Oil Geophysical Prospecting, 2019, 54(6): 1397-1418.
[13]	李桂花, 朱光明. 利用三分量微测井技术调查表层纵、横波速度[J]. 石油地球物理勘探, 2006, 41(2): 160-165. LI G H, ZHU G M. Using 3-C uphole survey techniqueto survey P-wave and S-wave velocity on surface[J]. Oil Geophysical Prospecting, 2006, 41(2): 160-165. DOI:10.3321/j.issn:1000-7210.2006.02.009
[14]	徐峰, 尹成, 李忠, 等. 井中激发地表接收的近地表结构调查方法[J]. 石油物探, 2009, 48(3): 294-298. XU F, YIN C, LI Z, et al. Investigation method for nearsurface structure with shot in hole and receive at surface[J]. Geophysical Prospecting for Petroleum, 2009, 48(3): 294-298.
[15]	李合群, 孟小红, 赵波, 等. 塔里木沙漠区地震数据品质与沙层Q吸收[J]. 石油地球物理勘探, 2010, 45(1): 28-34. LI H Q, MENG X H, ZHAO B, et al. Seismic data quality and sand layer Q absorption in Tarim desert area[J]. Oil Geophysical Prospecting, 2010, 45(1): 28-34.
[16]	张文, 周志才, 于承业. 一种改进的近地表强吸收补偿方法研究[J]. 石油物探, 2017, 56(2): 210-215. ZHANG W, ZHOU Z C, YU C Y. An improved compensation method for near surface strong absorption[J]. Geophysical Prospecting for Petroleum, 2017, 56(2): 210-215. DOI:10.3969/j.issn.1000-1441.2017.02.007
[17]	宋吉杰, 禹金营, 王成, 等. 近地表介质Q估计及其在塔河北部油田的应用[J]. 石油物探, 2018, 57(3): 436-442. SONG J J, YU J Y, WANG C, et al. Q estimation for near-surface media and its application in the Northern Tahe Oilfield, China[J]. Geophysical Prospecting for Petroleum, 2018, 57(3): 436-442. DOI:10.3969/j.issn.1000-1441.2018.03.013
[18]	丁冠东, 张小明, 陈浩林, 等. 激发深度和检波器耦合对近地表Q值估算的影响分析[J]. 石油物探, 2018, 57(5): 678-684. DING G D, ZHANG X M, CHEN H L, et al. Affects of excitation depth and geophone coupling on near-surface Q value estimation[J]. Geophysical Prospecting for Petroleum, 2018, 57(5): 678-684. DOI:10.3969/j.issn.1000-1441.2018.05.006
[19]	于承业, 周志才. 利用双井微测井资料估算近地表Q值[J]. 石油地球物理勘探, 2011, 46(1): 89-92. YU C Y, ZHOU Z C. Estrimation of near surface Q value based on the datasets of the uphole survey in double hole[J]. Oil Geophysical Prospecting, 2011, 46(1): 89-92.
[20]	翟桐立, 马雄, 彭雪梅, 等. 基于井地一体化测量的近地表品质因子Q值估算与应用[J]. 石油物探, 2018, 57(5): 685-690. ZHAI T L, MA X, PENG X M, et al. Near-surface Q factor measurement by combining surface and crosshole seismic surveys[J]. Geophysical Prospecting for Petroleum, 2018, 57(5): 685-690. DOI:10.3969/j.issn.1000-1441.2018.05.007
[21]	SONG W. Fast matching pursuit decomposition based near-surface seismic-logging data Q estimate with shaping regularization[J]. Expanded Abstracts of 86^th Annual Internat SEG Mtg, 2016, 2334-2338.
[22]	崔栋, 张研, 胡英, 等. 近地表速度建模方法综述[J]. 地球物理学进展, 2014, 29(6): 2635-2641. CUI D, ZHANG Y, HU Y, et al. The review of near surface velocity modeling[J]. Progress in Geophysics, 2014, 29(6): 2635-2641.
[23]	金昌昆, 王延光, 尚新民, 等. 微测井与方位加权插值精细近地表速度建模技术[J]. 石油地球物理勘探, 2020, 55(2): 257-265. JIN C K, WANG Y G, SHANG X M, et al. Near-surface velocity modeling based on micro-log and azimuth-weighted interpolation[J]. Oil Geophysical Prospecting, 2020, 55(2): 257-265.
[24]	王孝, 曾华会, 刘文卿, 等. 基于微测井分步约束的近地表速度层析反演[J]. 石油地球物理勘探, 2018, 53(S1): 69-74. WANG X, ZENG H H, LIU W Q, et al. Near-surface velocity tomographic inversion with a joint stepped-constraint of uphole and firstbreak information[J]. Oil Geophysical Prospecting, 2018, 53(S1): 69-74.
[25]	HALL B. Facies classification using machine learning[J]. The Leading Edge, 2016, 36(10): 906-909.
[26]	徐海, 都小芳, 高君, 等. 基于波形聚类的沉积微相定量解释技术研究[J]. 石油物探, 2018, 57(5): 744-755. XU H, DU X F, GAO J, et al. Quantitative interpretation of sedimentary microfaacies based on waveform clustering: A case study of X oilfield, Middle East[J]. Geophysical Prospecting for Petroleum, 2018, 57(5): 744-755. DOI:10.3969/j.issn.1000-1441.2018.05.014
[27]	魏艳, 尹成, 丁峰, 等. 地震多属性综合分析的应用研究[J]. 石油物探, 2007, 46(1): 42-47. WEI Y, YIN C, DING F, et al. Synthetic analysis of seismic multi-attribute and its application[J]. Geophysical Prospecting for Petroleum, 2007, 46(1): 42-47.
[28]	ZHANG T, RAMAKRISHNAN R, LIVNY M. BIRCH: An efficient data clustering method for very large databases[J]. Expanded Abstracts of 1996 ACM SIGMOD International Conference on Management of Data, 1996, 103-114.