地球物理学报  2020, Vol. 63 Issue (2): 687-714   PDF    
基于卷积神经网络的地震偏移剖面中散射体的定位和成像
奚先1, 黄江清2     
1. 中国地质大学(武汉)数学与物理学院, 武汉 430074;
2. 中国地质大学(武汉), 武汉 430074
摘要:本文提出了一种基于深度学习卷积神经网络(CNN)的全波形反演方法,可对地震散射波场中的散射体进行成像和定位.本文的灵感来自如下猜想:在散射波场剖面上的每个点附近的局部波场与该点到各散射体之间的最小距离有关系,并且这个关系可以被CNN网络所识别.我们将该最小距离定义为散射距离场,并将散射距离场的类别(即大小等级)作为CNN网络的预期输出,而输入就是该点附近的局部波场.最后用上述CNN网络对散射波场进行逐点训练和识别.计算结果证实了我们的灵感猜想,即上述CNN网络能够在复杂散射波场中对散射体进行成像.只通过一个训练模型的学习,CNN网络即可反演多种散射模型的偏移剖面,最后得到"类别函数预测值"和"滤波剖面"两种成像结果,由此可以辨识出在复杂的偏移剖面中各散射体的位置.
关键词: 散射波场反演成像      卷积神经网络      散射距离场      类别函数     
Location and imaging of scatterers in seismic migration profiles based on convolution neural network
XI Xian1, HUANG JiangQing2     
1. China University of Geosciences(Wuhan), School of Mathematics and Physics, Wuhan 430074, China;
2. China University of Geosciences(Wuhan), Wuhan 430074, China
Abstract: In this paper, a full waveform inversion method based on deep learning Convolution Neural Network (CNN) is proposed, which can image and locate scatterers in the seismic scattered wave field. The inspiration of this paper comes from the following conjecture:the local wave field near each point in a scattered wave field profile is related to the minimum distance between the point and every scatterer, and this relationship can be identified by CNN network. We define the minimum distance as the scattering distance field, and take the category of the scattering distance field (i.e. the size level) as the expected output of the CNN network, with input as the local wave field near the point. Finally, the scattered wave field is trained and identified point by point using the above CNN network. The calculation results confirm our speculation that the above CNN network can image scatterers in complex scattering wave fields. By learning only one training model, the migration profiles of various scattering models can be inverted by CNN network. Finally, two imaging results of "category function prediction value" and "filter profile" care obtained. Thus, the positions of scatterers in complex migration profiles can be identified.
Keywords: Scattered wave field inversion imaging    Convolution Neural Network (CNN)    Scattering distance field    Category function    
0 引言

散射地震波场的全波形反演理论和方法是地球物理领域的研究热点之一,具有广泛的实用价值.实际的地质勘探问题,如溶洞型油气藏勘探、金属矿勘探、岩性复杂区工程勘察等等,不同尺度的非均匀地质体共生,会引起各种反射波、绕射波及其对应的多次波、转换波等的相互叠加、干涉,可形成极为复杂的地震波场.对于复杂地震散射波场,理论上需要非线性优化算法来解决其反演问题.在传统的地震波逆散射成像理论或反演中广泛采用Born或Rytov近似(Mora, 1987; Stolt et al., 1985).前人(李武群等,2017尹军杰等,2005)应用声波或弹性波的逆散射理论大量进行了各种非均匀介质参数的反演.研究表明利用逆散射理论可以有效去除地震数据中的多次散射波(Weglein et al., 1997).在石油勘探领域,偏移成像和反演的一个重要发展方向是全波场偏移及全波形反演(FWI).Alkhalifah(2015)研究了基于散射角的波形反演梯度滤波方法,可改进FWI的效果;Innanen(2014)研究了地震AVO信息和逆Hessian算子在FWI中的应用;Li等(2018)建立了一种角域GRT(广义Radon变换)真振幅反演框架,与传统方法相比可以获得更好的效果;Persico等(2018)研究运用增强逆散射策略改进对探地雷达(GPR)数据的解释.

深度学习的概念最早由多伦多大学的Hinton等(2006)提出,并由此拉开了深度学习的序幕.最近,由Google开发的人工智能围棋程序AlphaGo(Silver et al., 2016)使用蒙特卡洛树搜索结合深度神经网络的方式进行围棋决策,引起了广泛的关注.卷积神经网络(CNN)作为深度学习领域的一个重要分支,因其权值共享的网络结构十分类似于生物神经网络,大大降低了网络模型的复杂度.使用CNN网络无需对图像进行复杂的前期预处理,只要直接将原始图像输入网络,就可以像使用一个黑盒子那样使用它.因为使用CNN网络可以避免专业、复杂而困难的特征提取、模型构建和数据重建等过程,所以成为了众多科学领域的应用热点(段艳廷等,2019杨柳青等,2019; 王文强等,2019).CNN网络早已经非常成功地应用于手写字符识别(Lecun et al., 1998)、行人检测(Sermanet et al., 2013)、图像处理(Martínez-Alvarez et al., 2015)、语音识别(Abdel-Hamid et al., 2014)等领域.大量成功的实际应用证明CNN网络在大量复杂对象的全自动特征提取和分类识别上有着超越传统方法的巨大优势和无限的发展潜力(Esser et al., 2016).

目前在地球物理各领域,使用CNN网络反演各种传统问题的研究也有很多,如地震油气储层的预测(林年添等,2018)、微震监测的自动探测和定位(Zhang et al., 2018)、识别表面波(Liu et al., 2018)、对地震数据中随机噪声的衰减(Si et al., 2018)、近地表速度结构特征化(Li et al., 2018)、自动识别微震波形(Lin et al., 2018)等等.而使用其他类型的各种人工神经网络反演各种传统问题的研究也是层出不穷. Ansari(2014)基于多种人工智能系统预测岩石孔隙度;Xie等(2013)根据探地雷达图像自动识别钢筋混凝土结构中的空洞;Maurya和Singh(2018)利用概率神经网络技术预测井间区域的孔隙度;Kumar和Sain(2018)用人工神经网络增强从地震数据解释不连续性地质结构的效果;Shirmohamadi等(2017)利用概率神经网络模型绘制孔隙类型图;Yıldırım等(2017)使用人工神经网络得到,由地震资料快速估计出土壤衰减Q值的实用方法;Moon等(2016)研究了神经网络多属性变换在使用三维地震和测井数据预测有效孔隙中的作用;Ohl和Raef(2014)利用人工神经网络实现岩石物理相分类;Kilic和Eren(2018)采用的神经网络模型,从探地雷达数据中识别出不完全灌浆、岩溶导管和空隙的存在等问题;Mollajan等(2018)提出了一种基于帝国竞争算法优化的人工神经网络的非线性岩石物理反演方法;Anemangely等(2018)采用多层感知器(MLP)神经网络与粒子群优化(PSO)算法相结合的混合模型,实现了对垂直油气井的钻速(ROP)的高精度预测.机器学习在其他领域的快速发展,也促进了该方法在地球物理相关领域的研究与应用(Cersósimo et al., 2016Ouadfeul and Aliouane, 2016Nwachukwu et al., 2018).人们从监督学习和无监督学习(Lee et al., 2017)角度出发,以各类神经网络算法对油气特征进行分类,获得了良好的应用效果(Cudjoe et al., 2016; Ebrahimi and Khamehchi, 2016; Ail Sebtosheikh and Salehi, 2015付超等,2018张繁昌等,2014).

本文主要研究散射体尺寸均小于地震波长的“弱散射”情形.奚先和黄江清(2018)首次提出了一种对地震波场中的散射体进行深度学习识别成像的新方法,并针对最简单的均匀背景中的随机溶洞介质模型,用卷积神经网络实现了对散射波场的反演成像.本文进一步对一般的层状随机溶洞介质模型所对应的复杂散射波场进行反演成像.期望能揭示出我们首次提出的这种波场反演新方法的本质规律,逐步得出一套可直接反演各种复杂散射波场的CNN网络反演框架.我们提出的反演方法可用于各种复杂散射波场的全波形反演.只要少量训练模型就可以完成CNN反演网络的学习训练,然后就可以用训练好的网络快速反演大量其他的地震波场.本文的方法可以让专业解释人员的经验被CNN网络快速、有效的学习把握,从而可大大提高对复杂散射波场解释的效率.

1 CNN网络的结构、散射介质模型的构造及其波场模拟 1.1 使用的卷积神经网络的结构

本文使用Matlab的深度学习工具箱构建了一个5层CNN网络,由此成功实现了复杂散射波场的反演成像.网络的中间层类型为6c-2s-12c-2s.网络由2个卷积层,2个池化层和一个全连接层构成;第一个卷积层有6个模板,尺寸为5×5,第二个卷积层有12个模板,尺寸为5×5,池化选择的是最大值池化方式,尺度为2.本文采用的上述CNN网络命名为NET0,网络输入是28×28的样本矩阵,网络输出是2×1的分类向量,其结构如图 1所示.

图 1 卷积神经网络NET0的网络结构图 Fig. 1 Structure of the convolution neural network NET0

NET0的输入层是一个28×28的局部波场矩阵.卷积层map的大小是由卷积核和上一层输入map的大小决定的,假设上一层的map大小是n、卷积核的大小是k,则该卷积层的map大小是n-k+1,比如图 1的C1层的map大小为24(=28-5+1),卷积层计算是卷积神经网络的核心.NET0的卷积层C1的输入来源于输入层,由6个大小为5×5的卷积核,得到6个24×24特征图.卷积层的每一个map与上层的所有map都关联,卷积层的每一个特征map是不同的卷积核在前一层所有map上作卷积并将对应元素累加后加一个偏置,再求非线性激活函数sigmod得到的.NET0的卷积层C3的输入来源于采样层S2,再由12个大小为5×5的卷积核,得到12个8×8特征图.下采样(池化)层(Subsampling, Down Pooling)是对上一层map的一个采样处理,池化的做法是对图像的某一个区域用一个值代替,如最大值或平均值.如果采用最大值,叫做max池化;如果采用均值,叫做均值池化.一般情况下max池化有更好的效果(Boureau et al., 2010).NET0的池化层的采样方式都是取2×2小区域中的最大值.需要注意的是,卷积的计算窗口是有重叠的(卷积核每次只移动一步),而采样的计算窗口没有重叠的.NET0对所有卷积核权重进行随机初始化,而对偏置进行全零初始化.

1.2 散射介质模型的构建及其弹性波场模拟

用随机介质的建模方法(Ikelle et al., 1993; Ergintav and Canitez, 1997; 奚先和姚姚, 2002; 奚先等, 2005)构造含多个随机起伏界面的多层随机溶洞介质模型.用交错网格有限差分法(Virieux, 1984, 1986; 董良国等,2000侯安宁等,1995奚先和姚姚,2001奚先等,2004)作弹性波模拟;用Cerjan等(1985)的吸收边界条件.Levander(1988)的结果显示,当每一个波长中的网格点数多于10个时,这时的网格色散与网格各向异性均可忽略不计.本文逐炮模拟弹性波的单炮记录,每次得到炮点处的一道自激自收时间记录,最终合成弹性波的自激自收零炮检距波场剖面.最后使用15°有限差分法进行逆时偏移,得到零炮检距波场的垂直分量剖面的时间偏移剖面,简称为“偏移剖面”.

本文将先设计出符合实际且复杂多样的层状溶洞介质模型,再进行弹性波场的正演模拟,最后用CNN网络进行波场反演的研究.因为地下介质中非匀质点的散射波始终位于散射点的正上方且与炮点位置无关,所以在理论上既可从偏移剖面上定位散射点的位置,也可以直接从自激自收剖面上准确定位散射点的位置.计算表明,通过偏移剖面或自激自收波场的垂直分量剖面等,都可用CNN网络进行波场反演,实现对散射体的成像和定位.

2 CNN网络波场反演的原理思路和实现方法

本文的思路源于我们的如下原创猜想:在散射波场剖面上的每个点附近的局部波场与该点到散射体之间的最小距离有关,并且这个关系可以被深度学习的卷积神经网络所识别.我们通过大量的模拟算例已经证实了上述猜想,奚先和黄江清(2018)针对最简单的均匀背景中的随机溶洞介质模型,已用CNN网络实现了对应的散射波场的反演成像.本文将针对一般的层状随机溶洞介质模型所对应的散射波场,进行反演成像研究.

2.1 CNN反演网络的样本输入

假设反演对象是大小为nx(Trace)×nt(ms)的散射波场剖面,将剖面上每个像素点都作为一个成像点,整个剖面就1-1对应nx×nt个输入样本点.我们从波场剖面中,针对每一个成像点提取对应的样本矩阵,它就是CNN反演网络的一个样本输入,具体步骤如下:

(1) 在成像点附近采集“局部波场矩阵”

本文主要研究偏移剖面的反演.所以,选择采样半径kh,在成像点(i, j)附近,1≤inx,1≤jnt,选择矩形框[ik, i+k]×[jh, j+h]作为采样区域,并采样得到大小为[2k+1]×[2h+1]局部波场矩阵.

(2) 采集该成像点对应的“样本矩阵”

先选择样本矩阵的大小s,然后直接将局部波场矩阵重采样成一个s×s的样本矩阵.计算表明,样本矩阵越大,网络的特征描述能力就越强,但训练时间也越长.例如,选择28×28或48×48的样本矩阵,后者每个epoch的训练时间大约是前者的十倍.

2.2 CNN反演网络的样本输出

我们对深度学习反演网络进行训练时,成像点P对应的样本输出,是该成像点对应的“散射距离场类别”.我们下面在空间-时间域上定义散射距离场类别.

假设在介质模型中总共有n个散射体,它们在空间-深度(x-z)域上的中心点分别为:通过时深转换,在空间-时间(x-t)域的波场剖面上,得到n个散射体的中心点的对应点:P1, P2, …, Pn;选择成像半径分别为Rx(x-空间方向)、Ct(t-时间方向),选择成像等级数k(k≥2),我们定义波场剖面上任意成像点P处的归一化散射距离场为

(1)

其中,(x(P)、t(P))表示波场剖面上任意像素点P的坐标.

根据散射距离场的值W(P)的大小,可定义散射距离场类别

(2)

即:将区间[0, 1]等间隔分为k-1个小区间,随着W(P)的值在区间[0, 1)中增加,的值依次取k-1, …, 2, 1;当W(P)≥1时,的值为0.

“散射距离场类别” 简称为“类别函数”.CNN网络对每个样本的期望输出实际是k维分类向量,对应的是第1类成像点——对应输出是(1, 0, …, 0)T对应的是第k类成像点——对应输出是(0, …, 0, 1)T.

2.3 用CNN网络进行波场反演并进一步得到滤波剖面

综上所述,复杂波场的反演成像问题,可转化为用CNN网络对散射波场中全体成像点识别分类的问题.在每个成像点处提取一个样本矩阵作为CNN网络的输入,该成像点对应的类别函数作为CNN网络的期望输出.先用训练模型对CNN网络进行训练,再用训练后的网络对训练模型和测试模型进行反演,网络输出就是CNN网络对成像点P类别的预测值.从反演输出的类别函数的图形中,可以直观观察到网络对散射体的成像结果,并可对散射体定位.

在本文的研究中,选择成像等级数为k=2.这时卷积神经网络的实际输出,可以理解为网络对成像点P的类别判断是“散射点”的预测概率.定义一个起到局部化作用的高斯窗函数为

(3)

我们使用卷积神经网络的输出,对散射波场剖面, nt}进行空间-时间(xt)域上的滤波,按如下方法得到可以强化散射波同时压制其他波的“滤波剖面”:先将散射点的预测概率分布与公式(3)所示的高斯窗函数作卷积,然后再与散射波场剖面相乘,得到的结果就是散射波场剖面按反演网络对散射点的预测概率加权平均的结果,将其简称为“滤波剖面”.地震波场剖面U的“滤波剖面”

(4)

2.4 反演效果的评价标准

为评价反演网络NET0对偏移剖面的反演效果,我们采用如下5个评价指标:

(1) 观察NET0的输出类别函数预测值,与理想输出类别函数图像对比,直观判断NET0能否完成对全部散射体的精确定位.其中类别函数预测值的真实含义是成像点P(i0, j0)为散射点的预测概率,而类别函数是成像点P(i0, j0)为散射点的真实概率.

(2) 将“滤波剖面” 与偏移剖面U对比,直观判断“滤波剖面”强化散射波同时压制其他波的效果,直观判断能否完成对全部散射体的精确定位.

(3) NET0对训练模型及测试模型反演识别准确率,表达式为

(5)

(4) 计算全部m个测试模型反演的平均识别准确率,表达式为

(6)

(5) 计算m个测试模型识别准确率的标准差,表达式为

(7)

由反演网络NET0得到“输出类别函数预测值”和“滤波剖面”两种成像结果,它们对应前两个评价指标, 是相对比较主观的定性评价,应作为主要评判标准;后3个是定量评价指标,对反演的准确性、稳定性等具有重要的对比分析价值.

3 CNN网络的反演算例

在6000 m×1000 m的矩形区域中,构造6个层状随机溶洞介质模型,如图 2所示.其中模型(a1)、(a2)有完全相同的背景速度和界面,溶洞外6层背景介质(从上到下)的纵波速度分别为:VP1= m·s-1;模型(b1)、(b2)是5层的层状随机溶洞介质模型,有不同的随机起伏界面,溶洞外5层介质(从上到下)的纵波速度分别为:;模型(c1)、(c2)也是6层的层状随机溶洞介质模型,且6层介质的背景速度和模型a1相同,但有不同的随机起伏界面.

图 2 6个层状随机溶洞介质模型 将(a1)作为训练模型,将(a2)、(b1)、(b2)、(c1)和(c2)作为5个测试模型. Fig. 2 Six layered random cavern media models Using (a1) as training model and (a2), (b1), (b2), (c1) and (c2) as five testing models.

溶洞中介质速度均为:;取横波速度值为:VS=0.7×VP;四周边界均采用吸收边界.我们选择震源炮间距为dx=20 m,每个自激自收波场记录包含地震道nx=301 Trace,采样间隔dt=1 ms,每道记录长度为nt=550 ms,使用频率f=30 Hz的瑞克子波作为震源函数,模拟得到6个弹性波的自激自收波场记录,其垂直分量的偏移剖面如图 3所示.

图 3 6个偏移剖面 (a1)来自训练模型;(a2)、(b1)、(b2)、(c1)、(c2)来自5个测试模型. Fig. 3 Six migration sections (a1) From the training model; (a2), (b1), (b2), (c1), (c2) From five test models.

选择前文的5层卷积神经网络NET0.根据训练模型(图 2a1)和偏移剖面(图 3a1),训练NET0然后对训练模型(a1)与测试模型(a2、b1、b2、c1、c2)反演成像,具体步骤如下:

(1) 对剖面上的每个成像点P(i0, j0),选择采样半径:Rx=14 Trace、Rt=56 ms;采集得到大小为2Rx×2Rt=28×112的局部波场矩阵,再重采样成为28×28的矩阵作为反演网络NET0的样本输入(注:只要是瑞克子波作为震源函数,都可以选择28×28的样本矩阵.当震源频率变小或变大时,应该相应的缩小或扩大局部波场矩阵的范围).例如,NET0在(图 3a1)标记成像点P0(i0, j0)处的样本输入如图 4所示.

图 4 图 3a1中的标记成像点P0(i0, j0)对应的局部波场,是NET0的一个学习样本的输入 Fig. 4 The local wave field corresponding to the labeled imaging point P0(i0, j0) in Fig. 3a1 is the input of a learning sample of NET0

(2) 选择成像等级数为2,成像半径Cx=5 Trace、Ct=20 ms,按公式(1)、(2)计算偏移剖面(图 3)中全部成像点的类别函数,如图 5所示,作为NET0的对应样本的理想输出.

图 5 偏移剖面(图 3)的“类别函数”,即NET0的理想输出 (a1)对应于训练模型;(a2)、(b1)、(b2)、(c1)、(c2)对应于5个测试模型. Fig. 5 The "category function" of migration profile (Fig. 3) as the ideal output of NET0 (a1) Corresponds to the training model; (a2), (b1), (b2), (c1), (c2) Correspond to five test models.

图 5中白色成像点对应类别函数值为1,黑色成像点对应类别函数值为0,灰色虚线仅表示反射界面大致位置,不影响对应的成像点类别函数值.图 3a1中标记点P0P1P2是散射波场中的3个成像点,对比图 5a1可知,对应的理想类别函数值为:(是散射点),(不是散射点).

用训练模型(a1)训练网络NET0,选取batchsize=5,训练50个epoch后结束;最后用反演网络NET0对训练模型和5个测试模型的偏移剖面(图 3)进行反演成像.NET0反演的类别函数预测值如图 6所示.

图 6 反演网络NET0对偏移剖面(图 3)的反演输出(类别函数预测值) (a1)对应训练模型;(a2)、(b1)、(b2)、(c1)、(c2)对应5个测试模型. Fig. 6 Inversion output of migration profile (Fig. 3) by inversion network NET0 (a1) Corresponds to training model; (a2), (b1), (b2), (c1), (c2) Correspond to five test models.

通过对比反演结果图 6和理想输出图 5可以看出:网络NET0对训练模型的反演效果极佳;对5个测试模型的反演效果相对较差,但也与理想输出都有一定的相关性(特别是浅层溶洞成像较好).计算表明,仅仅通过1个训练模型的学习,CNN网络就自动学会了相关的一次散射波场的部分特征,并可以进行任意散射波场的快速反演.

由理想输出图 5根据公式(3)、(4)求出偏移剖面(图 3)的“滤波剖面”,如图 7所示;同理由反演结果图 6求出的“滤波剖面”如图 8所示.

图 7 由理想输出图 5按公式(3)、(4)得到的“理想滤波剖面”, 可以观察在地震剖面中各种一次散射波的具体形态 (a1)对应训练模型;(a2)、(b1)、(b2)、(c1)、(c2)对应5个测试模型. Fig. 7 The ideal filter profile obtained from ideal output Fig. 5 according to formulas (3) and (4) which can be used to observe the specific forms of various primary scattering waves in seismic profiles (a1) Corresponding to training model; (a2), (b1), (b2), (c1), (c2) Corresponding to five test models.
图 8 由实际输出图 6按公式(3)、(4)得到的“滤波剖面”, 可以和图 7对比,观察NET0的反演效果 (a1)对应训练模型;(a2)、(b1)、(b2)、(c1)、(c2)对应5个测试模型. Fig. 8 Filter profile obtained from actual output Fig. 6 based on Equations (3) and (4), which can be compared with Fig. 7 to observe the inversion effect of NET0 (a1) Corresponding to training model, (a2), (b1), (b2), (c1), (c2) Corresponding to five test models.

通过对比图 7图 8,可以看出反演结果与理想结果之间比较接近.说明仅仅通过一个训练模型的学习,反演网络就具有了一定的强化一次散射波同时压制其他波的能力,可以帮助我们模糊定位散射体.计算表明,滤波剖面可以辅助我们了解反演网络识别出的散射波场剖面上散射波的具体形态,有助于解释人员准确定位散射体.

4 训练CNN网络的迭代次数对反演结果的影响

图 9显示了反演网络NET0的训练的均方误差曲线及对训练模型与测试模型的反演准确率随epoch逐个递增时的上升曲线.

图 9 (a) 训练反演网络NET0的均方误差曲线;(b)对训练模型与测试模型的反演准确率随epoch逐个递增时的变化曲线 Fig. 9 (a) The mean square error curve of the training inversion network NET0; (b) The curves of inversion accuracy of training model and the test models varying with successively increasing epoch

通过图 9可以看出,尽管测试模型b1与训练模型有相同背景速度,而其他4个测试模型与训练模型的背景速度有较大差异,但5个测试模型的反演准确率却没有明显差异.这说明反演网络NET0具有较好的鲁棒性和稳定性.

通过图 9还可以看出,只通过1个epoch的学习,训练模型与测试模型的反演准确率就都达到0.9,通过3个epoch的学习训练模型与测试模型的反演准确率达到第一个峰值,3 epoch训练的NET0的成像结果如图 10图 11所示.

图 10 训练3 epoch的NET0对偏移剖面(图 3)的成像结果(输出的类别函数预测值) (a1)对应训练模型;(a2)、(b1)、(b2)、(c1)、(c2)对应5个测试模型. Fig. 10 Imaging results (output category function prediction value) of migration profiles (Fig. 3) of NET0 trained by 3 epoch (a1) Corresponding to training model; (a2), (b1), (b2), (c1), (c2) Corresponding to five test models.
图 11 由实际输出图 10得到的“滤波剖面”, 可以和图 7图 8对比观察NET0的反演效果 (a1)对应训练模型;(a2), (b1), (b2), (c1), (c2)对应5个测试模型. Fig. 11 Filter profile obtained from the actual output Fig. 10 which can be compared with Fig. 7 and Fig. 8 to observe the inversion effect (a1) Corresponding to training model; (a2), (b1), (b2), (c1), (c2) Corresponding to five test models.

通过认真对比训练50个epoch和训练3个epoch时反演网络的成像效果,我们发现虽然前者对训练模型的成像结果优于后者,但两者对测试模型的反演成像效果却无显著差异.从这两个反演网络的成像效果的相似性,说明反演网络NET0具有较好的稳定性.计算表明上述CNN网络反演方法具有较强的鲁棒性和自适应能力.

5 用CNN网络直接反演“自激自收剖面”

本节中全部CNN网络反演参数的选择与前文完全相同.依然将图 2中的介质模型(a1)作为训练模型,将其他5个模型(a2)、(b1)、(b2)、(c1)、(c2)作为测试模型.与前文唯一的不同是CNN网络的采样和反演剖面换成6个弹性波的自激自收波场的垂直分量记录,如图 12所示.

图 12 6个自激自收波场剖面 (a1)来自训练模型;(a2)、(b1)、(b2)、(c1)、(c2)来自5个测试模型. Fig. 12 Six zero offset profiles (a1) From the training model; (a2), (b1), (b2), (c1) and (c2) from five test models.

对散射波场图 12a1中标记为P0P1P2的任意3个成像点,在黑框矩形区域中采集对应的局部波场,再重采样成为28×28的矩阵作为反演网络NET0的3个样本输入.依然选择图 5所示的类别函数作为NET0的理想输出.用训练模型(a1)训练网络NET0,训练50个epoch后结束;最后用反演网络NET0对训练模型和5个测试模型的自激自收剖面(图 12)进行反演成像.NET0反演的类别函数预测值和由此得到的滤波剖面如图 13所示.

图 13 CNN网络NET0对自激自收剖面(图 12)的反演输出——类别函数预测值及对应的滤波剖面 (a1)对应训练模型;(a2)、(b1)、(b2)、(c1)、(c2)对应5个测试模型. Fig. 13 CNN network NET0's inversion output (predicted value of category function) for zro offset profiles (Fig. 12) and corresponding filtering profiles (a1) Corresponding to training model; (a2), (b1), (b2), (c1), (c2) Corresponding to five test models.

通过对比图 13图 5图 6图 12,可以看出用CNN网络直接反演“自激自收剖面”的成像效果不亚于对“偏移剖面”的反演.对训练模型的反演结果完美,对测试模型的反演结果与理想结果之间也比较接近.说明仅仅通过一个训练模型的学习,反演网络就具有了一定的强化一次散射波同时压制其他波的能力,可以帮助我们直观地模糊定位散射体.显然滤波剖面具有强化一次散射波同时压制其他波的效果,可以辅助我们了解反演网络识别出的散射波场剖面上散射波的具体形态,有助于解释人员进一步准确定位散射体.值得指出的是为了方便,本算例没有改变“局部波场矩阵”和样本矩阵的大小,可以看出即使在“波场散射点”附近,“局部波场矩阵”中只能采集到一点点散射波的头部.然而大量计算的结果表明,CNN网络竟依然能够根据“样本矩阵”中的信息,稳健地识别出该样本点和各散射体的相对距离,实现复杂散射波场中散射体的成像和定位.

图 14显示了反演网络NET0的训练的均方误差曲线及对训练模型与测试模型的反演准确率随epoch逐个递增时的上升曲线.

图 14 (a) 训练反演网络NET0的均方误差曲线;(b)对训练模型与测试模型的反演准确率随epoch逐个递增时的变化曲线 Fig. 14 (a) The mean square error curve of the training inversion network NET0;(b) The curves of the inversion accuracy of the training model and the test models varying with successively increasing epoch

对比图 13图 14图 10图 11图 9可以看出,CNN网络直接反演“自激自收剖面”的成像效果、收敛性和稳定性与对“偏移剖面”的反演基本类似,两种反演结果各有特色.这进一步说明本文提出的CNN网络波场反演方法具有较好的鲁棒性和稳定性,即本文提出的CNN反演方法也可应用于偏移不好的散射波场剖面.综上所述,应用我们构造的CNN网络,只要在学习模型对应的散射波场剖面上知道所有散射体的准确位置,网络就可以自动学习掌握散射波的特点,并在各种测试模型中可以模糊定位散射点的位置.这个算例说明通过CNN网络,可以稳健、自适应地反演“偏移剖面”、“自激自收剖面”等各种不同类型的复杂散射波场.从而进一步说明了本文的波场反演方法的稳定性、鲁棒性和自适应能力.

6 不同成像半径对CNN网络反演结果的影响 6.1 4个卷积神经网络的设计及其对训练模型的反演结果

本节选择“偏移剖面”(图 3)作为采样和反演剖面,选择反演网络NET0的输入是与前文完全相同的样本矩阵.选择输出的成像等级数为2,选择四组不同的成像半径,对比研究CNN网络的反演效果.依然将图 2中的介质模型(a1)作为训练模型,将(a2)、(b1)、(b2)、(c1)、(c2)作为5个测试模型.选择如下四种不同的成像半径:

按公式(1)、(2)计算偏移剖面(图 3)中全部成像点的4种不同的类别函数将其作为NET0的对应样本的理想输出,对应得到4个反演网络,分别记为NET0-1、NET0-2、NET0-3、NET0-4.其中训练模型(a1)对应的4种类别函数如图 15所示.

图 15 训练模型(a1)的四种“类别函数”,用于训练反演网络;它们分别是NET0-1、NET0-2、NET0-3、NET0-4的理想输出 Fig. 15 Four "category functions" of the training model (a1) which are used to train the inversion network; they are the ideal outputs of NET0-1, NET0-2, NET0-3 and NET0-4, respectively

图 15中每个椭圆对应一个波场散射体,白色成像点对应类别函数值为1,黑色成像点对应类别函数值为0,灰色虚线仅表示反射界面大致位置,不影响对应的成像点类别函数值.用图 15所示的四种不同的“类别函数”训练CNN网络NET0得到4个反演网络NET0-1、NET0-2、NET0-3、NET0-4.

我们根据从训练模型(a1)的偏移剖面中提取的学习样本,对上述4个卷积神经网络进行训练,训练50个epoch后结束,训练的均方误差曲线如图 16所示.可见虽然4个反演网络定义的散射点区域大小各不相同,但它们都能够快速稳定的收敛.

图 16 4个反演网络训练的均方误差曲线 (a) NET0-1;(b) NET0-2;(c) NET0-3;(d) NET0-4. Fig. 16 The mean square error curves of four inversion networks

网络训练学习完成后,我们分别使用训练好的上述4个卷积神经网络NET0-1、NET0-2、NET0-3、NET0-4对训练模型进行反演:输入偏移剖面,输出类别函数预测值.上述4个卷积神经网络对图 3a1所示训练模型的偏移剖面的自动反演结果图 17所示.

图 17 4个CNN网络对训练模型(a1)的反演输出(类别函数预测值),输入为偏移剖面(图 3a1)且期望输出为类别函数如图 15所示 Fig. 17 The inversion output (predicted value of category function) of four CNN networks for the training model(a1).The input is the migration profile (Fig. 3a1) and the expected output is the category function as shown in Fig. 15

通过对比图 17图 15,可以看出4个CNN网络反演训练模型得到的结果都近似于理想结果图 15,可以和图 15所示类别函数理想值1, 2, 3, 4进行直观对比,观察其反演效果.具体来说,显然前2个反演网络没有能对全部散射体成像;后2个反演网络基本能对全部散射体清晰成像并反演定位.4个反演网络的成像效果依次评价为(*)、(**)、(***)、(***).计算表明,当散射波场较复杂且选择的成像半径太小时,即使是对训练模型都会出现个别散射体无法成像的现象.

6.2 4个CNN网络对测试模型的反演结果

一般CNN反演网络对训练模型的反演结果都较好,但对测试模型的反演结果才是判断反演网络好坏的关键.下面我们再用上述4个训练好的反演网络分别反演5个测试模型的偏移剖面(图 3),研究网络的泛化能力.我们使用上面训练好了的4个反演网络NET0-1、NET0-2、NET0-3、NET0-4分别对5个测试模型的波场剖面进行快速反演成像——输入偏移剖面(图 3)输出类别函数预测值的图像,最后得到“滤波剖面”的图像.4个反演网络NET0-1、NET0-2、NET0-3、NET0-4对所有5个测试模型的反演成像效果大体上十分类似,其中对测试模型(b2)的偏移剖面(图 3b2)的反演结果如图 19所示.

图 19 分别通过4个CNN网络对测试模型(b2)的理想输出和反演输出(图 19)得到的“滤波剖面”(上面4个和下面4个) Fig. 19 The "filter profiles" (four above and four below) obtained from the ideal output and the inversion output (Fig. 19) of the test model (b2) by four CNN networks

对比观察反演结果(图 18)和理想结果(类似于图 5b2)可以研究反演效果.4个反演网络对测试模型(b2)的反演结果明显不如对训练模型的反演结果.具体来说,反演网络NET0-1成像半径太小,难以从成像结果辨识全部散射体;反演网络NET0-4辨识的散射体有模糊化的趋势,说明成像半径太大已无法提高辨识效果;其他两个反演网络的反演图像基本能全面地辨识散射体的模糊位置.本例说明存在最佳成像半径可达到最佳辨识效果.我们将4个反演网络对测试模型(b2)的成像效果评价依次定为(*)、(***)、(***)、(*).

图 18 4个CNN网络对测试模型(b2)的反演输出(类别函数预测值),输入为偏移剖面(图 3b2) Fig. 18 Inversion output (predicted value of category function) of four CNN networks for the test model(b2).The input is the migration profile (Fig. 3b2)

由4个反演网络的输出结果, i=1, 2, 3, 4(图 18)和偏移剖面(图 3b2),进一步根据公式(3)、(4)分别求出“滤波剖面”.图 19显示了分别通过4个CNN网络对测试模型(b2)的理想输出和反演输出(图 18)得到的“滤波剖面”.

通过仔细对比图 19图 3b2图 5b2,可以观察在4个反演网络的“眼中”散射波的各种具体形态.可以看出4个网络对测试模型(b2)的反演具有强化散射波同时压制其他波的效果,可以帮助我们模糊定位散射体.反演网络NET0-4得到的“滤波剖面”对散射波的强化缺乏重点,成像效果较差;其他3个反演网络得到的“滤波剖面”,对散射波的强化比较全面、均衡,成像效果各有特色.我们将4个反演网络对测试模型(b2)的成像效果评价依次定为(***)、(***)、(***)、(*).4个反演网络虽然成像效果各有不同,得到的“滤波剖面”总体上都要优于原始偏移剖面.我们可以通过“滤波剖面”(图 19),观察反演网络识别出的散射波的各种具体形态,从而可直观模糊定位测试模型(b2)中全部散射体的“位置”.

综上所述,4个反演网络NET0-1、NET0-2、NET0-3、NET0-4对全部6个模型的偏移剖面的反演结果的(根据5个评价指标)综合分析见表 1所示.

表 1 4个反演网络NET0-1、NET0-2、NET0-3和NET0-4对6个偏移剖面的反演成像结果分析 Table 1 Analysis of four inversion networks NET0-1, NET0-2, NET0-3 and NET0-4 for 6 migration profiles

对测试模型(b2)成像效果较好的是表 1中带下划线的5个反演图像(图 19图 20).综合分析这4个图像可定位测试模型(b2)中全部散射体“位置”.从表 1中看出,(测试模型的)反演准确率随成像半径的增加而下降,成像半径太小(NET0-1)或太大(NET0-4)时成像效果不好.前3个CNN网络对全部6个模型反演都满足:αi>0.7、 < 1%,结果显示了反演网络的高鲁棒性和强泛化能力.

图 20 4个反演网络训练的均方误差曲线 (a) NET0-1;(b) NET0-2;(c) NET0-3;(d) NET0-4. Fig. 20 The mean square error curves of four inversion networks
7 成像半径的纵横向比率对CNN网络反演结果的影响

下面通过4个卷积神经网络及其反演结果,对比研究成像半径的纵横向比率对CNN网络反演结果的影响.

本节选择“偏移剖面”(图 3)作为采样和反演剖面,选择反演网络NET0的输入是与第三节完全相同的样本矩阵.选择输出的成像等级数为2,选择四组不同的成像半径,对比研究CNN网络的反演效果.依然将图 2中的介质模型(a1)作为训练模型,将(a2)、(b1)、(b2)、(c1)、(c2)作为5个测试模型.选择如下四种不同的成像半径:

按公式(1)、(2)计算偏移剖面(图 3)中全部成像点的4种不同的类别函数, i=1, 2, 3, 4,将其作为NET0的对应样本的理想输出,对应得到4个反演网络,分别记为NET0-1、NET0-2、NET0-3、NET0-4.我们根据从训练模型(a1)的偏移剖面中提取的学习样本,对上述4个卷积神经网络进行训练,训练50个epoch后结束,训练的均方误差曲线如图 20所示.可见虽然4个反演网络定义的散射点区域大小各不相同,但它们都能够快速稳定的收敛.

网络训练学习完成后,我们分别使用训练好的上述4个卷积神经网络NET0-1、NET0-2、NET0-3、NET0-4对训练模型进行反演:输入偏移剖面,输出类别函数预测值.上述4个卷积神经网络对图 3a1所示训练模型的偏移剖面的自动反演结果, i=1, 2, 3, 4,如图 17所示.

网络训练学习完成后,我们分别使用训练好的上述4个卷积神经网络NET0-1、NET0-2、NET0-3、NET0-4进行反演:输入偏移剖面,输出类别函数预测值.上述4个卷积神经网络对(图 3a1图 3b2)所示训练模型(a1)和测试模型(b2)的偏移剖面的理想输出和自动反演结果图 21所示.

图 21 4个CNN网络对偏移剖面(图 3)的期望输出和实际输出(类别函数预测值),其中左边对应训练模型(a1),右边对应测试模型(b2) Fig. 21 Expected and actual output of migration profiles (Fig. 3) from four CNN networks (predicted value of category function), including left corresponding to training model (a1) and right corresponding to testing model (b2)

通过图 21可以看出4个CNN网络NET0-1、NET0-2、NET0-3、NET0-4对训练模型(a1)反演得到的结果都已收敛到理想结果图,对测试模型的反演效果各不相同.4个反演网络对测试模型(b2)的反演结果和成像半径的纵横向比率有关,成像效果各具特色,4个反演网络可联合应用于各种复杂散射波场的反演成像.4个反演网络NET0-1、NET0-2、NET0-3、NET0-4对全部6个模型的偏移剖面的反演准确率,以及全部5个测试模型的平均准确率、标准差见表 2所示.

表 2 4个反演网络NET0-1、NET0-2、NET0-3和NET0-4对6个偏移剖面的反演成像准确率 Table 2 Accuracy of inversion imaging of four inversion networks NET0-1, NET0-2, NET0-3 and NET0-4 for 6 migration profiles
8 不同采样半径对CNN网络反演结果的影响

下面通过4个卷积神经网络及其反演结果,对比研究不同采样半径对CNN网络反演结果的影响.

依然选择“偏移剖面”(图 3)作为采样和反演剖面;选择输出的成像等级数为2,选择成像半径Cx=6 Trace、Ct=24 ms;依然将图 2中的介质模型(a1)作为训练模型,将(a2)、(b1)、(b2)、(c1)、(c2)作为5个测试模型.选择如下四种不同的采样半径:

在每个成像点(i, j)附近,选择矩形框作为采样区域,并采样得到大小为局部波场矩阵,然后将局部波场矩阵重采样成一个28×28的样本矩阵.由此训练CNN网络NET0,得到4个反演网络记为NET0-1、NET0-2、NET0-3、NET0-4.例如,NET0在(图 3a1)标记成像点P0(i0, j0)处的局部波场矩阵如图 22所示.

图 22 图 3a1中的标记成像点P0(i0, j0)对应的四种局部波场,分别是NET0-1、NET0-2、NET0-3、NET0-4的一个学习样本的输入 Fig. 22 Four local wave fields corresponding to labeled imaging points P0(i0, j0) in Fig. 3a1 with input of a learning sample of NET0-1, NET0-2, NET0-3 and NET0-4, respectively

我们根据从训练模型(a1)的偏移剖面(图 3)中提取的学习样本,对上述4个卷积神经网络进行训练,选取batchsize=5,训练50个epoch后结束,计算表明虽然4个反演网络定义的局部波场区域大小各不相同,但它们都能够快速稳定的收敛.

网络训练学习完成后,我们分别使用训练好的上述4个卷积神经网络NET0-1、NET0-2、NET0-3、NET0-4进行反演:输入偏移剖面,输出类别函数预测值.上述4个卷积神经网络对(图 3a1图 3b2)所示训练模型(a1)和测试模型(b2)的偏移剖面的理想输出和自动反演结果图 23所示.

图 23 4个CNN网络对偏移剖面(图 3)的期望输出和实际输出(类别函数预测值),其中左边对应训练模型(a1),右边对应测试模型(b2) Fig. 23 Expected and actual output of migration profiles (Fig. 3) from four CNN networks (predicted value of category function), including left corresponding to training model (a1) and right corresponding to testing model (b2)

通过图 23可以看出4个CNN网络NET0-1、NET0-2、NET0-3、NET0-4对训练模型(a1)反演得到的结果都已收敛到理想结果图,对测试模型的反演效果各不相同.4个反演网络对测试模型(b2)的反演结果和采样半径有关,采样半径太小或太大都会降低反演的成像效果.4个反演网络对全部6个模型的反演准确率如图 24所示.

图 24 4个反演网络对全部6个模型的反演准确率 Fig. 24 The inversion accuracy of four inversion networks for all six models

通过图 24可以看出对训练模型(a1)和测试模型(b2)NET0-2的反演准确率最高,而对其他4个测试模型NET0-3的反演准确率最高,总之存在最佳采样半径使得反演准确率达到极大.当选择采样半径70 ms≤h≤90 ms时,卷积神经网络对训练模型和测试模型的偏移剖面的成像效果都比较理想.

9 溶洞大小悬殊的新模型及其正、反演

在自然界中,溶洞的几何尺度差异较大,一般从1 m以下到10 m以上变化.前文的6个理论模型中溶洞的形状、大小、分布位置都是随机的,每个模型中平均有34~37个溶洞,每个溶洞直径大约为24~44 m.与真实情况比,本文设置的溶洞直径偏大且大小也不够悬殊.为此我们构造了对应的6个新模型.6个新模型和对应的6个旧模型有相同的层状背景速度和“类别函数”图,但是每个旧模型中都有十多个大溶洞替换成直径为4 m的小溶洞(小溶洞要将模型图放大才可能看到),如图 25所示.

图 25 6个介质新模型 (a1)、(a2)是2个训练模型;(b1)、(b2)、(c1)、(c2)是4个测试模型. Fig. 25 Six new media models (a1) and (a2) are two training models; (b1), (b2), (c1) and (c2) are four testing models.

依然用30 Hz瑞克子波作为震源函数进行波场模拟,选择和第三节完全相同波场观测系统,选择相同的CNN网络和采样半径、成像半径、样本矩阵、batchsize值等反演参数,6个新模型对应的类别函数如图 26所示.

图 26 6个新模型的类别函数,即NET0的理想输出 (a1)、(a2)是2个训练模型;(b1)、(b2)、(c1)、(c2)是4个测试模型. Fig. 26 Category functions of six new models, namely, the ideal output of NET0 (a1) and (a2) are two training models, (b1), (b2), (c1) and (c2) are four test models.

图 26中白色、灰色成像点对应类别函数值均为1,黑色成像点对应类别函数值为0,即图 26图 5定义的类别函数其实是相同的.灰色成像点对应于直径为4m的小溶洞,小溶洞在对应的模型(图 25)、偏移剖面(图 27左侧)或自激自收剖面(图 28左侧)中均不易辨识.将大、小溶洞一视同仁,本节用新模型中(a1)、(a2)两个训练模型的数据训练网络NET0,训练20个epoch后结束.然后用NET0对6个新模型的波场进行成像反演.

图 27 用(a1)、(a2)两个新模型的数据训练CNN网络NET0,用训练后的网络NET0反演6个新模型的偏移剖面得到类别函数预测值 图中左侧(偏移剖面)是NET0的输入,右侧(类别函数预测值图)是NET0对该偏移剖面的反演输出. Fig. 27 CNN network NET0 trained with the data of two new models (a1) and (a2). The migration profiles of six new models are retrieved with the trained network NET0 to obtain the predicted value of the category function The left (migration profile) is the input of NET0, and the right (prediction value map of category function) is the inversion output of NET0 to the migration profile.
图 28 用(a1)、(a2)两个新模型的数据训练CNN网络NET0,然后用训练后的网络NET0反演6个新模型的自激自收波场得到类别函数预测值 图中左侧(自激自收剖面)是NET0的输入,右侧(类别函数预测值图)是NET0对该自激自收剖面的反演输出. Fig. 28 CNN network NET0 is trained with the data of two new models (a1) and (a2). Then the zero offset wave fields of six new models are inverted with the trained network NET0 to obtain the predicted value of the category function The left (zero offset profile) is the input of NET0, and the right (category function prediction value chart) is the inversion output of NET0 to the zero offset profile.
9.1 用CNN网络NET0反演“偏移剖面”

使用新模型(a1)、(a2)的“偏移剖面”训练网络NET0,然后用NET0反演6个模型对应的偏移剖面,得到对应的类别函数预测值,如图 27所示.其中,图 27a1中标记点P0P1P2是散射波场中的3个成像点,在黑框矩形区域中采集这3个成像点对应的局部波场,得到对应的3个学习样本的输入.(对比图 5a1)3个成像点对应的理想类别函数值输出分别为:W(P1)=W(P2)=0(不是散射点),W(P0)=1(是散射点).

通过对比图 27图 26可以看出,反演网络NET0可以辅助我们大致识别各个模型中各大、小溶洞的大体位置.但我们发现即便是训练模型,即便对位于浅层的小溶洞,都有无法识别的个例存在,例如图 26(a1)上标注的“一个浅层小溶洞对应的一个波场散射体”未能成像,这说明反演网络NET0的反演有其局限性.

9.2 用CNN网络NET0反演“自激自收剖面”

下面直接反演“自激自收剖面”,网络NET0全部反演参数的选择与第三节完全相同.6个新模型对应的自激自收剖面如图 28(左侧)所示,用(a1)、(a2)两个模型的数据,训练反演网络NET0,训练20个epoch后结束.用训练后的网络NET0反演6个模型对应的自激自收剖面得到类别函数预测值,结果如图 28(右侧)所示.其中,图 28a1中标记点P0P1P2是散射波场中的3个成像点,在黑框矩形区域中采集这3个成像点对应的局部波场,得到对应的3个学习样本的输入.(对比图 5a1)3个成像点对应的理想类别函数值分别为:W(P1)=W(P2)=0(不是散射点),W(P0)=1(是散射点).

通过对比图 28图 26图 27可以看出,虽然NET0未识别出测试模型中的全部大、小溶洞,但NET0基本识别出了训练模型中的全部大、小溶洞,满足我们的基本要求,这说明在溶洞大小悬殊的情况下,NET0对“自激自收剖面”的反演要优于对“偏移剖面”的反演.这充分说明对于复杂的散射介质模型中散射体的定位不能仅仅依据“偏移剖面”,适当综合“自激自收剖面”甚至叠前炮记录信息可望得到更好的结果,而CNN网络可望帮助我们实现这个目标.值得指出的是为了避免太多讨论,我们没有改变“局部波场矩阵”的大小.然而大量计算的结果表明,虽然相对“自激自收剖面”此处“局部波场矩阵”过小——即使在“波场散射点”附近,在理论上也只能采集到散射双曲线的一点点头部,但CNN网络竟依然能够根据“局部波场矩阵”中的部分信息,较好地识别、定位复杂散射波场中的散射源位置,充分体现了CNN网络的超强分类识别能力.

9.3 由CNN网络的反演结果进一步得到滤波剖面

根据反演结果图 27图 28,由公式(3)、(4)可进一步得到滤波剖面,如图 29所示.

图 29 分别由CNN网络反演结果图 27图 28得到的滤波剖面 左侧是反演6个“偏移剖面”得到的滤波剖面;右侧是反演6个“自激自收剖面”得到的滤波剖面. Fig. 29 The filtering profiles obtained from the inversion results of CNN network in Figs. 27 and 28, respectively Left: the filter profile obtained by inversion of six "migration profiles". Right: the filter profile obtained by inversion of six "zero offset profiles".

通过观察对比图 29图 27图 28图 26和模型图 25可以看出,反演网络NET0具有强化散射一次波同时压制其他波的效果.综合对比基于“偏移剖面”和“自激自收剖面”的反演结果,对训练模型的反演后者要优于前者;对测试模型的反演两者各有特色.滤波剖面具有强化一次散射波同时压制其他波的效果,可以辅助我们了解反演网络识别出的散射波场剖面上散射波的具体形态.再利用反演得到类别函数预测值,通过综合分析CNN网络反演结果,可以有效辅助解释人员在复杂散射波场中定位全部大、小散射体的位置.

10 结论

本文提出了一种基于CNN网络的复杂散射波场中散射体的定位和成像方法.通过使用深度学习神经网络我们可以全自动地实现从端到端的反演,让专业解释人员的经验被卷积神经网络简单、快速、有效的学习把握,从而可大大提高波场解释的效率.得到如下结论:

(1) CNN网络可自适应地应用于各种复杂散射波场中散射体的成像和定位

本文研究“偏移剖面”的反演成像,对应的CNN网络选择“较小的”局部波场矩阵.但计算表明,该CNN反演网络还可应用于“自激自收波场剖面”等其他复杂散射波场,自适应地实现散射体的反演成像和定位.对于复杂散射介质模型,通过利用“偏移剖面”、“自激自收剖面”等信息,CNN网络可望得到“类别函数”和“滤波剖面”等2种成像结果,可以综合分析直观推断出散射点的模糊位置.

(2) 可以对CNN网络反演结果进行定性和定量的分析评价

为评价反演网络对偏移剖面的反演效果,我们提出采用如下5个评价指标:①反演网络的“输出类别”、②对偏移剖面的“滤波剖面”、③识别准确率、④测试模型的平均准确率、⑤测试模型的相对标准差.前两个主观的定性评价指标,应为主要评判标准;后3个是客观的定量评价指标,对反演的准确性、稳定性等具有重要的对比分析价值.

(3) 本文提出的CNN反演网络有很强的鲁棒性、泛化能力和自适应能力

CNN网络参数的选择对反演成像结果会有一定的影响,但不显著.CNN网络训练时,选择Batchsize大小、训练epoch次数等对反演成像结果有一些影响,反演结果各有特色,显示出CNN反演网络有很强的鲁棒性、泛化能力和自适应能力;我们分别研究了成像半径、采样半径等CNN网络参数对对波场反演效果的影响.发现反演准确率随成像半径的增加而下降.反演准确率和采样半径呈现非线性关系,当成像半径(或采样半径)太小或太大时成像效果都会相对变差.即对特定的反演问题,可能存在最优成像半径和最优采样半径.

(4) CNN网络反演结果图非常直观

反演结果“类别函数预测值”可实现对散射体的成像和定位,非常直观容易辨识且可不需要专业的波场识别技术.反演得到的图像对训练模型可实现“完美反演”;对测试模型的反演结果与理想结果之间虽有差距,但显然具有一定的相关性,可以实现对散射体的模糊定位.

(5)“滤波剖面”可以强化一次散射波同时压制其他波

由反演结果“类别函数预测值”可进一步得到“滤波剖面”图,它可以强化一次散射波同时显著压制其他波.还可以辅助我们了解反演网络识别出的散射波场剖面上散射波的具体形态,有助于解释人员准确定位散射体.

(6) CNN网络揭示出复杂散射波场也许有简单的本质

数值模拟证明,在人类眼中十分复杂的散射波场(有大量多次散射波、绕射波甚至多种波相互干涉等现象),在计算机的眼中却是有迹可循的,以至于仅仅通过1个训练模型的学习,CNN网络就自动学会了相关的一次散射波场的部分特征,并可以进行其他不同复杂散射模型的反演——得到期望的散射距离场类别,并且可以由此大致辨识出复杂散射模型中各散射点的模糊位置.更多的训练模型可望进一步提高CNN网络的识别和反演能力,本文提出的CNN波场反演方法还可以简单地推广到频率域中实施,得出类似而又不同的反演结果,作者将另文研究.

致谢  感谢中国地质大学(武汉)数理学院付丽华教授提出的修改意见,感谢审稿专家提出的修改意见和编辑部的支持.
References
Abdel-Hamid O, Mohamed A R, Jiang H, et al. 2014. Convolutional neural networks for speech recognition. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 22(10): 1533-1545. DOI:10.1109/TASLP.2014.2339736
Ail Sebtosheikh M, Salehi A. 2015. Lithology prediction by support vector classifiers using inverted seismic attributes data and petrophysical logs as a new approach and investigation of training data set size effect on its performance in a heterogeneous carbonate reservoir. Journal of Petroleum Science and Engineering, 134: 143-149. DOI:10.1016/j.petrol.2015.08.001
Alkhalifah T. 2015. Scattering-angle based filtering of the waveform inversion gradients. Geophysical Journal International, 200(1): 363-373.
Anemangely M, Ramezanzadeh A, Tokhmechi B, et al. 2018. Drilling rate prediction from petrophysical logs and mud logging data using an optimized multilayer perceptron neural network. Journal of Geophysics and Engineering, 15(4): 1146-1159. DOI:10.1088/1742-2140/aaac5d
Ansari H R. 2014. Use seismic colored inversion and power law committee machine based on imperial competitive algorithm for improving porosity prediction in a heterogeneous reservoir. Journal of Applied Geophysics, 108: 61-68. DOI:10.1016/j.jappgeo.2014.06.016
Boureau Y L, Ponce J, LeCun Y. 2010. A theoretical analysis of feature pooling in visual recognition.//Proceedings of the 27th International Conference on Machine Learning, Haifa, Israel, 2010, 111-118.
Cerjan C, Kosloff D, Kosloff R, et al. 1985. A nonreflecting boundary condition for discrete acoustic and elastic wave equations. Geophysics, 50(4): 705-708.
Cersósimo D S, Ravazzoli C L, Martínez R G. 2016. Prediction of lateral variations in reservoir properties throughout an interpreted seismic horizon using an artificial neural network. The Leading Edge, 35(3): 265-269. DOI:10.1190/tle35030265.1
Cudjoe S, Vinassa M, Gomes J H B, et al. 2016. A comprehensive approach to sweet-spot mapping for hydraulic fracturing and CO2 huff-n-puff injection in Chattanooga shale formation. Journal of Natural Gas Science and Engineering, 33: 1201-1218. DOI:10.1016/j.jngse.2016.03.042
Dong L G, Ma Z T, Cao J Z, et al. 2000. A staggered-grid high-order difference method of one-order elastic wave equation. Chinese Journal of Geophysics (in Chinese), 43(3): 411-419.
Duan Y T, Zheng X D, Hu L L, et al. 2019. Fault detection based on 3D semi-dense convolutional neural network. Progress in Geophysics (in Chinese), 34(6): 2256-2261. DOI:10.6038/pg2019CC0367
Ebrahimi A, Khamehchi E. 2016. Developing a novel workflow for natural gas lift optimization using advanced support vector machine. Journal of Natural Gas Science and Engineering, 28: 626-638. DOI:10.1016/j.jngse.2015.12.031
Ergintav S, Canitez N. 1997. Modeling of multi-scale media in discrete form. Journal of Seismic Exploration, 6(1): 77-96.
Esser S K, Merolla P A, Arthur J V, et al. 2016. Convolutional networks for fast, energy-efficient neuromorphic computing. Proceedings of the National Academy of Sciences of the United States of America, 113(41): 11441-11446. DOI:10.1073/pnas.1604850113
Fu C, Lin N T, Zhang D, et al. 2018. Prediction of reservoirs using multi-component seismic data and the deep learning method. Chinese Journal of Geophysics (in Chinese), 61(1): 293-303. DOI:10.6038/cjg2018L0193
Hinton G E, Osindero S, Teh Y W. 2006. A fast learning algorithm for deep belief nets. Neural Computation, 18(7): 1527-1554. DOI:10.1162/neco.2006.18.7.1527
Hou A N, He Q D. 1995. Study of a elastic wave high-order difference method and its stability in anisotropic media. Acta Geophysica Sinica (in Chinese), 38(2): 243-251.
Ikelle L T, Yung S K, Daube F. 1993. 2-D random media with ellipsoidal autocorrelation function. Geophysics, 58(9): 1359-1372. DOI:10.1190/1.1443518
Innanen K A. 2014. Seismic AVO and the inverse Hessian in precritical reflection full waveform inversion. Geophysical Journal International, 199(2): 717-734. DOI:10.1093/gji/ggu291
Kilic G, Eren L. 2018. Neural network based inspection of voids and karst conduits in hydro-electric power station tunnels using GPR. Journal of Applied Geophysics, 151: 194-204. DOI:10.1016/j.jappgeo.2018.02.026
Kumar P C, Sain K. 2018. Attribute amalgamation-aiding interpretation of faults from seismic data:An example from Waitara 3D prospect in Taranaki basin off New Zealand. Journal of Applied Geophysics, 159: 52-68. DOI:10.1016/j.jappgeo.2018.07.023
Lecun Y, Bottou L, Bengio Y, et al. 1998. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11): 2278-2324. DOI:10.1109/5.726791
Lee J, Byun J, Kim B, et al. 2017. Delineation of gas hydrate reservoirs in the Ulleung Basin using unsupervised multi-attribute clustering without well log data. Journal of Natural Gas Science and Engineering, 46: 326-337. DOI:10.1016/j.jngse.2017.08.007
Levander A R. 1988. Fourth-order finite-difference P-SV seismograms. Geophysics, 53(11): 1425-1436. DOI:10.1190/1.1442422
Li W Q, Mao W J, Li X L, et al. 2018. Angle-domain inverse scattering migration/inversion in isotropic media. Journal of Applied Geophysics, 154: 196-209. DOI:10.1016/j.jappgeo.2018.05.006
Li W Q, Mao W J, Ouyang W, et al. 2017. Second-order Born approximation and its application to inverse scattering GRT inversion. Progress in Geophysics (in Chinese), 32(2): 645-656. DOI:10.6038/pg20170227
Li Z A, Zhang J, Liu Z Y, et al. 2018. Characterizing the near-surface velocity structures by applying machine learning.//88th Ann. Internat Mtg., Soc. Expi. Geophys.. Expanded Abstracts, 2712-2716.
Lin B I, Wei X I E, Junjie Z H A O, et al. 2018. Automatic classification of multi-channel microseismic waveform based on DCNN-SPP. Journal of Applied Geophysics, 159: 446-452. DOI:10.1016/j.jappgeo.2018.09.022
Lin N T, Zhang D, Zhang K, et al. 2018. Predicting distribution of hydrocarbon reservoirs with seismic data based on learning of the small-sample convolution neural network. Chinese Journal of Geophysics (in Chinese), 61(10): 4110-4125. DOI:10.6038/cjg2018J0775
Liu J W, Wang T Y, Yuan S Y. 2018. Surface wave recognition using convolutional neural network. International Geophysical Conference, Beijing, China, 1740-1743.
Martínez-Alvarez J J, Garrigós J, Toledo J, et al. 2015. A scalable CNN architecture and its application to short exposure stellar images processing on a HPRC. Neurocomputing, 151: 91-100. DOI:10.1016/j.neucom.2014.09.071
Maurya S P, Singh N P. 2018. Application of LP and ML sparse spike inversion with probabilistic neural network to classify reservoir facies distribution-A case study from the Blackfoot field, Canada. Journal of Applied Geophysics, 159: 511-521. DOI:10.1016/j.jappgeo.2018.09.026
Mollajan A, Memarian H, Quintal B. 2018. Nonlinear rock-physics inversion using artificial neural network optimized by imperialist competitive algorithm. Journal of Applied Geophysics, 155: 138-148. DOI:10.1016/j.jappgeo.2018.06.002
Moon S, Lee G H, Kim H, et al. 2016. Collocated cokriging and neural-network multi-attribute transform in the prediction of effective porosity:A comparative case study for the Second Wall Creek Sand of the Teapot Dome field, Wyoming, USA. Journal of Applied Geophysics, 131: 69-83. DOI:10.1016/j.jappgeo.2016.05.008
Mora P. 1987. Nonlinear two-dimensional elastic inversion of multioffset seismic data. Geophysics, 52(9): 1211-1228. DOI:10.1190/1.1442384
Nwachukwu A, Jeong H, Pyrcz M, et al. 2018. Fast evaluation of well placements in heterogeneous reservoir models using machine learning. Journal of Petroleum Science and Engineering, 163: 463-475. DOI:10.1016/j.petrol.2018.01.019
Ohl D, Raef A. 2014. Rock formation characterization for carbon dioxide geosequestration:3D seismic amplitude and coherency anomalies, and seismic petrophysical facies classification, Wellington and Anson-Bates Fields, Kansas, USA. Journal of Applied Geophysics, 103: 221-231. DOI:10.1016/j.jappgeo.2014.01.017
Ouadfeul S A, Aliouane L. 2016. Total organic carbon estimation in shale-gas reservoirs using seismic genetic inversion with an example from the Barnett Shale. The Leading Edge, 35(9): 790-794. DOI:10.1190/tle35090790.1
Persico R, Ludeno G, Soldovieri F, et al. 2018. Improvement of Ground Penetrating Radar (GPR) Data Interpretability by an Enhanced Inverse Scattering Strategy. Surveys in Geophysics, 39(6): 1069-1079. DOI:10.1007/s10712-018-9493-z
Sermanet P, Kavukcuoglu K, Chintala S, et al. 2013. Pedestrian detection with unsupervised multi-stage feature learning.//2013 IEEE Conference on Computer Vision and Pattern Recognition. Portland, OR, USA: IEEE, 3626-3633.
Shirmohamadi M, Kadkhodaie A, Rahimpour-Bonab H, et al. 2017. Seismic velocity deviation log:An effective method for evaluating spatial distribution of reservoir pore types. Journal of Applied Geophysics, 139: 223-238. DOI:10.1016/j.jappgeo.2017.03.001
Si X, Yuan Y J. 2018. Random noise attenuation based on residual learning of deep convolutional neural network.//88th Ann. Internat Mtg., Soc. Expi. Geophys.. Expanded Abstracts, 1986-1990.
Silver D, Huang A, Maddison C J, et al. 2016. Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587): 484-489. DOI:10.1038/nature16961
Stolt R H, Weglein A B. 1985. Migration and inversion of seismic data. Geophysics, 50(12): 2458-2472. DOI:10.1190/1.1441877
Virieux J. 1984. SH-wave propagation in heterogeneous media; Velocity-stress finite-difference method. Geophysics, 49(11): 1933-1942. DOI:10.1190/1.1441605
Virieux J. 1986. P-SV wave propagation in heterogeneous media:Velocity stress finite difference method. Geophysics, 51(4): 889-901. DOI:10.1190/1.1442147
Wang W Q, Meng F S, Sun W L. 2019. Trace editing based on optimized convolutional neural network. Progress in Geophysics (in Chinese), 34(1): 214-220. DOI:10.6038/pg2019BB0387
Weglein A B, Gasparotto F A, Carvalho P M, et al. 1997. An inverse-scattering series method for attenuating multiples in seismic reflection data. Geophysics, 62(6): 1975-1989. DOI:10.1190/1.1444298
Xi X, Huang J Q. 2018. Deep learning inversion imaging method for scattered wavefield. Progress in Geophysics (in Chinese), 33(6): 2483-2489. DOI:10.6038/pg2018BB0531
Xi X, Yao Y. 2001. 2-D random media and wave equation forward modeling. Oil Geophysical Prospecting (in Chinese), 36(5): 546-552.
Xi X, Yao Y. 2002. Simulations of random medium model and intermixed random medium. Earth Science-Journal of China University of Geosciences (in Chinese), 27(1): 67-71.
Xi X, Yao Y. 2004. The analysis of the wave field characteristics in 2-D viscoelastic random medium. Progress in Geophysics (in Chinese), 19(3): 608-615.
Xi X, Yao Y, Gu H M. 2005. Simulations of random cave medium model. Journal of Huazhong University of Science and Technology (Nature Science) (in Chinese), 33(9): 105-108.
Xie X Y, Qin H, Yu C, et al. 2013. An automatic recognition algorithm for GPR images of RC structure voids. Journal of Applied Geophysics, 99: 125-134. DOI:10.1016/j.jappgeo.2013.02.016
Yang L Q, Chen W, Zha B. 2019. Prediction and application of reservoir porosity by convolutional neural network. Progress in Geophysics (in Chinese), 34(4): 1548-1555. DOI:10.6038/pg2019CC0528
Yıldırım E, Saatçılar R, Ergintav S. 2017. Estimation of seismic quality factor:Artificial neural networks and current approaches. Journal of Applied Geophysics, 136: 269-278. DOI:10.1016/j.jappgeo.2016.11.010
Yin J J, Liu X W, Li W H. 2005. The view of seismic wave scattering theory and its applications. Progress in Geophysics (in Chinese), 20(1): 123-134. DOI:10.3969/j.issn.1004-2903.2005.01.024
Zhang F C, Liu H Q, Niu X M, et al. 2014. High resolution seismic inversion by convolutional neural network. Oil Geophysical Prospecting (in Chinese), 49(6): 1165-1169.
Zhang X, Yuan C C, Zhang J, et al. 2018. Automatic microseismic detection and location via the deep-convolutional neural network.//88th Ann. Internat Mtg., Soc. Expi. Geophys.. Expanded Abstracts, 3057-3061.
董良国, 马在田, 曹景忠, 等. 2000. 一阶弹性波方程交错网格高阶差分解法. 地球物理学报, 43(3): 411-419. DOI:10.3321/j.issn:0001-5733.2000.03.015
段艳廷, 郑晓东, 胡莲莲, 等. 2019. 基于3D半密度卷积神经网络的断裂检测. 地球物理学进展, 34(6): 2256-2261. DOI:10.6038/pg2019CC0367
付超, 林年添, 张栋, 等. 2018. 多波地震深度学习的油气储层分布预测案例. 地球物理学报, 61(1): 293-303. DOI:10.6038/cjg2018L0193
侯安宁, 何樵登. 1995. 各向异性介质中弹性波动高阶差分法及其稳定性的研究. 地球物理学报, 38(2): 243-251. DOI:10.3321/j.issn:0001-5733.1995.02.014
李武群, 毛伟建, 欧阳威, 等. 2017. 二阶Born近似及其在逆散射GRT反演中的应用. 地球物理学进展, 32(2): 645-656. DOI:10.6038/pg20170227
林年添, 张栋, 张凯, 等. 2018. 地震油气储层的小样本卷积神经网络学习与预测. 地球物理学报, 61(10): 4110-4125. DOI:10.6038/cjg2018J0775
王文强, 孟凡顺, 孙文亮. 2019. 优化卷积神经网络在道编辑中的应用. 地球物理学进展, 34(1): 214-220. DOI:10.6038/pg2019BB0387
奚先, 黄江清. 2018. 复杂散射波场的深度学习反演成像法. 地球物理学进展, 33(6): 2483-2489. DOI:10.6038/pg2018BB0531
奚先, 姚姚. 2001. 二维随机介质及波动方程正演模拟. 石油地球物理勘探, 36(5): 546-552. DOI:10.3321/j.issn:1000-7210.2001.05.005
奚先, 姚姚. 2002. 随机介质模型的模拟与混合型随机介质. 地球科学-中国地质大学学报, 27(1): 67-71. DOI:10.3321/j.issn:1000-2383.2002.01.014
奚先, 姚姚. 2004. 二维粘弹性随机介质中的波场特征分析. 地球物理学进展, 19(3): 608-615. DOI:10.3969/j.issn.1004-2903.2004.03.019
奚先, 姚姚, 顾汉民. 2005. 随机溶洞介质模型的构造. 华中科技大学学报(自然科学版), 33(9): 105-108. DOI:10.3321/j.issn:1671-4512.2005.09.033
杨柳青, 陈伟, 查蓓. 2019. 利用卷积神经网络对储层孔隙度的预测研究与应用. 地球物理学进展, 34(4): 1548-1555. DOI:10.6038/pg2019CC0528
尹军杰, 刘学伟, 李文慧. 2005. 地震波散射理论及应用研究综述. 地球物理学进展, 20(1): 123-134. DOI:10.3969/j.issn.1004-2903.2005.01.024
张繁昌, 刘汉卿, 钮学民, 等. 2014. 褶积神经网络高分辨率地震反演. 石油地球物理勘探, 49(6): 1165-1169.