② 长江大学地球物理与石油资源学院, 湖北武汉 430100;
③ 中国石油大学(北京) CNPC物探重点实验室, 北京 102249;
④ 非常规油气湖北省协同创新中心, 湖北武汉 430100
② College of Geophysics and Petroleum Resources, Yangtze University, Wuhan, Hubei 430100, China;
③ CNPC Key Laboratory of Geophysical Prospecting, China University of Petroleum(Beijing), Beijing 102249, China;
④ Hubei Cooperative Innovation Center of Unconventional Oil and Gas, Wuhan, Hubei 430100, China
随着油气勘探环境变得愈加复杂,地震数据在采集过程中受到的噪声干扰也愈加严重[1]。地震数据中的噪声可分为两类:相干噪声和随机噪声。相干噪声具有一定的波形特征,而随机噪声没有固定的波形特征,与有效信号随机混合在一起,影响高分辨率处理、属性分析、反演等。
噪声压制在地球物理学中是一个经典的问题,已提出了很多方法。传统的噪声压制方法是基于地震数据的特性,如可预测性、稀疏性等。基于预测性的去噪方法利用有效信号线性或拟线性生成预测滤波器提高信噪比[2-3],但不能处理非线性地震信号。基于稀疏变换的去噪方法利用信号在变换域内具有较好的稀疏性压制噪声,例如小波变换[4-5]、曲波变换[6-7]、Shearlet变换[8-9]等。由于它们建立在固定的变换基函数上,因此不能自适应地处理结构复杂的地震数据。字典学习是一种基于数据驱动的算法,使用可学习的字典代替传统的变换基函数,因此可以自适应地表示数据[10-11]。中值滤波在图像处理中是一种经典的平滑去噪方法,利用信号与噪声之间的统计差异抑制噪声,常用于地震数据去噪[12]。以上方法噪声压制效果受限于模型假设和参数设置等因素。
近年来,深度学习在图像处理、语音处理等领域取得了显著成果[13-15]。通过构建多个处理层逐步实现抽象的特征表示,可以完成复杂的分类或预测等任务[16-19]。目前,基于标签数据的深度学习方法已经成功应用于地震随机噪声压制[20],根据生成标签数据的策略,主要可以分为两类:①将传统去噪方法的结果作为标签数据训练神经网络,然后将训练好的网络模型用于实际地震数据噪声压制[21-22];②将创建的合成地震数据作为标签数据训练神经网络[23],然后将训练好的网络模型用于实际地震数据噪声压制[24-25]。第一类方法制作的标签数据并不太准确,因此会影响网络模型的去噪性能。第二类方法制作的标签数据虽然准确,但是合成数据与实际地震数据差异大,影响网络模型的泛化能力。基于标签数据的深度学习方法取得了良好的去噪效果,但是在制作复杂而庞大的训练集上也会浪费大量的资源。因此,开发不依赖于标签数据的无监督学习方法对于地震数据噪声压制具有重要意义。
为了改善地震数据的噪声压制效果,本文提出了一种基于卷积降噪自编码器的地震噪声压制算法。该算法基于无监督学习,能够直接从含噪的地震数据中恢复无噪的地震数据,省去了标注数据所需的大量工作。
1 理论 1.1 自编码器自编码器属于无监督学习,它利用反向传播算法对无标签的输入数据进行重构。典型的自编码器如图 1所示,可以看出它包括两部分:编码框架和解码框架。编码框架负责将输入数据映射为潜在空间的特征表达,解码框架则负责将特征表达解码为与原始输入数据相近的输出数据。自编码器的目标是使输出数据尽可能等于其输入数据,但是它不能有效提取地震数据特征。对于无标签的输入数据,自编码器按以下方式重建输入数据
$ \mathit{\boldsymbol{H}} = {\xi _{{\mathit{\boldsymbol{\theta }}_1}}}\left( \mathit{\boldsymbol{P}} \right) = \sigma ({\mathit{\boldsymbol{W}}_1}\mathit{\boldsymbol{P}} + {b_1}) $ | (1) |
$ \mathit{\boldsymbol{Q}} = {\xi _{{\mathit{\boldsymbol{\theta }}_2}}}\left( \mathit{\boldsymbol{H}} \right) = \sigma ({\mathit{\boldsymbol{W}}_2}\mathit{\boldsymbol{H}} + {b_2}) $ | (2) |
式中:P、H与Q分别为输入数据、特征表达、输出数据;σ为sigmoid激活函数;W1与b1分别为输入层与隐藏层之间的权重矩阵与偏置;W2与b2分别为隐藏层与输出层之间的权重矩阵与偏置;θ1=[W1, b1]和θ2=[W2, b2]分别为编码参数和解码参数;ξθ1(P)和ξθ2(H)分别为编码函数和解码函数。
模型训练的目的是为了优化模型参数[θ1, θ2],使重建数据Q与输入数据P尽可能地接近,即
$ [{\mathit{\boldsymbol{\theta }}_1}, {\mathit{\boldsymbol{\theta }}_2}] = \mathop {\arg {\rm{ }}\min }\limits_{{\mathit{\boldsymbol{\theta }}_1}, {\mathit{\boldsymbol{\theta }}_2}} L\left\{ {\mathit{\boldsymbol{P}}, {\xi _{{\mathit{\boldsymbol{\theta }}_2}}}[{\xi _{{\mathit{\boldsymbol{\theta }}_1}}}\left( \mathit{\boldsymbol{P}} \right)]} \right\} $ | (3) |
式中L(·)表示L2范数,用于衡量Q与P之间的重构误差。
1.2 降噪自编码器降噪自编码器是自编码器的一个变体。与自编码器不同的是,降噪自编码器通过训练损坏的输入数据进行特征学习,其核心思想是提取数据的鲁棒性特征。典型的降噪自编码器如图 2所示,可以看出,降噪自编码器与自编码器对输入层的处理不同,降噪自编码器按照一定的概率将输入节点置0,如果这种损坏的概率为0,降噪自编码器就退化为自编码器。
为了定性地比较这两种自编码器的学习效果,分别设计了对应的两种自编码器网络,网络层数设置为3,其中隐藏层单元数为64,并将这两种自编码器输入层与隐层之间的权重矩阵进行可视化,结果如图 3所示。从图 3可以看出,自编码器训练后得到的权重是杂乱的,含有大量噪声,而降噪自编码器训练后得到的权重含有明显的结构特征,噪声较弱(这两种自编码器的输入数据均来源于本文实验部分的合成数据,权重尺寸为48×48,降噪自编码器的损坏程度为60%)。可以看出,降噪自编码器能够提取、编码出具有鲁棒性的特征,具有很强的网络表达能力。
全连接形式的降噪自编码器的输入是一维形式,因此对图像处理存在局限性。在图像中,局部的像素联系较为紧密,相距较远的像素关联性不大,而全连接神经网络的结构里下层神经元与所有上层神经元都能够形成连接,促使网络学习图像全局结构,忽略了图像的局部相关性,同时造成了参数糅杂。近年来,卷积神经网络在图像处理方面应用广泛,这归因于它能够通过卷积核捕获原始图像中的局部特征,并且卷积核权重共享,大大减少了参数量。卷积形式的降噪自编码器在图像处理方面已经取得了不错的效果,但还未被用于地震数据去噪。
本文设计的卷积降噪自编码器如图 4所示。使用3层卷积层和池化层作为编码框架,3层上采样层和卷积层作为解码框架。在编码框架中,卷积层作为特征提取层,用于捕捉地震数据波形特征,而池化层作为特征压缩层,一方面能够减小特征图的尺寸,降低网络计算量;另一方面能够提取重要的地震数据特征,有效降低噪声成分。本文将每层卷积层设置24个卷积核,卷积核的移动步长设置为1。因此,48×48×1的地震数据经过编码框架以后就被压缩为6×6×24的压缩特征表达。压缩特征表达保留了地震数据最重要的信息,但是丢失了大量细节信息。因此,解码框架承担着扩大特征图与恢复地震数据细节信息的任务。
地震数据的特征复杂,具有多尺度特征,而单一尺寸的卷积核只能学习到特定尺度的特征。因此,本文设计了多尺度卷积模块,一个多尺度模块相当于三个卷积核,如图 5所示。多尺度卷积模块就是将不同大小的卷积核构成的网络并联起来,既有效解决了卷积核大小的选择问题,又能够有效捕捉地震数据的复杂特征。
本文使用数据分块的训练方式去噪。即采用一个固定尺寸的窗口对地震数据进行滑移,窗口按固定的滑移步长每滑移一次,产生一个样本数据。窗口尺寸代表了样本数据的尺寸,窗口尺寸一旦确定,滑移步长就决定了样本数据的数量。首先,分块训练的方式较好地适应了地震数据的关键信息只与局部数据有关,避免了在训练过程中计算资源的浪费;其次,该训练策略会产生大量的样本数据,有利于训练出良好的模型参数。在本文实验中,将窗口尺寸设置为48×48,滑移步长设置为4。由于无监督学习的性质,本文实验不需要单独的训练集训练模型参数,模型参数的更新是通过对原始含噪数据的自我学习完成,利用早停止原则控制模型训练的结束。
使用合成地震数据与实际地震数据测试本文方法的去噪性能,并与多道奇异值分析(MSSA)[26]、小波变换[27]、f-x反褶积[3]等方法进行对比。其中小波变换采用bior2.4小波基,f-x反褶积预测滤波器的长度设置为6,MSSA要保留的奇异值数量设置为5。
2.1 合成地震数据合成地震数据(图 6a)共88道,每道468个样点,采样间隔为1ms。该合成数据包含线性同相轴、曲线同相轴、间断同相轴以及断层;当加入噪声后(图 6b),同相轴的连续性变差。使用信噪比(SNR)定量地评价不同方法的去噪性能
$ {\rm{SNR}} = 20\lg \frac{{\parallel {\mathit{\boldsymbol{d}}_{{\rm{clean}}}}{\parallel _2}}}{{\parallel {\mathit{\boldsymbol{d}}_{{\rm{denoised}}}} - {\mathit{\boldsymbol{d}}_{{\rm{clean}}}}{\parallel _2}}} $ | (4) |
式中dclean和ddenoise分别表示无噪地震数据与去噪后的地震数据。加噪合成地震数据的SNR为2.04dB。
由于网络结构的复杂性,首先测试卷积层数、卷积核数量、卷积核尺寸以及输入数据的损坏程度对去噪结果的影响。
(1) 卷积层数。将卷积层数从2增加到8,合成数据去噪后的SNR测试结果如图 7a所示。可见随着层数的增加,信噪比先增加后降低;当卷积层数为6时,网络去噪性能最佳,因此将卷积层数设置为6。
(2) 卷积核数量。将卷积核数量从6增加到72,合成数据去噪后的SNR测试结果如图 7b所示。可见,当卷积核数量为24时网络去噪性能最佳,因此将卷积核数量设置为24。
(3) 卷积核尺寸。将卷积核尺寸设置为3×3、5×5、7×7或三者的组合,合成数据去噪后的SNR测试结果如图 7c所示。可见,多尺度的卷积核能够获得更优的去噪结果,因此本文采用多尺度卷积核。
(4) 输入数据的损坏程度。本文测试了输入数据的损坏程度对去噪结果的影响,其结果如图 7d所示。由图 7d可知,对输入数据进行一定程度地损坏可以实现更好的去噪性能。根据测试结果,本文将输入数据的损坏程度设置为60%。
上述四种网络参数确定之后,运行该网络可获得最终的去噪结果,并与MSSA、小波变换和f-x反褶积等去噪方法进行比较(图 8)。由图 8可见:MSSA、f-x反褶积法去噪不足,去噪剖面上含有明显的残余噪声,且MSSA法去噪剖面的间断点不清晰;小波变换法去噪剖面上无明显残留噪声,但同相轴能量不稳定;本文方法的去噪剖面上基本无噪声残留、同相轴能量更稳定、间断点更清晰。
为了比较四种去噪方法的保幅性,计算了四种去噪方法的残差剖面(图 9)。小波变换与f-x反褶积法的残差剖面上有明显的有效信号痕迹,表明有效信号损失严重,而本文去噪方法的残差剖面上有效信号的痕迹不明显,有效信号损失最小,说明本文方法有良好的保幅效果。从平均振幅谱(图 10)上可以看出,本文方法去噪结果的平均振幅谱最接近于原始信号的平均振幅谱,所以本文方法在去除噪声的同时能够最大程度地保护有效信号不受损失。
为了定量比较四种方法的去噪性能,分别计算了不同方法去噪结果的信噪比。MSSA、小波变换、f-x反褶积和本文方法的去噪结果的信噪比分别为11.46、12.26、12.41、16.32dB。图 11为在不同噪声水平下的四种方法去噪结果的信噪比,可见四种方法去噪之后信噪比都会得到一定的提升,但本文方法始终保持最高的信噪比,说明本文方法有更强的鲁棒性。
选取一段明显被随机噪声污染的实际地震剖面(图 12)测试各种方法的去噪能力。该地震数据共120道地震道,单道含548个采样数,采样间隔为1ms。由图 12可以看出,该地震数据含有曲线同相轴以及断层构造,但受噪声干扰严重,同相轴连续性较差,弱信号识别困难。使用与合成数据去噪相同的网络模型,并重新训练用于实际地震数据去噪。MSSA、小波变换、f-x反褶积和本文方法去噪所耗时间分别为0.22s、0.07s、0.08s、515.86s。图 13为四种方法实际地震数据的去噪结果。小波变换法去噪后的地震剖面分辨率低,同相轴不清晰。与其他方法相比,f-x反褶积法去噪后的地震剖面中残留的噪声更多。MSSA法的去噪结果中无明显噪声残留,但损失了某些局部细节。本文方法去噪结果含有更丰富的局部细节,无明显噪声残留,同相轴清晰连续。图 14为四种方法对应的残差剖面,MSSA、小波变换和f-x反褶积方法的残差剖面上含有明显的有效信号的痕迹,因此这三种传统去噪方法在压制随机噪声的同时损失了部分有效信号。而本文方法的残差剖面上无明显有效信号的痕迹,说明本文方法在处理实际资料时具有良好的保幅特性。
为了有效地压制地震随机噪声,本文提出了基于卷积降噪自编码器的地震数据去噪方法。该方法利用卷积降噪自编码器的特性从含噪的地震数据中自适应地学习地震信号的特征,从而滤除较强的随机噪声。由于使用无监督学习,本文的去噪方法不需要标注无噪的地震数据,可以更加灵活应用。合成数据和实际数据的应用结果表明,与MSSA、小波变换、f-x反褶积方法相比,本文方法去噪效果最好。
然而,本文方法虽保证了去噪效果,但效率较低,如何提高计算效率需进一步研究。
[1] |
甘利灯, 张昕, 王峣钧, 等. 从勘探领域变化看地震储层预测技术现状和发展趋势[J]. 石油地球物理勘探, 2018, 53(1): 214-225. GAN Lideng, ZHANG Xin, WANG Yaojun, et al. Current status and development trends of seismic re-servoir prediction viewed from the exploration industry[J]. Oil Geophysical Prospecting, 2018, 53(1): 214-225. |
[2] |
Canales L L. Random noise reduction[J]. SEG Technical Program Expanded Abstracts, 1984, 3: 525-527. |
[3] |
Gulunay N.FXDECON and complex Wiener prediction filter[C].SEG Technical Program Expanded Abstracts, 1986, 5: 279-281.
|
[4] |
薛雅娟, 曹俊兴. 聚合经验模态分解和小波变换相结合的地震信号衰减分析[J]. 石油地球物理勘探, 2016, 51(6): 1148-1155. XUE Yajuan, CAO Junxing. Seismic attenuation ana-lysis using ensemble empirical mode decomposition and wavelet transform[J]. Oil Geophysical Prospecting, 2016, 51(6): 1148-1155. |
[5] |
Mousavi S M, Langston C A. Hybrid seismic denoi-sing using higher-order statistics and improved wavelet block thresholding[J]. Bulletin of the Seismological Society of America, 2016, 106(4): 1380-1393. DOI:10.1785/0120150345 |
[6] |
张华, 陈小宏, 李红星, 等. 曲波变换三维地震数据去噪技术[J]. 石油地球物理勘探, 2017, 52(2): 226-232. ZHANG Hua, Chen Xiaohong, Li Hongxing, et al. 3D seismic data de-noising approach based on Curvelet transform[J]. Oil Geophysical Prospecting, 2017, 52(2): 226-232. |
[7] |
Neelamani R, Baumstein A I, Gillard D G, et al. Coherent and random noise attenuation using the curvelet transform[J]. The Leading Edge, 2008, 27(2): 240-248. DOI:10.1190/1.2840373 |
[8] |
程浩, 王德利, 王恩德, 等. 尺度自适应三维Shearlet变换地震随机噪声压制[J]. 石油地球物理勘探, 2019, 54(5): 970-978. CHENG Hao, WANG Deli, WANG Ende, et al. Seismic random noise suppression based on scale-adaptive 3D-Shearlet transform[J]. Oil Geophysical Prospecting, 2019, 54(5): 970-978. |
[9] |
童思友, 高航, 刘锐, 等. 基于Shearlet变换的自适应地震资料随机噪声压制[J]. 石油地球物理勘探, 2019, 54(4): 744-750. TONG Siyou, GAO Hang, LIU Rui, et al. Seismic random noise adaptive suppression based on the Shearlet transform[J]. Oil Geophysical Prospecting, 2019, 54(4): 744-750. |
[10] |
乐友喜, 杨涛, 曾贤德. CEEMD与KSVD字典训练相结合的去噪方法[J]. 石油地球物理勘探, 2019, 54(4): 729-736. YUE Youxi, YANG Tao, ZENG Xiande. Seismic denoising with CEEMD and KSVD dictionary combined training[J]. Oil Geophysical Prospecting, 2019, 54(4): 729-736. |
[11] |
邵婕, 孙成禹, 唐杰, 等. 基于字典训练的小波域稀疏表示微地震去噪方法[J]. 石油地球物理勘探, 2016, 51(2): 254-260. SHAO Jie, SUN Chengyu, TANG Jie, et al. Micro-seismic data denoising based on sparse representations over learned dictionary in the wavelet domain[J]. Oil Geophysical Prospecting, 2016, 51(2): 254-260. |
[12] |
Mi Y.Median filtering in Kirchhoff migration for noisy data[C].SEG Technical Program Expanded Abstracts, 2000, 19: 822-825.
|
[13] |
Kavukcuoglu K, Sermanet P, Boureau Y L, et al.Lear-ning convolutional feature hierarchies for visual re-cognition[C].Advances in Neural Information Processing Systems, 2010, 1090-1098.
|
[14] |
Noda K, Yamaguchi Y, Nakadai K, et al. Audio-visual speech recognition using deep learning[J]. Applied Intelligence, 2015, 42(4): 722-737. DOI:10.1007/s10489-014-0629-7 |
[15] |
Maggiori E, Tarabalka Y, Charpiat G, et al. Convolutional neural networks for large-scale remote-sensing image classification[J]. IEEE Transactions on Geo-science and Remote Sensing, 2016, 55(2): 645-657. |
[16] |
宋辉, 陈伟, 李谋杰, 等. 基于卷积门控循环单元网络的储层参数预测方法[J]. 油气地质与采收率, 2019, 26(5): 73-78. SONG Hui, CHEN Wei, LI Moujie, et al. A method to predict reservoir parameters based on convolutional neural network-gated recurrent unit(CNN-GRU)[J]. Petroleum Geology and Recovery Efficieney, 2019, 26(5): 73-78. |
[17] |
杨柳青, 陈伟, 查蓓. 利用卷积神经网络对储层孔隙度的预测研究与应用[J]. 地球物理学进展, 2019, 34(4): 1548-1555. YANG Liuqing, CHEN Wei, ZHA Bei. Prediction and application of reservoir porosity by convolutional neural network[J]. Progress in Geophysics, 2019, 34(4): 1548-1555. |
[18] |
林年添, 付超, 张栋, 等. 无监督与监督学习下的含油气储层预测[J]. 石油物探, 2018, 57(4): 601-610. LIN Niantian, FU Chao, ZHANG Dong, et al. Supervised learning and unsupervised learning for hydrocarbon prediction using multiwave seismic data[J]. Geophysical Prospecting for Petroleum, 2018, 57(4): 601-610. |
[19] |
韩卫雪, 周亚同, 池越. 基于深度学习卷积神经网络的地震数据随机噪声去除[J]. 石油物探, 2018, 57(6): 862-869. HAN Weixue, ZHOU Yatong, CHI Yue. Deep lear-ning convolutional neural networks for random noise attenuation in seismic data[J]. Geophysical Prospecting for Petroleum, 2018, 57(6): 862-869. |
[20] |
Wang E, Nealon J. Applying machine learning to 3D seismic image denoising and enhancement[J]. Interpretation, 2019, 7(3): SE131-SE139. DOI:10.1190/INT-2018-0224.1 |
[21] |
Liu D, Wang W, Chen W, et al.Random noise suppression in seismic data: What can deep learning do?[C].SEG Technical Program Expanded Abstracts, 2018, 37: 2016-2020.
|
[22] |
Liu D, Wang W, Wang X, et al. Poststack seismic data denoising based on 3-D convolutional neural network[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 58(3): 1598-1629. |
[23] |
Kim Y, Hardisty R, Marfurt K J.Seismic random noise attenuation in f-x domain using complex-valued resi-dual convolutional neural network[C].SEG Technical Program Expanded Abstracts, 2019, 38: 2579-2583.
|
[24] |
Zhu W, Mousavi S M, Beroza G C. Seismic signal denoising and decomposition using deep neural networks[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(11): 9476-9488. DOI:10.1109/TGRS.2019.2926772 |
[25] |
Zhao Y, Li Y, Dong X, et al. Low-frequency noise suppression method based on improved DnCNN in desert seismic data[J]. IEEE Geoscience and Remote Sen-sing Letters, 2018, 16(5): 811-815. |
[26] |
Oropeza V, Sacchi M. Simultaneous seismic data de-noising and reconstruction via multichannel singular spectrum analysis[J]. Geophysics, 2011, 76(3): V25-V32. DOI:10.1190/1.3552706 |
[27] |
张华, 陈小宏, 杨海燕. 地震信号去噪的最优小波基选取方法[J]. 石油地球物理勘探, 2011, 46(1): 70-75. ZHANG Hua, CHEN Xiaohong, YANG Haiyan. Optimistic wavelet basis selection in seismic signal noise elimination[J]. Oil Geophysical Prospecting, 2011, 46(1): 70-75. |