地球物理学报  2019, Vol. 62 Issue (3): 1057-1070   PDF    
基于站间天然电磁场单位脉冲响应的大地电磁时间序列去噪方法
王辉1,2, 程久龙1,2, 姚郁松2, 罗景程2, 魏文博3     
1. 中国矿业大学(北京)煤炭资源与安全开采国家重点实验室, 北京 100083;
2. 中国矿业大学(北京)地球科学与测绘工程学院, 北京 100083;
3. 中国地质大学(北京)地球物理与信息技术学院, 北京 100083
摘要:针对天然大地电磁场信号在人文活动密集地区易受噪声干扰的问题,本文提出利用两个同步测点天然电磁场时间序列之间的单位脉冲响应,合成本地点受干扰时段的数据,从而去除大地电磁噪声.首先,选择高信噪比时段的数据,采用最小二乘法,估算本地点与参考点之间的单位脉冲响应,再根据卷积定律,结合参考磁场合成本地点的磁场和电场.最后用合成数据替换含噪声时段数据,实现时间域去噪.实测高信噪比数据和含噪数据的处理结果表明,该方法可以高精度合成本地点磁场与电场信号,有效去除本地点电场和磁场噪声,包括相关噪声,提高大地电磁数据质量.
关键词: 大地电磁      单位脉冲响应      时间序列      去噪     
A new method of noise deletion in magnetotelluric time-series based on impulse response of inter-station transfer function
WANG Hui1,2, CHENG JiuLong1,2, YAO YuSong2, LUO JingCheng2, WEI WenBo3     
1. State Key Laboratory of Coal Resources and Safe Mining, China University of Mining and Technology, Beijing 100083, China;
2. College of Geoscience and Surveying Engineering, China University of Mining and Technology, Beijing 100083, China;
3. School of Geophysics and Information Technology, China University of Geoscience, Beijing 100083, China
Abstract: A new method to construct synthetic natural electric and magnetic time series is proposed, in which the time series of local sites are derived using an impulse response and a reference (STIR). This method based on the assumption that the external source of the magnetic field is uniform, and the electric and magnetic fields acquired on the surface satisfy a time-independent linear relation in the frequency domain. According to the convolution theorem, we can synthesize natural electric and magnetic time series using the impulse responses of inter-station transfer function with a reference. Applying this method, two impulse responses need to be estimated:the quasi-MT impulse response tensor and the horizontal magnetic impulse response tensor. These impulse response tensors are related to the local horizontal electric and magnetic components with the horizontal magnetic components at a reference site, respectively. Some clean segments of time series are selected to estimate impulse responses by using the least-square (LS) method. A test with good quality of MT data shows that the resulted synthetic time-series agree with the natural electric and magnetic time series. For contaminated MT examples, when this method is used to remove noise present at the local site, the scatters of MT sounding curves are remarkably reduced and the data quality are improved.
Keywords: Magnetotellurics    Impulse response    Time-series    Noise deletion    
0 引言

大地电磁测深是一种天然场源的地球物理勘探方法,具有野外施工方便、探测深度大、不受高阻层屏蔽等优点(Cagniard,1953; 汤井田等, 2015; 赵国泽等, 2007),为研究深部流体分布、板块构造和大陆动力学等科学问题,提供了重要的地球物理依据(Wei et al., 2001; 金胜等, 2010; 赵国泽等, 2008).好的数据质量是大地电磁数据反演解释的前提(Schaa et al., 2016),而MT天然电磁场信号幅值微弱、频带宽,极易受到噪声干扰(Junge, 1996).大量实验结果表明,如矿区资源开采产生很强的相关噪声,导致测点即使偏离干扰源十几公里也无法获得较好的数据,造成重要地质构造区域深部物质电性资料的缺失(汤井田等, 2012a, 2012b; 李晋等, 2014, 2017a, 2017b).

人文电磁噪声成分非常复杂,先验信息少,各地区也有差异,加之MT信号场源也比较复杂,两者耦合在一起,很难用一种方法精确分离(Egbert, 1997; 王辉等,2014; 李晋等, 2017a, 2017b汤井田等, 2017).大地电磁数据去噪方法的研究始于20世纪80年代,一直伴随着MT的发展,目前已经提出了很多方法,可以简单分为三类:①频率域中的方法,如最小二乘法、Robust估计、远参考;②时频域的处理方法,如小波变换和希尔伯特-黄变换(Hilbert-Huang transform,HHT);③时域中对时间序列进行预处理:如形态滤波、信噪辨识、递归分析和聚类以及压缩感知重构算法,IARWR,基于同步时间序列依赖关系的大地电磁去噪方法以及STIN.

最小二乘法可以压制高斯随机噪声(Sims et al., 1971),但少数“飞点”也会导致估算值偏离真值.Robust估计的本质是加权估计(Egbert and Booker, 1986; Larsen, 1989),根据残差大小赋予数据不同的权重,从而压制“飞点”的影响.该方法要求大部分数据可靠,而且当输入端含噪声时,Robust估计反而会加重噪声的影响(Egbert, 1997; 柳建新等, 2003).远参考方法利用参考点信号与本地点信号相关的特点,压制不相关噪声(Gamble et al., 1979),远参考的处理效果依赖于参考点与本地点信号和噪声的相关性,实际中很难选择合适的参考距离,以保证测点之间信号相关的同时尽可能地远离噪声(Shalivahan and Bhattacharya, 2002; Goubau et al., 1984).

实测MT信号往往是非平稳的(王书明和王家映, 2004),很多学者试图用时频分析和处理非平稳信号的方法来代替傅里叶变换,以提高对噪声的分析能力,主要有小波变换和希尔伯特-黄变换.徐义贤和王家映(2000)提出了基于小波分析的大地电磁信号谱估计方法,可以有效抑制随机噪声和局部相关噪声.小波变换的处理效果还依赖于母波的选取和阈值的设定(Trad and Travassos, 2000),对于噪声成分复杂而信号频谱丰富的MT实测数据而言,母波的选取规则至今没有得到很好的解决(Escalas et al., 2013; Tary et al., 2014).希尔伯特-黄变换是一种分析非线性非平稳信号的方法(Huang et al., 1998),汤井田等利用HHT压制MT噪声,先对数据进行经验模态分解,判别各经验模态分量中的噪声,再对各分量进行阈值滤波,最后将滤波后的各分量数据相加,重构信号(汤井田等, 2008; Cai et al., 2009; Cai, 2014).HHT的缺点在于进行经验模态分解时,窗口首尾两端会引入误差,且运算速度较慢(Chen et al., 2012a; Neukirch and Garcia, 2014).

由于傅里叶变换是全时域到全频域的,导致时域突变噪声扩散至频域多个频带甚至全频带,对于这种噪声,可在时域中直接处理.汤井田等(2012a)将形态滤波应用到MT信噪分离中,表明该方法可以精细刻画数据的主体轮廓,滤除大尺度噪声.李晋等在形态滤波的基础上做二次信噪分离,保留低频信号(2014),但目前对结构元素的参数选择还没有形成完善的理论体系,这是形态滤波的灵活性也是其难度所在,汤井田等近两年又提出利用信噪辨识、递归分析和聚类以及压缩感知重构算法,以对复杂大地电磁干扰进行分离并取得了较好的应用效果(李晋等, 2017a, b汤井田等, 2017).Di et al.(2018)也提出了伪随机编码发射,时间序列实时相干解码接收,在去噪技术上有重要突破,实际深部找矿应用中效果显著.

在时域中处理MT噪声必须十分谨慎,确保微弱的信号不被滤除,否则即使得到了光滑的测深曲线,其正确性也无法保证,可能导致错误的地质解释.为了提高时间域去噪的精度,更多挖掘合成天然电磁场信号之间的内在关系,近年来学者们利用同步观测的天然电磁场在一定区域内具有相关性的特点,利用参考点数据合成本地点信号,用于替换本地点的噪声段数据,达到去噪的目的.Kappler(2012)方法通过对同步大地电磁数据进行维纳滤波,利用同步观测的参考点磁场数据,在时间域合成本地点信号,再利用方差比识别噪声,用合成信号替换噪声,达到去除突变噪声的目的,该方法可以提高低频数据质量,但对滤波后数据精确度缺乏有效验证,还会引入阶跃噪声.王辉等(2014)提出基于同步大地电磁时间序列依赖关系的去噪方法,该方法可以有效去除强噪声干扰,结合远参考方法可以抑制中高频段的近场源效应,同时保留了微弱的有效信号.Wang等(2017)提出STIN方法(Synthesis of natural electric and magnetic Time-series using Inter-station transfer functions and time-series from a Neighboring site,简称STIN),通过对站间传递函数进行傅里叶反变换,从而得到本地点合成数据,可以实现从时间域处理噪声,但合成数据的精度依赖于站间传递函数的数据质量,对于强干扰噪声,仍难以获得较高质量的站间传递函数,其应用范围受到一定限制.以上方法的不同之处在于构建同步天然电磁之间内在关系的模型不同,其合成信号的精度也存在一定差异.

本文提出利用两个同步测点天然电磁场时间序列之间的单位脉冲响应,合成本地点电磁场数据(Synthesis natural electric and magnetic Time series of local site using an Impulse Response and a reference),方法简称STIR,用合成数据替换本地点含噪声时段的数据,从时间域去除大地电磁噪声.

1 基本原理

大地电磁测深方法假设电磁波以均匀平面波的形式入射地表,通过在地表上观测水平电磁场,就可以获得代表地下物质电性结构的阻抗.设本地测点L和参考测点R的时间域电场和磁场分别为elhlerhr,在频率域中分别为ElHlErHr.通常大地电磁测深方法中的阻抗是指同一测点电场与磁场之间的传递函数,对本地点来说,Zl阻抗满足(Cagniard, 1953):

(1)

其中,El=FFT(el),Hl=FFT(hl),式中电场E和磁场H分别包括两个互相正交的分量[Ex, Ey]和[Hx, Hy],因此Z是2×2的复数张量,Z=

当存在两个或多个同步测点时,其中任意一个测点的电场或磁场与另一个测点磁场之间的传递函数,称之为站间传递函数(Egbert, 1997).包括拟阻抗和水平磁场传递函数,分别为:

(2a)

(2b)

Zlr为本地点电场El与参考点磁场Hr之间的传递函数,由于HlHr具有较高的相关性,当参考点与本地点距离不远时,Zlr近似于Zl,也称拟阻抗.Mlr为本地点磁场Hl与参考点磁场Hr之间的传递函数,称为水平磁场传递函数.

根据卷积定理,可以将公式(2a)和(2b)改写为时间域的卷积形式:

(3a)

(3b)

对于离散数据,上式可以改写为

(4a)

(4b)

其中zm分别表示拟阻抗和水平磁场传递函数在时间域的离散脉冲响应(Discrete Time domain Impulse Responses, DTIR).实际情况下,考虑噪声的影响,(4)式的无穷求和可以统一写为有限长度单位脉冲响应(Finite Impulse Response,FIR)的求和形式(Ljung, 1985):

(5a)

式(5a)可以改写为矩阵形式:

(5b)

其中:

(5c)

(5d)

y为模型输出信号,本文中具体为本地点合成的电场[elx, ely]与磁场[hlx, hly], u为模型输入信号,本文中为参考点磁场[hrx, hry],n表示单位脉冲响应函数的阶数,ε为噪声.h表示模型单位脉冲响应函数,本文中为拟阻抗zlr和水平磁场传递函数mlr的时间域单位脉冲响应,zlrmlr也是一个2×2阶的矩阵,分别为,若已知h,结合参考点磁场数据,可以利用式(4a)和(4b)得到本地点的电场与磁场时间序列.

h可以通过最小二乘法估算得到(Ljung, 1985),具体如下:

目标函数设为

(6)

其中,

(7)

最小二乘法以均分误差最小,即要求:

(8)

上式的解为(Ljung, 1985):

(9)

即为估算的单位脉冲响应,当噪声与信号无关,且满足高斯分布时,通过增大脉冲响应的阶数,可以获得真实的单位脉冲响应,实际数据含有噪声,通过设定阈值,当均方误差小于阈值时,即认为估算的单位脉冲响应精度满足要求(Chen et al., 2012b).

Egbert等(1992)指出大地电磁场离散时间序列之间的单位脉冲响应函数是非因果的,反映在估算的单位脉冲响应函数h中,具有小于零时刻的值.因此,式(5c)和(5d)可以写为:

(10a)

(10b)

其中n>0,m为该单位脉冲响应中非因果部分的阶数(m>0).

一般情况下,地下物质的电性结构不随时间变化,因此测点之间的站间传递函数也不随时间变化,所以可以利用某一时段站间传递函数的单位脉冲响应函数,结合参考点磁场数据,根据(4)式合成本地点任意时段的电场和磁场时间序列(参考点磁场所采集的时段内).

2 实测高信噪比数据的试算

为了验证本文STIR方法的可行性,选用一组高信噪比的实测大地电磁数据进行模拟试算,将合成数据与原始数据进行对比,讨论合成数据的精度,以及参考点对合成数据的影响.为此,选择西藏地区的A、B和C三个MT测点,如图 1所示,采用加拿大凤凰地球物理公司的V5系列大地电磁仪器进行采集,测点同步采集时间为11 h,测点附近没有人文噪声干扰,数据质量较好.首先以测点A为本地点,B为参考点,利用STIR方法,合成本地点A的电磁场信号.具体步骤如下:

图 1 大地电磁测点分布,A、B、C测点位于西藏阿里地区,远离人文活动区域 Fig. 1 Location of the MT sites (A, B, and C) in the north of Tibet. The sites are far away from any city or other human activity area

第一步,选择模型先验数据,估算单位脉冲响应函数h.从测点A和B同步之后的时间序列中,随机选择一段2 min的离散数据(采样率15 Hz,共1800个采样点),前1 min数据用于(9)式估算单位脉冲响应函数,后1 min数据作为验证数据,利用(4)式计算实测数据与合成数据的差值,评价所估算单位脉冲响应函数的有效性,利用拟合系数(Fit percent parameter, FITP)评价所估算单位脉冲响应函数的有效性,拟合系数的定义如下(Chen et al., 2012b):

(11)

其中x为实测数据(测点A的原始数据),y为合成数据(利用单位脉冲响应和参考点B,合成的测点A数据).‖‖表示L2的范数,拟合系数表示合成数据与实际数据的吻合度,其范围为负无穷至100%,如果两者完全一致,拟合系数为100%,拟合系数越小,表示合成数据与实测数据差别越大,意味着估算的单位脉冲响应误差较大.

图 2是拟合系数随单位脉冲响应函数阶数n及非因果部分阶数m的变化,图中只给出了exhy的结果,eyhx的结果类似,文中未给出.从图中可以看出,当模型阶数增大到一定数值时,拟合系数不再增大,对ex来说,最佳的模型阶数与非因果部分阶数分别为n=36、m=3,此时拟合系数为85.9%,对hy来说,最佳的模型阶数与非因果部分阶数分别为n=12、m=1,此时拟合系数为81.4%.此时对应的最佳单位脉冲响应函数如图 3所示,对Zlr而言,XY模式的单位脉冲响应系数要大于XX模式,这表示本地点的ex主要由参考点hy有关,对Mlr而言,YY响应远大于YX的响应,表明本地点的hy几乎只与参考点hy有关,与hx无关.

图 2 拟合系数随单位脉冲响应函数阶数n和非因果阶数m的变化 (a) ex, (b) hy. Fig. 2 Fit percent of FIR model with different model order n and feedback order m. (a) ex, (b) hy
图 3 天然电磁场站间单位脉冲响应函数 (a) zlrxx; (b) zlrxy; (c) mlryx; (d) mlryy. Fig. 3 Finite impulse response of quais-impedance

第二步,合成本地点电场与磁场数据.由上一步估算的单位脉冲响应函数h和参考点磁场数据[hrx, hry],利用式(4a)和(4b)分别合成本地点电场和磁场数据.为了定量评价合成数据的精度,采用拟合系数、相关系数(Correlated coefficient, CORC)和信噪比(Signal to noise ratio, SNR)三个参数进行比较(Wang et al., 2017),相关系数和信噪比的定义如下:

(12)

(13)

其中x表示实测数据,y表示合成数据,N表示数据长度.

相关系数表示合成数据与实测数据的相似程度,而不考虑幅值的变化,信噪比表示实测数据与残差(实测数据与合成数据之间的差值)功率的比值.理想情况下,希望合成数据与实测数据完全一致,即拟合系数接近100%,相关系数接近1,而信噪比越大越好.信噪比等于0表示实际数据与残差具有相当的功率,等于10 dB表示实际数据功率是残差功率的10倍,信噪比等于20 dB表示实际数据功率是残差功率的100倍.

图 4为任意一段合成数据与实测数据的对比,其中图 4a14b1为1 h数据,图 4a24b2为将图 4a14b1虚线标出区域放大后的1 min数据,图 4a34b3为将图 4a24b2虚线标出区域放大后的10s数据.图 5图 4对应的频谱图,从图 4图 5中可以发现.对磁场而言,无论是高频还是低频,合成数据精度都较高,在时间域合成数据与原始数据的相关系数大于0.97,拟合系数大于75%,信噪比大于12 dB,在频率域,两者的相关系数大于0.99,拟合系数大于62%,信噪比大于8 dB.对电场而言,高频部分电场合成数据与原始数据精度较高,在时间域两者的相关系数大于0.99,拟合系数大于86%,信噪比大于17 dB(图 4a2图 4a3),在频率域两者相关系数大于0.99,拟合系数大于95%,信噪比大于23 dB(图 5a2图 5a3),但低频部分合成数据噪声较大(图 4a1图 5a1),这是因为天然磁场信号具有区域性,不同测点磁场低频信号的相似性仍较高,而电场与磁场之间的相关性随着频率的降低而降低(Egbert et al., 1992),加之电场信号容易受到噪声干扰和电极极差漂移等非感应信号的影响,因此,电场难以获得高精度的低频合成信号.

图 4 测点A合成数据(以测点B为参考点)与原始数据的时间序列对比 红色实线表示原始数据,绿色实线表示合成数据,蓝色实线表示原始数据与合成数据的残差. (a) ex不同长度时间序列: (a1) 1 h, (a2) 1 min, (a3) 10 s, (b) hy不同长度时间序列:(b1) 1 h, (b2) 1 min, (b3) 10 s.原始数据与合成数据的相关系数、拟合系数及信噪比见各子图. Fig. 4 Comparison between the measured field time-series (red) of site A and the synthesized time-series (green) using STIR (a) ex time series with differing data lengths: (a1) 1 minute(a2) 10 seconds; (b) hy with differing data lengths: (b1) 1 minute (b2) 10 seconds. The correlation coefficient (CORC), fit percent (FITP) and SNR are shown in each sub-Figure to qualify the accuracy of STIR.
图 5 测点A合成数据(以测点B为参考点)与原始数据的频谱对比 红色实线表示原始数据,绿色实线表示合成数据,蓝色实线表示原始数据与合成数据残差的频谱. (a) ex不同长度时间序列对应的频谱:(a1) 1 h, (a2) 1 min, (a3) 10 s. (b) hy不同长度时间序列对应的频谱:(b1) 1 h, (b2) 1 min, (b3) 10 s.原始数据与合成数据的相关系数、拟合系数及信噪比见各子图. Fig. 5 Spectra of measured field time-series (red) of site A and the synthesized time-series (green) in Fig. 4 (a) ex time series with differing data lengths: (a1) 1 minute (a2) 10 seconds; (b) hy with differing data lengths:(b1) 1 minute (b2) 10 seconds; (c) Ex spectra with differing data lengths: (c1) 1 minute (c2) 10 seconds. (d) hy spectra with differing data lengths: (d1) 1 minute (b2) 10 seconds. The correlation coefficient (CORC), fit percent (FITP) and SNR are shown in each sub-Figure to qualify the accuracy of STIR.

为了测试不同参考点对合成数据的影响,选择距离测点A较远的测点C作为参考点,按照上述步骤,合成本地点A数据,合成数据与实测数据的对比如图 6所示,其结果与图 4图 5类似,无论从时间域还是从频率域对比,对于高频部分数据,电场与磁场的合成数据精度都较高,说明在一定区域范围内,合成数据的精度与参考点的选取位置关系不大.

图 6 测点A合成数据(以测点C为参考点)合成数据与原始数据时间序列和频谱的对比 红色实线表示原始数据,绿色实线表示合成数据,蓝色实线表示原始数据与合成数据的残差. (a) ex不同长度时间序列: (a1) 1 min, (a2) 10 s; (b) hy不同长度时间序列: (b1) 1 min, (b2) 10 s, (c)图(a)中ex不同长度时间序列对应的频谱: (c1) 1 min, (c2) 10 s. (d)图(b)中hy不同长度时间序列对应的频谱: (d1) 1 min, (d2) 10 s.原始数据与合成数据的相关系数、拟合系数及信噪比见各子图. Fig. 6 Comparison between the measured field time-series (red) of site A and the synthesized time-series (green) using STIR (site C as the reference) (a) ex time series with differing data lengths: (a1) 1 min (a2) 10 s. (b) hy with differing data lengths: (b1) 1 min; (b2) 10 s. (c) Ex spectra with differing data lengths: (c1) 1 min; (c2) 10 seconds. (d) hy spectra with differing data lengths: (d1) 1 minute; (b2) 10 seconds. The correlation coefficient (CORC), fit percent (FITP) and SNR are shown in each sub-Figure. The results are agree with Fig. 4 and Fig. 5.

能否选择一小段高信噪比模型先验数据,获得长段高精度合成数据呢?为此,测试合成数据精度与合成数据长度的关系,模型先验数据长度固定为1800个采样点,图 7为合成数据长度与合成数据精度变化的关系,总体上电场合成数据的精度随着合成数据长度的增大而降低,磁场变化不大.从图 7可知,为了同时获得高信噪比的电场与磁场合成数据,对于本文所选择的测试数据而言,合成数据的长度不宜大于5000个采样点,此时可以同时保证合成数据的相关系数大于0.9,拟合系数大于70%,信噪比大于10 dB.

图 7 合成数据精度随合成数据长度的变化 (a)合成数据与原始数据之间的相关系数; (b)拟合系数; (c)信噪比. Fig. 7 The fitness of the measured field time series of site A and the synthesized time series using STIR, when the length of synthetic data increasing (a) Correlation coefficient; (b) Fit percent; (c) SNR.
3 实测含噪数据的处理

为了验证本文方法对实测数据的处理效果,选择一个受噪声干扰较为严重的A′号测点进行处理,如图 8所示,该测点位于湖南衡阳某钨矿附近,几乎被矿区包围,受矿区近场源电磁强噪声干扰(王辉等,2016),参考点B′位于A′号测点西南方向130 km处,数据质量较好,两测点同步时长约为40.5 h.采用STIR方法对测点A′时间序列进行去噪处理:

图 8 实测含噪声大地电磁测点分布 测点A′为本地点,位于矿区附近,图中实线标出区域为正在开采的矿区,参考点B′位于测点A′的西南方向130 km处. Fig. 8 Location of MT sites in South of China Sites A′ was surrounded by the mining area (solid line). Electric and magnetic fields are affected by cultural noise. Reference site B′ was laid in the southeast of site A′, and the distance is 130 km.

首先利用方差比方法识别在时间域识别噪声,其基本原理是基于相同分量同步观测的电磁场在不同地区具有相关性的特点,来识别噪声,该方法可以在时间域快速有效判别噪声(Kappler, 2012; 王辉等, 2014; Wang et al., 2017),阈值通过人为设置,大于阈值的部分被标识为噪声,其结果如图 9所示,可以发现,测点A′的电场的大部分时段受到了严重的相关噪声影响,而磁场受噪声干扰相对较小.

图 9 利用方差比方法识别测点A′噪声所在的窗口 虚线表示阈值,大于阈值的时段被标识为含噪声窗口,如电场所在0~2000, 3000~6000和7000~7700窗口.
(a) ex; (b) ey; (c) hx; (d) hy.
Fig. 9 Variance ratio of electric and magnetic fields at site A′ using site B′ as a reference time-series Variance ratios greater than the threshold (dash line) are flagged as noisy windows. The window length is 300 data points. (a) ex component; (b) ey component; (c) hx component; (d) hy component. ex and ey are severely contaminated by correlated noise in windows 0 to 2000, 3000 to 6000, and 7000 to 7700 as shown in (a) and (b).

对于实测含人文噪声的数据而言,噪声不满足高斯分布,因此, 模型先验数据的选择至关重要,对于本例而言,首先通过图 9判断受噪声干扰较小的时段,如从不含明显人文噪声的6000~7000个窗口(窗口长度为300个采样点)中,人为选择较为干净的2 min数据作为先验数据.利用最小二乘法估算站间单位脉冲响应函数,再结合参考点磁场数据合成本地点电场与磁场数据,最后将合成数据替换含本地点含噪声窗口的数据,获得本地点去噪后的新数据,数据替换时在窗口的两端对数据进行平滑以避免引入噪声(Wang et al., 2017).测点A′去噪后的数据与原始数据的对比如图 10所示,由于磁场受噪声影响较小,图中只给出了电场的结果,可以发现,去噪后的电场时间序列消除了较为明显的人文噪声,如图 10中矩形框标出部分与图 9大于阈值部分对应.图 10a2图 10b2分别为图 10a1图 10b1虚线标出T1时段1 h的时间序列,图 10a3图 10b3分别为图 10a2图 10b2虚线标出T2时段1 min的时间序列,从中可以发现,去噪后的新数据去除了较为明显的人文强干扰噪声,如脉冲和方波等典型人文强噪声.

图 10 测点A′原始数据(红色)与去噪后数据(绿色)的对比 (a) ex,(a1)1 h数据,(a2)图(a1)T1时段的1 min数据, (a3)图(a2) T2时段10秒钟数据; (b) ey,(b1) 1 h数据,(b2)图(b1) T1时段的1 min数据, (b3)图(b2)T2时段10 s数据. Fig. 10 (a) ex time series of site A′ original time series (red) and using STIR method (green) (a1) 1 hour segment, (a2) 1 minute of the T1 segment in Fig. 10 (a1) 10 secs of the T2 segment in Fig. 10 (a2). (b) ey time series of site A′ original time series (gray) and using STIR method (black), (b1) 1 hour segment, (b2) 1 minute of the T1 segment in Fig. 10 (b1), (b3) 10 secs of the T2 segment in Fig. 10 (b2).

图 11是测点A′原始数据与去噪后数据的测深曲线及其误差的对比,数据采用开源的EMTF代码进行处理(Egbert and Booker, 1986),以B′为参考点,采用远参考方法处理.对比原始数据与去噪后数据的测深曲线可以发现,原始数据视电阻率曲线与相位曲线在10 s附近存在明显的噪声干扰,同时低频数据质量也较差,导致估算误差在该频段增大,而去噪后数据对应的视电阻率曲线和相位曲线更为光滑,尤其是10 s附近和低频段数据,有了明显的改善,同时大幅降低了估算的误差,使得绝大部分频段的估算误差小于5%(图 11b中虚线所示).

图 11 测点A′原始数据与去噪后数据的大地电磁测深曲线及其误差对比 (a) XY模式和YX模式视电阻率及相位曲线; (b) XYYX模式阻抗估算误差,图中虚线表示5%. Fig. 11 (a) Apparent resistivity and phase of site A′ when processing the original time-series (black), and time-series cleaned using STIR (white). (b) Comparison between the errors in the Zxy and Zyx components of site A′ when processing the original time-series, and the time-series cleaned by STIR. The dashed line indicates the 5% error.
4 讨论

如何提高干扰地区大地电磁数据的信噪比,已经成为制约大地电磁方法应用的一个重要因素.从时间域进行噪声去除,思路简单,难点在于如何保证合成数据或去噪后数据的精度.STIN方法和本文提出STIR的方法,其物理前提都是基于不同测点之前电磁场都满足平面波的假设条件,两者的区别在于前者利用天然电磁场在频率域线性关系(式(2)),对站间传递函数进行傅里叶逆变换,得到时间域电磁场信号,后者利用天然电磁场在时间域的卷积关系(式(3)),直接合成本地点时间域电磁场.STIN方法的合成数据精度依赖于全时段的站间传递函数和参考点数据质量,其优点在于合成数据在全频段都具有较高的质量(Wang et al., 2017),而STIN只要求本地点数据在观测的某一时段内是不受人文噪声干扰的(STIR方法不适用于持续不断电磁干扰,如电网等),而参考点在全时段受噪声干扰较小,至少应该保证本地点受噪声干扰时段内,参考点数据质量较好,才能保证用于替换噪声数据段的合成数据精度较高.

STIR方法合成数据的精度取决于站间单位脉冲响应函数的估算精度,以及参考道数据的信噪比.而单位脉冲响应的估算精度主要与选取的先验数据有关,因此,先验数据的选取及参考道的信噪比对合成数据的精度至关重要.实际中可以通过人为选择一段较为干净(图 9中,方差比基本不变的时段)的数据,作为先验数据,便可以得到精度较高的合成数据.诚然,合成数据必然会引入噪声,但是相对于人文强干扰,其噪声水平小了很多,采用常规Robust估计和远参考方法,便可以去除,获得较为可靠的阻抗(Kappler, 2012).反之,如果不进行去噪,原始数据中保留了这类强噪声,且是相关噪声,通过Robust估计等常规方法难以去除,最终导致测深曲线存在“飞点”或“视电阻率曲线在双对数坐标下呈45°上升,相位趋于0°的近场源干扰现象”.当然,有时合成数据引入的噪声可能比原始数据的噪声更大,这时通过方差比进行判断噪声水平,如果合成数据的方差比,比原始数据方差比还大,说明合成数据精度不够,其噪声水平比原始数据中噪声水平还高,则不进行替换,保留原始数据,从而保证不“过度去噪”.

STIR方法的去噪效果不仅与合成数据的精度有关,还与噪声识别的精度有关,即与方差比的阈值选择有关,阈值的选择不仅与测点间电磁场时间域信号的幅值比有关,还与窗口的长度有关,实际中通过对比不受干扰时段的窗口(如图 9所示,方差比基本不变的时段),通过人为设定阈值,容易判断噪声所在的窗口.除了采用方差比,还可以参用相干度、小波系数等参数在时间域判别大地电磁信号与人文噪声(Trad and Travassos, 2000).虽然STIR方法可以获得较高精度的本地点电磁场信号,为了确保不引入过多噪声,实际去噪过程中,只针对被识别为噪声部分的数据进行去噪.

从本文的试验结果来看,实际工作中,可以将参考点布设在远离噪声干扰的区域,即使参考距离大于500 km(图 1中测点A与测点C的距离大于500 km)也不会影响合成数据的精度.对于模型先验数据的选择,可以选择方差比方法判别为不受噪声干扰的时段,还可以人为手动选择,阈值的选择,不同的参考点有所不同,建议人为选择.模型先验数据的长度也不易太长,由于实测数据不可避免含有噪声,尤其是电场数据容易受到噪声的影响(人文噪声、自然电位和电极极差漂移等),导致估算的单位脉冲响应误差较大.从本文的实验看来,对于15 Hz的采样数据,2 min(1800个采样点)的数据足够估算精度较高的单位脉冲响应.

STIR方法适用于对间断噪声进行时间域处理,可以较为明显的提高中高频带的数据质量,同时可以避免强脉冲、方波等高频噪声扩散至整个频带,改善低频数据质量.合成数据还可以直接用于替换缺失时段的数据(如电源断电),将数据进行拼接.理论上,还可以利用参考点的电场数据合成本地点的电磁场,实际中由于电场资料容易受到干扰,合成数据的质量比不上以磁场为参考,本文中没有给出相关结果.

5 结论

本文基于站间天然电磁场单位脉冲响应函数,结合参考点磁场数据,合成本地点电磁场时间序列,用合成数据替换本地点受噪声时段的数据,实现从时间域去除大地电磁噪声.该方法的优点在于:①即使本地点存在相关噪声的情况下,选择一小段不受噪声干扰的时间序列,便可以合成任意时刻本地点电磁场时间序列信号,且合成信号的精度较高;②用合成数据替换本地点噪声数据,可以有效去除大地电磁噪声,提高阻抗数据质量,降低阻抗估算误差,以获得地下物质真实的电性结构信息.

致谢  本文中的实测大地电磁测深数据取自于国家科技专项“深部探测技术与实验研究”(SinoProbe)下属的“大陆电磁参数标准网实验研究”(SinoProbe-01,SinoProbe-01-02)和“大地电磁测深大剖面观测实验与壳/幔三维电性研究”(SinoProbe-02-04),在此对项目组所有成员表示感谢.感谢两位审稿人对论文的认真评审和给出的修改意见.
References
Cagniard L. 1953. Basic Theory of the magnetotelluric method of geophysical prospecting. Geophysics, 18(3): 605-635. DOI:10.1190/1.1437915
Cai J H, Tang J T, Hua X R, et al. 2009. An analysis method for magnetotelluric data based on the Hilbert-Huang Transform. Exploration Geophysics, 40(2): 197-205. DOI:10.1071/EG08124
Cai J H. 2014. A combinatorial filtering method for magnetotelluric time-series based on Hilbert-Huang transform. Exploration Geophysics, 45(2): 63-73. DOI:10.1071/EG13012
Chen J, Heincke B, Jegen M, et al. 2012a. Using empirical mode decomposition to process marine magnetotelluric data. Geophysical Journal International, 190(1): 293-309. DOI:10.1111/gji.2012.190.issue-1
Chen T S, Ohlsson H, Ljung L. 2012b. On the estimation of transfer functions, regularizations and Gaussian processes-Revisited. Automatica, 48(8): 1525-1535. DOI:10.1016/j.automatica.2012.05.026
Di Q Y, Xue G Q, Lei D, et al. 2018. Geophysical survey over molybdenum mines using the newly developed M-TEM System. Journal of Applied Geophysics, 158: 65-70. DOI:10.1016/j.jappgeo.2018.07.008
Egbert G D, Booker J R. 1986. Robust estimation of geomagnetic transfer functions. Geophysical Journal International, 87(1): 173-194. DOI:10.1111/gji.1986.87.issue-1
Egbert G D, Booker J R, Schultz A. 1992. Very long period magnetotellurics at tucson observatory:estimation of impedances. Journal of Geophysical Research:Solid Earth, 97(B11): 15113-15128. DOI:10.1029/92JB01252
Egbert G D. 1997. Robust multiple-station magnetotelluric data processing. Geophysical Journal International, 130(12): 475-496.
Escalas M, Queralt P, Ledo J, et al. 2013. Polarisation analysis of magnetotelluric time series using a wavelet-based scheme:a method for detection and characterisation of cultural noise sources. Physics of the Earth and Planetary Interiors, 2013, 218: 31-50.
Gamble T D, Goubau W M, Clarke J. 1979. Magnetotellurics with a remote magnetic reference. Geophysics, 44(1): 53-68. DOI:10.1190/1.1440923
Goubau W M, Maxton P M, Koch R H, et al. 1984. Noise correlation lengths in remote reference magnetotellurics. Geophysics, 49(4): 433-438. DOI:10.1190/1.1441678
Huang N E, Shen Z, Long S R, et al. 1998. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis. Proceedings of the Royal Society of London. Series A:Mathematical, Physical and Engineering Sciences, 454(1971): 903-995. DOI:10.1098/rspa.1998.0193
Jin S, Wei W B, Wang S, et al. 2010. Discussion of the formation and dynamic signification of the high conductive layer in Tibetan crust. Chinese Journal of Geophysics (in Chinese), 53(10): 2376-2385. DOI:10.3969/j.issn.0001-5733.2010.10.011
Junge A. 1996. Characterization of and correction for cultural noise. Surveys in Geophysics, 17(4): 361-391. DOI:10.1007/BF01901639
Kappler K N. 2012. A data variance technique for automated despiking of magnetotelluric data with a remote reference. Geophysical Prospecting, 60(1): 179-191. DOI:10.1111/gpr.2012.60.issue-1
Larsen J C. 1989. Transfer functions:Smooth robust estimates by least-squares and remote reference methods. Geophysical Journal International, 99(3): 645-663. DOI:10.1111/gji.1989.99.issue-3
Li J, Tang J T, Wang L, et al. 2014. Noise suppression for magnetotelluric sounding data based on signal subspace enhancement and endpoint detection. Acta Physica Sinica (in Chinese), 63(1): 019101.
Li J, Tang J T, Xu Z M, et al. 2017a. Magnetotelluric noise suppression base on signal-to-noise identification in ore concentration area. Chinese Journal of Geophysics (in Chinese), 60(2): 722-737. DOI:10.6038/cjg20170224
Li J, Tang J T, Yan H, et al. 2017b. Identification and spearation of magnetotelluric signal and noise based on recurrence analysis and clustering. Chinese Journal of Geophysics (in Chinese), 60(5): 1918-1936. DOI:10.6038/cjg20170525
Liu J X, Yan J B, He J S, et al. 2003. Robust estimation method of sea magnetotelluric impedance based on correlative coefficient. Chinese Journal of Geophysics (in Chinese), 46(2): 241-245.
Ljung L. 1985. On the estimation of transfer functions. Automatica, 21(6): 677-696. DOI:10.1016/0005-1098(85)90042-1
Neukirch M, Garcia X. 2014. Nonstationary magnetotelluric data processing with instantaneous parameter. Journal of Geophysical Research:Solid Earth, 119(3): 1634-1654. DOI:10.1002/2013JB010494
Schaa R, Gross L, Du Plessis J. 2016. PDE-based geophysical modelling using finite elements:examples from 3D resistivity and 2D magnetotellurics. Journal of Geophysics and Engineering, 13(2): S59-S73. DOI:10.1088/1742-2132/13/2/S59
Shalivahan N, Bhattacharya B B. 2002. How remote can the far remote reference site for magnetotelluric measurements be?. Journal of Geophysical Research:Solid Earth, 107(6): 2105. DOI:10.1029/2000JB000119
Sims W E, Bostick J X, Smith H W. 1971. The estimation of magnetotelluric impedance tensor elements from measured data. Geophysics, 36(5): 938-942. DOI:10.1190/1.1440225
Tang J T, Hua X R, Cao Z M, et al. 2008. Hilbert-Huang transformation and noise suppression of magnetotelluric sounding data. Chinese Journal of Geophysics (in Chinese), 51(2): 603-610.
Tang J T, Li J, Xiao X, et al. 2012a. Mathematical morphology filtering and noise suppression of magnetotelluric sounding data. Chinese Journal of Geophysics (in Chinese), 55(5): 1784-1793. DOI:10.6038/j.issn.0001-5733.2012.05.036
Tang J T, Xu Z M, Xiao X, et al. 2012b. Effect rules of strong noise on magnetotelluric (MT) sounding in the Luzong ore cluster area. Chinese Journal of Geophysics (in Chinese), 55(12): 4147-4159. DOI:10.6038/j.issn.0001-5733.2012.12.027
Tang J T, Ren Z Y, Zhou C, et al. 2015. Frequency-domain electromagnetic methods for exploration of the shallow subsurface. Chinese Journal of Geophysics (in Chinese), 58(8): 2681-2705. DOI:10.6038/cjg20150807
Tang J T, Li G, Xiao X, et al. 2017. Strong noise separation for magnetotelluric data based on a signal reconstruction algorithm of compressive sensing. Chinese Journal of Geophysics (in Chinese), 60(9): 3642-3654. DOI:10.6038/cjg20170928
Tary J B, Herrera R H, Han J J, et al. 2014. Spectral estimation-what is new? What is next?. Reviews of Geophysics, 52(4): 723-749. DOI:10.1002/2014RG000461
Trad D O, Travassos J M. 2000. Wavelet filtering of magnetotelluric data. Geophysics, 65(2): 482-491. DOI:10.1190/1.1444742
Wang H, Wei W B, Jin S, et al. 2014. Removal of magnetotelluric noise based on synchronous time series relationship. Chinese Journal of Geophysics (in Chinese), 57(2): 531-545. DOI:10.6038/cjg20140218
Wang H, Cheng J L, Teng X Z, et al. 2016. Source effect on magnetotelluric data due to mining area and its suppression. Progress in Geophysics (in Chinese), 31(3): 1358-1366. DOI:10.6038/pg20160359
Wang H, Campanyà J, Cheng J L, et al. 2017. Synthesis of natural electric and magnetic time-series using inter-station transfer functions and time-series from a neighboring site (STIN):applications for processing MT data. Journal of Geophysical Research:Solid Earth, 122(8): 5835-5851. DOI:10.1002/2017JB014190
Wang S M, Wang J Y. 2004. Analysis on statistic characteristics of magnetotelluric signal. Acta Seismologica Sinica (in Chinese), 26(6): 669-674.
Wei W B, Unsworth M, Jones A, et al. 2001. Detection of widespread fluids in the Tibetan crust by magnetotelluric studies. Science, 292(5517): 716-719. DOI:10.1126/science.1010580
Xu Y X, Wang J Y. 2000. Power spectrum estimation for magnetotelluric signal based on continuous wavelet transform. Chinese Journal of Geophysics (in Chinese), 43(5): 677-683.
Zhao G Z, Chen X B, Tang J. 2007. Advanced geo-electromagnetic methods in China. Progress in Geophysics (in Chinese), 22(4): 1171-1180.
Zhao G Z, Chen X B, Wang L F, et al. 2008. Evidence of the electromagnetic probe on the eastern edge crust "pipe flow" layer. Science Bulletin (in Chinese), 53(3): 345-350.
金胜, 魏文博, 汪硕, 等. 2010. 青藏高原地壳高导层的成因及动力学意义探讨-大地电磁探测提供的证据. 地球物理学报, 53(10): 2376-2385. DOI:10.3969/j.issn.0001-5733.2010.10.011
李晋, 汤井田, 王玲, 等. 2014. 基于信号子空间增强和端点检测的大地电磁噪声压制. 物理学报, 63(1): 019101.
李晋, 汤井田, 徐志敏, 等. 2017a. 基于信噪辨识的矿集区大地电磁噪声压制. 地球物理学报, 60(2): 722-737. DOI:10.6038/cjg20170224
李晋, 汤井田, 燕欢, 等. 2017b. 基于递归分析和聚类的大地电磁信噪辨识及分离. 地球物理学报, 60(5): 1918-1936. DOI:10.6038/cjg20170525
柳建新, 严家斌, 何继善, 等. 2003. 基于相关系数的海底大地电磁阻抗Robust估算方法. 地球物理学报, 46(2): 241-245. DOI:10.3321/j.issn:0001-5733.2003.02.018
汤井田, 化希瑞, 曹哲民, 等. 2008. Hibert-Huang变换与大地电磁噪声压制. 地球物理学报, 51(3): 603-610.
汤井田, 李晋, 肖晓, 等. 2012a. 数学形态滤波与大地电磁噪声压制. 地球物理学报, 55(5): 1784-1793. DOI:10.6038/j.issn.0001-5733.2012.05.036
汤井田, 徐志敏, 肖晓, 等. 2012b. 庐枞矿集区大地电磁测深强噪声的影响规律. 地球物理学报, 55(12): 4147-4159. DOI:10.6038/j.issn.0001-5733.2012.12.027
汤井田, 任政勇, 周聪, 等. 2015. 浅部频率域电磁勘探方法综述. 地球物理学报, 58(8): 2681-2705. DOI:10.6038/cjg20150807
汤井田, 李广, 肖晓, 等. 2017. 基于压缩感知重构算法的大地电磁强干扰分离. 地球物理学报, 60(9): 3642-3654. DOI:10.6038/cjg20170928
王辉, 魏文博, 金胜, 等. 2014. 基于同步大地电磁时间序列依赖关系的噪声处理. 地球物理学报, 57(2): 531-545. DOI:10.6038/cjg20140218
王辉, 程久龙, 腾星智, 等. 2016. 矿区近场源噪声对大地电磁测深数据的影响及其压制方法. 地球物理学进展, 31(3): 1358-1366. DOI:10.6038/pg20160359
王书明, 王家映. 2004. 大地电磁信号统计特征分析. 地震学报, 26(6): 669-674. DOI:10.3321/j.issn:0253-3782.2004.06.013
徐义贤, 王家映. 2000. 基于连续小波变换的大地电磁信号谱估计方法. 地球物理学报, 43(5): 677-683. DOI:10.3321/j.issn:0001-5733.2000.05.011
赵国泽, 陈小斌, 汤吉. 2007. 中国地球电磁法新进展和发展趋势. 地球物理学进展, 22(4): 1171-1180. DOI:10.3969/j.issn.1004-2903.2007.04.024
赵国泽, 陈小斌, 王立凤, 等. 2008. 青藏高原东边缘地壳"管流"层的电磁探测证据. 科学通报, 53(3): 345-350. DOI:10.3321/j.issn:0023-074X.2008.03.011