文章快速检索    
  地震地磁观测与研究  2023, Vol. 44 Issue (4): 63-67  DOI: 10.3969/j.issn.1003-3246.2023.04.010
0

引用本文  

尹康达, 李小军, 张晓刚, 等. 台基噪声功率谱估计中的Welch参数选择[J]. 地震地磁观测与研究, 2023, 44(4): 63-67. DOI: 10.3969/j.issn.1003-3246.2023.04.010.
YIN Kangda, LI Xiaojun, ZHANG Xiaogang, et al. Selection of Welch parameters in seismic station noise power spectrum estimation[J]. Seismological and Geomagnetic Observation and Research, 2023, 44(4): 63-67. DOI: 10.3969/j.issn.1003-3246.2023.04.010.

基金项目

2021年河北省地方标准制修订项目计划(第二批)(项目编号:FW202154)

作者简介

尹康达(1987-), 男, 工程师, 主要从事地震观测技术研究工作。E-mail: yinkangda@126.com

文章历史

本文收到日期:2023-04-05
台基噪声功率谱估计中的Welch参数选择
尹康达 1),2)   李小军 1),2)   张晓刚 1),2)   丁成 1),2)     
1) 中国邢台 054000 河北红山巨厚沉积与地震灾害国家野外科学观测研究站;
2) 中国石家庄 050021 河北省地震局
摘要:Welch参数的选择对台基噪声功率谱估计结果影响较大,目前尚无统一选取标准。通过比较不同Welch参数组合下功率谱密度曲线平滑度的变化规律,研究窗口长度和重叠率对功率谱估计的影响,并提出最低重叠率和匹配重叠率的概念。研究表明,当窗口长度大于50%、重叠率取值小于最低重叠率时,功率谱估计偏差较大;特定窗口长度对应一系列匹配重叠率,在匹配重叠率下的功率谱估计更准确。
关键词Welch参数    台基噪声    功率谱估计    匹配重叠率    
Selection of Welch parameters in seismic station noise power spectrum estimation
YIN Kangda 1),2)   LI Xiaojun 1),2)   ZHANG Xiaogang 1),2)   DING Cheng 1),2)     
1) Hebei Hongshan National Observatory on Thick Sediments and Seismic Hazards, Xingtai 054000, China;
2) Hebei Earthquake Agency, Shijiazhuang 050021, China Abstract
Abstract: The selection of Welch parameters has a significant impact on the estimation results of the power spectral density of seismic station noise, and there is currently no unified selection standard. By comparing the variations of the power spectral density curves smoothness at different Welch parameter combinations, this study investigates the effects of window length and overlap rate on power spectrum estimation, and introduces the concepts of minimum overlap rate and matching overlap rate. The result shows that when the window length is greater than 50%, and the overlap value is less than the minimum overlap, the bias in the power spectrum estimation is significant. A specific window length corresponds to a series of matching overlaps, and the power spectrum estimation under matching overlap is more accurate.
Key words: Welch parameters    seismic station noise    power spectrum estimation    matching overlap rate    
0 引言

地震台站噪声水平是影响观测数据质量的重要因素(林彬华等,2020),功率谱密度(power spectral density,简称PSD)是研究台基噪声并对其进行量化的重要手段(McNamara et al,2009葛洪魁等,2013杨千里等,2019)。噪声的频段范围分布较广,长周期的自然界噪声和高频段的人类活动是地震观测中的主要噪声源(葛洪魁等,2013谢江涛等,2021);可靠的台基噪声功率谱估计方法可为地震观测环境等级划分、观测数据可用性评估、地震监测能力评估、噪声源分析提取等提供依据。

地震预警系统是基于P波初始记录进行计算的。预警台站数量的迅速增加对观测数据质量提出了更高的要求(Enferadi et al,2021)。台基噪声功率谱估计及RMS计算已成为地震台网的日常工作。Welch修正周期图法(Welch,1967)是计算噪声PSD的常用方法,但对其参数的选择目前尚无统一标准,这导致计算结果存在较大偏差(Li et al,2015Xu et al,2019)。Li等(2015)对Welch方法中几个常用参数,如窗口函数、窗口长度、分段数据长度、重叠率等的选取进行了研究,发现不同参数组合对PSD的计算结果会产生较大影响。本研究在此基础上,进一步开展工作,以期对规范日常台基噪声计算中的参数选择提供参考。

1 方法 1.1 功率谱估计方法

通常用PSD来描述噪声的频域特性,评价一个地震台站的观测等级。利用Welch方法进行傅里叶变换的数据较短,在许多情况下Welch方法比其他方法计算量更少(Welch,1967),是目前进行功率谱估计的通用方法(Xu et al,2019)。该方法假设原始数据为一个二阶稳态随机序列,并将其分成若干长度相等的数据段,对分段数据进行加窗重叠,并通过修正周期图来进行谱的平滑和方差的减小,从而在一定程度上减小谱估计的误差。通常窗口长度与分段数据长度相等,文中统一称为窗口长度。Welch方法数据分段示意图如图 1所示。

图 1 Welch方法数据分段示意图 Ld为原始数据长度;S1S2,…,Sn为分段数据;窗口长度为Lc;重叠部分长度为Lo;重叠率Ro=Lo/Lc Fig.1 Record segmentation of Welch method

Welch(1967)在进行功率谱估计方法研究时,将方差作为一个重要衡量指标,从理论角度推导出了通过分段和重叠可在一定程度上减小方差,并从计算耗时角度指出,当窗口长度小于原始数据长度的平方根时,耗时更短。本文对重叠率的选择进行了研究,研究结果可对该方法进行一定的补充。

1.2 最低重叠率、匹配重叠率

窗口长度和重叠率取值组合不同,功率谱估计结果亦不同。本文从分段数据匹配的角度,研究窗口长度与重叠率间的关系。

窗口长度占比(本文简称为窗口长度)Rcd = Lc/Ld,当Rcd>50%且重叠率较小时,第2段数据末端会超出原始数据,从而导致该数据段不参与计算。当第2段数据末端与原始数据重合时(图 2),将对应的重叠率定义为最低重叠率Rom,计算公式为

$ R_{\mathrm{om}}=\frac{L_{\mathrm{c}}-\left(L_{\mathrm{d}}-L_{\mathrm{c}}\right)}{L_{\mathrm{c}}}=2-\frac{L_{\mathrm{d}}}{L_{\mathrm{c}}}=2-\frac{1}{R_{\mathrm{cd}}} $ (1)
图 2 最低重叠率示意图 Ld为原始数据长度;S1S2,…,Sn为分段数据;窗口长度为Lc;重叠部分长度为Lo;重叠率Ro=Lo/Lc Fig.2 Illustration of minimum overlap rate

当窗口长度固定时,仅当Sn末端与原始数据重合时,各段叠加之后的数据才是完整的(图 1),将此时的重叠率定义为匹配重叠率Rm;当RoRm时(图 3),Ln+1末端会超出范围,无法参与计算,使得叠加后无法完整覆盖原始数据,造成长度为Ls的数据缺失。

图 3 非匹配重叠示意图 Ld为原始数据长度;S1S2,…,Sn为分段数据;窗口长度为Lc;重叠部分长度为Lo;重叠率Ro=Lo/Lc Fig.3 Illustration of unmatching overlap

匹配重叠率计算过程如下:

能够参与计算的有效分段数为

$ n=\frac{L_{\mathrm{d}}\left(1-R_{\mathrm{cd}}\right)}{L_{\mathrm{c}}\left(1-R_{\mathrm{o}}\right)}+1=\frac{1-R_{\mathrm{cd}}}{R_{\mathrm{cd}}\left(1-R_{\mathrm{o}}\right)}+1 $ (2)

n≥2且为整数时,对应的重叠率Ro即为匹配重叠率Rm,公式为

$ R_{\mathrm{m}}=\frac{n}{n-1}-\frac{1}{R_{\mathrm{cd}}(n-1)} \quad(n=2, 3, \ldots) $ (3)

n = 2时,即最低重叠率;当n = 2,3,…,1 000时,匹配重叠率随窗口长度的变化曲线如图 4所示。当选择其下方区域的参数组合时,仅第1段数据参与计算,造成数据缺失。最低重叠率曲线可作为对Li等(2015)提出的K线的解释。

图 4 匹配重叠率随窗口长度的变化 红色曲线即最低重叠率 Fig.4 Curves of matching overlap rate with window length
1.3 平滑度评价指标

通过周期图法计算PSD时,对有限长数据的周期性拓展会产生较大的随机偏差,功率谱密度曲线波动较大,平滑度较低,Welch方法可在一定程度上改善功率谱密度曲线的平滑度。参考Welch(1967)的评价指标,通过方差来表征谱曲线的平滑度,方差计算公式如下

$ \operatorname{var}=\frac{1}{D / 2-1} \sum\nolimits_{i=1}^{D / 2}\left(p_i-p_{\mathrm{a}}\right)^2 $ (4)

其中,var为PSD曲线方差;D为原始数据采样点数;pi为各频点下的PSD值;pa为各频点PSD均值。

2 数据处理和分析

宽频带地震计具有较小的自噪声和较大的动态范围(Sleeman et al,2006李小军等,2019),是目前地震台网常用观测设备之一。选取CTS-1型甚宽频带地震计进行观测实验,由于甚宽频带地震计对温度变化较敏感(田文德等,2013),传感器安装在山洞内。选取1 h观测数据(采样率为100Hz)进行功率谱估计实验。通过改变窗口长度和重叠率,来研究其对PSD平滑度的影响,从而确定窗口长度和重叠率的合理取值区间。

数据处理基于MATLAB软件平台的Pwelch函数对记录的垂直分量进行计算。由于线性趋势会抵消低频段的频谱能量,使谱估计产生较大失真(Mcnamara et al,2004),因此,在进行功率谱计算之前,对所有记录数据进行去均值和线性趋势处理。

通过方差对功率谱密度曲线的平滑度进行定量分析。窗口长度为1%—100%,步长1%;重叠率为0—99%,步长1%,对10 000种窗口长度和重叠率的组合,进行功率谱估计实验。

按式(4)计算10 000条速度功率谱密度曲线的方差,研究不同参数组合对平滑度的影响,计算结果如图 5所示。由图 5可见,方差随重叠率和窗口长度呈阶跃式变化,突变的位置可以形成一系列曲线与图 4匹配重叠率曲线相对应。

图 5 速度PSD方差随Welch参数的变化 Fig.5 Variance of velocity PSD at different Welch parameters

随着窗口长度的增加,方差呈趋势性增大,这主要是因为未互相重叠的分段数减少,减弱了利用分段平均进行平滑的效果,虽然通过较大的重叠率,可使分段数增加,但重叠部分的平均对平滑度的改善效果不显著。

当窗口长度大于50%时,在最低重叠率下方区域方差整体偏大。由于此时没有通过取均值进行平滑的过程,且与原始数据偏差较大,此区域内方差不随重叠率而改变,为不可靠区域。

当固定窗口长度时,在2个匹配重叠率间隔内,随着重叠率的增大,方差逐渐增大,这主要是因为窗口叠加之后不能完全覆盖原始数据。对于可近似为随机信号的台基噪声,随着缺失数据的增多,方差变大,谱估计的误差增大;当取匹配重叠率时,方差突然减小,因为此时窗口经过叠加对原始数据形成了全覆盖,功率谱估计相对准确,这也验证了选取匹配重叠率的重要性。同时,对于同一窗口长度取不同的匹配重叠率时,方差变化不大,因为重叠的主要作用是补偿由加窗所造成的信号两端衰减。在同一窗口长度下,增大重叠率,虽然在保证分辨率不降低的前提下,增加了分段数,但多为重复数据,取平均对功率谱密度曲线平滑度的改善效果不明显。

3 结论与讨论

针对台基噪声功率谱估计中的参数选择问题,通过对Welch方法不同参数组合下功率谱密度曲线的平滑度进行分析,并以方差指标来进行定量研究,可为地震台站观测环境综合评价和观测数据质量分析提供参考。

在本研究中定义了最低重叠率,当窗口长度大于原始数据的50%,重叠率取值小于最低重叠率时,功率谱估计结果不可靠;定义了匹配重叠率,特定窗口长度对应一系列匹配重叠率,且在匹配重叠率下的台基噪声功率谱估计结果更准确。

Welch方法将原始数据进行分段时,分段长度和重叠率取值都是单一的,这导致重叠率的选取受到限制。在2个匹配重叠率之间,随着重叠率的增大,缺失数据也会增加,而且当分段数较少时,2个匹配重叠率的间隔较大,此时若想通过增加重叠率对功率谱估计结果有所改善,必须进行跨越式增大,这将会使计算量大大增加。

因此,如何根据研究目的和原始数据特征,选择更合理的分段、重叠方式,并通过分段加权进行平均,需要开展进一步研究。

参考文献
葛洪魁, 陈海潮, 欧阳飚, 等. 流动地震观测背景噪声的台基响应[J]. 地球物理学报, 2013, 56(3): 857-868.
李小军, 谢剑波, 杨大克, 等. 基于概率统计的甚宽频带地震计自噪声水平分析[J]. 中国地震, 2019, 35(1): 38-52.
林彬华, 金星, 黄玲珠, 等. 地震台站噪声水平定量评估及其在气枪源探测中的应用[J]. 地震工程学报, 2020, 42(6): 1555-1564.
田文德, 叶建庆, 胡俊明. 成都地震台JCZ-1与JCZ-1T甚宽频带地震仪对比观测分析[J]. 地震研究, 2013, 36(3): 372-378.
谢江涛, 林丽萍, 赵敏, 等. 四川地区地震背景噪声特征分析[J]. 地震学报, 2021, 43(5): 533-550.
杨千里, 郝春月, 田鑫. 新疆和田台阵PSD与PDF分析[J]. 地球物理学报, 2019, 62(7): 2591-2606.
Enferadi S, Shomali Z H, Niksejel A. Feasibility study of earthquake early warning in Tehran, Iran[J]. Journal of Seismology, 2021, 25(4): 1127-1140.
Li X J, Yang D K, Xie J B, et al. Applicability of the Welch method for examining self-noise level parameters for broadband seismometers[J]. Geodesy and Geodynamics, 2015, 6(3): 233-239.
McNamara D E, Buland R P. Ambient noise levels in the continental United States[J]. Bulletin of the Seismological Society of America, 2004, 94(4): 1517-1527.
McNamara D E, Hutt C R, Gee L S, et al. A method to establish seismic noise baselines for automated station assessment[J]. Seismological Research Letters, 2009, 80(4): 628-637.
Sleeman R, Van Wettum A, Trampert J. Three-channel correlation analysis: a new technique to measure instrumental noise of digitizers and seismic sensors[J]. Bulletin of the Seismological Society of America, 2006, 96(1): 258-271.
Welch P D. The use of fast Fourier transform for the estimation of power spectra: a method based on time averaging over short, modified periodograms[J]. IEEE Transactions on Audio and Electroacoustics, 1967, 15(2): 70-73.
Xu W W, Yuan S Y. A case study of seismograph self-noise test from Trillium 120QA seismometer and Reftek 130 data logger[J]. Journal of Seismology, 2019, 23(6): 1347-1355.