2. 中国地震局兰州岩土地震研究所,兰州市东岗西路450号,730000
在日常地震监测工作中,由于爆破、塌陷等事件记录的波形与天然地震类似,传统的地震类型判别方法需要花费大量时间进行人工识别与排除,并且高度依赖震相分析人员的经验与理论水平,分类识别结果具有主观性。传统区分非天然地震的方法一般主要依据爆破事件的波形震相特征、初动方向、振幅比、尾波衰减特征等进行综合判断,表 1为不同类型事件的初动方向、P/S谱比值、Pm/Pc、Pm/Sm、Pc/Sm、Pm/Tc、Sm/Tc(Pm、Pc、Sm、Tc分别表示P波最大振幅、P波初动、S波最大振幅、尾波持续时间)等典型判别指标,其中滑坡和塌陷的部分判别指标尚不明确[1-3]。
为解决人工识别效率低、误差较大、主观性强的问题,近年来众多学者对天然地震与爆破、塌陷等非天然地震事件的波形特征展开深入研究[4-8]。深度学习技术在地震震相分类、识别及定位方面的应用发展迅速。Perol等[9]应用卷积神经网络模型ConvNetQuake对美国俄克拉荷马地区的连续记录波形进行识别与定位,检测到的地震事件数量明显比已记录的地震事件数量多,且算法计算速度更快;Ross等[10]基于美国南加州地区大量人工标记P波到时和极性的地震图训练CNN模型,从而实现P波震相到时和初动极性的自动化识别。赵明等[11]对选自中国地震台网的441个台站8 d的连续波形数据进行识别和到时拾取,同时与参考地震目录进行关联,证明CNN网络对于不同类型的地震和噪声样本具有较好的泛化能力。刘芳等[12]结合台阵策略设计单独识别P波和S波的长时窗震相拾取深度学习模型PP(phase picker)及其训练方式,且将该方法运用到中国内蒙古地区台网的观测数据中,可检测到人工目录中98.1%的地震, 地震拾取总数为人工目录数量的30倍。
深度学习强调模型的深度和训练的重要性,利用大数据训练来学习特征,具有更好的表达丰富信息特征的能力[13]。由于地震事件的复杂性,不同地区的地层构造、仪器类型参数、背景噪声等存在差异,记录的事件波形特征可能呈现多种形态。收集制作不同地震事件类型(如天然地震、爆破、塌陷、滑坡等)样本数量充足的数据集,利用卷积神经网络的特征提取及自学习能力,学习天然地震、爆破等波形的深度特征,建立能识别非天然地震事件的神经网络模型,应用到地震监测、地震灾害防治及公共服务领域,可进一步提高工作效率,及时回应社会关切,减轻灾害损失[14]。
1 数据和方法 1.1 数据来源本文以甘肃省及周边地区为研究区域(92°~108°E, 32°~42°N),以2009-01-01~2016-12-31甘肃测震台网记录的80个地震事件和20个爆破事件作为研究数据。其中,天然地震震级为M2.0~6.0,爆破事件震级为M1.0~3.5,天然地震和爆破事件主要分布在甘肃省内及周边邻近地区。
1.2 波形选取及数据集生成本文所使用的数据来自甘肃测震台网,台站总数84个,包含47个甘肃省内测震台和37个周边省份测震台。在获取2009-01-01~2016-12-31甘肃测震台网的震相数据和原始波形数据后,首先依据甘肃测震台网记录的该时间段编目报告(包括发震时刻、震中经纬度、震源深度、震级、地震类型等)人工选择地震事件,然后利用地震数据处理程序CNNdatamake,根据震相到时截取每条记录60 s垂直分量波形数据,进行滤波和归一化等预处理,生成地震事件波形数据。由于地震信号的采样率为100,因此选择6 000个采样点为最大地震波形截取长度。为尽可能减小波形事件程序筛选产生的误差,提高数据集质量,采用人工方法对事件原始波形及图片进行辨别分析,既通过波形震相特征、初动方向等进行分析判断,同时以天然地震时频表示图(图 1(a))及爆破事件时频表示图(图 1(b))作为辅助参考因素选择数据集原始事件条目。时频图显示天然地震P波的高能量密度区频率比爆破事件高;天然地震的高能量密度区分布较为离散,而爆破事件则较为集中。去除噪声过多及事件重叠的波形数据,最终选取5 000条地震波形(垂直分量),其中天然地震事件地震波形4 000条,爆破事件地震波形1 000条;同时人工标注每条记录相应的标签,生成一个10分类的标签文件。然后从有效波形文件中选取前4 500条记录作为训练波形数据集,后500条记录作为测试波形数据集。爆破事件的震源深度通常为0 km,为避免爆破与天然地震之间的模糊性,本文仅选取甘肃测震台网地震目录中震源深度小于10 km的非天然地震。
在机器学习中,卷积神经网络是一种深度前馈人工神经网络,广泛应用于图像识别。卷积神经网络包括卷积层、池化层、全连接层以及Softmax层,卷积过程可表示为:
$ X_j^l = \int {(\sum\nolimits_{i \in {M_j}} {X_i^{l - 1} \cdot K_{{\rm{ij}}}^l} } + b_j^l) $ | (1) |
式中,l为层数,Xjl为第l层第j个特征图,Mj为感受野,K为卷积核,b为偏置,∫为激活函数。
卷积是指神经网络对图片中每一小块像素区域(局部感受野)进行加权,区域权值称为卷积核。图像经过卷积运算后加上偏置值,再通过激活函数可得到特征图。卷积有助于找到特定的局部图像特征(如边缘),从而可加深神经网络对图片的理解。
原始图像经过池化层可实现特征降维,压缩数据和参数数量,减少过拟合现象,同时可提高模型的容错性。池化过程可表示为:
$ X_j^l = {\rm{down}}(X_j^{l - 1}) $ | (2) |
式中,down()表示下采样,可构成新特征图。池化操作通常分为最大池化与平均池化,最大池化可提取图片纹理,平均池化可保留图片背景。
Softmax层在多分类过程中将多个神经元的输出映射到(0, 1)区间内, 并且约束各节点输出值之和为1,满足概率性质。Softmax函数可表示为:
$ {S_j} = \frac{{{{\rm{e}}^{{\alpha _j}}}}}{{\sum\limits_{k = 1}^T {{{\rm{e}}^{{\alpha _k}}}} }} $ | (3) |
式中,Sj表示第j个神经元的输出,输出向量为各个分类的概率。
为提高本文中学习模型的识别率,并比较其与目前经典训练模型计算效率及泛化能力的差异,利用GoogLeNET神经网络模型Inception V1进行训练,同时采用自主设计的seismic phase classification CNN训练模型进行计算与对比分析,两种模型中Softmax层均设计为10分类输出。
1.3.1 Inception V1增加模型的深度(层数)或宽度可获得高质量模型,但这种设计思路会导致参与计算的参数过多,容易引起过拟合和网络退化问题。Inception是GoogLeNET团队提出的经典CNN分类模型之一[15],该模型通过改进神经网络结构,在有效保留图像特征的同时减少计算量。Inception V1模型在同一层网络中使用不同尺寸的卷积核,可提取不同尺寸特征,通过设定少于输入特征图深度的1×1卷积核个数,减少输出特征图深度和参数量,从而提高模型感知力。本文中Inception V1训练模型为10层,ReLu函数作为激活函数,交叉熵作为损失函数,优化器算法选择Adam。
1.3.2 Seismic phase classification CNN模型2为5层CNN网络结构,命名为震相分类神经网络(seismic phase classification CNN, 简称SPCCNN)。该模型由4个卷积层C和3个池化层M交替组成,然后再连接1个全连接层,最后一层作为卷积神经网络的输出层。该网络使用5×5像素的内核进行卷积,以2为步长进行下采样。使用交叉熵作为损失函数,优化器算法选择Adam。每个卷积层均利用Batch Normalization(BN)操作实现正则化以防止过拟合。最后经过全连接层,使用Softmax激活函数计算分类概率,将不同类型地震波形特征对应的输出向量与该类型地震波形的标签进行比较,确定其地震类型。
2 分类识别模型训练和测试结果利用5 000条地震波形(垂直分量)构建实验数据集,分为训练集和测试集,包括天然地震、爆破等目标样本。利用基于CNN的Inception V1模型和SPCCNN模型分别对训练集中的波形图像特征进行抽象与学习,得到优化后的网络模型,然后利用测试数据集得到目标测试结果。两种模型训练过程的准确度和损失函数曲线分别见图 2(a)和2(b),表 2为最终训练模型的损失率与准确率结果。
从图 2和表 2可以看出,随着迭代次数的增加,训练集准确率保持在96%左右,测试集准确率超过90%,表明两种模型的收敛性良好,泛化能力较好。
3 结语本文利用Inception V1模型和SPCCNN模型将天然地震事件和爆破事件等目标样本进行自动分类。从训练结果来看,不同训练模型在识别效果上具有一定差异,随着训练时长的增加,不同模型对数据的泛化能力大致趋同。分析两种模型的计算过程发现,Inception V1模型耗时略大,识别率更高;SPCCNN模型耗时较少,识别率相对略低。结果表明,Inception V1模型作为同时具有深度和宽度的神经网络,其效果更优,能更好地克服地震波形特征的复杂性,该模型对于地震波形分类具有较好的应用前景,可以考虑在此基础上改造和应用最新的Inception V4等模型,开发更优的地震事件分类模型。
实验结果表明,两种分类模型均能从训练集中学习不同地震波形的深度特征,Inception V1模型和SPCCNN模型总体识别率分别为92.3%和90.1%,说明卷积神经网络具有较好的分类识别能力。同时由于爆破类地震事件样本数较少,训练数据不够,存在过拟合问题。对于爆破等非天然地震事件,建立样本数量充足的大型数据集难度较大,需要持续收集来自不同区域、不同构造的真实非天然地震事件样本,才有可能使卷积神经网络模型具备更强的泛化能力和更高的分类识别准确率。由于训练过程中数据计算量较大,本研究仅使用每条记录的垂直分量波形,且在训练输入神经网络时对60 s时长的6 000个采样点数据以6为步长间隔进行降采样,后续研究中可考虑同时使用地震事件的三分量波形且使用全量数据,从而不断提高训练模型的分类识别能力。
致谢: 感谢甘肃数字地震台网提供地震观测数据以及甘肃地震台提供地震数据处理程序CNNdatamake。
[1] |
潘常周, 靳平, 王红春. P/S震相幅值比判据对低震级地震事件的适用性检验[J]. 地震学报, 2007, 29(5): 521-528 (Pan Changzhou, Jin Ping, Wang Hongchun. Applicability of P/S Amplitude Ratios for the Discrimination of Low Magnitude Seismic Events[J]. Acta Seismologica Sinica, 2007, 29(5): 521-528 DOI:10.3321/j.issn:0253-3782.2007.05.009)
(0) |
[2] |
杨芳, 朱嘉健, 刘智, 等. 广东地区地震与爆破事件识别方法研究[J]. 华南地震, 2016, 36(3): 110-115 (Yang Fang, Zhu Jiajian, Liu Zhi, et al. Study on Identification Methods between Earthquakes and Explosions Occurred in Guangdong Region[J]. South China Journal of Seismology, 2016, 36(3): 110-115)
(0) |
[3] |
Allmann B P, Shearer P M, Hauksson E. Spectral Discrimination between Quarry Blasts and Earthquakes in Southern California[J]. Bulletin of the Seismological Society of America, 2008, 98(4): 2 073-2 079 DOI:10.1785/0120070215
(0) |
[4] |
Hao X, Zhang G G, Ma S. Deep Learning[J]. International Journal of Semantic Computing, 2016, 10(3): 417-439 DOI:10.1142/S1793351X16500045
(0) |
[5] |
Zheng Y, Zhang Q, Yusifov A, et al. Applications of Supervised Deep Learning for Seismic Interpretation and Inversion[J]. The Leading Edge, 2019, 38(7): 526-533 DOI:10.1190/tle38070526.1
(0) |
[6] |
Woollam J, Rietbrock A, Bueno A, et al. Convolutional Neural Network for Seismic Phase Classification, Performance Demonstration over a Local Seismic Network[J]. Seismological Research Letters, 2019, 90(2A): 491-502 DOI:10.1785/0220180312
(0) |
[7] |
于子叶, 储日升, 盛敏汉. 深度神经网络拾取地震P和S波到时[J]. 地球物理学报, 2018, 61(12): 4 873-4 886 (Yu Ziye, Chu Risheng, Sheng Minhan. Pick Onset Time of P and S Phase by Deep Neural Network[J]. Chinese Journal of Geophysics, 2018, 61(12): 4 873-4 886)
(0) |
[8] |
Dokht R M H, Kao H, Visser R, et al. Seismic Event and Phase Detection Using Time-Frequency Representation and Convolutional Neural Networks[J]. Seismological Research Letters, 2019, 90(2A): 481-490 DOI:10.1785/0220180308
(0) |
[9] |
Perol T, Gharbi M, Denolle M. Convolutional Neural Network for Earthquake Detection and Location[J]. Science Advances, 2018, 4(2)
(0) |
[10] |
Ross Z E, Meier M A, Hauksson E. P Wave Arrival Picking and First-Motion Polarity Determination with Deep Learning[J]. Journal of Geophysical Research: Solid Earth, 2018, 123(6): 5 120-5 129 DOI:10.1029/2017JB015251
(0) |
[11] |
赵明, 陈石, Dave Yuen. 基于深度学习卷积神经网络的地震波形自动分类与识别[J]. 地球物理学报, 2019, 62(1): 374-382 (Zhao Ming, Chen Shi, Dave Yuen. Waveform Classification and Seismic Recognition by Convolution Neural Network[J]. Chinese Journal of Geophysics, 2019, 62(1): 374-382)
(0) |
[12] |
刘芳, 蒋一然, 宁杰远, 等. 结合台阵策略的震相拾取深度学习方法[J]. 科学通报, 2020, 65(11): 1 016-1 026 (Liu Fang, Jiang Yiran, Ning Jieyuan, et al. An Array-Assisted Deep Learning Approach to Seismic Phase-Picking[J]. Chinese Science Bulletin, 2020, 65(11): 1 016-1 026)
(0) |
[13] |
Khan A, Sohail A, Zahoora U, et al. A Survey of the Recent Architectures of Deep Convolutional Neural Networks[J]. Artificial Intelligence Review, 2020, 53: 5 455-5 516 DOI:10.1007/s10462-020-09825-6
(0) |
[14] |
Ross C P, Cole D M. A Comparison of Popular Neural Network Facies-Classification Schemes[J]. The Leading Edge, 2017, 36(4): 340-349 DOI:10.1190/tle36040340.1
(0) |
[15] |
Szegedy C, Liu W, Jia Y Q, et al. Going Deeper with Convolutions[C]. IEEE Conference on Computer Vision and Pattern Recognition(CVPR), Boston, 2015
(0) |
2. Lanzhou Institute of Geotechnique and Earthquake, CEA, 450 West-Donggang Road, Lanzhou 730000, China