2. 山东省地震局, 济南市文化东路20号, 250014
随着地震监测能力的提升和人类生产活动干扰的增加,现今数字化地震设备记录了越来越多的爆破与塌陷信号。这些非天然地震信号不仅造成较高的地震误触发率,也影响地震预警、地震速报及地震应急的时效性与准确性。为进一步加强和完善地震监测、应急与科研工作,提高地震学研究的整体效率,地震类型的分类识别问题亟待解决。国内外关于天然地震与非天然地震的识别研究始于20世纪50年代,主要是基于数字信号理论和地震信号的特点,针对地震信号的波形、震相、频谱等特征开展研究,例如振幅比、瞬态谱等方法[1]。目前的研究重点是天然地震与人工爆破及核爆的识别,而针对天然地震、爆破与塌陷的识别方法研究较少,且大多是依赖于波形和震相特点的人工识别,而对于地震监测工作者而言,这3种地震类型的自动识别研究更具有实际意义。近年来,刘希强等[2]和黄汉明等[3]基于小波理论对天然地震、爆破及塌陷的分类识别展开研究。本文利用LIBSVM分类方法,通过识别3种地震类型的波形特征向量来实现地震类型的识别,并设计一系列实验研究影响最终分类效果的因素。
1 研究方法 1.1 小波分析与特征提取将地震事件预处理为sac格式,采用小波分析方法对数据进行分解,地震信号分解后会产生若干个小波系数,对小波系数提取波形特征,将其依次排序组成多维向量作为波形特征向量。
本文采用的小波分解方式有小波包分解(WPT)和离散小波变换(DWT),并对地震信号作4层分解。小波包分解(WPT)是对每层的高频和低频部分同时进行分解,将产生的24=16个香农熵小波系数依次排序组成16维的波形特征向量。离散小波变换(DWT)仅分解每层的低频部分,分解后产生1个低频系数和4个高频系数,组成5维的波形特征向量。地震信号分解得到的波形特征向量数值巨大,为便于计算处理,对其全部归一化[4-5]。
1.2 支持向量机方法早在1963年,Vapnik就提出了支持向量机(SVM)的概念。支持向量机是一种通过对不同类别的已知样本的特点进行学习,来预测未知样本类别的机器学习方法[6]。1995年统计学理论得到迅速发展,使得SVM理论得到进一步发展和完善,并在解决非线性模式识别问题、小样本模式识别问题,尤其是高维模式识别问题上展现出极大的优势[3]。对于线性不可分的情形,SVM则是利用核函数将空间向量映射到高维空间,将问题转化成高维空间下的线性可划分问题。普通的支持向量机分类算法C-SVC是使用一个常数C来调节模型复杂程度与训练样本误差大小之间的平衡[7]。由于该常数的效果取决于决策者的经验,因此研究者通过引入一个0~1之间的参数υ来调节算法误差,以改善这个问题,这就是υ-SVC算法。
SVM的本质是一个二分类的算法分类器,也可以扩展到多分类的情形,本文采用的扩展方式是一对多方法。该方法的原理是依次将N个类别中的一类单独分类,剩下的归为一类,得到的N种二分类器都对未知样本进行分类,从分类结果中选择出现最多的类别作为最终结果[8-9]。3种地震类型——天然地震、爆破与塌陷的分类识别就是一个典型的多分类问题。
2 影响因素分析实验 2.1 数据选取选用山东地区2006~2017年地震事件的波形记录,统一采用BHN分量的记录,其中爆破事件的数据采用M≥1.5的记录,塌陷事件的数据则采用M≥2的记录,天然地震事件的数据采用M≥3的近震记录,并在其中择取记录清晰、信噪比高的波形数据作为原始数据。最终每类事件数据各择取60个,其中随机选取20个作为训练样本,剩余40个作为测试样本,共计训练样本60个,测试样本120个。在总计的180个样本中,天然地震事件选用的记录台站沿省内断裂带均有分布,能较全面地反映山东省近震记录的特点;而塌陷和爆破事件由于更受地形及人类活动的影响,记录台站并未遍布全省。
2.2 实验设计通过分析可知,影响最终分类效果的因素主要有信号窗长度、小波分解方式、小波基类型、向量机算法类型、向量机核函数类型等,其中核函数类型选用4种——线性核函数、多项式核函数、RBF核函数和sigmoid核函数。将数据集分为8组进行64次实验,以第1组的8次实验为例,其中第1组实验均采用信号窗长度1 000 s、DWT小波分解方式、db7小波基类型进行,而向量机算法与核函数类型有所区别,实验1-1~1-4采用υ-SVC算法,实验1-5~1-8则采用C-SVC算法,具体实验设计见表 1。
在尽可能包含完整波形的地震事件中,以事件记录的最大振幅处为中心点,分别截取1 000 s、2 000 s、4 000 s和6 000 s等4种窗长的信号,来研究不同信号窗长度的记录对最终分类识别效果的影响。不同信号窗长度截取的事件记录波形如图 1所示。
本文选取第1、3、7、8组实验进行不同信号窗长度的分类识别效果测试,各组均采用相同的DWT小波分解方式和db7小波基类型,而采用不同的信号窗长度,表 2(单位%)为对应的识别率统计结果。
由表 2可知,采用2 000 s的信号窗长度时,识别率整体最优。还可以看出,在υ-SVC算法下,核函数类型选择线性或多项式核函数时识别率明显较高。
3.2 小波分解方式本次实验采用DWT和WPT两种小波分解方式,共进行2组对照实验,用来测试不同小波分解方式对最终分类识别效果的影响。表 3(单位%)为第1、2组实验和第3、6组实验分别进行分类识别的结果。
由表 3可知,不论采用DWT还是WPT的小波分解方式,对最终分类识别结果的影响不大。还可以看出,在υ-SVC算法下,核函数类型选择线性或多项式核函数时识别率明显较高。
3.3 小波基的类型表 4(单位%)为采用DWT小波分解方式、2 000 s信号窗长度时不同小波基的识别率统计结果。由表可知,采用不同小波基时的分类识别效果为db7小波基>sym6小波基>rbio1.5小波基,且υ-SVC算法下的识别结果明显优于C-SVC算法。
表 5为采用不同向量机算法与核函数时的分类识别结果。由表可见:1)采用υ-SVC算法的整体识别效果优于C-SVC算法,C-SVC算法在识别3种地震类型时,识别率几乎都在70%以下或至少一种类型全部识别错误;而当采用υ-SVC算法+多项式核函数的组合时,识别率均在80%以上。2)采用sigmoid核函数时,全部实验中的地震事件都被识别为塌陷;当采用RBF核函数时,实验中的全部天然地震与大部分爆破被识别为塌陷,少部分爆破能被正确识别。线性核函数与多项式核函数只有在υ-SVC算法下才能达到较好的识别效果,其中当采用υ-SVC算法+多项式核函数的组合时,无论采用哪一种信号窗长度、小波分解方式和小波基类型,都能达到较好的识别结果,识别的成功率和稳定性均较高。
本文通过8组64次实验研究了信号窗长度、小波分解方式、小波基类型、向量机算法类型、向量机核函数类型5种因素对3种地震类型分类识别效果的影响。识别率高于75%的13种组合方式见表 6。
由表 6可知,本文的各组实验设计了不同的影响因素组合,在64种组合方式中,识别率高于75%的有13种,高于80%的有11种,高于85%的有8种。当识别率高于85%时,绝大多数爆破与天然地震能被正确识别,只有少部分塌陷被识别;当识别率低于85%时,天然地震的误识别率也显著增加;当识别率低于80%时,近半数天然地震被误识别。
4 结语在本文的影响分类效果因素实验研究中,5种影响因素——信号窗长度、小波分解方式、小波基类型、向量机算法类型、向量机核函数类型均对地震类型分类的识别结果产生了一定的影响。其中,信号窗长度采用2 000 s时识别效果最优;2种小波分解方式的识别效果均较好,DWT略优于WPT;小波基类型采用db7时识别效果最优;向量机算法类型采用υ-SVC时的识别率明显高于C-SVC;向量机核函数类型的选用需考虑向量机算法类型的影响,只有在υ-SVC算法下线性核函数与多项式核函数才能达到较好的识别效果。
综合实验结果可知,识别率最高的3组处理方式均采用了2 000 s信号窗长度+db7小波基+υ-SVC算法的组合,识别率前3名的组合依次为:1)2 000 s信号窗长度+DWT小波分解方式+db7小波基+υ-SVC算法+线性核函数;2)2 000 s信号窗长度+DWT小波分解方式+db7小波基+υ-SVC算法+多项式核函数;3)2 000 s信号窗长度+WPT小波分解方式+db7小波基+υ-SVC算法+多项式核函数。
本文研究所得的识别率较高的几种影响因素组合,可应用于地震监测部门对地震类型的实时分类识别,以进一步提高地震类型识别率和触发准确率。然而,地震类型的分类识别是一个复杂的研究课题,用少量的影响因素和有限的地区样本仅能进行初步的探讨,未来应发掘和研讨更多影响分类识别效果的指标,使用更多地区的地震事件作进一步研究和验证。
[1] |
和雪松, 李世愚, 沈萍, 等. 用小波包识别地震和矿震[J]. 中国地震, 2006, 22(4): 425-434 (He Xuesong, Li Shiyu, Shen Ping, et al. A Wavelet Packet Approach to Wave Classification of Earthquakes and Mining Shocks[J]. Earthquake Research in China, 2006, 22(4): 425-434)
(0) |
[2] |
刘希强, 沈萍, 张玲, 等. 用小波变换能量线性度方法识别天然地震与爆破或塌方[J]. 西北地震学报, 2003, 25(3): 204-209 (Liu Xiqiang, Shen Ping, Zhang Ling, et al. Using Method of Energy Linearity in Wavelet Transform to Distinguish Explosion or Collapse from Nature Earthquake[J]. Northwestern Seismological Journal, 2003, 25(3): 204-209)
(0) |
[3] |
黄汉明, 边银菊, 卢世军, 等. υ-SVC算法在地震与爆破识别及窗长度选取中的应用[J]. 地震地磁观测与研究, 2010, 31(3): 24-31 (Huang Hanming, Bian Yinju, Lu Shijun, et al. υ-SVC Algorithm Applied in Earthquake and Explosion Recognition and the Choice of Window Length[J]. Seismological and Geomagnetic Observation and Research, 2010, 31(3): 24-31 DOI:10.3969/j.issn.1003-3246.2010.03.005)
(0) |
[4] |
卢世军.天然地震与人工爆破波形特征提取与识别算法研究[D].桂林: 广西师范大学, 2009 (Lu Shijun. Research of Seismic Wave Features Extraction and Recognition Algorithm of Earthquake and Explosion[D]. Guilin: Guangxi Normal University, 2009) http://d.wanfangdata.com.cn/thesis/D069900
(0) |
[5] |
黄汉明, 边银菊, 卢世军, 等. 天然地震与人工爆破的波形小波特征研究[J]. 地震学报, 2010, 32(3): 270-276 (Huang Hanming, Bian Yinju, Lu Shijun, et al. A Wavelet Feature Research on Seismic Waveforms of Earthquakes and Explosions[J]. Acta Seismologica Sinica, 2010, 32(3): 270-276)
(0) |
[6] |
边肇祺, 张学工. 模式识别(第三版)[M]. 北京: 清华大学出版社, 2000 (Bian Zhaoqi, Zhang Xuegong. Pattern Recognition(Third Edition)[M]. Beijing: Tsinghua University Press, 2000)
(0) |
[7] |
郝红艳.基于支持向量机的可靠性优化设计方法研究[D].武汉: 华中科技大学, 2013 (Hao Hongyan.Research on RBDO Methods Based on SVM[D]. Wuhan: Huazhong University of Science and Technology, 2013) http://d.wanfangdata.com.cn/thesis/D410220
(0) |
[8] |
郭显娥, 武伟, 刘春贵, 等. 多类SVM分类算法的研究[J]. 山西大同大学学报:自然科学版, 2010, 26(3): 6-8 (Guo Xian'e, Wu Wei, Liu Chungui, et al. Research of Multi-Class Support Vector Machines Classification Algorithm[J]. Journal of Shanxi Datong University:Natural Science, 2010, 26(3): 6-8 DOI:10.3969/j.issn.1674-0874.2010.03.002)
(0) |
[9] |
张敏, 肖海波. SVM算法在入侵检测系统中的应用[J]. 江西理工大学学报, 2007, 28(3): 39-40 (Zhang Min, Xiao Haibo. Application of SVM in Intrusion Detection System[J]. Journal of Jiangxi University of Science and Technology, 2007, 28(3): 39-40)
(0) |
2. Shandong Earthquake Agency, 20 East-Wenhua Road, Jinan 250014, China