文章快速检索     高级检索
  大地测量与地球动力学  2020, Vol. 40 Issue (10): 1034-1038  DOI: 10.14075/j.jgg.2020.10.008

引用本文  

范晓易, 曲均浩, 刘方斌, 等. 使用支持向量机识别地震类型的影响因素分析[J]. 大地测量与地球动力学, 2020, 40(10): 1034-1038.
FAN Xiaoyi, QU Junhao, LIU Fangbin, et al. Analysis of Influencing Factors in Use of Support Vector Machine Method to Identify Earthquake Types[J]. Journal of Geodesy and Geodynamics, 2020, 40(10): 1034-1038.

项目来源

中国地震局地震科技星火计划(XH19027);山东省地震局科研项目(YB2003)。

Foundation support

The Spark Program of Earthquake Technology of CEA, No. XH19027; Projects of Shandong Earthquake Agency, No. YB2003.

通讯作者

曲均浩,博士,高级工程师,主要从事数字地震学应用及余震活动机理研究,E-mail: gisqjh@126.com

Corresponding author

QU Junhao, PhD, senior engineer, majors in digital seismology and aftershock activity, E-mail: gisqjh@126.com.

第一作者简介

范晓易,工程师,主要从事地震监测分析及地球动力学研究,E-mail: fanxiaoyi1007@163.com

About the first author

FAN Xiaoyi, engineer, majors in earthquake monitoring and geodynamics, E-mail: fanxiaoyi1007@163.com.

文章历史

收稿日期:2019-12-16
使用支持向量机识别地震类型的影响因素分析
范晓易1     曲均浩2     刘方斌2     周少辉2     
1. 山东省地震局泰安基准地震台, 山东省泰安市罗汉崖路2号, 271000;
2. 山东省地震局, 济南市文化东路20号, 250014
摘要:对山东地区2006~2017年3种地震事件——天然地震、爆破及塌陷的波形记录进行小波变换,对提取出的香农熵特征采用支持向量机LIBSVM方法进行分类识别,并设计一系列实验研究影响最终分类效果的因素。结果表明,5种影响因素——信号窗长度、小波分解方式、小波基类型、向量机算法类型、向量机核函数类型均对地震类型的分类识别结果产生一定的影响;识别率最高的3组处理方式均采用了2 000 s信号窗长度+db7小波基+υ-SVC算法的组合方式。所得的识别率较高的几种影响因素组合,在未来可应用于地震类型的实时识别,进一步提高地震类型的识别率和触发准确率。
关键词支持向量分类机香农熵特征向量分类识别影响因素

随着地震监测能力的提升和人类生产活动干扰的增加,现今数字化地震设备记录了越来越多的爆破与塌陷信号。这些非天然地震信号不仅造成较高的地震误触发率,也影响地震预警、地震速报及地震应急的时效性与准确性。为进一步加强和完善地震监测、应急与科研工作,提高地震学研究的整体效率,地震类型的分类识别问题亟待解决。国内外关于天然地震与非天然地震的识别研究始于20世纪50年代,主要是基于数字信号理论和地震信号的特点,针对地震信号的波形、震相、频谱等特征开展研究,例如振幅比、瞬态谱等方法[1]。目前的研究重点是天然地震与人工爆破及核爆的识别,而针对天然地震、爆破与塌陷的识别方法研究较少,且大多是依赖于波形和震相特点的人工识别,而对于地震监测工作者而言,这3种地震类型的自动识别研究更具有实际意义。近年来,刘希强等[2]和黄汉明等[3]基于小波理论对天然地震、爆破及塌陷的分类识别展开研究。本文利用LIBSVM分类方法,通过识别3种地震类型的波形特征向量来实现地震类型的识别,并设计一系列实验研究影响最终分类效果的因素。

1 研究方法 1.1 小波分析与特征提取

将地震事件预处理为sac格式,采用小波分析方法对数据进行分解,地震信号分解后会产生若干个小波系数,对小波系数提取波形特征,将其依次排序组成多维向量作为波形特征向量。

本文采用的小波分解方式有小波包分解(WPT)和离散小波变换(DWT),并对地震信号作4层分解。小波包分解(WPT)是对每层的高频和低频部分同时进行分解,将产生的24=16个香农熵小波系数依次排序组成16维的波形特征向量。离散小波变换(DWT)仅分解每层的低频部分,分解后产生1个低频系数和4个高频系数,组成5维的波形特征向量。地震信号分解得到的波形特征向量数值巨大,为便于计算处理,对其全部归一化[4-5]

1.2 支持向量机方法

早在1963年,Vapnik就提出了支持向量机(SVM)的概念。支持向量机是一种通过对不同类别的已知样本的特点进行学习,来预测未知样本类别的机器学习方法[6]。1995年统计学理论得到迅速发展,使得SVM理论得到进一步发展和完善,并在解决非线性模式识别问题、小样本模式识别问题,尤其是高维模式识别问题上展现出极大的优势[3]。对于线性不可分的情形,SVM则是利用核函数将空间向量映射到高维空间,将问题转化成高维空间下的线性可划分问题。普通的支持向量机分类算法C-SVC是使用一个常数C来调节模型复杂程度与训练样本误差大小之间的平衡[7]。由于该常数的效果取决于决策者的经验,因此研究者通过引入一个0~1之间的参数υ来调节算法误差,以改善这个问题,这就是υ-SVC算法。

SVM的本质是一个二分类的算法分类器,也可以扩展到多分类的情形,本文采用的扩展方式是一对多方法。该方法的原理是依次将N个类别中的一类单独分类,剩下的归为一类,得到的N种二分类器都对未知样本进行分类,从分类结果中选择出现最多的类别作为最终结果[8-9]。3种地震类型——天然地震、爆破与塌陷的分类识别就是一个典型的多分类问题。

2 影响因素分析实验 2.1 数据选取

选用山东地区2006~2017年地震事件的波形记录,统一采用BHN分量的记录,其中爆破事件的数据采用M≥1.5的记录,塌陷事件的数据则采用M≥2的记录,天然地震事件的数据采用M≥3的近震记录,并在其中择取记录清晰、信噪比高的波形数据作为原始数据。最终每类事件数据各择取60个,其中随机选取20个作为训练样本,剩余40个作为测试样本,共计训练样本60个,测试样本120个。在总计的180个样本中,天然地震事件选用的记录台站沿省内断裂带均有分布,能较全面地反映山东省近震记录的特点;而塌陷和爆破事件由于更受地形及人类活动的影响,记录台站并未遍布全省。

2.2 实验设计

通过分析可知,影响最终分类效果的因素主要有信号窗长度、小波分解方式、小波基类型、向量机算法类型、向量机核函数类型等,其中核函数类型选用4种——线性核函数、多项式核函数、RBF核函数和sigmoid核函数。将数据集分为8组进行64次实验,以第1组的8次实验为例,其中第1组实验均采用信号窗长度1 000 s、DWT小波分解方式、db7小波基类型进行,而向量机算法与核函数类型有所区别,实验1-1~1-4采用υ-SVC算法,实验1-5~1-8则采用C-SVC算法,具体实验设计见表 1

表 1 分类效果影响因素的实验设计 Tab. 1 Experimental design of influencing factors of classification effect
3 影响因素探讨 3.1 信号窗长度

在尽可能包含完整波形的地震事件中,以事件记录的最大振幅处为中心点,分别截取1 000 s、2 000 s、4 000 s和6 000 s等4种窗长的信号,来研究不同信号窗长度的记录对最终分类识别效果的影响。不同信号窗长度截取的事件记录波形如图 1所示。

图 1 不同信号窗长度的波形信号对比 Fig. 1 Waveform signal contrast of different window lengths

本文选取第1、3、7、8组实验进行不同信号窗长度的分类识别效果测试,各组均采用相同的DWT小波分解方式和db7小波基类型,而采用不同的信号窗长度,表 2(单位%)为对应的识别率统计结果。

表 2 不同信号窗长度下的分类识别结果 Tab. 2 The results of classification recognition using different window lengths

表 2可知,采用2 000 s的信号窗长度时,识别率整体最优。还可以看出,在υ-SVC算法下,核函数类型选择线性或多项式核函数时识别率明显较高。

3.2 小波分解方式

本次实验采用DWT和WPT两种小波分解方式,共进行2组对照实验,用来测试不同小波分解方式对最终分类识别效果的影响。表 3(单位%)为第1、2组实验和第3、6组实验分别进行分类识别的结果。

表 3 不同小波分解方式下的分类识别结果 Tab. 3 The results of classification recognition using different wavelet decomposition modes

表 3可知,不论采用DWT还是WPT的小波分解方式,对最终分类识别结果的影响不大。还可以看出,在υ-SVC算法下,核函数类型选择线性或多项式核函数时识别率明显较高。

3.3 小波基的类型

表 4(单位%)为采用DWT小波分解方式、2 000 s信号窗长度时不同小波基的识别率统计结果。由表可知,采用不同小波基时的分类识别效果为db7小波基>sym6小波基>rbio1.5小波基,且υ-SVC算法下的识别结果明显优于C-SVC算法。

表 4 采用不同小波基时的分类识别结果 Tab. 4 The results of classification recognition using different wavelet basis
3.4 支持向量机算法与核函数的类型

表 5为采用不同向量机算法与核函数时的分类识别结果。由表可见:1)采用υ-SVC算法的整体识别效果优于C-SVC算法,C-SVC算法在识别3种地震类型时,识别率几乎都在70%以下或至少一种类型全部识别错误;而当采用υ-SVC算法+多项式核函数的组合时,识别率均在80%以上。2)采用sigmoid核函数时,全部实验中的地震事件都被识别为塌陷;当采用RBF核函数时,实验中的全部天然地震与大部分爆破被识别为塌陷,少部分爆破能被正确识别。线性核函数与多项式核函数只有在υ-SVC算法下才能达到较好的识别效果,其中当采用υ-SVC算法+多项式核函数的组合时,无论采用哪一种信号窗长度、小波分解方式和小波基类型,都能达到较好的识别结果,识别的成功率和稳定性均较高。

表 5 采用不同向量机算法与核函数时的分类识别结果 Tab. 5 The results of classification recognition using different vector machine algorithm and kernel function
3.5 总体评估

本文通过8组64次实验研究了信号窗长度、小波分解方式、小波基类型、向量机算法类型、向量机核函数类型5种因素对3种地震类型分类识别效果的影响。识别率高于75%的13种组合方式见表 6

表 6 分类识别率高于75%的前13种组合结果排序 Tab. 6 Ranking of the first 13 combinations with classification recognition rate greater than 75%

表 6可知,本文的各组实验设计了不同的影响因素组合,在64种组合方式中,识别率高于75%的有13种,高于80%的有11种,高于85%的有8种。当识别率高于85%时,绝大多数爆破与天然地震能被正确识别,只有少部分塌陷被识别;当识别率低于85%时,天然地震的误识别率也显著增加;当识别率低于80%时,近半数天然地震被误识别。

4 结语

在本文的影响分类效果因素实验研究中,5种影响因素——信号窗长度、小波分解方式、小波基类型、向量机算法类型、向量机核函数类型均对地震类型分类的识别结果产生了一定的影响。其中,信号窗长度采用2 000 s时识别效果最优;2种小波分解方式的识别效果均较好,DWT略优于WPT;小波基类型采用db7时识别效果最优;向量机算法类型采用υ-SVC时的识别率明显高于C-SVC;向量机核函数类型的选用需考虑向量机算法类型的影响,只有在υ-SVC算法下线性核函数与多项式核函数才能达到较好的识别效果。

综合实验结果可知,识别率最高的3组处理方式均采用了2 000 s信号窗长度+db7小波基+υ-SVC算法的组合,识别率前3名的组合依次为:1)2 000 s信号窗长度+DWT小波分解方式+db7小波基+υ-SVC算法+线性核函数;2)2 000 s信号窗长度+DWT小波分解方式+db7小波基+υ-SVC算法+多项式核函数;3)2 000 s信号窗长度+WPT小波分解方式+db7小波基+υ-SVC算法+多项式核函数。

本文研究所得的识别率较高的几种影响因素组合,可应用于地震监测部门对地震类型的实时分类识别,以进一步提高地震类型识别率和触发准确率。然而,地震类型的分类识别是一个复杂的研究课题,用少量的影响因素和有限的地区样本仅能进行初步的探讨,未来应发掘和研讨更多影响分类识别效果的指标,使用更多地区的地震事件作进一步研究和验证。

参考文献
[1]
和雪松, 李世愚, 沈萍, 等. 用小波包识别地震和矿震[J]. 中国地震, 2006, 22(4): 425-434 (He Xuesong, Li Shiyu, Shen Ping, et al. A Wavelet Packet Approach to Wave Classification of Earthquakes and Mining Shocks[J]. Earthquake Research in China, 2006, 22(4): 425-434) (0)
[2]
刘希强, 沈萍, 张玲, 等. 用小波变换能量线性度方法识别天然地震与爆破或塌方[J]. 西北地震学报, 2003, 25(3): 204-209 (Liu Xiqiang, Shen Ping, Zhang Ling, et al. Using Method of Energy Linearity in Wavelet Transform to Distinguish Explosion or Collapse from Nature Earthquake[J]. Northwestern Seismological Journal, 2003, 25(3): 204-209) (0)
[3]
黄汉明, 边银菊, 卢世军, 等. υ-SVC算法在地震与爆破识别及窗长度选取中的应用[J]. 地震地磁观测与研究, 2010, 31(3): 24-31 (Huang Hanming, Bian Yinju, Lu Shijun, et al. υ-SVC Algorithm Applied in Earthquake and Explosion Recognition and the Choice of Window Length[J]. Seismological and Geomagnetic Observation and Research, 2010, 31(3): 24-31 DOI:10.3969/j.issn.1003-3246.2010.03.005) (0)
[4]
卢世军.天然地震与人工爆破波形特征提取与识别算法研究[D].桂林: 广西师范大学, 2009 (Lu Shijun. Research of Seismic Wave Features Extraction and Recognition Algorithm of Earthquake and Explosion[D]. Guilin: Guangxi Normal University, 2009) http://d.wanfangdata.com.cn/thesis/D069900 (0)
[5]
黄汉明, 边银菊, 卢世军, 等. 天然地震与人工爆破的波形小波特征研究[J]. 地震学报, 2010, 32(3): 270-276 (Huang Hanming, Bian Yinju, Lu Shijun, et al. A Wavelet Feature Research on Seismic Waveforms of Earthquakes and Explosions[J]. Acta Seismologica Sinica, 2010, 32(3): 270-276) (0)
[6]
边肇祺, 张学工. 模式识别(第三版)[M]. 北京: 清华大学出版社, 2000 (Bian Zhaoqi, Zhang Xuegong. Pattern Recognition(Third Edition)[M]. Beijing: Tsinghua University Press, 2000) (0)
[7]
郝红艳.基于支持向量机的可靠性优化设计方法研究[D].武汉: 华中科技大学, 2013 (Hao Hongyan.Research on RBDO Methods Based on SVM[D]. Wuhan: Huazhong University of Science and Technology, 2013) http://d.wanfangdata.com.cn/thesis/D410220 (0)
[8]
郭显娥, 武伟, 刘春贵, 等. 多类SVM分类算法的研究[J]. 山西大同大学学报:自然科学版, 2010, 26(3): 6-8 (Guo Xian'e, Wu Wei, Liu Chungui, et al. Research of Multi-Class Support Vector Machines Classification Algorithm[J]. Journal of Shanxi Datong University:Natural Science, 2010, 26(3): 6-8 DOI:10.3969/j.issn.1674-0874.2010.03.002) (0)
[9]
张敏, 肖海波. SVM算法在入侵检测系统中的应用[J]. 江西理工大学学报, 2007, 28(3): 39-40 (Zhang Min, Xiao Haibo. Application of SVM in Intrusion Detection System[J]. Journal of Jiangxi University of Science and Technology, 2007, 28(3): 39-40) (0)
Analysis of Influencing Factors in Use of Support Vector Machine Method to Identify Earthquake Types
FAN Xiaoyi1     QU Junhao2     LIU Fangbin2     ZHOU Shaohui2     
1. Tai'an Fiducial Seismic Station of Shandong Earthquake Agency, 2 Luohanya Road, Tai'an 271000, China;
2. Shandong Earthquake Agency, 20 East-Wenhua Road, Jinan 250014, China
Abstract: In this paper, the authors used the waveform records of the 2006 to 2017 earthquake events in Shandong province, and the wavelet transform of three kinds of earthquake type: natural seismic, blasting and collapse waveform are carried out, and Shannon entropy features are extracted by support vector classifier LIBSVM. A series of experiments are designed to study the factors that affect the final classification effect. The results show that the length of signal window, the way of wavelet decomposition, the type of wavelet base, the type of vector machine and the type of vector machine kernel function all have some influence on the result of seismic classification. The combination of 2 000 seconds signal window length +db7 wavelet base+υ-SVC vector machine is used in the three groups with the highest recognition rate. The combination of several factors with high recognition rate can be applied to real-time recognition of earthquake type in the future to further improve the recognition rate of earthquake type and trigger accuracy.
Key words: support vector machine; Shannon entropy; feature vector; classification recognition; influencing factor