支持向量机在地震与爆破识别中的应用

引用本文

王军. 支持向量机在地震与爆破识别中的应用[J]. 地震地磁观测与研究, 2018, 39(3): 181-188. DOI: 10.3969/j.issn.1003-3246.2018.03.027.

Wang Jun. Application of SVM to discriminating earthquakes and explosions[J]. Seismological and Geomagnetic Observation and Research, 2018, 39(3): 181-188. DOI: 10.3969/j.issn.1003-3246.2018.03.027.

基金项目

中国地震局测震青年骨干培养专项（项目编号：20140310）

作者简介

王军(1983-), 男, 江苏泰兴人, 工程硕士, 工程师, 主要从事测震台网运维工作。E-mail:26428693@qq.com

文章历史

本文收到日期：2017-09-25

Contents Abstract Full text Figures/Tables PDF

支持向量机在地震与爆破识别中的应用

王军

中国上海 200062 上海市地震局

本文收到日期：2017-09-25

基金项目：中国地震局测震青年骨干培养专项（项目编号：20140310）

作者简介：王军(1983-), 男, 江苏泰兴人, 工程硕士, 工程师, 主要从事测震台网运维工作。E-mail:26428693@qq.com

摘要：为研究天然地震事件和爆破事件识别算法，对上海测震台网记录的上海周边区域天然构造地震和爆破事件记录进行小波包分解，并提取特征向量，提出用支持向量机（SVM）识别天然构造地震和人工爆破的算法。结果表明，基于SVM算法的向量识别分类方法，在天然地震和爆破识别中是可用的，准确率预计达85%以上。

关键词：支持向量机特征向量小波包分解地震爆破

Application of SVM to discriminating earthquakes and explosions

Wang Jun

Shanghai Earthquake Agency, Shanghai 200062, China

Abstract: In order to study the recognition algorithm of natural earthquake and explosion events, this paper decomposes and extracts the eigenvectors of the natural earthquakes and explosion events in the surrounding area of Shanghai recorded by Shanghai Seismic Network, and proposes the identification of natural earthquakes and explosion events by Support Vector Machine (SVM). The results show that the method based on SVM algorithm is available in identification research of natural earthquakes and explosion events, and the recognition accuracy is over 85%.

Key Words: SVM eigenvector wavelet packet nature earthquake explosion

0 引言

2008年上海测震台网开始部署自动速报系统，系统运行期间触发事件大部分为浙江舟山以及上海长江口附近的爆破事件。为提高自动速报系统信息发布的准确性，将上述区域地震信息发布震级阈值提升为M_L 2.5，可基本减少爆破信息发布的可能，但导致该区域震级较小天然地震的漏报。因此，需要研究适用于上海区域的地震和爆破识别算法，并应用于实际工作。

20世纪50年代开始，国内外对天然地震与人工爆破的识别进行了广泛和深入的研究，如：刘希强等(2003, 2005)利用小波变换方法识别天然地震与爆破或塌方或矿震事件；边银菊（2002）将遗传算法（GA）和反向传播算法（BP算法）相结合成为GA-BP算法，建立遗传BP神经网络应用于地震和爆破识别；沈萍等（1999）采用非稳态的WD理论，利用地震核爆和天然地震的瞬态谱特征，瞬时频率随时间的变化等特征来识别天然地震与地下核爆炸；杨选辉等（2005）利用小波包分量比方法识别地震和爆破识别；和雪松等（2005）用小波包识别地震和矿震。卢世军（2009）归纳了基于地震波辐射图形、地震波谱分析和震相特征的地震和爆破识别判据，主要包括：波初动、震源深度、倒谱、体波震级m_b与面波震级M_S之比、P波初动振幅与P波位移最大振幅比、勒夫波和瑞利波振幅比、P波与S波谱振幅比、小波变换、P波谱振幅与勒夫波谱振幅比、瞬态谱等。

本文对上海测震台网记录的上海周边区域天然构造地震和爆破事件波形进行小波包分解，并提取特征向量，提出用支持向量机（SVM）识别天然构造地震和人工爆破的方法。结果表明，基于SVM算法的向量识别分类方法在区域天然地震和爆破事件识别研究中是可用的，识别准确率预计达85%以上。

1 资料收集

选取2008年11月至2016年9月上海市地震监测中心记录的34个浙江舟山爆破事件和66个天然地震事件为研究样本，事件目录详见表 1和表 2。

表 1 爆破事件目录Tab. 1 Catalogue of explosion events

序号	爆破时刻	φN/(°)	λE/(°)	震中距/km	M_L
1	2008-10-07T11:20	30.5	122.38	132	2.2
2	2008-10-08T14:52	30.15	121.97	129	1.7
3	2008-11-02T16:44	30.5	122.38	132	1.2
4	2008-11-05T09:34	30.03	121.8	132	2.7
5	2008-11-06T14:17	30.28	122.1	126	1.7
6	2008-11-26T19:38	30.52	122.37	130	1.8
7	2008-12-31T12:05	30.48	122.35	130	2.4
8	2009-02-22T22:34	30.5	122.32	127	2.3
9	2016-04-04T11:44	30.23	121.97	121	2.4
10	2016-04-07T12:02	30.27	121.98	120	2.4
11	2016-04-09T12:24	30.23	122.07	128	2.5
12	2016-04-10T17:49	30.28	121.93	115	1.8
13	2016-04-13T12:46	30.38	121.9	104	2.1
14	2016-04-16T11:39	30.28	121.98	118	2.5
15	2016-04-17T10:55	30.35	121.95	110	2.4
16	2016-04-19T11:57	30.35	121.93	109	2.3
17	2016-04-19T18:13	30.27	121.95	118	1.8
18	2016-04-21T13:43	30.27	121.95	118	2.6
19	2016-04-23T17:06	30.28	121.97	117	2.3
20	2016-04-24T09:50	30.27	121.98	120	2
21	2016-04-25T18:13	30.27	121.98	120	2.4
22	2016-08-18T10:06	30.27	121.95	117	1.9
23	2016-08-21T13:13	30.28	121.97	118	1.8
24	2016-08-22T11:57	30.17	121.98	128	1.8
25	2016-08-23T16:52	30.22	122.03	126	2.1
26	2016-08-25T12:26	30.25	121.93	118	1.9
27	2016-08-26T17:35	30.25	121.97	120	1.8
28	2016-08-29T11:02	30.22	121.97	123	2
29	2016-08-30T13:05	30.27	121.92	115	2
30	2016-09-02T12:10	30.22	122.02	126	2.3
31	2016-09-03T13:57	30.22	122.02	126	1.8
32	2016-09-05T12:10	30.15	122.05	134	1.9
33	2016-09-07T11:37	30.25	121.95	119	2
34	2016-09-14T08:53	30.25	121.95	119	2.5

表 1 爆破事件目录 Tab.1 Catalogue of explosion events

表 2 地震事件目录Tab. 2 Catalogue of earthquake events

序号	爆破时刻	震中地点	φN	λE	M_L	震中距/km
1	2008-10-13T03:44	南黄海	32°27′	121°34′	2.5	136
2	2009-01-17T05:06	苏州	31°07′	120°16′	1.7	116
3	2009-01-31T03:57	江苏张家港	31°51′	120°31′	2.3	114
4	2009-03-27T04:03	浙江长兴	31°08′	120°04′	2.3	135
5	2009-05-03T04:37	浙江嘉兴以西	30°52′	120°42′	0.9	84
6	2009-05-04T01:07	浙江余杭	30°23′	120°21′	1.9	143
7	2009-06-06T00:19	江苏启东东北沿海	32°03′	121°44′	2.1	94
8	2009-07-17T22:14	长江口以东海中	31°39′	123°01′	2.9	153
9	2009-09-03T15:03	浙江湖州	31°02′	120°10′	2.3	127
10	2009-09-04T05:18	南黄海	32°27′	121°30′	2.2	135
11	2010-01-07T14:47	浙江宁波	29°51′	121°15′	2.5	155
12	2010-01-08T23:39	浙江宁波	29°53′	121°13′	2	152
13	2010-01-10T17:25	南黄海	32°27′	121°31′	2.5	135
14	2010-03-15T23:04	江苏苏州、锡山之间	31°30′	120°26′	0.9	103
15	2010-03-23T22:57	浙江嘉兴	30°50′	120°44′	1.9	83
16	2010-03-23T23:51	浙江嘉兴	30°50′	120°44′	1.7	83
17	2010-05-01T22:46	黄海	32°24′	121°44′	1.6	132
18	2010-05-04T11:07	浙江湖州	30°55′	119°54′	1.5	154
19	2010-05-17T11:07	浙江长兴	30°54′	119°56′	1.5	151
20	2010-05-28T06:42	江苏无锡	31°29′	120°20′	2	112
21	2010-07-09T21:59	江苏如东近海	32°31′	121°34′	2.1	143
22	2010-07-14T00:44	江苏苏州	31°13′	120°31′	2	91
23	2010-07-21T07:22	浙江湖州	30°51′	120°05′	1.5	139
24	2010-09-10T00:13	江苏如东附近海域	32°27′	121°32′	2.3	136
25	2010-11-20T14:08	黄海	32°40′	121°34′	3.2	160
26	2010-12-31T00:45	江苏苏州	31°11′	120°27′	2.5	98
27	2011-01-31T18:44	江苏东台以东海中	32°27′	121°43′	2.4	137
28	2011-03-01T07:49	江苏南通启东	31°57′	121°39′	1.7	82
29	2011-03-18T12:13	浙江安吉	30°44′	120°04′	1.9	145
30	2011-05-17T14:32	江苏南通	31°55′	120°55′	2.5	93
31	2011-06-24T05:14	江苏如东近海	32°29′	121°35′	1.8	140
32	2011-06-24T11:07	江苏如东近海	32°29′	121°41′	3.3	141
33	2011-07-19T11:18	浙江宁波	29°53′	121°19′	2.5	151
34	2011-08-10T01:07	江苏启东	32°01′	121°42′	1.5	90
35	2011-08-19T13:21	江苏如东海域	32°13′	122°06′	2.5	124
36	2011-08-27T07:34	江苏泰州靖江	32°01′	120°18′	1.9	141
37	2011-09-12T01:50	浙江湖州	31°03′	119°57′	1.5	147
38	2011-10-08T19:25	江苏南通如皋	32°10′	120°33′	3.6	136
39	2011-10-09T04:40	江苏南通启东	32°03′	121°44′	1.8	94
40	2011-10-11T02:48	江苏南通通州	32°03′	121°07′	1.3	97
41	2011-12-08T23:07	东海海域	31°25′	122°32′	2	103
42	2011-12-28T23:42	东海海域	31°09′	122°24′	2.3	88
43	2012-02-24T06:36	江苏如东附近海域	31°58′	121°47′	2.6	87
44	2012-06-04T22:45	江苏如东以东近海	32°30′	121°38′	1.7	142
45	2012-06-12T23:24	浙江湖州	31°14′	120°07′	2.5	129
46	2012-06-16T19:41	浙江湖州	30°44′	120°18′	1.8	125
47	2012-06-17T04:30	浙江湖州	31°11′	120°06′	2.2	131
48	2012-07-01T12:43	江苏苏州	31°13′	120°13′	2.5	120
49	2012-07-09T11:59	江苏如东附近海域	32°27′	121°42′	3.2	137
50	2012-07-12T09:00	江苏如东附近海域	32°24′	121°35′	2.2	130
51	2012-09-03T17:57	江苏苏州	31°19′	120°37′	2.6	82
52	2012-10-21T08:37	江苏苏州	31°15′	120°08′	1.4	128
53	2012-10-29T00:40	浙江舟山	30°07′	121°53′	2.5	130
54	2012-11-25T02:46	江苏南通	32°24′	120°39′	2.3	152
55	2012-11-26T11:49	浙江余姚	30°25′	120°15′	1.9	148
56	2012-12-23T20:44	江苏如东附近海域	32°34′	121°29′	3	148
57	2013-01-20T02:40	杭州湾	30°29′	121°29′	1	83
58	2013-03-02T04:25	江苏如东附近海域	32°30′	121°35′	2.3	141
59	2013-05-20T10:48	江苏如东附近海域	32°28′	121°48′	2.7	141
60	2014-07-05T11:37	浙江绍兴上虞	30°15′	120°48′	1.7	127
61	2014-07-07T14:09	浙江嘉兴平湖	30°34′	121°08′	3.1	81
62	2014-08-08T18:18	浙江宁波北仓	29°59′	121°57′	2	146
63	2014-09-03T01:22	江苏泰州靖江	32°00′	120°06′	1.6	156
64	2014-09-15T04:48	黄海	32°25′	121°31′	2	132
65	2014-11-09T18:03	江苏泰州靖江	31°56′	120°13′	2	143
66	2014-11-16T08:10	江苏启东近海	32°09′	121°49′	1.8	107

表 2 地震事件目录 Tab.2 Catalogue of earthquake events

2 数据预处理 2.1 格式转换

选取事件原始记录波形为SEED格式或EVT格式，为方便在Mablab中进行研究和计算，对选取的数据文件进行预处理，即将SEED/EVT文件按通道导出为ASCII格式文件。ASCII格式文件是地震台站实际记录的地动数据，由纯数字构成。在Matlab中使用importdata函数，将波形记录导入Matlab，使用save函数，将导入的数据保存为Matlab可直接分析处理的mat文件（王军，2017）。为研究方便，选取垂直向信号进行分析。

因所有数据均来源于上海测震台网，地震台站配置相同，可以自行编制基于Matlab软件环境的批处理软件，对待处理地震事件进行预处理。示例代码如下

importdata SH_DAX_SHZ_2.txt %读入SH_DAX_SHZ_2.txt

DAX=ans %将读入值赋值给数组DAX

save 'DAX.mat' DAX %将工作区的DAX数组保存为DAX.mat

2.2 细节分量提取

为得到高信噪比的震相记录，将原始垂直向记录进行2层小波分解并提取细节分量作为研究对象，预处理前后波形记录对比见图 1。

图 1 滤波处理前后波形记录对比 Fig.1 Comparison of waveform before and after filtering

处理过程在Matlab软件中完成，示例代码如下

[c, l]=wavedec(DAX, 2, 'haar'); %将原始垂直向信号进行2层Haar滤波

DAX0=detcoef(c, l, 1); %提取第一层细节分量

2.3 波形检查

对于每一个事件，不可能所有地震台站均能记录到清晰震相，在实际处理过程中，需对记录进行检查，剔除事件发生时的故障和无记录地震台。为方便波形检查工作，基于Matlab软件编写波形检查代码，画出滤波后所有地震台站记录波形，查找并剔除无数据和事件记录不正常的地震台。13个地震台波形检查结果见图 2。

图 2 波形检查 Fig.2 Check the waveform

3 特征向量提取 3.1 小波包变换

小波包变换能够为信号提供一种更加精细的分析方法。该变换将频带进行多层次划分，对多分辨率分析未细分的高频部分进一步分解，并能够根据被分析信号的特征，自适应的选择相应频带，使之与信号频谱相匹配，从而提高时频分辨率，因此小波包具有广泛的应用价值。

对于小波包分析的理解，此处以一个3层分解进行说明。小波包分析树见图 3，图中：A表示低频分量，D表示高频分量，末尾的序号表示小波包分解的层数。分解具有以下关系：S=AAA3+DAA3+ADA3+DDA3+AAD3+DAD3+ADD3+DDD3。

图 3 小波包分析树 Fig.3 Decomposition tree of wavelet packet

3.2 特征向量提取

将记录进行4层db1分解基的小波包分解，每层分别重构，重构系数利用最大奇异值分解算法（SVD）计算得到原始特征向量，将原始特征向量进行归一化处理，即得到归一化特征向量。将每个事件有记录台站的归一化特征向量取平均值，得到该事件的特征向量。以某事件有HUH和TMS 2个地震台清晰记录为例，基于Matlab环境编写程序代码，部分代码如下

HUHt=wpdec(HUH0, 4, 'db1', 'shannon'); %4层小波包分解预处理后提取的细节向量

TMSt=wpdec(TMS0, 4, 'db1', 'shannon');

For n=1:16

HUHcg(n, :)=wprcoef(HUHt, [4, n-1]); %按层实现第n层重构

TMScg(n, :)=wprcoef(TMSt, [4, n-1]);

HUHnorm(n)=norm(HUHcg(n, :)); %第n层重构后得到的原始特征值

TMSnorm(n)=norm(TMScg(n, :));

end

HUHnormsum=sum(HUHnorm);

TMSnormsum=sum(TMSnorm);

for n=1:16

HUHnorma(n)=HUHnorm(n)/HUHnormsum; %特征值归一化处理

TMSnorma(n)=TMSnorm(n)/TMSnormsum;

R02(n)=(HUHnorma(n)+TMSnorma(n))/2;%求取平均特征向量

end

将66个天然地震事件的特征向量合成一个66×16的矩阵，将34个爆破事件特征向量合成一个34×16的矩阵。实际小波包分解后各结点频带不按照从小到大顺序排列，频谱最终形成格雷码顺序。编写基于Matlab的软件代码，调整100个事件特征向量各元素之间的顺序，得到爆破特征向量库和地震特征向量库，具体数值见图 4、图 5。

图 4 爆破事件特征向量库 Fig.4 Eigenvector library of explosion events

图 5 地震事件特征向量库 Fig.5 Eigenvector library of earthquake events

4 SVM向量分类 4.1 SVM算法

研究过程中采用基于支持向量机（SVM）的向量分类识别算法。SVM是一种常见识别方法，在机器学习领域通常用于模式识别、分类以及回归分析。如图 6所示，二维平面上有正常元素和异常元素两种数据元素，分别用五角星和圆圈表示，识别算法就是找到一条直线将2类数据分开，一边对应的全是正常元素，另一边所对应的全是异常元素。

图 6 识别算法基本原理 Fig.6 Basic principle of recognition algorithm

SVM的主要思想可以概括为：①基于结构风险最小化理论，在特征空间中建构最优分割超平面，使得学习器得到全局最优化，并在整个样本空间的期望风险以某个概率满足一定上界；②对于线性不可分情况，通过使用非线性映射算法，将低维输入空间线性不可分样本转化为高维特征空间，使其线性可分，从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能，见图 7。

图 7 SVM算法高维思想 Fig.7 Higher dimensions in SVM

4.2 实现方法

SVM识别算法基于Matlab软件环境完成。首先生成学习样本库和样本类型向量。部分代码如下

for n=1:66

all(n, :)=T(n, :); %学习样本库all的1-66行为天然地震特征向量

class(n)=0 %类型向量class前1-66行赋值0，代表天然事件

end

for n=67:100

all(n, :)=B(n-66, :); %学习样本库all的67-100行为非天然事件特征向量

class(n)=1 %类型向量class的67-100行赋值1，代表非天然事件

end

采用svmtrain函数进行支持向量机的自我学习，核函数为线性核函数，学习代码为

svmstruct=svmtrain(all，class)

当得到一个未知类型事件特征向量unknow时，可以使用vmclassify函数，结合预测识别方案，对事件类型进行自动识别。识别代码如下

classunknow=svmclassify(svmstruct，unknow) %unknow为未知事件的特征向量

4.3 自验证

使用原始样本库中100个事件的特征向量，对预测识别方案进行自验证，自验证代码如下

for n=1:66

group(n)=svmclassify(svmstruct, T(n, :))-class(n);

end

for n=67:100

group(n)=svmclassify(svmstruct, B(n-66, :))-class(n);

end

plot(group)

title('预测结果')

自验证结果显示，66个天然地震中有7个被识别为爆破，34个爆破事件中有4个被识别为天然地震，可见100个事件的自验证结果准确率为89%。自验证结果证明，基于SVM算法的向量识别分类方法在区域天然地震和爆破的识别研究中是可用的。

5 结束语

使用基于SVM算法的向量识别分类方法，对研究样本库事件自验证识别的准确率为89%，在后期使用中，因不断有新资料的补充，实际预测识别准确率预计将达85%以上。支持向量机的算法具有学习功能，新的事件发生后，可以以预测识别方案对事件类型进行识别；当事件类型明确后，可将特征向量加入学习样本库，随着样本库的不断增加，预测识别方案也不断得到修正，预测识别的准确率随之得到提高。

在后期工作中，可将识别算法接入上海测震台网自动速报系统，实现地震数据预处理、小波包分解、特征向量提取、事件类型识别等工作的自动化完成，进一步提高工作效率。

参考文献

	边银菊. 遗传BP网络在地震和爆破识别中的应用[J]. 地震学报, 2002, 24(5): 516-524.
	和雪松, 李世愚, 沈萍, 等. 用小波包识别地震和矿震[J]. 中国地震, 2006, 22(4): 425-434.
	刘希强, 杜贻合, 徐波, 等. 区域矿震与地震的定量识别方法及其应用[J]. 中国地震, 2005, 21(1): 50-60.
	刘希强, 沈萍, 张玲, 等. 用小波变换能量线性度方法识别天然地震与爆破或塌方[J]. 西北地震学报, 2003, 25(3): 204-209.
	卢世军. 天然地震与人工爆破波形特征提取与识别算法研究[D]. 广西师范大学, 2009 http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=D069900
	沈萍, 郑治真. 瞬态谱在地震与核爆识别中的应用[J]. 地球物理学报, 1999, 42(2): 233-240.
	王军. Mallat算法在数字地震信号压缩中的应用[J]. 地震地磁观测与研究, 2017, 38(5): 133-138.
	杨选辉, 沈萍, 刘希强, 等. 地震与核爆识别的小波包分量比方法[J]. 地球物理学报, 2005, 48(1): 148-156.