文章快速检索    
  地震地磁观测与研究  2020, Vol. 41 Issue (2): 165-171  DOI: 10.3969/j.issn.1003-3246.2020.02.019
0

引用本文  

赵明, 廖诗荣, 黄玲珠. 基于深度学习技术的地震实时流数据自动处理辅助工具开发[J]. 地震地磁观测与研究, 2020, 41(2): 165-171. DOI: 10.3969/j.issn.1003-3246.2020.02.019.
ZHAO Ming, LIAO Shirong, HUANG Lingzhu. Development of auxiliary tools for automatic processing of seismic real-time stream data based on deep learning technology[J]. Seismological and Geomagnetic Observation and Research, 2020, 41(2): 165-171. DOI: 10.3969/j.issn.1003-3246.2020.02.019.

基金项目

中国地震局地球物理研究所基本科研业务专项(项目编号:DQJB19A0114);中国地震局监测预报司自动编目专项;国家自然科学基金(项目编号:41804047)

作者简介

赵明(1984-05-), 中国地震局地球物理研究所助理研究员, 主要从事地震学和机器学习方法研究工作。E-mail:mzhao@cea-igp.ac.cn

文章历史

本文收到日期:2020-03-06
基于深度学习技术的地震实时流数据自动处理辅助工具开发
赵明 1,2, 廖诗荣 3, 黄玲珠 3     
1. 中国北京 100081 中国地震局地球物理研究所;
2. 中国北京 100095 北京白家疃地球科学国家野外科学观测研究站;
3. 中国福州 350003 福建省地震局监测中心
摘要:以JOPENS系统实时流接收为基础,应用Redis共享内存技术和近年来发展较快的深度学习震相自动识别技术,设计一套可7×24小时不间断稳定接收并实时识别连续地震流数据中P、S震相的系统,为地震台网实时数据处理提供一套辅助工具,并在福建省地震局测震台网128个台站的实时数据流上进行测试。该工具由Redis实时数据流共享模块与深度学习震相到时自动拾取、MSDP震相格式转换3个模块组成,可以实时接收并自动识别台网地震连续波形,生成P、S震相报告,并可导入MSDP人机交互工具进一步处理,在一定程度上可以减轻人工处理工作量。
关键词深度学习    实时流    震相挑取    
Development of auxiliary tools for automatic processing of seismic real-time stream data based on deep learning technology
ZHAO Ming 1,2, LIAO Shirong 3, HUANG Lingzhu 3     
1. Institute of Geophysics, China Earthquake Administration, Beijing 100081, China;
2. Beijing Baijiatuan Earth Science National Observation and Research Station, Beijing 100095, China;
3. Monitoring Center, Fujian Earthquake Agency, Fuzhou 350003, China
Abstract: We provided a set of auxiliary tools for real-time stream data processing of the seismic networks. The tool consists of three modules:the Redis real-time data stream sharing module, the automatic phase picking module by deep learning, and the phase format conversion tool for MSDP. This tool has been tested on the real-time data streams of 128 stations in the Seismic Network of Fujian Province. Its biggest advantage is that it can receive continuous waveforms of the network in real-time and automatically identify and generate P and S phase reports. Phase reports can also be imported into MSDP human-computer interaction software for further processing, which can reduce the manual processing workload to a certain extent.
Key words: deep learning    real-time data stream    phase picking    
0 引言

地震实时波形数据快速自动化处理是自动地震速报工作的基础。地震实时流波形快速自动化处理的内容包括:接收数据、识别震相并形成震相报告。长期以来,在自动检测地震和识别震相方面,STA/LTA(Allen,1982)和AR-AIC(Sleeman et al,1999)等常用方法已经在地震台网数据处理中得到广泛应用,JOPENS5.2以上系统已集成相关功能。近年来,深度学习技术开始被用于地震分类和震相识别,如:卷积神经网络地震自动分类和Unet_cea(赵明等, 2019a, b)、GPD(Ross et al,2018)、PhaseNet(Zhu et al,2019)等,并展示了较高的识别效率、识别精度和泛化能力,已经用于地震序列的快速定位与分析(Liu et al,2020)。如何将这些先进的人工智能技术与地震日常业务系统有机结合,减轻地震台网速报、编目人员的工作量,是一个亟待解决的问题。

对于地震实时流接收,基于JOPENS的实时数据流服务(SSS)可以实时传输全国2 000多个地震台网(地震监测站点)的信息,实现自动处理、人机交互、信息发布一体化,并已在地震局业务系统被广泛采用(吴永权等,2010)。本文以JOPENS系统实时流接收为基础,应用Redis共享内存技术和近年来发展较快的深度学习震相自动识别技术,设计一套可7×24小时不间断稳定接收并实时识别连续地震流数据中P、S震相的系统,自动实时输出震相报告,从而为自动地震速报、编目工作提供辅助。

文中简要评述Redis软件和PhaseNet深度学习震相识别算法,介绍地震实时流数据自动处理辅助工具的设计及核心模块功能,并以福建省地震局实时流接收和识别为例,介绍工具的实际应用效果及如何将自动生成的震相报告导入MSDP并做进一步处理,且就该工具的特点,结合实际需求分析其应用前景,总结工具开发过程,为相关研究积累经验。

1 Redis和PhaseNet深度学习震相识别技术介绍 1.1 Redis技术

Redis是一个key-value型存储系统,与其他非关系型数据库主要不同点在于:Redis中value的类型不仅限于字符串,还支持一些抽象数据类型,如:字符串列表,无序不重复的字符串集合,有序不重复的字符串集合,键、值为字符串的哈希表等。其主要优点有:①速度快,数据存在内存中,查找和操作的时间复杂度较低;②数据类型丰富,包括string(字符串)、list(链表)、set(集合)、zset(有序集合)和hash(哈希类型)等;③特性丰富:可用于缓存消息,按key设置过期时间,过期自动删除。

由于Redis速度快,可用于缓存,支持的数据类型丰富,因此可以将JOPENS数据流写入Redis共享内存,并为后续震相识别提供稳定、快速访问和及时更新的数据流服务。

1.2 PhaseNet震相识别算法

PhaseNet是Zhu等(2019)提出的基于U-net深度神经网络的自动P、S震相识别算法。该算法使用了北加州地震台网889个台站数据,由专家挑取700 000个以上具有P、S震相到时标签的三分量波形样本进行训练,所得模型在78 592个事件样本构建的验证集上取得P波0.939、S波0.853的识别正确率(正确率高表明算法误检率低)及P波0.857、S波0.755的查全率(查全率高表明算法漏检少),与人工拾取结果相比,到时挑取误差95%以上均在±0.1 s以内(Zhu et al,2019)。模型输出P波、S波和噪声的概率分布,P、S概率分布峰值所对应的时间采样点即为自动挑取的到时。PhaseNet的突出优势有:①训练模型具有良好的泛化能力,可适用不同地区;②可直接检测连续地震波形,并保持较低的误检率;③检测快速,在DELL Precision-7920-Tower工作站(12 GB显存的NVIDIA GTX 1080ti GPU加速卡)测试表明,检测速度为95桢/s,则单台一天(可分成2 880段波形)的波形检测只需约30 s。

考虑到以上优势,选择PhaseNet作为震相识别模块开发的核心算法,并用Redis技术为震相识别模块提供7×24小时不间断稳定接收数据流,自动生成的震相报告可为进一步人工分析处理提供辅助参考。

2 辅助工具设计及核心模块功能

地震实时流数据自动处理辅助工具主要基于python语言和linux平台进行开发,用到python的诸多工具包,如obspy、numpy、redis、matplotlib、tensorflow等,其中obspy为开源地震数据处理工具(www.obspy.org/),matplotlib是python的2D绘图库,numpy是python的高性能维度数组与矩阵运算工具,tensorflow是PhaseNet所基于的开源机器学习平台,也是流行的机器学习平台之一。此外,Redis服务构建、PHA格式转换用到JAVA。

地震实时流数据自动处理辅助工具的工作流程见图 1

图 1 地震实时流数据自动处理辅助工具的工作流程 Fig.1 The workflow of auxiliary tools for automatic processing of seismic real-time stream data
2.1 实时流接收模块

实时流接收模块主要接收和共享JOPENS的数据流,其工作流程如下:通过服务器端waveSrc2redis模块接收JOPENS数据流,并利用定义的Trace类缓存数据,最后客户端通过连接服务器端获取数据。

(1)服务器端:通过waveSrc2redis模块接收Jopens流服务器的实时波形数据流,解析miniseed数据包,按秒写入redis共享内存。redis共享内存中的数据按照先入先出规则进行管理,保证当前可用实时波形数据为固定长度。为方便保持不同软件模块之间台站参数的一致性,waveSrc2redis模块也将台站参数信息写入redis共享内存。

(2)定义一个Trace类便于缓存数据,类结构见图 2。Trace类包括多种数据类型,主要由numpy数组tr_data和字典型列表tr_Stat构成,其中tr_data用于存放三分量波形数据,tr_Stat存放台站参数、波形信息等。

图 2 Trace类数据结构 Fig.2 The data structure of trace class

(3)客户端:连接redis服务器,从redis共享内存中读取台站参数信息写入tr_Stat,台站信息存入一维数组station_list,通道信息存入二维数组channel_list,按秒读取redis中指定台站编号、通道编号、波形开始时间、波形结束时间的波形数据,返回tr_data,传输失败的秒数记录到tr_Stat的errorSecSum。

2.2 深度学习波形识别模块

深度学习波形识别模块部署在客户端,对接收的Redis共享内存中的数据使用深度学习模型进行实时P、S震相识别和到时拾取,其处理流程如下。

(1)调用obspy,循环读取每个地震台站对应的Trace类数据,输入数据采样率均为100 Hz,将数据切割成3 000采样点的等长片段波形,去除每个分量波形的平均值,通过标准偏差进行标准化,使用python的Multiprocessing模块对读取过程进行并行加速。

(2)基于Tensorflow GPU版1.4平台,载入PhaseNet模型对波形片段进行批量识别,同时使用Multiprocessing和GPU卡进行加速。

(3)PhaseNet的输出有2种:①表格数据,震相文件格式见表 1;②含震相自动标注和概率分布的图片,见图 3(图中绿色线条为P波概率分布,紫色线条为S波概率分布,概率峰值对应于到时)。虽然输出图片更为直观,但会拖慢实时处理速度,因此一般默认输出表格数据。

表 1 PhaseNet输出震相文件格式 Table 1 The file format of PhaseNet output phases
图 3 地震三分量事件波形的PhaseNet震相自动识别 Fig.3 Automatic seismic phases identification of three-component event waveform by PhaseNet
2.3 MSDP交互

目前地震台站和台网分析人员大多使用JOPENS—MSDP人机交互地震分析系统,故开发Res2pha工具,将PhaseNet波形识别模块输出的震相文件表格转化为JOPENS可读取的PHA格式,从而导入MSDP与波形关联,查看并进一步修正自动处理结果(具体效果可见实例分析部分的图 5)。

图 5 JOPENS导入PhaseNet震相识别文件 Fig.5 Import PhaseNet phase identification file to JOPENS
3 实例分析 3.1 福建台网实时流接收与识别实验

在福建省地震局搭建Redis共享内存服务器,可共享该局128个地震台站的实时数据流,配备DELL Precision-7920-Tower工作站(12 GB内存的NVIDIA GPU 1080ti),搭建Redis客户端,进行7×24小时不间断实时流接收,并调用PhaseNet波形识别模块进行实时震相识别。Redis处理监视系统见图 4

图 4 Redis处理监视系统 Fig.4 Redis processing and monitoring system

在系统运行期间(2020年2月14日—26日),根据中国地震台网中心报告,2月15日在福建莆田海域发生3.3级地震(117.43°N,23.33°E),该辅助工具实时接收并自动处理了福建测震台网128个地震台站记录的地震波形,且将自动生成的P、S震相报告转成JOPENS支持格式,导入JOPENS系统并与相应波形关联,见图 5(标注格式为“震相类型_概率:震相绝对到时/权重”,图中虚线框标出几种常见误检、漏检情况),共得到P震相51个(概率阈值0.5),S震相66个(概率阈值0.4),根据人工编目震相报告,对43个台站拾取27个Pg(Pn)到时、40个Sg到时,以人工结果为标准,将二者进行对比,发现漏检2个Pg到时,3个Sg到时,其余震相均被成功检测且到时误差在±0.1 s以内。

机器学习自动识别结果目前存在的主要问题有3点:①存在少量震相类型误检测,例如P、S震相类型混淆;②存在到时接近的多个检测震相;③少量检测结果精度不够。以上问题可以通过导入MSDP做进一步手工修正以及后续多台震相关联予以解决(图 5)。

4 结论及展望

通过对地震实时流数据自动处理辅助工具的开发与实践,成功地将当前在地震数据自动化处理领域发展较快的深度学习技术应用于地震实时流数据识别,识别结果可以对接JOPENS-MSDP做进一步处理,从而为地震台站和台网监测人员及时高效地处理数据,提供一种基于深度学习技术的辅助方案。该工具开发主要完成了Redis实时流接收模块、深度学习震相识别模块、JOPENS震相文件格式转换设计。利用福建省地震局搭建的Redis服务器,成功使用该工具对实时数据流进行自动处理和震相识别,与同期地震台站编目震相报告相比,自动处理结果能够检测到其中绝大多数震相,且误差在±0.1 s以内。

深度学习模型目前存在的主要问题是,在P、S震相类型判断上需要进一步加强,误报震相需进一步减少,这可能与PhaseNet模型的训练数据未包含福建测震台网本地数据有关。因此,在下一步研究工作中,计划利用福建测震台网的历史编目数据制作深度学习数据集,从而进行迁移学习训练,以期得到更加精确并适用于区域测震台网数据的PhaseNet模型,使得该工具更加实用。

感谢张淼博士分享朱尉强博士开发的PhaseNet算法。
参考文献
吴永权, 黄文辉. 2010. 数据处理系统软件JOPENS的架构设计与实现[J]. 地震地磁观测与研究, 31(6): 59-63. DOI:10.3969/j.issn.1003-3246.2010.06.011
赵明, 陈石, Yuen D. 2019a. 基于深度学习卷积神经网络的地震波形自动分类与识别[J]. 地球物理学报, 62(1): 374-382.
赵明, 房立华, 陈石, Yuen D A. 2019b. 基于U形卷积神经网络的震相识别与到时拾取方法研究[J]. 地球物理学报, 62(8): 3034-3042.
Allen R. 1982. Automatic phase pickers: Their present use and future prospects[J]. Bulletin of the Seismological Society of America, 72(6B): S225-S242.
Liu M, Zhang M, Zhu W Q, et al. 2020. Rapid characterization of the July 2019 Ridgecrest, California, earthquake sequence from raw seismic data using machine- learning phase picker[J]. Geophysical Research Letters, 47(4): e2019GL086189.
Ross Z E, Meier M A, Hauksson E, Heaton T H. 2018. Generalized seismic phase detection with deep learning[J]. Bull Seismol Soc Am, 108(5A): 2894-2901. DOI:10.1785/0120180080
Sleeman R, Van Eck T. 1999. Robust automatic P-phase picking: an on-line implementation in the analysis of broadband seismogram recordings[J]. Physics of the Earth and Planetary Interiors, 113(1/2/3/4): 265-275.
Zhu W Q, Beroza G C. 2019. Phasenet: a deep-neural-network-based seismic arrival-time picking method[J]. Geophysical Journal International, 216(1): 261-273.