文章快速检索    
  地震地磁观测与研究  2017, Vol. 38 Issue (4): 207-211  DOI: 10.3969/j.issn.1003-3246.2017.04.035
0

引用本文  

郑钰, 彭朝勇, 杨建思. 历史地震图数据库及共享平台[J]. 地震地磁观测与研究, 2017, 38(4): 207-211. DOI: 10.3969/j.issn.1003-3246.2017.04.035.
Zheng Yu, Peng Chaoyong, Yang Jiansi. Historical seismogram database and sharing platform based on the distributed file system[J]. Seismological and Geomagnetic Observation and Research, 2017, 38(4): 207-211. DOI: 10.3969/j.issn.1003-3246.2017.04.035.

基金项目

中国地震局地球物理研究所中央级公益性科研院所基本科研业务专项(项目编号:DQJB14B10,DQJB15C01)

作者简介

郑钰(1979-), 男, 广西人, 硕士研究生, 研究方向:地球探测与信息技术

文章历史

本文收到日期:2016-07-27
历史地震图数据库及共享平台
郑钰 , 彭朝勇 , 杨建思     
中国北京 100081 中国地震局地球物理研究所
摘要:历史地震图纸是记录历史地震的重要资料,在进行电子化之前,图纸的唯一性限制了其大范围共享的可能。电子化处理是抢救和保护历史地震图纸的重要手段,可以有效发挥其使用及研究价值,具有重要意义。为此研制历史地震图数据库及共享平台,对北京国家地球观象台现存的60万张历史地震图纸进行高精度(600 dpi)扫描和规则化命名,利用数据库和FastDFS分布式文件系统进行统一存储,并采用多级缩略图和网络服务方式提供数据共享服务。
关键词历史地震图    数据库    分布式文件系统    共享平台    
Historical seismogram database and sharing platform based on the distributed file system
Zheng Yu, Peng Chaoyong, Yang Jiansi     
Institute of Geophysics, China Earthquake Administration, Beijing Municipality 100081, China
Abstract: Historical seismograms are important data recording historical earthquakes. Before the electronic process, the uniqueness of the seismograms limits the possibility of the large-scale sharing. The electronic processing is an important method to rescue and protect the historical seismograms, which can give full play to its usage and research value, and is of great significance. To this end, this project develops the database and sharing platform of the historical seismograms.600 thousand historical seismograms existing at Beijing National Earth Observatory were scanned with high precision (600 dpi) and named regularly. Then they were stored uniformly by the database and FastDFS distributed file system. Finally, the data sharing services was provided using the multistage thumbnails and web services.
Key Words: historical seismogram    database    sharing platform    distributed file system    
0 引言

地震图纸记录了地下活动的历史信息,带来地球活动的重要信息,具有唯一、不可重现、不可重复的特性。在模拟地震图纸时代,记录图纸在完成地震定位后几乎不再利用。随着时间的推移,科学技术迅猛发展,能从地震图纸提取的信息越来越多,包括地噪声,均成为提取地下信息的重要来源。

国外研究机构将模拟地震图纸数据保存与服务列为重要工作,并以数据服务为最大特色,有世界一流的地震数据服务平台(http://ds.iris.edu/seismo-archives/)、数据产出和加工软件(Teseo2,SeisDig)及科学分析软件,得到全球地震界认可。哈佛大学Adam Dziewonski Observatory观测站、伯克利地震学实验室(BSL)(对长周期地震图纸)、美国密歇根大学和洛斯阿拉莫斯实验室、意大利20世纪90年代开展的SISMOS计划,均对地震记录图纸进行数字化。

中国一些省地震局和单位,从2000年就开展了历史地震图保护和抢救工作。上海地震局和中国科学技术大学合作,于2001年对上海地震台网地震图进行抢救(刘政凯等,2001),并实现网络化管理(李平等,2003);2003年中国地震局监测预报司组织对大连、徐家汇、青岛、重庆北培和南京水晶台清晰历史地震图纸进行电子化,并出版成册;2006—2008年,许健生等(2008)将白家疃1957—2000年6级以上地震记录图进行电子化,数据量约2—3万张;河北省地震局2015年完成25万张模拟地震图(蒋宏毅等,2015)的数字化存储。

中国地震台站从老八台(8个地震台)到1990年时不足300个地震台,记录了大量地震图纸,是中国地下活动历史信息唯一资料。2012年中国地震局地球物理研究所在完成“北京观象台历史地震记录图抢救与共享”(许健生等,2008)后,启动历史地震图纸数字化工作。此次工作与上次有2点不同:①台站选择不同,上次仅就北京国家观象台历史地震图纸进行电子化,本次目标是北京国家地球观象台保存的包括兰州、佘山、乌鲁木齐等60个台站的历史地震图纸;②图纸选择方式不同,上次只选择有地震记录的图纸,本次不区分有震和无震图纸,对库存图纸均进行电子化处理,图纸达60万张左右,总计存储需求60 TB,此为与之前工作的最大不同点。

此次历史地震图纸数字化工作分几期进行,大量的存储工作不可能一步到位,且随着时间的推移,存储价值下降。为了适应大存储数据量和可扩展性需求,采用FastDFS分布式文件系统进行数据存储,在容量不足时可随时增加新的存储空间。

1 图件扫描与命名 1.1 高分辨图纸扫描

扫描图的清晰程度受扫描分辨率影响,分辨率过低难以有效保存信息,分辨率过高对存储量需求过高,统计国内外电子化图纸采用的分辨率,以便合理选择图纸扫描分辨率。

哈佛大学Adam Dziewonski Observatory观测站(Torpey and Ishii, 2010)根据数字化软件的具体情况,在200—800 dpi之间选择电子化分辨率。伯克利地震学实验室(BSL)对长周期地震图纸,选用400 dpi分辨率进行电子化、TIFF格式存储。美国密歇根大学和洛斯阿拉莫斯实验室(Mackey and Hartse, 2009)采用600 dpi精度对图纸进行电子化。意大利20世纪90年代开展的SISMOS计划中,根据数字化需求等因素决定图纸电子化分辨率,例如:考虑图纸记录笔迹的粗细等,电子化一般采用1 016 dpi、256灰度,使用TIFF格式存储,每张图纸电子化后约300—400 MB。

在中国,2003年中国地震局监测预报司在大连、徐家汇、青岛、重庆北培和南京水晶台清晰历史地震图电子化时采用600 dpi分辨率;许健生等(2008)对白家疃1957—2000年6级以上地震记录进行电子化时采用300 dpi分辨率;河北省地震局在进行地震图纸电子化时采用600 dpi分辨率。

参考国际国内同行进行电子化时的经验,采用600dpi扫描精度,每张图纸扫描后的文件大小在80—130 MB,平均每张图纸100 MB。

1.2 命名规则

在地震图纸扫描成图件后,需对图件进行命名,以便为后期图件入库提供足够信息。经研讨,图纸命名格式为:台名-仪器-起始时间-截止时间。其中开始、结束时间精确到小时。在此命名规则下,每张图纸均有唯一名称,为图件检查和导入数据库提供精确信息。

2 数据库和存储设计

大量数据储存一般采用分布式数据库和分布式文件系统。分布式数据库以Mongodb、NoSQL、HBase等为代表,安装、运行和维护均需一定技术实力;分布式文件系统中,GFS(Google File System)、HDFS(Hadoop Distributed File System)、TFS(Taobao File System)均应用于PB级存储,对本项目并不适用。历史地震图件的特点是,文件大小基本一致,平均长度100 m,总量60 TB左右,考虑到今后扩展问题,选择FastDFS(余庆,2010饶庆云,2013)分布式文件系统存储历史地震图件,将图件路径和索引保存在数据库中。FastDFS是一个开源的轻量级分布式文件系统,用C语言实现,使用专有API对文件进行访问,其代码量小,适合对中小文件(1—500 MB)进行在线服务,存储服务可以由1台或多台服务器组成,增加和删除存储服务器对在线服务影响不大,适合动态扩展存储。

在数据库中,根据实际需要设计对应的表结构,主要有台站参数表、历史地震图件表、用户表、缩略图表、历史地震表等。其中,台站参数表保存各个台站参数,包含台站中英文名称、经纬度、高程、图件数量;历史地震图件表包含历史地震图件在文件系统中的保存位置、图件台站、仪器类型、图件开始及结束时间;用户表包含用户的各项信息;缩略图表记录历史地震图件原件位置,同时记录3个级别的缩略图在文件系统的位置;历史地震表保存历史地震三要素及所有关联的历史地震图件数量和位置。

3 共享平台

历史地震图数据库特点是容量大,但用户数量不多,对网站服务的并发性要求不高,但在网络上直接传输原始图件,依然需要较大带宽,由此对历史地震图进行3个级别的压缩,缩略图的高分别固定为144像素、640像素、1 280像素,具体宽度由原始图件确定。在页面上首先显示最小级别缩略图,需要时显现其他大小的缩量图或原始图件文件。该设计加快了浏览和传输速度,便于访问更高精度的图件。

数据共享平台分为历史地震图件管理、历史地震管理、用户管理、权限管理几部分,见图 1。历史地震图件管理包括对历史地震图件的增加、删除、同步、查询和下载功能;历史地震管理包括历史地震的增加、删除及关联图纸功能;用户管理包括用户注册、审核、删除等功能;权限管理主要是管理部分地震图的查看权限。

图 1 共享平台功能架构 Fig.1 Architecture of sharing platform

历史地震图件的同步功能是整个系统的核心功能之一,在增加或删除历史地震图后,要对缩略图表、图片索引、台站信息、图片数量、关联的地震等进行修改,同步功能则将这些信息均进行修改。查询功能可以让用户根据台站、历史地震、图纸时间对历史地震图件进行查询和检索。下载功能可以让用户选择不同级别的缩略图或原图进行下载,适应不同用户要求。历史地震图件与历史地震的关联,主要依据地震对台站到时来确定,选用IASP91模型计算走时,且前人在图纸上标记不少震相和到时,为历史地震和图纸之间的关联确认提供了条件。如:乌鲁木齐地震台记录的邢台地震波形见图 2,当时由基式地震计记录,震中距22.5°,原图纸上标注的震相有eP1、eP2、PP、ix、S1、SS、iS2、LQ、iLg1、Lg1。

图 2 乌鲁木齐台记录邢台地震波形 Fig.2 Urumqi station recorded the waveform of Xingtai earthquake
4 处理结果

截至2016年12月,已完成30万张图纸的电子化,数字化成果均可通过地震行业网(http://10.2.100.109)进行访问。历史地震图纸默认按照地震台站进行进行索引(图 3),北京国家地球观象台数量最多,接近10万张,其中有震图纸11 594张。1957—2006年,中国发生5级以上地震3 846次,这些历史地震信息已入库,且通过发震时刻与图纸进行自动关联(图 4)。一部分地震对的应图纸已整理完成,将集结成图集出版。

图 3 历史地震图共享平台主界面 Fig.3 The main interface of the sharing platform of the historical seismogram
图 4 历史地震与图纸自动关联 Fig.4 Auto association of historical earthquake and seismogram

在此给出2个比较典型地震:①广东河源6.1级地震(发震时刻1962年3月19日4时18分54,23.72°N,114.67°E)是中国发生的第1次大型水库地震,共找到11张清晰图纸,为我国水库地震研究提供了丰富资料;②1966年邢台地震共找到10张清晰图纸,震中距最小的车尔营地震台(位于北京市海淀区车尔营村,震中距2.9°,仪器为SK)完整保存了地震初动资料。

5 结论

通过介绍历史地震图纸电子化过程中的几个关键技术方案,为图件进一步数字化提供详尽资料和信息。通过对图纸采样率的调研分析,确定600 dpi为图纸扫描分辨率,在存储空间和图纸精度之间保持平衡。图件文件名称设计为“台名-仪器-起始时间-截止时间”,为每张图纸确立唯一名称,为图纸检查和后期数据库导入提供便利。通过对数据库和存储方式的调研和测试,确定图像保存在文件系统,图像索引保存在数据库,由FastDFS分布式文件系统来保证系统扩展性方案。采用基于网页服务的共享方式,为加快图纸预览,对每张图件建立三级缩略图。采用以上方式,用户可以在历史地震图共享平台上查询和检索历史地震图件,可查看历史地震对应图件,为充分发掘历史地震图件的研究价值提供条件。

参考文献
蒋宏毅, 王红蕾, 边鹏飞, 等. 地震模拟图纸数字化存储的实现[J]. 地震地磁观测与研究, 2015, 36(3): 133-138.
李雷, 邓存华, 陈翔. 地震台站地震图管理系统设计及实现[J]. 地震地磁观测与研究, 2008, 29(3): 94-99.
李平, 于海英. 上海地震图纸网络化管理[J]. 地震研究, 2003, 01: 92-95. DOI:10.3969/j.issn.1000-0666.2003.01.014
刘政凯, 王炜, 张荣, 俞能海, 张天中, 潘坚云. 地震图纸数字化及数据库管理系统[J]. 地震学报, 2001, 03: 314-321. DOI:10.3321/j.issn:0253-3782.2001.03.011
饶庆云, 丁晶晶, 苏乐乐, 等. 基于云计算的分布式切图服务设计与实现[J]. 测绘与空间地理信息, 2013, 36(Z1): 29-35. DOI:10.3969/j.issn.1672-5867.2013.z1.008
王鹏, 赵镇岭, 何佳, 刘政凯. 模拟地震数据库系统的设计及实现[J]. 计算机工程, 2002, 05: 272-274. DOI:10.3969/j.issn.1000-3428.2002.05.104
习守中. 地震史料的数字化处理[J]. 国际地震动态, 2007(1): 25-30.
许健生, 许康生, 隗永刚, 等. 北京国家地球观象台历史地震记录图抢救与共享[J]. 地震地磁观测与研究, 2008, 29(3): 100-104.
余庆. 分布式文件系统FastDFS架构剖析[J]. 程序员, 2010, 11061106(11): 63-65.
Mackey K G and Hartse H E. Analysis of digitized seismograms from Russian geophysical survey stations of Soviet peaceful nuclear explosions[C]. 2009 Monitoring Research Review:Ground-Based Nuclear Explosion Monitoring Technologies, 2009:121-130.
Torpey M and Ishii M. Digitization Procedures of Analogue Seismograms from the Adam Dziewonski Observatory (HRV) at Harvard, MA[C]. American Geophysical Union, Fall Meeting, 2010.