大数据(big data,mega data)或称海量数据,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产(维克托·迈尔·舍恩伯格,2013)。进入“大数据”时代,数据成为服务国家、服务社会的基础,是国家决策的战略资源。大数据和数据共享已成为时代的洪流。
地震科学数据是防震减灾工作的重要信息源,也是重要的战略资源(马斌等,2014)。随着信息时代的来临,全球地震数据量飞速增长,地震科学数据网站和平台应运而生,如美国地质调查局下的国家地震信息中心(NEIC)、美国地震学研究联合会(IRIS)、国际地震中心(ISC)等机构或组织,为全球提供全面、快速的地震数据服务,促进了地震学领域科学数据的开放共享。其中,NEIC为全球提供完整的地震数据信息,数据源主要来自美国国家地震台网和全球地震台网,产出用于地震应急服务的地震报警数据、地震目录、地震报告、地震活动图像以及地震波形数据等数据信息。IRIS是国际主要地震数据共享中心之一,其管理的全球地震网络(GSN)是世界上先进的数字化地震台网。ISC主要收集和计算包括震源位置、数据振幅、震源机制解等在内的数据及参数,通过与其他地震数据中心和地震机构合作,为科研人员提供数据服务。其他如欧洲—地中海地震中心(EMSC)、瑞士地震服务中心(SED)、日本气象厅(JMA)、UNAVCO等机构或组织,主要负责本国及周边地区的地震监测和数据收集,同时提供数据共享服务。
随着科学技术的不断发展,数据库建设技术越来越成熟,对数据的保护和管理也日益完善,可以提供更加方便、快捷、稳定的支持(马斌等,2014)。国外各个单位和科研机构也在积极建立数据库来完善地震资料,如:美国PEER提供的NGA-West2数据库及USGS和COSMOS的CESMD数据库,日本的K-NET和KIK-NET,意大利的ITACA,土耳其的TR-NSMN,新西兰GNSD的GeoNnet数据库。自20世纪90年代起,随着计算机技术的发展和存储设备等硬件的更新换代,深地测深数据库建设不断与时俱进,现以地震科学数据共享平台为依托,收录中国地震局地球物理勘探中心成立至2016年的人工地震剖面资料(2017年及以后的数据正在整理中,完成后会予以收录),为地球深部构造研究工作提供有效的基础数据,为防震减灾应急救援工作提供有力的数据支持。数据服务系统网址:http://http://www.gecseis.org/。
本文从深地测深数据库功能定位和需求分析,对数据库架构进行了剖析,并依据数据服务对象的需求,对入库基础信息进行了分析、整理,并介绍了该数据库的功能和应用前景。
1 数据采集和处理过程 1.1 数据基础中国地震局地球物理勘探中心(下文简称物探中心)拥有配套齐全的深、浅地球物理探测仪器设备和数据处理软、硬件系统。物探中心自主研发了具有国际先进水平的轻便数字地震仪,建立了人工地震测深数据库,开发了地震数据一维、二维、三维的构造成像和层析成像的综合数据处理解释系统。几十年来,承担并完成了一批国家重大科研项目,如:联合国开发计划署与中国合作的京、津、唐地震预报实验场项目,国际地学大断面中的中国地学大断面项目,国家高技术项目(863计划),国家重点基础研究发展规划项目(973计划),国家科技攻关项目,国家自然科学基金项目以及中国地震局重点科研项目,取得一批具有国际水平且国内领先的科学研究成果,获得多项国家科技进步奖、中国地震局科技进步奖,并在国际及国内核心期刊上发表千余篇高水平科研论文(林吉焱等,2017)。
对于人工地震测深,物探中心从未间断研究。自1956年以来,物探中心布设人工地震测线150多条,爆破1 200多次,爆炸当量过千吨,测点达60 000多个,完成的深地震测深宽角反射/折射剖面近5万千米(图 1)。
一个项目从设计开发,到现场施工,再到完成,所产生的项目设计书、项目施工信息、剖面信息、炮场信息、炮点信息、一维计算结果、二维计算结果以及结题报告、论文等多项数据,为该数据库系统集成提供了有利条件,多年来深地测深数据库不断收录物探中心产出的人工地震数据,累计数据量上TB,见表 1。
本数据库数据资料来源于中国地震局地球物理勘探中心档案管理部门较早的深地震测深剖面结题报告和已公开发表的文献,涵盖全国各地区131条深地震测深剖面(图 1)的人工地震资料,详见表 1,其中包含剖面的名称、观测系统、实施时间、经纬度、炮点、二维速度等值线图等多种信息。
深地震测深剖面信息为详细研究各地区地壳结构、揭示发震构造等提供了基础资料。但是,随着时间的推移,这些珍贵资料大多零散地保存在项目结题报告和已经发表的文献中。其他学科学者参考资料时往往需要花费大量精力搜寻这些剖面的相关信息,许多结果需要经过整理才能使用。年代久远的剖面仅保存清晰度不高的二维速度等值线图,大部分剖面仅给出桩号、深度对应的介质速度信息,而缺少经纬度信息。这给深地震测深成果的应用带来巨大阻力。本数据库对以往纸质数据、软盘数据、磁盘数据、光盘数据进行了系统性整理和数字化处理,提高了数据使用的便捷性,对深入研究各地区地壳结构、地震发震构造等科学问题具有较大的实用价值。
2 数据内容描述人工地震剖面数据库系统中常见数据资料类型如下:①文档数据:项目编号、项目所在地区、剖面组成、起止时间、设计及实施单位等文档信息; ②采集数据:野外设计报告、施工报告、地震原始数据等; ③处理数据:处理设计流程报告、处理总结报告、处理过程中的各种数据体等; ④解释数据:结题报告、历年来的地震、地质研究成果,如地震解释、地质研究的各种平面图、地震数据体、剖面及地质模型等,与项目相关的各种文档、汇报材料、论文等。
3 数据库质量及准确度 3.1 数据录入执行物探中心数据库标准从数据的汇交、收集到整理、入库,再到共享,实现的流程化、标准化,均遵循专人对接、数据准确且多人核对、数据操作前备份以及原始保留的原则,做到从初始数据即保证其准确性、可靠性。
3.2 数据库质量在数据库将全部数据汇总之后,为了数据体要素所赋属性内容、结构、编码等的完整性和正确性,项目组根据“数据库开发细则”,进行数据内容的全面检查与修改。检查数据是否在规定范围之内,各条目属性是否正确,拓扑关系是否正确,并在数据入库后检查按图幅显示是否完整。针对每幅图生成图例,按图例、图层检查属性及面元颜色、填充图案是否正确。针对文档数据,检查文档日期、标号是否正确等。在建库过程中,经过多层次、多环节的质量检查与监督,确保数据库数据准确无误。
4 数据库应用前景人工地震剖面数据库具有广泛的应用前景,可提供各地区深地资料及精细速度结构模型,还可广泛用于地质矿产调查、管理、规划与经济建设工作(聂高众等,2002)。项目起点高,设计思想先进,应用了先进的信息技术,内容丰富、查询检索方便、用途广泛、可操作性强,并建立了相应的元数据库,便于库的管理与信息共享。深地震测深数据库的建设,为深地震测深成果的转化提供了条件,为地球科学相关领域提供了精细的地壳模型参考,也提高了该项数据资料服务社会的水平。该数据库为深入研究各地区地震的发震原因、发震构造、大地动力学等科学问题,提供了基础的数据资料。
5 结论目前,地震研究工作面临着各种各样的技术难题,迫切需要进行多学科、多专业的紧密合作,综合应用多学科方法来解决技术难题已成为一种必然趋势。而专业型数据库在多学科综合应用等方面有独到优势,因此,专业型数据库的建立和应用具有重要的现实意义。专业型数据库系统,是一个涵盖人工地震剖面从设计到完成全过程的数据管理的综合系统,它涉及到早期的人工地震施工设计、数据采集、资料处理、解释,以及后期数据开发等多个方面,其综合了人工地震各个领域多种数据类型的管理,由此导致系统自身庞大而复杂。任何一个系统从设计、开发、测试、实际应用,再到全面推广都需要一段时间,而这段时间的长短,是由该系统的开发与应用的成熟度来决定的。普通用户从对系统一无所知,到熟练应用也需要一个时间过程。每个数据库或数据模型,都有其自身生命周期和适应环境,在数据模型建设之前,充分调研国内外已有数据库综合应用情况,使数据模型与企业的科研生产需求相一致,使其具有实用性、先进性、前瞻性,并尽可能保证其具有较长的生命周期。
深地震测深成果库的建设是对深地震测深资料的深度整理,再次发掘,充分发挥了已有数据资料的价值,数字化的数据资料不仅更利于数据的管理与存储,也更利于服务防震减灾事业,并为地质、地球物理、地球化学等领域的学者提供详细精准的数据和资料,实现了深地震测深成果的转化,使科技成果更好地转化为生产力,也提高了地震测深数据服务社会的水平。
在论文撰写过程中,邓晓华给予指导和帮助,中国地震局地球物理勘探中心提供数据支持,中国地震局台网中心数据共享组给予支持,在此表示感谢。
林吉焱, 段永红. 华北地区深地震测深成果库建设及应用[J]. 地球物理学进展, 2017, 32(5): 1901-1906. |
马斌, 周平, 张建业, 等. 大数据时代的数据挖掘[J]. 中国科技信息, 2014(23): 117-118. |
聂高众, 陈建英, 李志强, 等. 地震应急基础数据库建设[J]. 地震, 2002, 22(3): 105-112. |
维克托·迈尔·舍恩伯格, 肯尼斯·库克耶著, 盛杨燕, 周涛译. 大数据时代[M]. 杭州: 浙江人民出版社, 2013: 125-129.
|