应用气象学报  2012, 23 (2): 238-244   PDF    
WMO信息系统中气象元数据的设计与实现
祝婷, 李湘     
国家气象信息中心, 北京 100081
摘要: 随着越来越多基于网络、自动化的信息共享系统的广泛使用,元数据已成为不同学科间共享信息的关键。近年来气象数据的应用领域不断扩展,气象数据面临着海量信息流通共享的迫切需要,由此气象元数据应运而生。该文介绍的气象元数据是在满足WMO (世界气象组织) 信息系统提出的包括提供在线元数据、数据目录服务和提高元数据定义、收集、归档和交换的标准化水平在内的总体需求的背景下,依据WMO核心元数据标准设计并由自开发程序自动生成的。北京GISC系统是WMO信息系统中承担区域间及全球资料交换的主干通信中心之一,至2012年1月,北京GISC系统制作并提供系统内全部数据对应的气象元数据,共计约12万条。
关键词: 元数据    WMO信息系统    WMO核心元数据标准    气象数据    
Development of DAR Metadata for Meteorological Data in WIS
Zhu Ting, Li Xiang     
National Meteorological Information Center, Beijing 100081
Abstract: As the use of automated and web based systems increasing, metadata has become the key to sharing information between people working in different disciplines. As the interest of other earth science communities in meteorological data increases, there is a great deal of meteorological data which need to be transferred and shared. Traditionally weather data has been exchanged without metadata, i.e., the information about the data itself. It is assumed that the recipient understands the abbreviated message format, and has access to any metadata needed to determine the meaning of the transmitted data. This mode of data exchange works well within the meteorological community. However, it will be a problem for users outside of the meteorological community. Meteorological metadata will be the key to resolve the problem. The standardization of metadata within the meteorological community is becoming an important task during the last couple of years. WMO has recognized the importance of standardized metadata. A CBS expert team has been established after the CBS conference in 2000, aiming to develop a proposal for a WMO metadata standard. The team came up with the draft WMO Core Metadata Profile, version 0.2 at the end of 2003, based on the geographical standard ISO 19115. During the 14th World Meteorological Congress (Cg-XIV, 2003), a plan is approved for developing an overarching, integrated WMO Information System (WIS) that could meet the requirements of all WMO programs, affiliated international organizations and programs. The WIS architecture, functions and services will provide the solution for information exchange, management and access. Its main functional organizations include National Centers (NC), Data Collection or Product Centers (DCPC), and Global Information System Centers (GISC). China Meteorological Administration (CMA) has joined WIS program and achieved the core function requirement of GISC, including providing entry points and data service, through Beijing GISC and comprehensive metadata catalogues. In Beijing GISC, DAR (Discovery Access and Retrieval) meteorological metadata is the foundational information used for managing data resource and providing service of data discovery and access. It's also the reference information used for users to discover and retrieve data and products in WIS. An introduction is given on the background of applying DAR meteorological metadata in WIS, the WMO Core Metadata Profile, the metadata template applied in Beijing WIS portal, and how to generate DAR metadata instance in CMA. There are about 120000 corresponding DAR metadata for all the meteorological data provided by Beijing GISC.
Key words: metadata     WMO Information System     WMO Core Metadata Standard     meteorological data    
引言

20世纪60—70年代,世界气象组织 (World Meteorological Organization,简称WMO) 正式推出了必要的政策和系统来支持免费和不受限制的国际气象资料和相关信息的交换。全球通信系统 (Global Telecommunication System,简称GTS) 是其中负责资料交换的基础业务系统。到20世纪80年代后期,全球通信系统数据交换能力不足的问题日渐突显,世界气象组织各项计划中的大量数据通过全球通信系统之外的互联网和双边协议进行交换,造成了全球通信系统资料传输目录不能涵盖所有参与交换的气象数据,就像拥有一个图书馆,但不是所有的书名都记录在册。另一方面,传统的气象数据交换只传输数据本身,数据接收者只有熟练掌握气象数据通信的若干规则才能确定数据的意义。这两方面存在的问题成为气象数据共享的瓶颈。

为了满足世界气象组织各项计划及各成员对数据交换和使用的需求,世界气象组织于2003年第14届世界气象大会上决议建立一个通用、综合高效的WMO信息系统 (WMO Information System,简称WIS),为世界气象组织及其他国际组织有关计划的信息交换与共享提供支撑,为各国水文气象部门以外的政府部门及其他用户提供服务,同时作为支持各种自然灾害早期预警系统资料交换的实时主干业务平台[1]。WMO信息系统的主要功能结构由国家中心、资料收集或产品中心、全球信息系统中心 (Global Information System Centers,简称GISC) 和连接这3类功能中心的数据通信网络组成。其中,全球信息系统中心是支撑WMO信息系统数据交换和服务的核心功能中心,它承担责任区内全球交换资料的收集和分发,并与其他全球信息系统中心交换全球数据;同时,负责收集和存储WMO信息系统提供服务的全部数据和产品的元数据,维护元数据目录,并通过数据门户提供数据发现等服务[2]。WMO信息系统的建立意味着气象信息将更开放,气象信息服务将以用户为导向。

在WMO信息系统中成为GISC是中国气象局的既定目标。中国气象局国家气象信息中心已经完成WMO信息系统中北京GISC系统核心功能的建设,2010年8月北京成为首个通过现场评估的GISC申请中心;2011年世界气象组织第16次世界气象大会上,北京被任命为首批5个GISC中心之一。2012年1月北京GISC系统正式进入业务运行阶段。全球信息系统中心职能中的元数据目录和数据服务功能就是通过北京GISC系统实现的,本文谈及用于发现、访问和获取数据的元数据 (metadata for discovery access and retrieval,简称DAR元数据) 是中国气象局制作的、应用于北京GISC系统的元数据。

1 元数据

有关元数据的名词起源于1969年Jack Myeris提出的元数据 (metadata),当时指能够有效描述资料的规则,后来面对电子信息所特有的分散式、变动性与多元性,元数据再度引起更广泛的关注,元数据的基本定义出自1995年国际图书馆电脑中心 (OCLC) 与美国国家超级计算应用中心 (NCSA) 所主办的元数据研讨会,它将元数据定义为描述数据的数据[4]。此后各种有关元数据的定义纷纷出现,主要根据特定群体或使用情境而不同,如有关数据的数据;描述资源属性的数据;有关信息对象的结构化描述信息等。20世纪90年代以来,元数据在不同领域得到了应用。应用范围包括发现和识别、编目、资源管理及资源保护与归档等。

元数据描述的对象为某一类型 (具有某些特征) 的数据信息。元数据主要应用于描述数据资源和组织数据资源。前者通过详细深入地描述数据,使数据的意义直观体现出来;后者通过有效组织数据,使网络化的数据资源易于发现、查找、管理、评价和共享[5-7]

近年来,元数据技术已经在气象数据信息服务领域得到不同程度的应用[8-11]

2 元数据标准

随着空间信息技术的快速发展及资料共享技术和观念的推广,人们在进行各种空间信息应用时,期望能够依托互联网技术和开放式信息系统的各项标准与架构来发展各种空间信息服务;能够使用户在分散式网络环境中通过公开的服务界面搜索信息,而不必自行生产所有需要的信息。事实证明,空间信息能够成功共享流通的关键是元数据的成功推广和元数据标准的建立。

2.1 ISO地理信息元数据标准

国际标准化组织 (ISO) 的工作内容主要包括制定全世界工业和商业的国际标准。地理信息技术委员会 (ISO/TC 211) 专门负责地理信息领域相关的标准化。在国际通用的地理信息元数据标准出现之前,各国的元数据只能依循自行定义的内容及格式,缺乏彼此之间转换的通道。ISO地理信息元数据标准的出现为通过计算机系统间的互操作,简便地处理和利用地理信息提供了有利的支撑环境[12]

1998年7月地理信息技术委员会正式发布了元数据标准ISO 19115 V1.0[13]。ISO 19115是抽象的内容标准,定义和组织了地理信息和服务可能涉及的所有类型的信息内容。ISO标准的推出使地理信息领域使用统一的元数据结构描述数据成为可能[14]。ISO 19115最重要并且很实用的特性是模块化和易扩展性,它抽象地定义了元数据内容的基本架构。

ISO 19115没有对如何执行和如何编码进行定义。理论上可以使用一般的文本文档、关联式数据库信息表或可扩展的置标语言 (XML) 等各种可记录格式来编写ISO 19115元数据。2007年地理信息技术委员会发布ISO 19139标准。它是ISO 19115的具体化,提供了使用可扩展的置标语言记录ISO 19115元数据所需遵循的具体编码和执行标准[15]

2.2 WMO核心元数据标准

气象数据具有显著的空间特征、时间特征、地域性、连续性以及种类和要素多样性等特点,是典型的空间信息数据。可以借鉴和依托空间信息共享方面的经验和成果来促进气象数据的共享流通。近些年,随着气象观测技术的发展 (卫星、雷达等遥感系统)、气象涉及领域的扩大 (水文气象,农业气象,航空气象,海洋气象等) 和数值预报技术的飞跃发展带动了气象数据的海量增长。这意味着WMO信息系统需要管理和维护数量庞大的气象元数据。统一和标准的元数据描述将有助于处理海量用于交换、发现和检索的元数据。

世界气象组织各成员国的元数据标准化在过去几年中成为一项重要的任务,气象元数据标准化得到了世界气象组织的大力支持。世界气象组织基本系统委员会 (CBS) 专家团队于2000年成立,致力于制定WMO元数据标准。2003年底推出了基于ISO 19115地理信息元数据标准的WMO核心元数据标准草案0.2版。

WMO核心元数据标准是面向应用的,立足于描述数据内容特征及数据传输和服务特征。它是基于ISO 19115标准所发展的Profile。所谓Profile,可以是ISO 19115的子集合,也可以根据不同领域的应用需要扩展不属于ISO 19115的其他元数据项目。WMO核心元数据标准属于ISO 19115的子集合,并未扩充任何不属于ISO 19115标准的元数据项目。因此,以可扩展的置标语言记录符合WMO核心元数据标准的元数据文件,完全依循了ISO 19139标准。

WMO核心元数据标准完全引用了ISO 19115中14个实体的设置,保留了ISO 19115中绝大部分描述空间特征的元素,定义了气象元数据中必要的核心要素 (最少要素) 和可选要素。同时为了满足描述气象数据的特定需要做了一些扩展和特殊约束。例如,在ISO 19139中数据空间描述方式元素的值域中增加了不规则点 (irregularPoint) 选项;对ISO 19115中描述数据类别关键字的元素增强了约束,要求其必须包含WMO目录列表中的值;定义了ISO 19115中的补充要素,用于描述气象领域特有的数值模式运行分析时间时必须遵循的语法结构[16]

WMO核心元数据标准定义了气象元数据包含的核心元素,由表 1列出[17]

表 1 WMO核心元数据 Table 1 WMO core metadata

3 DAR气象元数据实例

WMO信息系统中的气象元数据需遵循WMO核心元数据标准[17-19],不同国家在元数据内容要求和元数据应用策略等方面存在差异,各国提供的元数据模板格式不尽相同。通过ISO 19139验证合法的元数据能够确保元数据的内容是以ISO 19115标准定义的结构来记录的,这样保证了各种格式的元数据都能够被解析。通过分析元数据要素与内容的对应关系来全面了解可转换的实质内容,再通过设计转换程序实现不同元数据模板间的转换。

3.1 元数据内容与结构

WMO信息系统中用户将不直接面对数据,元数据成为用户和系统交流的媒介。元数据必须准确、详细地描述数据,并且易于用户理解、易于支持系统应用。

北京GISC系统中应用的气象元数据是基于WMO核心元数据标准的基本框架,将数据集的描述信息和系统应用信息按照ISO 19139标准要求记录为可扩展的置标语言 (XML格式) 的文件结构体。以下为元数据模板的整体结构。

<?xmlversion="1.0"encoding="UTF-8"?>

-<gmd:MD_Metadataxmlns:gmd="http://www.isotc211.org/2005/gmd"

xmlns:gco ="http://www.isotc211.org/2005/gco"

xmlns:gml="http://www.opengis.net/gml/3.2"

xmlns:xlink="http://www.w3.org/1999/xlink"

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.isotc211.org/2005/gmdhttp://www.isotc211.org/2005/gmd/gmd.xsd"

-<gmd:fileIdentifier>

<gco:CharacterString>cn.gov.cma.NMC.T213.HOXM70</gco:CharacterString>

</gmd:fileIdentifier>

+<gmd:language>

+<gmd:characterSet>

+<gmd:hierarchyLevel>+<gmd:hierarchyLevelName>

+<gmd:contact>

+<gmd:dateStamp>

+<gmd:metadataStandardName>

+<gmd:metadataStandardVersion>

+<gmd:referenceSystemInfo>

-<gmd:identificationInfo>

-<gmd:MD_DataIdentification>

-<gmd:citation>

+<gmd:CI_Citation>

</gmd:citation>

-<gmd:abstract>

<gco:CharacterString00P) Tj0>P<gco:CharacterString>Productname:Verticalvelocity.Area:globalarea.Resolution:1°×1°.Forecasttimes:96hrs.Level:700hPa.Modelname:CMA T213.</gco:CharacterString>

</gmd:abstract>

+<gmd:pointOfContact>

+<gmd:resourceMaintenance>

+<gmd:descriptiveKeywords uuidref="theme">

+<gmd:descriptiveKeywords uuidref="place">

+<gmd:descriptiveKeywords uuidref="TemporalInfo">

+<gmd:resourceConstraints>

+<gmd:language>

+<gmd:topicCategory>

+<gmd:extentuuidref="BBox">

</gmd:MD_DataIdentification>

</gmd:identificationInfo>

+<gmd:distributionInfo>

+<gmd:dataQualityInfo>

+<gmd:metadataMaintenance>

</gmd:MD_Metadata>

MD_Metadata为元数据的根元素,包含14个主要子元素 (模块)。子元素fileIdentifier是元数据文件的唯一标识,在应用元数据时起到至关重要的作用。子元素language用于说明元数据使用的描述语言。子元素characterSet用于说明元数据使用的字符集。子元素hierarchyLevel用于说明元数据描述主体的类别,这决定了元数据描述的内容和方式。子元素hierarchyLevelName用于说明数据集的目录层次信息。子元素contact用于记录元数据创建方的联系方式。子元素dateStamp用于记录元数据创建或更新时间。子元素metadataStandName用于说明元数据遵循的标准。子元素metadataStandVersion用于说明元数据标准的版本。子元素referenceSystemInfo用于说明元数据描述数据使用的坐标系。子元素identificationInfo用于描述数据集的详细信息,是元数据最核心的部分。具体包括数据集摘要、数据集标题、描述数据集的关键字 (主题、时间、地理位置)、数据覆盖的地理范围和时间范围、数据生产方的联系方式、数据限制级别、数据优先级和数据维护信息等。子元素distributionInfo用于说明数据分发的相关信息,包括数据的格式、数据的获取方式等。子元素dataQualityInfo用于说明数据的质量信息。子元素metadataMaintenance用于说明元数据的更新维护信息。

3.2 元数据生成

在WMO信息系统实施的起步阶段,绝大多数国家还不能提供全球交换数据中本国的元数据。现阶段,中国气象局为所有的全球交换数据生成对应的气象元数据。

世界气象组织传统的全球实时气象数据交换不涉及元数据,它通过每两周发布的全球交换数据的数据目录 (WMO VolC1) 对每一类数据进行较详细的描述。这个数据目录提供的信息包括数据方所在区域代码、国家名称、数据产品中心、公报简式报头中TTAAii、公报简式报头中CCCC、数据格式、数据发布时次、数据覆盖站点或范围以及备注说明。这些信息是以气象通信中约定的代码或编号进行描述。元数据生成的第1步是参照权威发布的、正确的参考信息对数据目录中的记录进行正确有效的解析,还原其真实、直白的描述。基于解析出的信息,通过重组等手段,获得填充到元数据文件中的实质内容信息,包括元数据标识、标题、摘要、覆盖范围的东南西北边界、主题关键字、地理关键字、数据发布时次等元数据信息。第2步通过元数据生成软件将元数据信息填充入预先定义的元数据模板中,并根据文件命名规则最终生成元数据文件实例。元数据生成流程参见图 1

图 1. 元数据生成流程 Fig 1. Flow chart of metadata generating

除全球交换资料外,其他数据和产品的元数据文件生成流程与上述类似。

至2012年1月,北京GISC系统提供的全部数据都拥有其对应的元数据文件。具体包括全球交换资料元数据文件60633个;中国气象局T213模式数值预报产品元数据文件1218个;风云二号D星、E星产品元数据文件165个;全球集合预报中心生成的TIGGE产品元数据文件57952个。

4 气象元数据的应用意义

在北京GISC系统中,气象元数据是系统用于组织和管理WMO信息系统的数据资源、提供数据发现和检索服务的基础信息,也是用户用于了解、获取和使用数据和产品的参考信息。其应用意义具体表现在以下4个方面。

4.1 提升数据价值

单纯的数据对一般用户而言,仅是数字而已,本身没有意义。通过气象元数据对数据全方面的描述,用户很清晰知道这个数据是什么,是否为所需要的信息。

4.2 展示数据

元数据与其所描述的数据完全同步,因此元数据目录记录着系统中所有数据的信息。元数据能够展示出系统内所有的气象数据。

4.3 发现数据

元数据中包含了与数据关联的绝大部分要素,如数据分类信息、标题、摘要、相关的关键字、数据覆盖范围等,这些信息为用户通过查询方式定位到元数据提供了可能。依托于DAR气象元数据,北京GISC系统已提供了通过任意的查询 (包括关键字、地理范围、时间范围、任意字段等),找到相关的元数据。例如,用户搜索任意字段wind,所有包含wind一词的元数据文件将被发现,通过浏览这些元数据,用户可以从中找到感兴趣的、与wind有关的气象数据。

4.4 支持系统应用

从元数据的应用趋势来看,元数据不仅是关于数据本身的描述,而且涉及了数据应用和服务的相关内容。例如,气象元数据中包含了元数据对应数据的文件名模板,这并不是气象数据本身的信息,而是当系统提供数据服务时,可以利用该文件名模板到数据库获取数据。

5 小结

依照WMO核心气象元数据标准,根据WMO信息系统对气象元数据的设计要求和北京GISC系统对元数据的应用需求,设计了应用于北京GISC系统的气象元数据模板。该元数据模板的特征包括:遵循WMO核心元数据标准,内容覆盖了WMO核心元数据要素;可使用ISO 19139验证合法性;内容包括数据分类目录信息、标题、摘要、主题关键字、地理关键字、时间关键字和地理范围信息,支持查询方式定位到元数据。

便捷地实现数据的发现、访问和获取是WMO信息系统中气象元数据最重要的应用意义。北京GISC系统中的气象元数据正是围绕着这个理念设计的。基于WMO信息系统的建设现状,北京GISC系统制作并提供系统内全部数据对应的气象元数据,总计约12万条。随着对气象数据流通和共享需求的增加以及元数据应用技术的发展,气象元数据也会不断丰富完善。

参考文献
[1] World Meteorological Organization Annual Report 2005. [2011-05-15].http://www.wmo.int/pages/prog/www/WIS /Publications /AnnualReport_WMO/1000_E.pdf.
[2] Foreman S J. WMO Core Profile of the ISO 19115 Metadata Standard. [2011-06-01].http://www.wmo.int/pages/ prog/www/ TECO-WIS/abstract_1-3-2_UK-Foreman_WMO-CoreMetadata_20060909.doc.
[3] 刘华, 周峥嵘. WIS-WMO未来信息系统. 气象软科学, 2007, (4): 143–150.
[4] Metadata definition from the online medical dictionary. [2011-05-22].http://www.mondofacto.com/facts/ dictionary?Metadata.
[5] 吴显义. 我国元数据研究现状分析. 情报科学, 2004, 22, (1): 55–62.
[6] 魏亮, 刘士彬, 王杰生. 基于元数据目录服务的地理空间数据共享. 遥感技术与应用, 2005, 20, (6): 616–619. DOI:10.11873/j.issn.1004-0323.2005.6.616
[7] 王国复, 徐枫, 吴增祥. 气象元数据标准与信息发布技术研究. 应用气象学报, 2005, 16, (1): 114–121.
[8] 李集明, 沈文海, 王国复. 气象信息共享平台及其关键技术研究. 应用气象学报, 2006, 17, (5): 621–628.
[9] 高峰, 王国复, 喻雯, 等. 气象数据文件快速下载服务系统的设计与实现. 应用气象学报, 2010, 21, (2): 243–249.
[10] 邓莉, 王国复, 孙超, 等. 基本气象资料共享系统建设. 应用气象学报, 2004, 15, (增刊): 33–38.
[11] 周峥嵘, 王琤, 何文春. 分布式气象元数据同步系统的探索研究. 应用气象学报, 2010, 21, (1): 121–128.
[12] 冯学兵, 杨伯纲. Du.om基础地理信息数据库元数据引擎研究. 测绘通报, 2006, 12: 48–50. DOI:10.3969/j.issn.0494-0911.2006.03.017
[13] Bu Yong Ahn, Min Su Joh, Hun Ju Myung. Development of metadata and ontology standardization strategy for Korean Earth Observation Data. International Journal of Database Theory and Application, 2009, 2, (1): 1–10.
[14] ISO/TC 211. ISO/FDIS 19115. Geographic Information-Metadata. [2011-06-15].http://www.isotc211.org.
[15] ISO/TC 211. ISO 19139. [2011-06-15].http://www.iso.org/iso/catalogue_detail.htm?csnumber=26020.
[16] Development of the WMO Core Profile of the ISO Metadata standard. [2011-06-20].http://www.wmo.int/ pages/prog/www/WDM/Metadata/documents.html.
[17] WMO Core Metadata. [2011-05-30]. http://www.wmo.int/pages/prog/www/metadata/WMO-core-metadata.html.
[18] The Version 1.1 of the WMO Core Metadata Profile of the ISO Metadata Standard: UML representation. [2011-05-31].http://www.wmo.int/pages/prog/wis/2008/metadata/draft_version_1-1/WMOCore_ver1_1_UML_20081030.pdf.
[19] The Version 1.1 of the WMO Core Metadata Profile of the ISO Metadata Standard: Extensions to ISO Code Lists. [2011-05-31].http://www.wmo.int/pages/prog/wis/2008/metadata/draft_version_1-1/WMOCodeLists_ver1_1.pdf.