测绘地理信息   2022, Vol. 47 Issue (1): 69-73
0
考虑三维空间关系的海洋科学数据本体构建及推理研究[PDF全文]
王建1, 闫丹凤1, 宋巍1, 黄冬梅1,2, 郑小罗1, 王军1    
1. 上海海洋大学信息学院,上海,201306;
2. 上海电力大学,上海,200090
摘要: 海洋科学数据是典型的多源异构三维空间数据,其特征为数据的管理、应用与共享带来了困难。本体作为一种可共享的、明确的、规范化的说明,是处理异构数据的一种有效手段。以构建海洋科学数据本体为目标,首先梳理了海洋空间本体的构建流程。然后针对流程中的两个核心步骤进行了创新和改进:①为更完整地表达海洋空间本体中的对象属性,在海洋科学数据空间关系描述中,从海洋水深角度出发,提出了考虑内部划分的三维方位关系模型,并对维数扩展9交矩阵模型(dimensionally extended nine-intersection model,DE-9IM)取值进行了三维扩展,使其能够准确表达三维对象之间的拓扑关系。②根据丰富后的海洋科学数据空间关系,设计了适合该本体推理的空间规则集。最后以国家极地科学数据为例,搭建了考虑三维空间关系的海洋科学数据本体库,并从数据检索的查全率与查准率两方面证明了该本体的有效性。
关键词: 三维空间关系    海洋本体    海洋科学数据    本体推理    
Construction and Reasoning of Marine Science Data Ontology Considering 3D Spatial Relations
WANG Jian1, YAN Danfeng1, SONG Wei1, HUANG Dongmei1,2, ZHENG Xiaoluo1, WANG Jun1    
1. College of Information Technology, Shanghai Ocean University, Shanghai 201306, China;
2. Shanghai University of Electric Power, Shanghai 200090, China
Abstract: Marine science data is a typical multi-source heterogeneous 3D spatial data. Its characteristics bring difficulties to data management, application and sharing. As a sharable, explicit and standardized description, ontology is an effective means to deal with heterogeneous data. With the goal of building marine science data ontology, we first sort out the construction process of marine space ontology, and then innovate and improve the two core steps in the process. Firstly, in order to express the object attributes in the ontology of marine space more completely, we propose a 3D azimuth relationship model considering internal division from the perspective of ocean water depth, in the description of spatial relationship of marine science data. The values of dimensionally extended nine-intersection model(DE-9IM)are extended in three dimensions to accurately express the topological relationships between 3D objects. Secondly, we design a spatial rule set suitable for the ontology reasoning with the enriched spatial relationships of marine science data. Finally, taking the National Arctic and Antarctic Data Center data as an example, we build a marine science data ontology database considering the 3D spatial relationship, and prove the effectiveness of the ontology from both the recall rate and the precision rate of data retrieval.
Key words: 3D spatial relationship    marine ontology    marine science data    ontological reasoning    

随着智慧海洋工程的推进和海洋信息化的发展,中国在海洋资源、经济、生态环境等领域获得了大量数据,同时,海洋信息获取技术早已超出了海面二维的范畴,延伸到了整个海洋三维一体化的空间范围[1]。如何加强海洋三维数据的科学管理以及实现数据高效共享成为了当前的第一要务。但海洋数据采集设备、处理平台、数据存储格式等差异造成了数据的语义异构问题,为数据的集成、交换和共享带来了困难;同时在海洋三维信息检索方面,传统的关键词匹配具有数据检索效率低等诸多问题。

张峰[2]通过分析比较传统的数据集成方案,得出本体是解决语义异构较好的办法。本体作为一种特殊类型的术语集,不仅能够表达对象的概念及属性,还能定义实例间的关系,在海洋领域中已有广泛应用。

针对本体在海洋领域中的管理与共享问题,Bermudez等[3]创建了基于现有词汇表的海洋本体;云红艳等[4]构建了海洋生态本体模型和海洋生态形式化本体,使海洋生态数据能够高效共享;Wang等[5]建立了基于海洋地球化学元数据标准的海洋样本本体。考虑到空间数据的属性与空间位置信息具有直接关联的特点[6],通过空间关联性查询可有效提高查全率与查准率。黄茂军等[7]建立了能够表达空间特性的地理本体;马雷雷[8]提出了符合常识空间认知的二维空间本体模型;Zhang等[9]在对地理关系进行语义分析的基础上,建立了地理对象空间关系的本体知识库;Huang等[10]建立了二维空间关系的海洋科学数据本体,实现了海洋科学数据共享。

综上,现有研究缺乏基于三维空间关系的海洋本体模型。因此,本文构建了考虑三维空间关系的海洋科学数据本体。针对本体中三维空间关系的表达,提出了适合海洋数据的三维空间关系模型。同时,基于语义网规则语言(semantic web rule language,SWRL)构建了包含三维空间关系的海洋本体的推理规则集,实现了更精确的海洋数据的空间位置检索,为海洋数据的共享提供了有效解决方案。

1 海洋科学数据本体的构建流程

目前,通用的本体构建方法主要有骨架法、七步法、TOVE(Toronto virtual enterprise)等。本文在七步法的基础上设计了海洋科学数据空间本体构建流程,具体如下:

1) 确定本体的应用范围为海洋领域。研究目的是建立海洋科学数据本体,辅助海洋数据的管理及关联查找。

2) 对现有的海洋本体进行归纳总结。目前对海洋本体的研究多从语义及二维空间关系角度开展,没有从三维空间关系角度展开的研究。

3) 根据海洋信息元数据标准提供的元素信息定义海洋科学数据的概念及属性,并确定其等级体系。

4) 构建海洋科学数据的三维空间关系模型,确定海洋科学数据的对象属性。

5) 根据对象属性构建合理的海洋本体推理规则集,实现实例之间的知识推理。

6) 通过本体构建软件构建海洋科学数据本体,包括构建语义概念、数据属性、对象属性、推理规则。根据实例的地理位置信息进行分析,获得实例之间的空间关系,并以此搭建本体知识库。

7) 对海洋科学数据本体进行归档。

2 海洋科学数据本体构建

通过定义和描述与海洋科学数据相关的语义概念、数据属性和对象属性,从而构建较为完整的海洋科学数据本体。其中,语义概念是对事物本质属性的概括性描述;数值属性描述类的属性;对象属性描述类、实例之间的关系,如语义关系、空间关系等。

2.1 语义概念和数值属性分类体系

海洋信息元数据标准中定义了建立海洋数据集所需的核心元数据元素,如数据集名称、负责单位、地理位置、水深覆盖范围、语种、专题类别等。文献[10] 中归纳总结了海洋数据的特征,将其语义概念划分为3大类:数据来源、数据形态、数据本质。本文根据划分依据,对海洋信息元数据标准中定义的必选元素和部分推荐可选元素进行了语义划分,并设计了概念之间的子类-父类关系(subClassof),构建了图 1所示的概念层次,其中,实线代表类之间的subClassof关系。将具有描述性的元素,如开始时间、经纬度、数据质量描述等作为数值属性。

图 1 海洋科学数据语义概念分类 Fig.1 Classification of Semantic Concepts in Marine Science Data

2.2 海洋本体构建中三维空间关系的定性描述

海洋三维空间关系是指海洋数据之间存在的与空间特性有关的关系,如度量关系、方位关系、拓扑关系等。三维空间关系的确定是构建海洋科学数据本体对象属性的重要内容,也是建立空间数据关联的核心。其中,方位关系和拓扑关系是空间关系研究的重点[11]。关于度量关系的相关研究已经比较成熟,故本文不再赘述。

2.2.1 三维拓扑关系

拓扑关系是空间关系中最基本、最重要的关系,也是空间查询和推理的基础,主要表现为空间对象之间的相邻、分离和包含等关系[12, 13]。目前拓扑模型分为N-交集模型和区域连接演算(region connection calculus,RCC)理论。

通过对现有拓扑关系模型的分析对比,以及结合海洋科学数据的特点,本文对维数扩展9交矩阵模型(dimensionally extended nine-intersection model,DE-9IM)的取值进行三维扩展,从而实现三维拓扑关系的表达。该模型矩阵表示如下:

$ \begin{array}{c} {R_{{\rm{DE}} - 9{\rm{IM}}}} = \\ \left[ {\begin{array}{*{20}{c}} {\dim \left( {{A^0} \cap {B^0}} \right)}&{\dim \left( {{A^0} \cap \partial B} \right)}&{\dim \left( {{A^0} \cap {B^ - }} \right)}\\ {\dim \left( {\partial A \cap {B^0}} \right)}&{\dim (\partial A \cap \partial B)}&{\dim \left( {\partial A \cap {B^ - }} \right)}\\ {\dim \left( {{A^ - } \cap {B^0}} \right)}&{\dim \left( {{A^ - } \cap \partial B} \right)}&{\dim \left( {{A^ - } \cap {B^ - }} \right)} \end{array}} \right] \end{array} $ (1)

式中,A0B0分别表示空间对象AB的内部;∂A、∂B分别表示空间对象AB的边界;A-B-分别表示空间对象AB的外部。

在三维空间拓扑关系表达中,将空间目标交集扩展到三维,其交集结果的维数取值为{-1,0,1,2,3},依次代表交集为空、交集为点、交集为线、交集为面、交集为体。

2.2.2 三维方位关系

方位关系是指对象之间方向与位置的相对关系。最基本的三维空间方位关系是3DR7模型中的7种方位关系,包括上、中、下、东、西、南、北。考虑到海洋科学数据的特点,现有方位关系模型不能较好地满足海洋数据的方位关系划分,主要体现在两个方面:

1) 现有的方位模型虽然满足了对外方位的划分,但部分方位模型(3DR7、3DR27[14]、3DR39[15])没有考虑内方位关系,无法表达两个对象在空间中相交的具体方位关系。

2) 海洋科学数据的深度信息十分重要,在其对内部方位关系划分时,需要着重考虑对深度的划分。而现有的考虑内方位关系的模型(3DR44[16]、3DR46[17])重点研究其水平方位的划分,忽略了其深度上的方位关系。

针对以上问题,需要对海洋科学数据的内部方位进一步划分,且内方位的划分重点应在深度方向。本文提出了一种考虑内方位的三维空间模型——3DR29模型,将空间方位划分为29个区域,模型示意图见图 2。该三维方位关系模型中,o表示外方位;i表示内方位;O代表每层方位中间的方位。以参照对象的最小外接立方体表示对象本身,延伸对象的最小外接立方体边,将外部的三维空间划分为27个区域,形成27个外方位,分别采用下标URD代表上方位、正方位和下方位,如上方位有9个:UoO (正上方)、UoE(上方东)、UoS(上方南)、UoW(上方西)、UoN(上方北)、UoNW(上方西北)、UoNE(上方东北)、UoSW (上方西南)、UoSE(上方东南),其余方位以此类推。将内部区域划均分为3个区域,分别表示为UiO (上方)、RiO(中间)、DiO(下方)。其模型矩阵如式(2) 所示,若源目标位于参考目标的某一方位区域,则矩阵中相应的方位交集取值为1,否则为0。

图 2 3DR29模型示意图 Fig.2 Diagram of 3DR29 Model

$ \begin{array}{c} {\rm{Dir}}(\mathit{B},\mathit{A}) = \\ \left[ {\begin{array}{*{20}{c}} {U_{{A^o}}^{NW} \cap B}&{U_{{A^o}}^N \cap B}&{U_{{A^o}}^{NE} \cap B}&{U_{{A^o}}^W \cap B}&{U_{{A^o}}^O \cap B}&{U_{{A^o}}^E \cap B}&{U_{{A^o}}^{SW} \cap B}&{U_{{A^o}}^S \cap B}&{U_{{A^o}}^{SE} \cap B}&{U_{{A^i}}^O \cap B}\\ {R_{{A^o}}^{NW} \cap B}&{R_{{A^o}}^N \cap B}&{R_{{A^o}}^{NE} \cap B}&{R_{{A^o}}^W \cap B}&{R_{{A^o}}^O \cap B}&{R_{{A^o}}^E \cap B}&{R_{{A^o}}^{SW} \cap B}&{R_{{A^o}}^S \cap B}&{R_{{A^o}}^{SE} \cap B}&{R_{{A^i}}^O \cap B}\\ {D_{{A^o}}^{NW} \cap B}&{D_{{A^o}}^N \cap B}&{D_{{A^o}}^{NE} \cap B}&{D_{{A^o}}^W \cap B}&{D_{{A^o}}^O \cap B}&{D_{{A^o}}^E \cap B}&{D_{{A^o}}^{SW} \cap B}&{D_{{A^o}}^S \cap B}&{D_{{A^o}}^{SE} \cap B}&{D_{{A^i }}^O \cap B} \end{array}} \right] \end{array} $ (2)
3 基于三维空间关系的海洋本体推理

本体推理是指在计算机中实现基于知识的推理,即根据已知的相关理论定义推理规则集,借助本体推理机实现对数据关系的定性分析和处理。

引入本体推理后,可以通过已知的关系获得隐含的关系,完善和加强海洋数据之间的联系,也可以检测本体定义过程中是否存在冲突,保证本体的一致性,优化本体的构建[18]。此外,由于目前本体实例及关系大多是手动搭建的,引入空间关系推理后,能有效减少构建本体关系的工作量。例如,n条数据两两分析,存在n(n - 1)条拓扑关系,而引入推理后,最多只需建立$ \sum\limits_{i = 1}^{n - 1} i $条空间关系,即可得到所有关系。

本文根据对象属性的特征以及自定义推理规则集实现本体推理。

1) 根据对象属性特征的推理。对象属性的属性特性包括对称性、传递性、互逆性等。通过定义属性特性,可实现简单的推理。表 1定义了拓扑关系的属性特征。

表 1 拓扑关系属性特征 Tab.1 Property Characteristics of Topological Relations

2) 基于三维空间关系自定义推理规则。由于海洋本体的空间关系错综复杂,只定义对象属性特征并不能满足复杂空间关系推理的要求,因此需要自定义推理规则,从而实现较完备的本体库推理。

本文采用SWRL定义推理规则,该规则包括前提(head)和结论(body)两部分。表示形式为head→ body。表 2展示了部分自定义的SWRL推理规则,包括规则表达式以及对应的语义描述。

表 2 空间推理规则实例 Tab.2 Examples of Spatial Inference Rules

4 考虑三维空间关系的海洋本体构建应用分析

本文将国家极地科学数据中心(Chinese National Arctic and Antarctic Data Center,NADC)的公开数据集作为海洋科学数据本体库的数据源。该数据中心记录了自20世纪80年代至今中国主要的极地科学数据,共存储1 097条数据。使用Protege5.5.0软件搭建了海洋科学数据空间本体,并利用中国极地重点研究区域普里兹湾地区具有地理信息的数据构建了本体实例。

4.1 基于推理规则的实体关系丰富

根据极地普里兹湾地区海洋数据中的空间位置信息,共建立了1 226条三维拓扑关系,经对象属性特征和自定义推理规则集推理可得2 531条三维空间拓扑关系。以“2007/2008年中国第24次南极考察普里兹湾叶绿素a样品数据”为例,推理前已知且与本条数据存在空间相交的数据共有6条。利用本文提出的三维空间关系的海洋本体推理规则进行推理后,得到了9条与该条数据存在空间关系的数据,实现了实体关系扩充,使得海洋科学数据本体中实例之间的关系更加完整。

4.2 基于本体库的查询结果分析

本文从查准率与查全率两方面对海洋空间本体库进行查询结果分析。在查准率方面,相较于二维空间关系检索,基于三维空间关系的检索更精准。三维空间关系检索过滤了投影到二维平面后存在相交但在深度上无交集的数据,提高了检索的查准率。表 3列举了部分数据在二维空间关系和三维空间关系中的检索结果。例如,当检索“中国第15次南极考察普里兹湾叶绿素测量数据”时,利用考虑二维空间关系的方法进行检索,结果包含52条数据,其中存在25条在空间中并不相关的数据,查准率为51.9%;而通过本文方法检索到27条数据,查准率为100%。在查全率方面,使用关键字进行查询时,国家极地科学数据中心网站只能检索到标题中包含关键字的数据,数据关联性较弱;而在海洋空间本体中还可以检索到在空间位置上与之关联的数据,同时可实现海洋科学数据多学科交叉查询。例如,当要检索普里兹湾叶绿素数据并对其进行叶绿素含量的影响因子分析时,在国家极地科学数据中心网站只能检索到4条包含普里兹湾叶绿素关键字的数据信息;而在本文构建的本体库中可检索到7条数据,其中,“普里兹湾营养盐”“DO数据”“CTD数据”等,均为同区域范围内影响叶绿素含量的关联数据。

表 3 基于二维和三维空间关系的数据检索结果统计 Tab.3 Statistics of Search Results Based on 2D and 3D Spatial Relations

经以上对比分析可知,一方面,基于海洋科学数据空间本体的检索充分利用了海洋科学数据的空间位置信息,实现了数据空间关联查找,极大提高了查全率与查准率,优化了查询结果;另一方面,通过本体库进行跨学科数据检索时,可获取同区域不同学科要素的数据,方便了数据的获取,为多学科数据分析提供了有力支撑。

5 结束语

针对海洋数据的多源异构问题及其空间性,本文构建了海洋空间本体,并以国家极地数据中心的数据为海洋本体实例进行了实验分析。在海洋空间本体构建过程中,针对海洋科学数据的特点,定义了适合的拓扑关系表达方式,并提出一种改进的三维方位关系表示模型;同时引入本体推理,构建了空间关系推理规则集,进一步完善了海洋空间本体。实验证明,对于海洋空间数据,通过海洋空间本体查询可以获得更精确且关联性强的信息,有效解决了使用关键词查询时得到的信息关联性弱、查全率与查准率低等问题。

但由于大部分实例和关系通过手工构建,工作繁多且效率较低,因此,实现本体的自动构建将是下一步的研究重点。

参考文献
[1]
邢喆, 王祎婷, 李艳雯, 等. 多源数据组织建模在海洋空间数据管理中的应用研究[J]. 测绘地理信息, 2016, 41(1): 74-78.
[2]
张峰. 基于本体的海洋数据集成方法研究[D]. 青岛: 中国海洋大学, 2008
[3]
Bermudez L, Graybeal J, Isenor A W, et al. Construction of Marine Vocabularies in the Marine Metadata Interoperability Project[C]. Proceedings of OCEANS 2005 MTS/IEEE, Washington, DC, USA, 2005
[4]
云红艳, 徐建良, 郭振波, 等. 海洋生态本体建模[J]. 计算机应用, 2014, 34(4): 1105-1108. DOI:10.3969/j.issn.1001-3695.2014.04.036
[5]
Wang X H, Xu J L, Liu M T, et al. An Ontology-Based Approach for Marine Geochemical Data Interoperation[J]. IEEE Access, 2017, 5: 13364-13371. DOI:10.1109/ACCESS.2017.2724641
[6]
黄冬梅, 张倩, 王建, 等. 考虑空间关系的极地科学数据本体表达与构建方法研究[J]. 极地研究, 2018, 30(1): 77-87.
[7]
黄茂军, 杜清运, 杜晓初. 地理本体空间特征的形式化表达机制研究[J]. 武汉大学学报·信息科学版, 2005, 30(4): 337-340.
[8]
马雷雷. 空间关系本体描述与推理机制研究[D]. 郑州: 信息工程大学, 2012
[9]
Zhang X, Xu J. Construction of Geo-Ontology Knowledge Base About Spatial Relations[C]. Proceedings 2011 IEEE International Conference on Spatial Data Mining and Geographical Knowledge Services, Fuzhou, China, 2011
[10]
Huang D M, Zhang Q, Wang J, et al. Marine Information System Based on Ocean Data Ontology Construction [C]. 2018 IEEE International Conference on Systems, Man, and Cybernetics(SMC), Miyazaki, Japan, 2018
[11]
Chen X H, Liu Y Z, Xu L, et al. The Construction Method of Geographic Knowledge Graph Ontology Model Based on GML[C]. International Conference on Computer Science and Artificial Intelligence, Beijing, China, 2019
[12]
吴华意, 刘波, 李大军, 等. 空间对象拓扑关系研究综述[J]. 武汉大学学报·信息科学版, 2014, 39(11): 1269-1276.
[13]
Smart P D, Abdelmoty A I, El-Geresy B. Spatial Reasoning with Place Information on the Semantic Web[J]. International Journal on Artificial Intelligence Tools, 2014, 23(5): 1450011. DOI:10.1142/S0218213014500110
[14]
王淼, 郝忠孝. 三维空间方向关系的定性描述与推理[J]. 计算机工程, 2009, 35(15): 22-25. DOI:10.3969/j.issn.1000-3428.2009.15.008
[15]
郝晓红, 张丽平, 赵龄强, 等. 3DR39-3D方位关系模型与反方位关系[J]. 计算机工程, 2014, 40(7): 258-262. DOI:10.3969/j.issn.1000-3428.2014.07.053
[16]
郝晓红, 张丽平, 李松. 三维空间中3DR44方向关系表示模型[J]. 计算机工程, 2011, 37(1): 75-77.
[17]
郝晓红, 李松, 郝忠孝. 复杂3D空间中的3DR46模型的表示与推理[J]. 计算机科学与探索, 2020, 14(12): 2004-2013.
[18]
潘超, 古辉. 本体推理机及应用[J]. 计算机系统应用, 2010, 19(9): 163-167.