研究表明,地球上至少60%的信息都具备地理空间参考信息,地理元素已成为信息的重要组成部分。特别是在社会信息化和网络化高速发展的时代,地理信息已然是众多如环境保护、智慧城市、基于位置服务等应用重要的数据基础。与此同时,地理数据资源也越来越丰富,不仅数据覆盖范围变广(高空、地上、地表及地下全空间),而且信息维度也不断增加(二维、三维和时空四维)。如何从丰富数据资源中获取正确的地理信息是满足日益增长且持续变化的应用需求的基本前提。通常,获取地理信息的方式有人工采集与模型计算两种。人工采集的地理信息通常是基础地理信息,而需要依赖模型计算提取的地理信息则是复合地理信息。在当前基础地理信息相对丰富的情况下,研究如何利用语义信息辅助计算机正确地执行提取模型,从丰富数据资源中获取准确的复合地理信息变得相对更重要。本文结合语义分析技术,提出了语义支持的地理实例计算模型,并研发了相应的原型系统,讨论了地理语义应用于地理模型计算的可行性。论文工作包含以下几个方面。
(1) 构建了以地理概念为核心对象的语义网络,从语义内涵及语义关联表达地理概念语义,并以五元组形式表达:SGIC-Onto={C,PC,R,IC,X},分别代表地理概念、本体属性集合、语义关联集合、概念实例及语义约束;构建了由语义关联与关联概念组成的地理概念语义约束,其中语义关联是指用于提取地理实例的模型,关联概念是指模型计算所需的概念型参数。因此语义约束联连结地理概念的纽带,是实现模型计算的关键。
(2) 重点分析与形式化表达地理概念、概念实例与语义约束的语义内涵及关联;采用资源描述框架(RDF)的三元组,即{主语、谓词、宾语}的形式,以及统一资源描述符(URI)描述地理语义信息,构建了符合关联数据(Linked Data)规范的地理概念语义网络,并基于D2RQ软件平台将地理语义信息发布为地理知识关联数据库。
(3) 基于地理知识关联数据库,提出语义支持的地理实例计算模型。通过分析并形式化表达地理概念的语义内涵及语义约束,构建地理知识关联数据库,并以此为知识基础研发语义支持的地理实例计算引擎,提供基于语义信息的地理实例提取模型计算。其中如何形式化表达地理概念语义及利用语义信息实现地理实例计算是整个模型的关键。
(4) 提出了基于概念语义内涵(以本体属性表达)的数据语义有效性验证模型。该验证模型将地理概念的本体属性类型划分为4种类型(同义型、层次型、数值型与常规型),分别采用不同的算法计算各本体属性的语义相似度,通过综合计算用户输入数据所属类别与语义约束关联概念类别的语义相似度,确定二者之间的相似性。有效性验证模型在传统语法正确性验证的基础上增加语义层面的保证,确保用户输入符合计算模型的语义要求,有力地保证了模型计算结果的正确性。
(5) 设计并研发了基于计算模型的原型系统,以验证模型设计的合理性。原型系统实现包括语义形式化表达、语义约束构建、知识链构建与计算等功能的实现;通过实现地理概念“河口”与“坡度变化率”的提取实验,验证了计算模型在语义有效性匹配与地理概念网络推理计算方面所具备的能力;实现了“城市热岛提取”应用案例,完整展示了计算模型各功能模块间的语义交换与计算过程。结果验证了地理语义应用于地理实例提取过程的可行性与有效性。