2. 南京邮电大学泛在网络健康服务系统教育部工程研究中心,江苏 南京 210023;
3. 南京邮电大学通信与信息工程学院,江苏 南京 210023
2. Engineering Research Center of Ubiquitous Network Health Service System of Ministry of Education, Nanjing University of Posts and Telecommunications, Nanjing 210023, China;
3. College of Telecommunications & Information Engineering, Nanjing University of Posts and Telecommunications, Nanjing, 210023, China
1 引 言
为实现地理信息资源的充分共享和广泛应用,体现其最大价值,一些政府机构或组织已相继资助了一批项目,如美国的“地理空间一站式访问”(geospatial one stop,GOS)计划[1]、美国国家航空航天局(NASA)的ACCESS、REASoN、MEaSUREs等项目[2]、加拿大的GeoConnections计划[3]、澳大利亚空间数据基础设施(ASDI)[4]、欧洲空间信息基础设施(INSPIRE)项目[5]等。在国内,以文献[6]的中国地球系统科学数据共享网建设项目[6]为代表,也开展了相关的研究工作,如中国西部环境与生态科学数据中心[7, 8, 9]等。在这些项目实施的过程中,产生了大量的地理信息服务资源为主要形式的研究成果。地理信息服务的剧增使得基于数据模型层面的共享已越来越难以满足人们的需求。基于关键字的匹配查询时,搜索内容很难实现多个关键字(比如子概念与概念)的描述,同时,查询关键字也可能存在于地理信息服务元数据的多个描述地方,但不能体现该地理信息服务的真正内容,而语义搜索就可以解决类似问题。为了克服传统的地理信息检索方法由于关键词词形匹配带来的缺陷[10],通过引入地理本体相关概念对知识的概念和相互间的关系进行较为精确的定义,实现良好的概念层次结构和对逻辑推理的支持。
地理信息服务在地理空间知识的有效组织和表达方面的能力比较弱,缺乏对服务信息的描述,处于数据丰富而知识缺乏的境地,造成了已有的数据在知识的表示和检索上的缺陷。为从海量地理信息服务源中快速获取所感兴趣的、与所需内容具有高语义相似度的服务,通过应用粗糙集理论对已有的地理信息服务数据进行知识约简,从而有效地对复杂知识进行简化处理获取有用的知识[11]。
2 基于地理本体的OGC地理信息服务表达 2.1 地理本体地理本体是通过地理本体来研究地理信息科学领域内不同层次和不同应用方向上的地理间信息概念的详细内涵和层次关系,并给出概念的语义标识[12],是基于本体的地理数据框架中的一个应用,在领域本体中定义地理学科的本体概念已在地理信息科学领域的研究与应用受到广泛关注。地理本体作为一种领域本体,可以提供地理间信息领域中概念的词表以及概念间的关系的描述方法。因此,在地理信息集成与互操作、地理信息语义共享、地理时信息语义描述等方面已有相关的应用研究。文献[13, 14, 15, 16]通过引入本体来消除地理信息在语义层面的歧义,促进异构地理信息数据间的共享与互操作;文献[17, 18, 19, 20, 21]基于本体实现信息服务在语义层面的表达与共享;文献[22]通过定义概念的本体属性来明确及规范化地表达概念的语义,给出基础地理信息陆地水系要素的形式化语义,为基于本体开展语义检索提供了基础。与早期的基于关键字和依赖词法的信息检索技术相比,用于信息管理的语义搜索和推理方法的研究处于增长的趋势。由此可以看出,地理本体作为GIS共享概念模型建模的最为有效的方式,在描述不同数据源之间的语义差异性、共享与互操作方面的优势已得到GIS界的广泛重视,是用于地理信息服务语义演绎推理研究的一个重要方法。
2.2 OGC地理信息服务本体库本文研究对象主要以基于网络地图服务(web map service,WMS)标准规范发布的地理信息服务数据为目标数据,OGCWMS实现规范[23]中主要提供3个服务接口:GetCapabilities、GetMap和GetFeatureInfo。其中,GetCapabilities操作返回服务的元数据,它对服务检索起到关键作用,本文所约简的对象即为该信息中的描述词汇。
2.2.1 OWS本体信息词典本文通过收集领域信息,在充分了解领域知识的基础上,信息来源包括专家、书籍、网络、甚至是其他的本体等,基于GB/T 13923-2006基础地理信息要素分类标准和搜集到的300条地理信息服务共享数据样本,主要以海岸线要素领域的OWS(OGC Web Service,OGC网络服务)为例,提取描述描述词汇,建立本体信息词典,如表 1所示。
本体信息 |
水系、海洋要素、海岸线、地图输出模式、服务摘要、图层标题、地图投影、图层名称、服务标题、服务类型、服务链接、服务版本信息、加拿大海岸线、美国海岸线、水、water、流水、海、海洋、ocean、sea、seas and oceans、coastline、海岸、beach line、sea line、shoreline、strandline、Canada、Canada coastline、加拿大、American、美国、American coastline |
表 1中海岸线要素的OWS本体信息词典列举了地理信息服务领域大量的概念术语,但仅仅是一张毫无组织结构的词汇表。为了形成客观世界的概念知识模型,本文依据类、属性和个体(实例)的方式进行划分,形成一个领域知识的框架体系,得到领域本体的基本框架结构。基于领域地理框架构建方法,以水系为例构建的OWS服务的地理本体框架如图 1所示,图中用表示属性,表示类,表示实例,E表示等价关系,P表示属性,is-a表示父类与子类关系。
2.2.3 OWS关系存储基于本体库中的属性描述词汇对所搜集的OWS服务的能力文件XML样本数据进行解析,建立地理信息服务实例数据库,并在数据库中保留一张通用表,表中的列表示本体中的属性,表中的行表示本体中的每个实例。例如一条实例如“加拿大海岸线”在关系数据库中的存储方式如表 2所示,该描述方式包括了OGC WMS标准的所有必须标签内容,但其重要度在整个WMS数据中并不是同等的。
字段名 | 字段值 |
实例名 | 加拿大海岸线 |
服务标题 | CubeSERV Demo WMS |
服务链接 | http://portal.cubewerx.com/cubewerx/cubeserv/cubeserv.cgi |
图层标题 | coastlines |
服务摘要 | OGC-compliant cascading web map server(WMS) by CubeWerx Inc |
服务类型 | WMS |
图层名称 | foundation.oceansea_1m |
版本信息 | 1.3.2 |
地图投影 | EPSG:4326 |
图层空间范围 | -180, -90, 90, 180 |
地图输出格式 | image/png |
地理信息服务实例数据库中存储了大量地理信息服务属性描述词汇,数据库中的描述词汇并不是同等重要的,甚至其中某些词汇存在语义冗余,直接影响检索结果的准确率进而干扰用户的决策。本文拟把粗糙集理论应用到复杂的地理信息服务描述处理中,在保持分类和决策能力不变的条件下,剔除不相关或不重要的冗余描述词汇,保证推理结果的准确性。
3.1 地理信息服务描述词汇约简 3.1.1 基本定义[24]定义1 一个信息系统S可以表示为:S=〈U,A,V,f〉。其中,U是对象的非空有限集合,即论域;A是属性集合;V=∪Va,Va表示属性a的值域;f:U×A→V。 定义2 设 KRS =(U,A,V,f)是一个知识表达系统,其中论域是对象的一个非空有限集合U={x1,x2,…,xn},|U|=n,则定义
式中,Cij={a|(a∈A)∧(fa(xi)≠fa(xj)},∀i,j=1,2,…,n为知识表达系统的差别矩阵,差别矩阵的元素Cij就是能够区分对象xi和xj的所有简单属性组成的集合。 定义3 CORE (C)={a|(a∈C)∧(∃cij((cij∈Mn×n)∧(cij=a)))},即系统的核等于该信息系统的差别矩阵中所有简单属性(单个属性)元素组成的集合。 3.1.2 算法描述(1) 对OWS服务描述数据库的300条OWS服务样本数据进行解析,构成地理信息服务实例数据库,将每一条OWS服务描述词汇集的数据构成一个研究对象,结合领域知识形成宜于实施分析的数据形式。同时,基于信息系统的定义,将所有OWS服务的描述词汇集数据作为论域,描述词汇集作为属性集合,形成一个面向OWS服务描述词汇的信息系统 S。
(2) 结合信息系统S 和差别矩阵的定义,形成面向OWS服务描述词汇的差别矩阵Mn×n=(Cij)n×n。
(3) 求出信息系统的核。根据系统核的定义,搜索差别矩阵中所有的单属性元素(即Cij中包含的aij的个数为1),将其赋予 CORE (A),并设B= CORE (A)。
(4) 将差别矩阵中与系统核集不存在交集的集合设置为空,即∀a(xi,xj)(i,j=1,2,…,n),如果a(xi,xj)∩B≠Φ,则令a(xi,xj)=0。
(5) 判断差别矩阵中的所有集合是否为空,即∀a(xi,xj)(i,j=1,2,…,n),如果有a(xi,xj)=0,则转到步骤(7),否则转到步骤(6)。
(6) 统计差别矩阵中每个属性出现的次数,选取出现次数最多的元素加入属性核集 CORE (A)中,即a= max {a在差别矩阵中出现的次数},B=B∪a,转到步骤(4)。
(7) 输出 CORE (A)。 CORE (A) 中包含的描述词汇即为最优OWS服务描述词汇,完成约简模型搭建。整个建立过程如图 2所示。
整个OWS约简模型工作流程如下:
(1) 能力描述文件解析。应用JAXB(Java Architecture for XML Binding:XML数据绑定框架)解析OWS的能力描述文件,获取服务的主要描述词汇,并将解析结果数据以数据库形式存储,构建OWS实例数据的词汇描述数据库。
(2) 形成信息系统。基于领域本体知识,分别将OWS服务的描述词汇集数据、描述词汇集以及描述词汇所对应的标签值看作论域U、属性集合A和属性值域V ,构建面向OWS的信息系统。
(3) 构造差别矩阵。依据Skowron差别矩阵的定义,通过比较300条OWS的各描述词汇的属性值,得到一个300×300的差别矩阵,矩阵中的元素代表能够区分对应两条OWS的所有简单属性组成的集合。
(4) 析出信息系统核。将差别矩阵中所有出现次数为1的元素即单属性元素析出,构成信息系统的核。
(5) 获得属性集。判断矩阵中的任一非空元素是否与核集相交,①若皆不相交,则输出属性集A的核即为OWS最优属性描述词汇集,基于此可构建最优实例数据库;②若仍存在相交的集合,则将出现次数最多的元素加入属性核集,再次进行“判断矩阵中的任一非空元素是否与核集相交”操作,直至输出OWS最优属性描述词汇集。
3.2 OWS最优实例数据库基于地理信息服务的描述词汇约简算法,实现对地理信息服务实例数据库进行知识约简,最终获取最优描述词汇词汇集:服务标题、服务链接、图层标题、服务摘要、图层名称、服务类型,并删除冗余属性描述词汇:地图输出模式、服务版本信息、地图投影,形成地理信息服务最优实例数据库数据库中一个地理信息服务存储形式如表 3所示。
字段 | 字段值 |
服务标题 | CubeSERV Demo WMS |
服务链接 | http://portal.cubewerx.com/cubewerx/cubeserv/cubeserv.cgi |
图层标题 | coastlines |
服务摘要 | OGC-compliant cascading web map server(WMS) by CubeWerx Inc |
服务类型 | WMS |
图层名称 | foundation.oceansea_1m |
Jena是惠普公司开发的一个基于Java的开放源代码语义网工具包,为解析资源描述框架(resource description framework,RDF)和OWL本体提供的编程环境及基于规则的推理引擎。本文应用Jena包中的解析类,对研究样本的OWS地理信息服务本体库文件进行解析,采取工厂化方法获得其通用规则推理机,将推理机和需要进行推理的本体进行绑定,得到进行检索的模型对象,借助Ontology API和Model API对已建立的模型对象进行操作和处理,通过对概念的推理完成基于语义的信息检索,从而实现基于地理信息服务本体库的知识语义搜索。具体实现如图 3所示。
4.2 语义推理系统框架为实现地理信息服务语义推理,基于上述研究内容设计了集成框架体系结构及其工作流程如图 4所示,整个体系结构分为3层:①用户界面层是该体系结构与用户交互的部分,主要用于用户构建基于地理信息服务关键词的查询语句,以及返回用户查询结果;②中间层主要包括应用语法分析和语义分析模块,语法分析模块主要包括对查询语句进行关键词提取,并验证本体库中是否存在关键词所对应的本体类,语义分析模块主要包括对关键词进行同义词扩展,利用本体库中的本体类等价关系对本体进行推理,得到隐含的信息,并构建数据库查询语句,获取查询结果;③数据层提供地理信息服务本体和实例数据,本体数据提供语义分析的依据,实例数据提供服务查询结果
。 4.3 实例验证在本文所建立的OWS服务地理本体框架中,“水系”“海洋要素”“海岸线”和“美国海岸线”这4个词汇构成本体框架的主干线。试验以检索与该4个词汇有关的OGC地理信息服务为例,验证本文提出的约简方法的有效性和准确性。分别基于关键词匹配方式查询、无约简的本体扩展推理和约简的本体扩展推理3种方式,进行3组推理试验对比,其对应的查全率和查准率如表 4-表 7所示。
检索方式 | 返回OWS数量 | 相关OWS数量 | 对应OWS数量 | 查全率/(%) | 查准率/(%) |
关键词匹配 | 72 | 58 | 150 | 38.7 | 80.6 |
无约简的本体扩展推理 | 158 | 146 | 150 | 97.3 | 92.4 |
约简的本体扩展推理 | 154 | 146 | 150 | 97.3 | 94.8 |
检索方式 | 返回OWS数量 | 相关OWS数量 | 对应OWS数量 | 查全率/(%) | 查准率/(%) |
关键词匹配 | 58 | 45 | 105 | 42.8 | 77.6 |
无约简的本体扩展推理 | 100 | 96 | 105 | 91.4 | 96.0 |
约简的本体扩展推理 | 98 | 96 | 105 | 91.4 | 98.0 |
检索方式 | 返回OWS数量 | 相关OWS数量 | 对应OWS数量 | 查全率/(%) | 查准率/(%) |
关键词匹配 | 25 | 21 | 50 | 42.0 | 84.0 |
无约简的本体扩展推理 | 52 | 47 | 50 | 94.0 | 90.4 |
约简的本体扩展推理 | 49 | 47 | 50 | 94.0 | 95.9 |
检索方式 | 返回OWS数量 | 相关OWS数量 | 对应OWS数量 | 查全率/(%) | 查准率/(%) |
关键词匹配 | 15 | 11 | 32 | 42.3 | 73.3 |
无约简的本体扩展推理 | 31 | 29 | 32 | 90.6 | 93.5 |
约简的本体扩展推理 | 30 | 29 | 32 | 90.6 | 96.7 |
通过表 4-表 7的试验数据可以看出,与基于关键词匹配的检索方式相比,在应用约简算法简化OWS服务描述词汇后,查全率与查准率两个指标都有较大程度提高;而与无约简服务描述词汇的本体扩展推理方式相比,其OWS查全率并未降低,且提高了检索的查准率,证明本文所采取的约简算法是有效且准确的。
5 结 论语义信息在异构地理信息服务共享中占据重要位置,随着地理信息科学的发展,地理信息服务基于语义层面的演绎推理研究的地位日益凸显。然而,一个地理信息服务所描述的往往不是一个孤立的地理语义,有时会因为地理信息分类体系之间的语义不一致性导致在不同领域、不同系统中解决问题时对同一概念理解不一致,因而存在语义差异问题。在访问、检索和集成应用这些地理信息服务时,往往由于语义差异性导致用户很难获取或是获取不全其真正所需要的地理信息服务。
本文通过引入粗糙集理论的约简规则模型,优化了OWS地理信息服务数据的描述词汇,并建立了适合于描述OWS地理信息服务的本体描述方法、定义及其最优实例数据集。基于该本体描述集,应用并改进了已有的语义推理包,实现了OWS地理信息服务语义层面的演绎推理,并具有较高的准确度与查全率,能够实现OWS服务之间无歧义的基于语义层面的演绎推理。
由于搜集的地理信息服务样本数据数量有限,本文主要以海岸线要素领域为例研究了OWS地理信息服务的语义推理,地理信息服务还涉及很多方面,如地质、行政区域等,在后期研究中将继续开展其他领域地理信息服务的研究。此外,本文未涉及地理信息服务空间属性的讨论,可以从服务样本数据中提取空间属性关键描述词汇并插入到实例数据库中,根据用户输入的空间查询条件,从数据库中获取满足该条件的地理信息服务数据,基于服务空间属性的知识推理也将是今后地理信息服务语义推理的一个重要研究方向。
[1] | LI Zhenlong, YANG Chaowei, WU Huayi, et al. An Optimized Framework for Seamlessly Integrating OGC Web Services to Support Geospatial Sciences[J]. International Journal of Geographical Information Science, 2011, 25(4): 595-613. |
[2] | MIAO Lizhi, HOUSER P, YANG Chaowei, et al. Earth Science Data Records Sharing Supported by the Spatial Web Portal[C]//IEEE International Geoscience and Remote Sensing Symposium. Honolulu, Hawaii: IEEE, 2010: 4749-4752. |
[3] | JUDGE E F, SCASSA T. Intellectual Property and the Licensing of Canadian Government Geospatial Data: an Examination of GeoConnections’ Recommendations for Best Practices and Template Licences[J]. The Canadian Geographer/Le Géographe Canadien, 2010, 54(3): 366-374. |
[4] | MCDOUGALL K, RAJABIFARD A, WILLIAMSON I. Local Government and SDI-Understanding Their Capacity to Share Data[EB/OL].[2013-10-28]. http://www.csdila.unimelb.edu.au/publication/conferences/GSDI-11/LocalGovernmentandSDI.pdf. |
[5] |
CRAGLIA M, ANNONI A. INSPIRE: An Innovative Approach to the Development of Spatial Data Infrastructures in Europe[EB/OL]. [2013-10-28]. http://ies.jrc.ec.europa.eu/uploads/SDI/INSPIRE%20An%20 Innovative%20Approach%20to%20the%20Development%20of%20SDIs%20in%20Europe%20GSDI%209.pdf. |
[6] | Institute of Geographic Sciences and Natural Resources Research, CAS. Data Sharing Infrastructure of Earth System Science[EB/OL]. [2013-11-2]. http://www.geodata.cn. |
[7] | ZHU Yunqiang, SUN Jiulin. The Research Progress in Geo-data Sharing Based on e-GeoScience[J]. Advanced in Earth Science, 2006, 21(3): 286-290. (诸云强, 孙九林. 面向e-GeoScience的地学数据共享研究进展[J]. 地球科学进展, 2006, 21(3): 286-290.) |
[8] | ZHU Yunqiang, SUN Jiulin, LIAO Shunbao, et al. Earth System Scientific Data Sharing Research and Practice[J]. Journal of Geo-Information Science, 2010, 12(1): 1-8. (诸云强, 孙九林, 廖顺宝, 等. 分布式地球系统科学数据共享平台研究[J]. 地球信息科学学报, 2010, 12(1): 1-8.) |
[9] | Clod Region and Arid Region Science Data Centre[EB/OL]. [2013-11-4]. http://westdc.westgis.ac.cn/. |
[10] | LIU Jiping, LI Bin, SHI Lihong, et al. An Automated Retrieval Method of Geo-spatial Event Information Based on Ontology[J]. Acta Geodaetica et Cartographica Sinica, 2011, 40(4): 502-508. (刘纪平, 栗斌, 石丽红, 等. 一种本体驱动的地理空间事件相关信息自动检索方法[J]. 测绘学报, 2011, 40(4): 502-508.) |
[11] | PAWLAK Z. Rough sets[J]. Communications of the ACM, 1995, 38(11): 89-95. |
[12] | SUN Min, CHEN Xiuwan, ZHANG Feizhou. Geographic Information Ontology Theory[J]. Geography and Geographic Information Science, 2004, 20(3): 6-11. (孙敏, 陈秀万, 张飞舟. 地理信息本体论[J]. 地理与地理信息科学, 2004, 20(3): 6-11.) |
[13] | KAUPPINEN T, HENRIKSSON R, SINKKIL R, et al. Ontology-based Disambiguation of Spatiotemporal Locations[EB/OL]. [2012-05-09]. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.142.7873&rep=rep1&type=pdf. |
[14] | TAN Xicheng, BIAN Fuling. Heterogeneous Spatial Information Interoperability Based on Cooperative Ontologies[J]. Geomatics and Information Science of Wuhan University, 2005, 30(2): 178-181. (谭喜成, 边馥苓. 基于本体协同的空间信息互操作方法[J]. 武汉大学学报: 信息科学版, 2005, 30(2): 178-181.) |
[15] | CUI Wei. Ontology-based GIS Interoperability[J]. Journal of Geomatics, 2004, 29(1): 20-22. (崔巍. 用地理本体实现地理信息系统互操作[J]. 测绘信息与工程, 2004, 29(1): 20-22.) |
[16] | DUAN Xueqing. A Research of Share and Interoperability in Semantic Geo-Spatial Information Based on Ontology[D]. Zhenjiang: Jiangsu University, 2007. (段学庆. 基于Ontology的语义地理信息共享与互操作技术的研究[D]. 镇江: 江苏大学, 2007.) |
[17] | WEIENBERG N, GARTMANN R. Ontology Architecture for Semantic Geo Services for Olympia 2008[EB/OL]. [2013-11-05]. http://www.gi-tage.de/archive/2003/downloads/gitage2003/tagungsband/weissenberg.pdf. |
[18] | LI Hongmei, ZHAI Liang, ZHU Huang. Semantic Similarities Calculative Modeling for Geospatial Entity Classes Based on Ontology[J]. Science of Surveying and Mapping, 2009, 34(2): 12-14, 24. (李红梅, 翟亮, 朱熀. 基于本体的地理空间实体类型语义相似度计算模型的研究[J]. 测绘科学, 2009, 34(2): 12-14, 24.) |
[19] | HUANG Yuxia. GIS Semantic Sharing[D]. Beijing: Institute of Geographic Sciences and Natural Resources Research, CAS. (黄裕霞. GIS语义共享[D]. 北京: 中国科学院地理科学与资源研究所, 2000.) |
[20] | JING Dongsheng. A Research on Geo-Spatial Information Semantic Expression and Service Based on Ontology[D]. Beijing: Institute of Remote Sensing Applications Chinese Academy of Sciences, 2005. (景东升. 基于本体的地理空间信息语义表达和服务研究[D]. 北京: 中国科学院遥感应用研究所, 2005.) |
[21] | JING Dongsheng, WU Fei. Geo-spatial Information Semantic Share on Base of Ontology and Agent[J]. Geomatics World, 2005, 3(4): 35-38. (景东升, 吴斐. 基于本体和Agent的地理空间信息语义共享[J]. 地理信息世界, 2005, 3(4): 35-38.) |
[22] | LI Lin, ZHU Haihong, WANG Hong, et al. Semantic Analyses of the Fundamental Geographic Information Based on Formal Ontology——Exemplifying Hydrological Category[J]. Acta Geodaetica et Cartographica Sinica, 37(2): 230-235. (李霖, 朱海红, 王红, 等. 基于形式本体的基础地理信息语义分析——以陆地水系要素类为例[J]. 测绘学报, 37(2): 230-235.) |
[23] | BEAUJARDIERE J. OpenGIS Web Map Service (WMS) implementation specification version[EB/OL]. [2013-11-05]. http://www.opengeospatial.org/standards/wms. |
[24] | PAWLAK Z. Rough Sets[EB/OL]. [2013-11-03]. http://bcpw.bg.pw.edu.pl/Content/2026/RoughSetsRep29.pdf. |