本体属性的基础地理信息概念语义相似性计算模型

Download PDF 打印本文

文章快速检索

高级检索

引用本文

谭永滨，李霖，王伟，等。本体属性的基础地理信息概念语义相似性计算模型[J].测绘学报，2013，42(5)：782-789. 复制到剪切板

TAN Yongbin，LI Lin，WANG Wei,et al.Semantic Similarity Measurement Model between Fundamental Geographic Information Concepts Based on Ontological Property[J]. Acta Geodaetica et Cartographica Sinica,2013,42(5): 782-789. 复制到剪切板

本体属性的基础地理信息概念语义相似性计算模型

谭永滨¹,李霖^1,2 ,王伟^1,3,于忠海¹,张志军^4,5 ,毛凯¹,许赟¹

1. 武汉大学资源与环境科学学院，湖北武汉 430079 ；
2. 武汉大学地理信息系统教育部重点实验室，湖北武汉 430079；
3. 国家测绘与地理信息局，北京 100039；
4. 天津市测绘院，天津 300381；
5. 武汉大学测绘遥感信息工程国家重点实验室，湖北武汉 430079

收稿日期：2012-08-10；修回日期：2013-06-04

基金项目：国家自然科学基金(41271453)；教育部高等学校博士学科点专项科研基金(博导类) (20120141110048)

第一作者简介：谭永滨(1985-)，男，博士生，研究方向为数字地图制图、地理信息本体模型。E-mail： briandottan@whu.edu.cn

通信作者：李霖,E-mail：lilin@whu.edu.cn

摘要：语义相似性对于知识自动共享与集成起着非常重要的作用。面向基础地理信息领域，利用属性枚举方法表达概念的本质语义特征，从基础地理信息概念的内涵出发，提出基于本体属性的语义相似性计算模型。该模型将每个概念表达为本体属性集合，利用相关本体属性的相似性，结合权重信息计算概念的相似性。最后从基础地理信息概念中提取出100组样本，计算概念间的语义相似度并验证基于本体属性模型的有效性。试验结果表明，基于本体属性的模型能更合理地计算出基础地理信息概念的相似度。

关键词：本体属性语义相似性属性枚举基础地理信息概念

Semantic Similarity Measurement Model between Fundamental Geographic Information Concepts Based on Ontological Property

TAN Yongbin¹ ,LI Lin^1,2 ,WANG Wei^1,3 ,YU Zhonghai¹ ,ZHANG Zhijun^4,5,MAO Kai¹,XU Yun¹

1. School of Resources and Environmental Science, Wuhan University, Wuhan 430079, China;
2. Key Laboratory of GIS of Ministry of Education, Wuhan University, Wuhan 430079, China;
3. National Administration of Surveying, Mapping and Geo-information, Beijing 100830, China;
4. Tianjin Institute of Surveying and Mapping, Tianjin, 300381, China;
5. State Key Laboratory of Information Engineering in Surveying,Mapping and Remote Sensing,Wuhan University,Wuhan 430079,China

First author: TAN Yongbin(1985-),male,PhD candidate,majors in digital cartography,geo-ontology model.E-mail: briandottan@whu.edu.cn

Corresponding author: LI Lin,E-mail：lilin@whu.edu.cn

Abstract: Semantic similarity plays an important role in the knowledge sharing and data integration.This article proposes a semantic similarity measurement model based on the intrinsic features of the concepts, represented by the attribution enumeration for the need of fundamental geographical domain application. In this model, a set of ontology properties, representing the natural features of each concept, were defined to model each fundamental geographic concept. After that, the similarity of each pairs of the concepts can be measured by integrating the similarity of each ontological property and its corresponding weight, which were defined by the experts.A hundred samples of the concepts of the fundamental geographic information were chosen to compute their similarity. The results showed that this proposed approach achieved good performance in measuring the similarity of the fundamental geographic information concepts.

Key words: ontological property semantic similarity attribution enumeration fundamental geographic information concept

1 引言

相似性度量是描述概念间相关程度的重要方法，目前广泛应用于计算语言学与人工智能等领域中，如知识获取、信息检索、数据集成等^{[1, 2, 3, 4, 5]}。计算机领域一般将相似性定义为概念在层次结构中的语义距离^[6]；认知心理学领域认为相似性是关于概念特征相似性的描述^[7]。随着语义层面的地理信息互操作越来越频繁，地理数据的语法异构与语义异质影响着地理信息互操作的进程，如何有效地度量地理信息的语义相似性显得越来越重要^{[8, 9]}。此外，随着地理数据不断丰富，明确概念语义以保证数据正确关联是保持地理数据现势性的关键。文献^[10]通过计算语义相似度寻找并发现新旧地理数据集里的相关要素，实现基于不同采集标准的地理要素更新；文献^[11]借助集合论定义空间相似关系，并应用于多比例尺地图自动制图综合过程。

目前相似性度量方法众多，有基于字符串的计算模型^{[12, 13, 14]}、基于语义距离的计算模型^{[15, 16, 17]}、基于特征的计算模型^[18]、基于信息内容的计算模型^{[19, 20, 21]}等。文献^[22]利用WordNet中词汇的义项、关系等内容构建地理信息服务的功能、部分与属性，结合比率模型^[18]和语义距离，计算词汇的相似度。文献^[23]将概念形式化为相应的几何域，形成概念空间的多维区域，利用欧式距离计算区域距离描述概念相似度。在地理信息领域的语义相似度算法研究，虽然直接利用分类体系作为领域(或任务)本体可快速简便地计算语义相似度，但是由于分类体系通常是面向具体应用构建的，因此同一组概念的相似度会因为分类体系的不同而产生差异。例如，地理要素类别“旱地”与“果园”在《GB/T 21010-2007 土地利用现状分类》与《GB/T 13923-2006 基础地理信息要素分类与代码》中位于不同的位置，利用概念矢量算法^[16]计算可得，在前者相似度为0.006 4，而在后者其相似度却是0.548 1。另外为了保证分类树状结构的平衡性和完整性，分类体系常常会将少数或难以划分的概念归类于“其他”类中。例如在《GB/T 13923-2006基础地理信息要素分类与代码》中，地理要素类别“岸滩”与“水井”被归类到“其他水系要素”中，“沙滩”位于另一分枝中，利用概念矢量算法可得“岸滩”与“水井”的相似度为0.402 8，而“岸滩”与“沙滩”的为0.229 3，相似度的大小关系与常识判断不符。

本文面向基础地理信息领域，试图从概念的内涵出发提出一种基于概念本体属性^[24]的语义相似性度量模型。该模型根据本体属性的类型不同，分别采用不同的算法计算本体属性值的相似度，最终结合各个本体属性的重要性计算概念间的语义相似度。

2 概念语义描述

本体论是从概念本原明确描述语义信息的理论^[25]。为了实现形式化知识的共享与重用，将本体论引入信息科学领域形成信息本体。信息本体是信息知识概念化的、明确的描述^[26]，具有概念化、明确、形式化及共享的特点^[27]。常用的概念语义表达方法有比喻法、代数法、描述逻辑^[28]、属性枚举法^[24]等。属性枚举法是列举出概念的相关属性项以表达概念语义，具有方便快捷的特点。本文采用属性枚举法表达概念语义。概念通常包含有描述本质特征的属性，以及描述辅助信息的属性。概念的本体属性是指所有实例都应具有的，属性值不因其实例状态的变化而发生改变，始终保持为常量的属性项^[24]。为了权衡结果准确性与算法效率，本文通过整合本体属性的相似性表达概念间的整体相似性。

由于每个本体属性对于要素分类的重要性各不相同，本文提出的模型中增加权重分量以描述特定本体属性的重要性。本体属性集合向量结构定义为A = {a₁v₁ω₁,a₂v₂ω₂,…,[a_nv_nω_n]}，其中，a为本体属性项分量，v为本体属性值，ω为各个本体属性所占的权重值，可由层次分析法^[29]确定。

3 基于本体属性的语义相似性模型

计算概念整体相似度的关键在于估计各个本体属性项的相似度。本文针对不同的属性类型采用相应的相似度算法，分别计算每个本体属性项的相似度，最终结合权重值计算概念相似度。本体属性项可分为5种类型：标称型、同义型、层次型、数值型和其他型。基于本体属性的语义相似度计算模型如图 1所示。对于概念c与c′的相似度函数δ_A(c,c′)，令P为本体属性集合，U={N,S,H,M,T}分别表示各种属性类型的相似度算法；c与c′的属性项p (p∈P)的值分别为v_p^c与v_p^c′；Φ_A^u(v_p^c,v_p^c′)为各种属性类型相应的算法函数；u∈U表示特定的属性类型；ω_p为概念的每个本体属性的权重值。基于本体属性的相似度算法函数为

点击浏览公式

图 1 基于本体属性的语义相似度计算模型 Fig. 1 The measurement model for the semantic similarity based on the ontological property

图选项

3.1 本体属性类型

标称型属性相似度Φ_A^N(v_p^c,v_p^c′)：进一步划分为有序标称属性与无序标称属性。

同义类型属性相似度Φ_A^S(v_p^c,v_p^c′)：利用外部类义词词典计算属性值间的相似度。

层次型属性相似度Φ_A^H(v_p^c,v_p^c′)：结合外部本体结构，利用属性值间的关系综合计算相似度。

数值型属性相似度Φ_A^M(v_p^c,v_p^c′)：利用属性值中可能存在的数值范围，计算v_p^c与v_p^c′的相似度。

其他类型属性相似度Φ_A^T(v_p^c,v_p^c′)：针对不属于上述任意一种类型的属性计算相似度。

3.2 各种类型的相似度算法

本节将给出了上述5种类型的本体属性的相似度算法，通常在计算前先明确属性类型是否属于前4种，若不属于其中任意一种再采用其他类型属性相似度模型计算相似度。假定要计算概念c_i与c_j的相似度，分别提取出c_i与c_j本体属性集合P_ci与P_cj。对于其中某个本体属性项p而言，存在以下3种情况：

(1) 若p∉P_ci 且 p∉P_cj，则认为该属性项的相似度Φ_A(p_ci,p_cj) = null，最终相似度结果不考虑该属性项。

(2) 若(p∈P_ci 且 p∉P_cj)或(p∉P_ci 且 p∈P_cj)，则认为该属性项的相似度Φ_A(p_ci,p_cj) = 0，最终相似度结果仍需考虑该属性项。

(3) 若p∈(P_ci∩P_cj)，则根据属性类型选择相应的模型计算相似度。

接下来，本文将详细介绍各类型属性项的相似度算法。假设本体属性项p可能存在的属性值域为v(p)；c_i与c_j的属性p的值分别为v_p^c与v_p^c′，满足v_p^c∈v(p)，v_p^c′∈v(p)；所有相似度结果均被归一化到0至1之间。

3.2.1 标称属性的相似度计算

标称属性是指具有两个及两个以上的状态值的属性，可由字符串、符号或数值表达。但需要注意的是，各种状态值可不代表任何特定的顺序，只是用于表达数据的整数值，也可表达具有一定顺序的符号。

3.2.1.1 有序标称属性

有序标称属性特指具有特定顺序或程度差别的标称属性。例如，描述地形倾斜信息的“坡度”属性值包含有“小于20°”，“20°~40°”，“40°~70°”与“大于70°” 4个等级程度，可称为有序标称属性。其相似度计算方法可先将所有属性值升序排列，接着从数值1开始为每个属性值编号作为其各自的索引值，通过计算两个属性值相对应的索引值之间的差值描述其不相似度，并进一步计算差值与属性值域基数的比值，归一化表达相似度结果。有序标称属性相似度函数为

点击浏览公式

式中，函数f用于对应每个属性值的索引值，对于任意属性值v_p^c都存在唯一的索引值f(v_p^c)与之相对应；m表示属性值域的基数。

3.2.1.2 无序标称属性

无序标称属性是指无程度差别或次序关系的标称属性。由于此类属性项各值之间保持独立，且不存在交集，因此若完全相同则认为其相似度为1；反之为0。无序标称属性相似度函数为

点击浏览公式

3.2.2 同义属性值相似度计算

同义关系是指一种等价关系，可通过引入类义词词典等外部资源判断。本文认为同义词间的相似度应略低于相同属性值间的相似度。同义属性相似度函数如下所示，其中函数syn()表明v_p^c与v_p^c′为同义属性值

点击浏览公式

3.2.3 层次型属性相似度计算

由于概念间是存在语义关系，则表达概念特征的本体属性值间也必然存在一定的语义关系。本体结构中的语义关系主要包括上下义关系与整体部分关系两种。上下义关系属性是描述处于不同逻辑层次上具有共同特征的属性值之间的语义关系；而整体部分关系表达了概念在组成结构上的相关性。

本文结合外部本体结构，采用文献^[17]提出相似度模型计算层次型属性的相似度。该算法充分利用本体结构中的各种关系，结合层次概念关系图的结构密度与深度，构建关联节点的概念向量，并最终基于余弦相似度模型计算概念的相关度，余弦相似度模型函数如下所示。此外，算法引入调节参数α来消除由于子代节点分布不均造成的影响，本文采用推荐值，α=0.5。其中v_p^c与v_p^c′分别为v_p^c与v_p^c′关联节点的概念向量。

点击浏览公式

3.2.4 数值型属性相似度计算

数值型属性是采用数值形式描述概念的属性项。通常允许数值间存在一定的精度误差，即若两个数值间的差值小于等某误差阈值，则可认为二者相等。数值型属性相似度计算函数如下，其中λ为误差阈值。

点击浏览公式

3.2.5 其他类型属性相似度计算

其他类型属性项是指不属于上述任意一种属性类型中的属性。由于已排除了同义词的情况，且同属于相同领域内的属性值，因此对于此类型的本体属性，可利用属性值字符串相似度计算其相似度。

3.2.5.1 英文属性值相似度计算

本文采用编辑距离算法，从字符串组成上比较词汇的相似度，计算了两个英文词汇间的字面相似度^[30]。

点击浏览公式

式中，|v_p^c|、|v_p^c′|分别是v_p^c与v_p^c′的字符串长度；ed(v_p^c,v_p^c′)是v_p^c转换为v_p^c′所需要的最小编辑操作次数。

3.2.5.2 中文属性值相似度计算

根据汉语词汇的构词特点，从字面上来看绝大多数的同义词均含有相同的语素^[32]，且同一类属性值的语义内容基本上集中于后半部分，如“照明用电”与“动力用电”都属于“用电的类型”，关注点在于其类别均为“用电”。因此本文采用文献^[14]提出重心后移规律算法计算中文属性值的相似度

点击浏览公式

式中，v_p^c、v_p^c′为待计算的字符串；α为v_p^c、v_p^c′中含有相同语素个数的影响权重，β为相同语素在各个词中的位置关系的影响权重，满足条件α+β=1，在文献^[13]中，推荐α为0.6，β设定为0.4；m、n分别是v_p^c、v_p^c′的字符长度，k是v_p^c、v_p^c′匹配的字符数；L₁(i)、L₂(i)分别表示第i个匹配字符分别在v_p^c、v_p^c′的匹配正序值。

4 基础地理信息概念相似度计算及分析

本文进行“相似度实例分析”与“算法精度验证”两组试验，以验证基于本体属性的语义相似度计算模型合理性。试验过程中涉及的基础地理要素类别采用文献^[32]定义的本体属性信息；同时由专家评价各本体属性间的相对重要性，利用层次分析法确定本体属性的权重值。本体属性的权重信息如表 1所示。

表 1 本体属性权重信息 Tab. 1 Weight of ontological properties

物质性	组成物质	成因	空间性					时间性				功能	其他特性	量度
			空间形态		空间方向	空间位置		空间关系	周期性	生命周期	诞生时间
			空间结构	空间形状		位置	地域性
0.09	0.17	0.03	0.04	0.13	0.02	0.06	0.06	0.03	0.07	0.04	0.02	0.20	0.02	0.02

表选项

4.1 相似度实例分析

本试验以地理要素类别“干沟”与“时令湖”的相似度计算为例，验证本文提出的算法的可行性。“干沟”与“时令湖”的本体属性信息如表 2所示，表中只罗列了两个概念均具备的本体属性项。

表 2 “干沟”与“时令湖”的本体属性信息 Tab. 2 Ontology properties on “main-ditch” and “seasonal-lake”

概念名称	物质性(层次类型)	成因(标称类型)	空间形状(层次类型)	位置(层次类型)	周期性(标称类型)	生命周期(层次类型)	功能(其他类型)
干沟	水	人工	V字槽形		季节周期	干涸	流通水
时令湖	水	天然	坑状	陆地表面	季节周期	常态期	贮藏水

表选项

(1) 根据3.2节的前提条件，“位置”属性的相似度为0；“物质性”与“周期性”的相似度均为1；“成因”属性由于是无序标称类型，因此其相似度值为0。

(2) “空间形状”属性为层次类型，其属性值间的关系结构如图 2(a)所示。根据层次属性相似度模型可知，V_V字槽= [1 0 0 0 4 0 0 0 0 0 0 13 0 0 0 0 0 0 1]；V_坑状 = [1 0 0 0 4 0 0 0 13 0 0 0 0 0 0 0 0 0 0]；因此利用公式(5)计算可得二者的相似度为0.091 1。

图 2 本体属性值层次结构图 Fig. 2 Hierarchy of ontological property values

图选项

(3) “生命周期”属性为层次类型，其属性值关系结构如图 2(b)所示。根据层次属性相似度模型可知因此利用公式(5)计算可得二者的相似度为0.433 6。

(4) “功能”属性为其他类型属性项。根据公式(8)计算可得，“流通水”与“贮藏水”的相似度为0.4；结合表 1的权重信息，地理要素类别“干沟”与“时令湖”的语义相似度为0.434 2。

4.2 算法精度验证 4.2.1 样本数据集

为了验证基于本体属性的相似度模型的有效性，本文采用分层抽样法，从《GB/T 13923-2006基础地理信息要素分类与代码》中选取100组具有代表性的地理要素对作为试验的样本数据。为了保证样本的典型性，选取时要求满足以下条件：① 涵盖标准中8个大类且均匀分布；② 尽可能覆盖“完全相同”到“完全不相关”的区间。

4.2.2 试验计算 4.2.2.1 算法对比分析

为了验证基于本体属性的相似度算法的有效性，本文对比了其他3种相似度算法计算样本数据集：① 概念矢量算法^[17]，该算法利用概念在本体结构的相关概念的层次密度，构建概念矢量空间计算相似度；② Wu-Palmer算法^[33]，该算法利用两个概念与其最近共同祖先概念的距离计算相似度；③ 层次深度算法^[34]，该模型以概念在本体结构的深度信息为权重值，利用概念间的语义距离计算相似度。为了保证计算结果的最优，计算过程中涉及的参数均采用相关文献的推荐值。

4.2.2.2 专家评价结果

为了验证基于本体属性的相似度算法的合理性，本文邀请9位具有地理信息专业知识背景的专家、博士及硕士研究生，以人工的方式评价样本数据的相似性。通过计算所有专家评价结果的Cronbach α系数^[35]，本文检验样本数据的相似度专家评价结果的趋势。评价结果的α系数值如表 3所示。

表 3 专家评价结果的α系数 Tab. 3 Cronbach α coefficient of human judgments

Cronbach α	标准化α	有效样本数目	参与者
0.981	0.982	100	9

表选项

通常为了简便评价一致性，将α系数一致性等级划分为5个等级，如表 4所示^[36]。根据表 3的信息，人工评价结果的α系数值为0.981，标准α系数为0.982，表明专家对于样本相似度的评价结果是基本一致的，可将其视为算法自动计算的相似性结果的评判基准。

表 4 α系数一致性等级 Tab. 4 Consistency grades of α coefficient

α系数值	一致性等级
小于0.60	不理想
0.60～0.80	可接受
0.80～0.90	理想
大于0.90	非常理想

表选项

4.2.3 试验结果分析

如表 5展示部分试验结果。本文采用Pearson相关系数以及结果误差程度进行对比，定量分析基于本体属性的相似度算法的有效性。

表 5 部分样本的专家评价与各算法相似度结果表 Tab. 5 Similarity on part of samples from four approaches and human judgments

要素类别对	专家评价结果	本体属性算法	概念矢量算法	Wu-Palmer算法	层次深度算法
岸滩-水井	0.126 1	0.200 5	0.402 8	0.666 7	0.527 1
岸滩-沙滩	0.426 7	0.345 3	0.229 3	0.285 7	0.238 4
成林-幼林	0.906 9	0.900 7	0.394 3	0.750 0	0.776 4
独立树-大地原点	0.028 2	0.023 8	0.006 2	0.000 0	0.139 1
干沟-时令河	0.649 5	0.867 4	0.400 6	0.333 3	0.258 9
干渠-沟渠	0.855 2	0.612 2	0.332 1	0.800 0	0.776 4
复线窄轨-铁路	0.907 4	0.920 0	0.179 8	0.666 7	0.631 6
高水界-干出线	0.705 6	0.747 7	0.302 6	0.333 3	0.258 9
时令湖-时令河	0.672 0	0.637 9	0.528 5	0.333 3	0.258 9
学校-高层房屋	0.588 0	0.535 0	0.300 6	0.285 7	0.238 4

表选项

4.2.3.1 Pearson系数分析

Pearson相关系数常常被用于评价相似度算法的优劣，系数值越高表明算法计算的相似度值与专家评价结果越接近，算法也越优。图 3描述了4种相似度算法与专家评价结果的Pearson相关系数值。从图中可以看到，本体属性算法的计算结果与专家评价结果最吻合；层次深度算法与Wu-Palmer算法很接近；概念矢量算法的相关系数最低。这是因为：① Wu-Palmer算法是利用概念在结构树中层次以及概念与它们最近共同祖先结点的距离计算相似度，而《GB/T 13923-2006》是面向地图制图等应用的分类体系，并非完全以概念的本质特征构建的分类体系，造成其计算结果与专家评价结果不够吻合；② 层次深度算法原理与Wu-Palmer算法的方法类似，虽然以概念的深度作为路径权重，但其计算结果仍然与专家评价结果不够吻合；③ 在4种算法中，概念矢量算法不仅仅考虑概念本身，还考虑与相关的概念集合，若此时概念结构树不合适反而会造成误差累加，产生更大的误差。

图 3 各算法与专家评价结果的Pearson相关系数 Fig. 3 Pearson’s correlation coefficients from four

approaches against human judgments

图选项

4.2.3 .2 误差分析

本文统计每组样本的四种算法计算结果与专家评价结果的误差信息。由于相似度结果不可能完全一致，因此可认为当算法计算的相似度结果与专家评价结果间的差值小于0.08时，相似度结果是等价的。相似度误差的平均值、最大值及标准差如表 6所示。

表 6 各种相似度算法与专家评价结果的误差 Tab. 6 Error of similarity from four approaches against human judgments

相似度算法	与专家评价结果的误差
相似度算法	平均值	最大值	标准差
本体属性算法	0.100 5	0.407 6	0.090 7
概念矢量算法	0.215 8	0.763 8	0.187 1
Wu-Palmer算法	0.170 1	0.471 7	0.122 0
层次深度算法	0.185 5	0.485 7	0.124 7

表选项

从表 6的结果看到：① 虽然本体属性算法与Wu-Palmer算法及层次深度的最大误差值接近，但前者的均值明显小于后二者，说明前者的总体误差相对小，同时前者的标准差也相对小，表明误差值相对集中在均值范围内，并没有过多较大的误差值；②概念矢量算法的平均误差值，最大值及标准差均最大，因此算法精度也相对较低，与该算法的Pearson系数值最小的情况相符合。此外，本文将误差值划分为无错误(0~0.1)、误差小(0.1~0.25)、误差中等(0.25~0.5)与误差大(0.5~1)4个等级，误差等级分布如图 4所示。

图 4 算法的相似度误差等级 Fig. 4 Error grades of similarity from four approaches

图选项

从图中可以看到：① 虽然基于概念矢量算法的Pearson系数远小于其他算法(仅为0.465)，但正确匹配的概念数目却与Wu-Palmer算法、基于层次深度算法的结果接近；② 基于本体属性算法的正确匹配度为67%，主要因为在人工主观判断样本是否相似时，基本从感性，直观的角度考虑相似度，例如基础地理信息概念实例的组成、形状、作用等，却忽略概念内部的信息，如时间性、地域性等。

5 结论

本文提出一种基于概念内涵的语义相似度计算模型。该模型以本体属性集合形式化表达概念，通过综合各个本体属性间的语义相似度以度量概念的整体语义相似性。文中以100组基础地理信息概念为试验样本，将本文提出的计算模型与常用的模型进行比对试验。结果表明，本文提出的计算模型可在不依赖于概念本体结构的基础上计算概念间的语义相似度，并且计算结果可行有效，符合人类的心理认知。本文研究的关注点在于结合本体属性的概念表达方式计算模型，以避免相似度计算结果因分类标准不同而产生结果差异的情况。在未来的研究中，将进一步考虑本体属性权重配置的合理性，以期获得更优的相似度结果。

参考文献

[1]	ALGULIEV R, ALIGULIYEV R, GANJALIYEV F. Investigation of the Role of Similarity Measure and Ranking Algorithm in Mining Social Networks[J]. Journal of Information Science, 2011, 37(3): 229-234.

[2]	LUO Q M, CHEN E H, XIONG H. A Semantic Term Weighting Scheme for Text Categorization[J]. Expert Systems with Applications, 2011,38(10): 12708-12716.

[3]	SU W F. Combining Tag and Value Similarity for Data Extraction and Alignment[J]. IEEE Transactions on Knowledge and Data Engineering, 2012,24(7): 1186-1200.

[4]	HONG J L. Data Extraction for Deep Web Using Wordnet[J]. IEEE Transactions on Systems Man and Cybernetics Part C:Applications and Reviews, 2011, 41(6): 854-868.

[5]	JEAN M Y R, SHIRONOSHITA E P, KABUKA M R. Ontology Matching with Semantic Verification[J]. Web Semantics: Science, Services and Agents on the World Wide Web, 2009,7(3): 235-251.

[6]	BRIGHT M W, HURSON A R, PAKZAD S. Automated Resolution of Semantic Heterogeneity in Multidatabases[J]. ACM Trans Cation Database System 1994,19(2): 212-253.

[7]	MCRAE K,BOISVERT S. Automatic Semantic Similarity Priming[J]. Journal of Experimental Psychology-Learning Memory and Cognition, 1998,24(3): 558-572.

[8]	TOCH E, REINHARTZ B I, DORI D. Humans, Semantic Services and Similarity: A User Study of Semantic Web Services Matching and Composition[J]. Web Semantics: Science, Services and Agents on the World Wide Web, 2011, 9(1): 16-28.

[9]	LI Deren ,CUI Wei. Geographic Ontology and SIMG[J]. Acta Geodaetica et Cartographica Sinica, 2006,35(2): 143-148.(李德仁, 崔巍. 地理本体与空间信息多级网格[J]. 测绘学报, 2006,35(2): 143-148.)

[10]	UITERMARK H T J A. Ontology-based Geographic Data Set Integration[D]. Enschede: University of Twente, 2001.

[11]	YAN Haowen. Fundamental Theories of Spatial Similarity Relations in Multi-scale Map Spaces[J]. Chinese Geographical Science, 2010,20(1): 18-22.

[12]	DHYANI D, NG W K, BHOWMICK S S. A Survey of Web Metrics[J]. ACM Computer Surveying, 2002. 34(4): 469-503.

[13]	WANG Yuan,WU Xiaobin. Computer Processing of Post-Control Indexing[J]. New Technology of Library and Information Sciece, 1993(2): 4-7.(王源,吴晓滨.后控规范的计算机处理[J]. 现代图书情报技术, 1993(2): 4-7.)

[14]	WU Zhiqiang, The Development of Post-Control Words during Economical Information Retrieval[D]. Nanjing: Nanjing Agricultural University, 1999.(吴志强. 经济信息检索后控制词表的研制[D]. 南京: 南京农业大学, 1999.)

[15]	D′ULIZIA A. Approximating Geographical Queries[J]. Journal of Computer Science and Technology, 2009,24(6): 1109-1124.

[16]	DAOUD M, TAMINE L, BOUGHANEM M. A Personalized Search Using a Semantic Distance Measure in a Graph-based Ranking Model[J]. Journal of Information Science, 2011,37(6): 614-636.

[17]	LIU H, BAO H, XU D. Concept Vector for Semantic Similarity and Relatedness Based on Wordnet Structure[J]. Journal of Systems and Software, 2012, 85(2): 370-381.

[18]	TVERSKY A. Features of Similarity[J]. Psychological Review, 1977, 84(4): 327.

[19]	RESNIK P. Using Information Content to Evaluate Semantic Similarity in a Taxonomy[C] // Proceedings of the 14th International Joint Conference on Artificial Intelligence (IJCAI-95}.San Francisco: Morgan Kaufmann, 1995: 448-453.

[20]	LIN D. An Information-Theoretic Definition of Similarity[C] //Proceedings of the 15th International Conference on Machine Learning. San Francisco: Morgan Kaufmann, 1998: 296-304.

[21]	LORD P W. Investigating Semantic Similarity Measures across the Gene Ontology: The Relationship between Sequence and Annotation[J]. Bioinformatics, 2003,19(10): 1275-1283.

[22]	RODRIGUEZ M, EGENHOFER M, RUGG R. Assessing Semantic Similarities among Geospatial Feature Class Definitions[J]. Interoperating Geographic Information Systems, 1999(1): 189-202.

[23]	SCHWERING A, RAUBAL M. Measuring Semantic Similarity between Geospatial Conceptual Regions[C] // Proceedings of GeoSpatial Semantics.Mexico City: Springer, 2005: 90-106.

[24]	LI Lin, ZHU Haihong, WANG Hong, et al.Semantic Analyses of The Fundamental Geographic Information Based on Formal Ontology-Exemplifying Hydrological Category[J]. Acta Geodaetica et Cartographica Sinica, 2008,37(2): 230-235.(李霖, 朱海红,王红,等. 基于形式本体的基础地理信息语义分析——以陆地水系要素类为例[J]. 测绘学报, 2008, 37(2): 230-235.)

[25]	HUANG Maojun.Study on Formal Representation of Geographic Ontology and Its Application in Map Services[D]. Wuhan: Wuhan University, 2005.(黄茂军. 地理本体的形式化表达机制及其在地图服务中的应用研究[D]. 武汉: 武汉大学, 2005.)

[26]	GRUBER T R. A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquis, 1993,5(2): 199-220.

[27]	STUDER R. Knowledge Engineering: Principles and Methods[J]. Data and Knowledge Engineering, 1998,25(1-2): 161-197.

[28]	ZHENG Maohui, FENG Xuezhi, JIANG Yingying, et al. A Formal Approach for Multiple Representations in GIS Based on DL Ontologies[J]. Acta Geodaetica et Cartographica Sinica, 2006, 35(3): 261-266. (郑茂辉, 冯学智, 蒋莹滢,等. 基于描述逻辑本体的GIS多重表达[J]. 测绘学报, 2006,35(3): 261-266.)

[29]	SAATY T L. The Analytic Hierarchy Process[M]. New York: McGraw-Hill, 1980.

[30]	LEVENSHTEIN V I. Binary Codes Capable of Correcting Deletions, Insertions and Reversals[J]. Soviet Physics Doklady, 1966. 10: 707-710.

[31]	LU Yong.Automatic Recognition of Chinese Synonyms for Information Retrieval[D]. Nanjing: Nanjing Agricultural University, 2005(陆勇.面向信息检索的汉语同义词自动识别[D]. 南京: 南京农业大学, 2005)

[32]	WANG Hong, LI Lin, ZHU Haihong.The Key Research of National Fundamental Geographic Information Ontology [M]. Beijing: Science Press, 2011.(王红, 李霖, 朱海红.国家基础地理信息本体关键问题研究[M]. 北京: 科学出版社,2011.)

[33]	WU Z ,PALMER M. Verbs Semantics and Lexical Selection[C] //Proceedings of the 32nd Annual Meeting on Association for Computational Linguistics. Las Cruces: Association for Computational Linguistics, 1994: 133-138.

[34]	TANG Luliang.Spatial Data Change Detection Based on Geo-Feature Similarity[D]. Wuhan: Wuhan University, 2007.(唐炉亮. 基于地物相似性的空间数据变化发现[D]. 武汉: 武汉大学, 2007.)

[35]	CRONBACH L. Coefficient Alpha and the Internal Structure of Tests[J]. Psychometrika, 1951,16(3): 297-334.

[36]	DEVELLIS R F. Scale Development: Theory and Applications[M].Thousand Oaks:Sage Publications, 2011.

中国科学技术协会主管、中国测绘地理信息学会主办。

文章信息

谭永滨，李霖，王伟，等

TAN Yongbin，LI Lin，WANG Wei,et al

本体属性的基础地理信息概念语义相似性计算模型

Semantic Similarity Measurement Model between Fundamental Geographic Information Concepts Based on Ontological Property

测绘学报，2013，42(5)：782-789

Acta Geodaetica et Cartographica Sinica,2013,42(5): 782-789.

文章历史

收稿日期：2012-08-10

修回日期：2013-06-04

文章信息

文章历史

相关文章

工作空间