一种开放式地理空间数据可用性评价方法的研究 | ![]() |
2. 武汉大学地理信息系统教育部重点实验室,湖北 武汉,430079;
3. 北京长地万方科技有限公司佛山分公司,广东 佛山,528305;
4. 北京市测绘设计研究院,北京,100038
2. Key Laboratory of Geographic Information Systems, Ministry of Education, Wuhan University, Wuhan 430079, China;
3. Beijing Changdi Wangfang Co., Ltd. Foshan Branch, Foshan 528305, China;
4. Beijing Institute of Surveying and Mapping, Beijing 100038, China
地理空间数据即带有地理坐标的数据,地球上人类活动中80%以上的信息都与地理位置有关[1],地理空间数据广泛应用于交通、国土、水利、环境等多个领域,与社会发展和经济水平提升有着重要联系。随着信息技术的发展与普及,地理空间数据的获取与应用传播方式更加多样,由大众创建维护应用的自发地理信息 (volunteer geographic information,VGI)[2, 3],基于Web2.0、GPS定位、宽带通信等技术的众源地理数据 (crowdsourcing geographic data)[4]等成为地理信息科学研究的热点。同时,以现代测绘技术与信息技术为基础的地理信息产业快速发展,并逐步向社会和民众普及,为了使获取数据更加便捷,让数据得到充分利用,地理空间数据的开放已成为社会各界关注的热点。
开放式地理空间数据主要是指可通过免费方式获取的地理空间数据,目前多个组织提供开放式地理空间数据,比如Open Street Map的OSM数据,GLCF的SRTM数据,地理空间数据云的卫星影像数据等,虽然开放式地理空间数据还缺少统一的规范,数据质量各异,但因其数据量大、类型丰富、成本低、现势性强以及关注用户需求等优点广泛应用于城市建设管理、生态环境、灾害救援与地理科学研究[5-11]等领域。信息技术的快速发展引发数据的爆炸式增长,大数据推动了社会各行各业的发展,同时,由于地理空间数据的开放,庞大的数据量和质量各异的数据为数据的选择与应用带来不便,近年来,地理空间数据研究关注的方向从数据的生产及相关研究转向数据的质量与精度的研究,并进一步向数据不确定性和数据可用性研究发展[12]。李志林[13]指出,对包括数据质量在内的数据可用性进行研究是用户最关心的一个方面。2001年,AGILE大会上提出了空间数据可用性的52个度量指标;同年11月在荷兰召开空间数据可用性的工作组会议,使空间数据可用性逐渐成为研究的热点;2003年2月,《Data Science Journal》刊登了有关空间数据可用性的问题;2009年,空间数据的可用性研究位列ICA地图学和地理信息科学领域十大关键词第4位[14];近几年,多国组织了进行地理空间数据可用性方面的研究。目前,开放式地理空间数据可用性的研究成果较少,Girres等[15-19]通过确立包括几何精度、属性精度、逻辑一致性、时间精度等在内的评价指标对空间数据的质量进行了评价,涉及可用性评价的内容较少;陈换新等[20]通过构成要素及其相互关系以及应用实例对空间数据可用性框架进行了研究。为了对开放式地理空间数据的可用性进行评价,实现数据的优化利用,本文提出了一种开放式地理空间数据可用性评价方法,并以2014年西安市开放街道地图 (open street map,OSM) 道路数据为例进行评价分析。
1 开放式地理空间数据可用性评价文献[20]给出了空间数据可用性的概念,基于此,开放式地理空间数据的可用性,即是免费获取的地理空间数据被特定的用户通过特定的方法工具使用所共同表现出的开放式地理空间数据在某一方面的用途。地理空间数据、用户和方法是构建地理空间数据可用性框架的三大基本要素,开放式地理空间数据可用性评价需考虑开放式地理空间数据的数据特征、数据用途和用户获取数据的难易程度等方面,针对这些方面确立评价指标进行开放式地理空间数据的可用性评价。
1.1 评价指标的选取开放式地理空间数据可用性评价的评价指标选取时需考虑到以下几点:
1)“地理空间数据”是评价的主体对象,评价指标的确定需要结合地理空间数据的特征,比如属性特征、空间特征和时间特征等;
2)“开放式”是评价主体的重要定位,目前地理空间数据的开放是一种基于互联网的开放,即意味着评价的主题对象是互联网中的可免费获取的地理空间数据,属于网络资源,需要考虑网络资源的特点,如网页交互性、传输速度等;
3)“可用性”是评价的最终目的,可用性是开放式地理空间数据最应优先考虑的问题,因为质量高的空间数据不一定满足用户需求,适用性以及可获得性等都是空间数据能否有效应用的重要因素,而质量仅是可用性的一个重要方面,所以将可用性作为评价指标选取的参考依据。
开放式地理空间数据的可用性评价指标选取需充分考虑以上三点,制定出完善科学的评价方案,文献[15-19]通过空间数据质量评价或可用性评价的研究确立了包括数据数学精度、数据时间精度、逻辑一致性等评价指标进行评价,2009年出版的《测绘成果质量检查与验收》[21]一书提出使用数学精度、数据完整性与正确性等质量元素进行测绘成果的质量检查与验收,ISO-19157[22]也提出了类似空间数据质量评价指标。本文在此基础上总结出包括数据数学精度、数据时间精度、数据完整性与正确性、逻辑一致性、元数据质量、数据权威性、数据适用性以及数据可获得性的一级评价指标,具体评价指标见表 1。
表 1 开放式地理空间数据可用性的评价指标 Table 1 The Indexes of Open Geospatial DataUsability |
![]() |
1.2 评价模型的确立
本文研究采用层次分析法来评价各评价指标对开放式地理空间数据可用性的影响。层次分析法 (analytic hierarchy process,AHP) 是一种将定性分析与定量分析结合起来的系统性分析方法,在20世纪70年代初由美国著名运筹学家Saaty提出,该方法能将复杂问题系统分解,既讲究定性的分析与判断,又注重数学化的逻辑推理,是一种非常科学且简便的分析方法。层次分析法主要包括分解研究对象、建立层次结构模型、构造判断矩阵、层次单排序和一致性检验、层次总排序以及结果分析这几个步骤,具体实施过程见图 1。
![]() |
图 1 层次分析法流程图 Figure 1 Flow Chart of Analytic Hierarchy Process |
构造判断矩阵时,参考地理空间数据质量、可用性评价等方面专家的意见,结合评价指标,采用专家咨询法,确定评价指标中各因素两两相比对上层元素的重要性标度结果,在对评价指标的相对重要性进行评判时,引入了9分位的比例标度,表 2为评价指标相对重要的比例标度。
表 2 相对重要的比例标度 Table 2 Relatively Important Proportion Criteria |
![]() |
判断矩阵构造完成后,按照图 1中层次分析法的流程进行各项评价指标的权重计算,各项评价指标的权重值见表 3。
表 3 各项评价指标权重计算结果表 Table 3 Calculation Results of Indexes |
![]() |
表 3显示了开放式地理空间数据可用性评价各项评价指标的权重,其中数据的完整性与正确性、逻辑一致性和数据数学精度对OSM数据的可用性影响最大,其次是数据的可获得性和适用性,而元数据质量、数据权威性等的影响较小。
开放式地理空间数据可用性评价的最终结果由二级评价指标的权重与得分乘积的和决定,如下式:
$ \begin{gathered} y = 0.082\;8\;{x_1} + 0.024\;0\;{x_2} + 0.053\;5\;{x_3} + \hfill \\ \cdots 0.084\;4\;{x_{19}} \hfill \\ \end{gathered} $ | (1) |
式中,x1, x2, x3, …, x19为表 3中各项二级评价指标分析的得分;y值为开放式地理空间数据可用性评价的结果。当85≤y≤100时,可用性程度为“优秀”;当70≤y < 85时,可用性程度为“中等”;当60≤y < 70时,可用性程度为“一般”;当30≤y < 60时,可用性程度为“较差”;当0≤y < 30时,可用性程度为“很差”。
2 西安市OSM数据可用性分析本文采用Open Street Map网站提供的2014年西安市OSM道路数据为例进行研究 (见图 2(a)),参考数据为2014年西安市导航数据 (见图 2(b))。
![]() |
图 2 开放式地理空间数据可用性评价研究数据 Figure 2 Data of Open Geospatial Data Usability Evaluation |
分别对各项二级评价指标进行分析、打分,并计算最终得分,结果见表 4。
表 4 OSM数据可用性评价结果 Table 4 Results of OSM Data Usability Evaluation |
![]() |
由表 4可知,西安市OSM道路数据的可用性为“中等”,数据可用性较强,与导航数据最相关的是数据数学精度、数据正确性与完整性、逻辑一致性、数据适用性以及数据更新时间等评价指标,西安市OSM道路数据都具有不错的评价结果。同时Open Street Map网站 (http://www.openstreetmap.org/) 界面清晰,数据查找方便,根据不同需求提供了多种下载方式,数据获取方便。西安市OSM道路数据在权威性方面存在一定的不足,但随着时代发展,数据的数据精度与质量不断提高,同时属性的完整性方面需要进一步加强,大部分属性欠缺严重。本文开放式地理空间数据的可用性评价主要针对西安市OSM的道路数据,其他数据也可采用此类方法进行评价。
3 结束语地理空间数据的开放使空间数据的获取、传输和应用变得多样化,开放式地理空间数据的可用性评价能够帮助用户评价并根据需求选择合适的数据。本文提出了一种开放式地理空间数据可用性评价的方法,并以西安市OSM道路数据为例,对西安市OSM道路数据进行可用性评价,得出西安市OSM道路数据的可用性等级为“中级”,评价结果还显示西安市OSM道路数据在时间精度、数据适用性、数据可获得性、逻辑一致性以及数学精度方面得分较高,说明在这些方面数据存在优势,但是在数据属性完整性、下载速度等方面具有一定的劣势。西安市OSM道路数据可用性评价结果表明:OSM道路数据可以为城市道路数据提供数据来源并实现导航等应用,Telenav以及苹果等公司都是用OSM数据作为数据源,也说明OSM导航数据能够满足应用。本文研究的开放式地理空间数据可用性评价方法能够在一定程度上评价开放式地理空间数据的可用性,但还需要更加合理的评价指标以及结合专家意见的更科学的打分体系。
[1] | 陈述彭, 鲁学军, 周成虎. 地理信息系统导论[M]. 北京: 科学出版社, 1999. |
[2] | Goodchild M F. Citizens as Sensors:the World of Volunteered Geography[J]. GeoJournal, 2007, 69(4): 211–221. DOI: 10.1007/s10708-007-9111-y |
[3] | 李德仁, 钱新林. 浅论自发地理信息的数据管理[J]. 武汉大学学报·信息科学版, 2010, 35(4): 379–383. |
[4] | Heipke C. Crowdsourcing Geospatial Data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2010, 65(6): 550–557. DOI: 10.1016/j.isprsjprs.2010.06.005 |
[5] |
田文文.基于自发地理信息的空间数据变化发现与更新方法研究[D].武汉:武汉大学, 2013 |
[6] | 崔洪铭, 白文琳. 政府信息公开对地理信息资源开发利用的影响——基于NYC open data计划的案例研究[J]. 图书情报知识, 2014, (3): 35–40. |
[7] | Wiersma Y F. Birding 2.0: Citizen Science and Effective Monitoring in the Web 2.0 World Ornithologie 2.0: la science citoyenne et les programmes de suivi à l'èred'internet 2.0[J]. Avian Conservation and Ecology, 2008, 5(2): 13. |
[8] | Gouveia C, Fonseca A, Câmara A, et al. Promoting the Use of Environmental Data Collected by Concerned Citizens Through Information and Communication Technologies[J]. Journal of Environmental Management, 2004, 71(2): 135–154. DOI: 10.1016/j.jenvman.2004.01.009 |
[9] | Goodchild M F, Glennon J A. Crowdsourcing Geographic Information for Disaster Response: A Research Frontier[J]. International Journal of Digital Earth, 2010, 3(3): 231–241. DOI: 10.1080/17538941003759255 |
[10] |
陈舒燕.基于Open Street Map的出行可达性分析与实现[D].上海:上海师范大学, 2010 |
[11] | 周文生, 毛锋, 胡鹏. Web环境下地理空间数据的开放式表达体系研究[J]. 武汉大学学报·信息科学版, 2004, 29(1): 32–36. |
[12] | 陈换新, 孙群, 刘雅彬, 等. 空间数据研究的发展及对策[J]. 测绘工程, 2015, 24(2): 10–14. |
[13] | 李志林. 空间数据的关注问题:从质量到可用性[J]. 地理信息世界, 2006, 4(3): 14–17. |
[14] | Virrantaus K, Fairbairn D, Kraak M J. ICA Research Agenda on Cartography and GIScience[J]. The Cartographic Journal, 2009, (1): 1–14. |
[15] | Girres J F, Touya G. Quality Assessment of the French Open Street Map Dataset[J]. Transactions in GIS, 2010, 14(4): 435–459. DOI: 10.1111/tgis.2010.14.issue-4 |
[16] | Haklay M. How Good is Volunteered Geographical Information? A Comparative Study of Open Street Map and Ordnance Survey Datasets[J]. Environment and Planning B:Planning and Design, 2010, 37(4): 682–703. DOI: 10.1068/b35097 |
[17] | Goodchild M F, Li L. Assuring the Quality of Volunteered Geographic Information[J]. Spatial Statistics, 2012, (1): 110–120. |
[18] | 王明, 李清泉, 胡庆武, 等. 面向众源开放街道地图空间数据的质量评价方法[J]. 武汉大学学报·信息科学版, 2013, 38(12): 1 490–1 494. |
[19] | 曾衍伟, 龚健雅. 空间数据质量控制与评价方法及实现技术[J]. 武汉大学学报·信息科学版, 2004, 29(8): 686–690. |
[20] | 陈换新, 吕东儒, 常丽君, 等. 空间数据可用性的框架研究[J]. 信息工程大学学报, 2014, 15(3): 350–354. |
[21] |
GB/T 24356-2009, 测绘成果质量检查与验收[S].北京:北京科文图书业信息技术有限公司, 2009 |
[22] | ISO (2010).ISO/CD19157 Geographic Information-Data Quality[S]. International Standard Organization, 2010 |