测绘地理信息   2018, Vol. 43 Issue (2): 101-104
0
道路志愿者地理信息数据融合处理方法[PDF全文]
盛帅1, 盛业华2, 张艺航3    
1. 武汉大学测绘学院,湖北 武汉, 430079;
2. 南京师范大学地理科学学院,江苏 南京, 210000;
3. 空军通信士官学校,辽宁 大连, 116600
摘要: 随着因特网的快速发展和移动终端的普及,志愿者地理信息(volunteered geographic information,VGI)也在快速增长。在许多国家,在因特网上分享VGI数据早已成为一种时尚。对同一个地理要素可能存在大量不同精度、不同格式的VGI数据。为了便于VGI数据的管理和利用,迫切需要对VGI数据进行融合处理。由于现有的许多人工干预融合处理方法自动化程度不高,因此提出了一种针对多人利用GPS沿道路行走时记录的轨迹数据自动构建道路网络的方法。结合ArcGIS Engine开发的原型系统3sdnMap对其进行验证和对比分析,结果表明,该方法能够较好地删除错误数据,同等条件下能够提高数据的精度和可靠性。
关键词: 志愿者地理信息     道路识别     道路融合     ArcGIS Engine二次开发    
Data Fusion Processing of Road Volunteered Geographic Information
SHENG Shuai1, SHENG Yehua2, ZHANG Yihang3    
1. School of Geodesy and Geomatics, Wuhan University, Wuhan 430079, China;
2. School of Geography Science, Nanjing Normal University, Nanjing 210000, China;
3. Airforce Communication NCO Academy, Dalian 116600, China
Abstract: In order to facilitate the management and use of VGI data, it is urgent to deal with VGI data. Many of the existing manual intervention fusion methods are not highly automated, this paper proposes a method for the automatic construction of road network based on the track data recorded by GPS along the road and a prototype system—3sdnMap developed by C# combined with ArcGIS engine to make verification and comparative analysis. The method can better remove the error data, and improve the accuracy and reliability of the data under the same conditions.
Key words: volunteered geographic information     road identification     road fusion     secondary development of ArcGIS Engine    

志愿者地理信息(volunteered geographic information, VGI)发展至今,已经被应用于许多方面,如作为地图数据源或用于救灾等。数据之间按照某种内在关系进行配准称为数据匹配。数据集成通过应用间的数据交换从而达到集成,主要解决数据的分布性和异构性问题。而数据融合是对多源数据加以智能化合成,产生比单一数据源更精确和更完整的估计和判断。它是在匹配的基础上对原始数据进行选择后加以智能化集成, 并生产出比单一数据源更为有用的数据。许多学者对数字地图融合与合并进行了研究,并提出了相关方法与解决方案[1-3]。图形匹配是数据融合的基础,目前主要的匹配方法有几何匹配、拓扑匹配、语义匹配等,为了保证融合质量,需要对匹配结果进行检验[4-6]。李德仁等提出了动态线综合二叉树与缩放四叉树的设计思想,解决了VGI数据管理中的难题[7]; Goodchild等以2007-2009年在圣塔巴巴拉地区影响较大的4次火灾为例,分析了使用VGI数据的优点和风险[8];Schade等将传感器网络标准应用于VGI数据,对数据进行规范,发展出一套VGI传感和事件检测技术,便于将VGI数据应用于空间数据基础设施建设[9];Spinsanti等设计了一个用于整合VGI与权威数据的系统[10];邹进贵等提出了一种将GB-SAR(ground-based synthetic aperture radar)和三维激光扫描(terrestrial laser scanning,TLS)数据融合的方法,该方法生成的三维干涉雷达点云使GB-SAR视线方向的变形信息能够三维可视化,整合了两种手段的优势[11]。现有研究有的仅从理论层面进行分析和讨论,未能进行具体的实现;有的虽开发出了相应的软件系统,但自动化处理程度不高。本文提出的方法能利用多人采集的轨迹自动构建道路网络,自动化程度高,并能提高路网精度和可靠性。

1 数据处理过程

该方法的基本思路是先对单人采集轨迹进行处理生成单人路网,然后对多人采集轨迹进行融合处理,最终生成融合后的路网。

1.1 VGI道路数据来源

目前VGI道路数据主要有两个来源:①志愿者使用OpenStreetMap或者利用摄影测量相片或遥感影像矢量化对道路数据进行采集;②志愿者使用手机等移动设备实地进行采集。

1.2 VGI道路数据精度

非实测方法获取的VGI道路数据的精度主要取决于所使用的地图或影像的精度。§1.1中第获②种数据的精度主要取决于志愿者所使用的移动设备的采集精度。

本文所使用的数据为实测数据。由于采集时为白天,且采集道路时较少受到建筑物的遮挡,利用手机APP软件采用单点定位模式沿道路行驶的精度近似为10 m。

1.3 单人采集数据路网的生成

1) VGI道路轨迹的求交。为便于后期处理,需要根据交点对各个采集数据进行分段,以进行后期同名路段的识别。道路节点是通过两条或两条以上道路相交得到的。实际采集道路是多段线,求取道路节点首先要遍历两条道路的各个折线段,然后求取交点即为节点。

2) 道路分段。对单人采集道路进行求交操作,得到道路交点图层,使用交点图层打断采集的道路数据,最终生成以道路交点为分界点的更小的路段数据,便于后期的分段融合。

3) 多余采集路段的删除。在采集过程中,为了保证道路采集数据的完整性,部分路段采集的长度比实际道路的长度要长,需要对采集的多余部分进行删除。经过分析,相邻的较大路口交叉点之间的距离都应大于50 m,设过滤条件为“距离小于50 m”对分段后的各个路段进行过滤,并删除满足过滤条件的路段。

4) 多人采集数据路网融合。对多人采集的道路数据的节点进行融合,通过一定方法对同一条道路不同的采集数据进行识别,对其路段进行融合,生成融合后的路网数据。

2 数据处理方法

数据处理方法涉及到多人采集数据节点和路段的融合方法。

2.1 单人采集数据的拓扑化

由于采集轨迹导出后为csv格式,是一系列点,因此先将其转换为地理信息系统中常用的shapefile矢量数据格式,然后将矢量数据自动生成拓扑关系,其中弧段和节点之间的关系如表 1表 2所示。弧段a1a2a3a4a5a6a7之间的邻接矩阵为:

$ \left[{\begin{array}{*{20}{c}} -&1&1&0&1&1&0\\ 1&-&1&1&0&1&0\\ 1&1&-&1&1&0&0\\ 0&1&1& - &1&1&0\\ 1&0&1&1& - &1&0\\ 1&1&0&1&1& - &0\\ 0&0&0&0&0&0& - \end{array}} \right]{\rm{ }} $
表 1 弧段和节点之间的关系 Table 1 Relations Between Arcs and Nodes

表 2 节点和弧段之间的关系 Table 2 Relations Between Arc and Nodes

节点N1N2N3N4N5之间的连通矩阵为:

$ \left[{\begin{array}{*{20}{c}} -&1&1&1&0\\ 1&-&1&1&0\\ 1&1&-&1&0\\ 1&1&1& - &0\\ 0&0&0&0& - \end{array}} \right] $
2.2 节点融合

P1(x1, y1)为圆心,以R=20 m为半径搜索节点,P2(x2, y2)为空间中任意点,则P1P2之间的距离d为:

$ d = \sqrt {{{\left( {{x_1} - {x_2}} \right)}^2} + {{\left( {{y_1} - {y_2}} \right)}^2}} $ (1)

dR,则可判定P1P2两点为同名点;若d>R,则可判定P1P2两点不是同名点。

道路数据的采集采用同一设备,定位模式均为单点定位,可以认为对同一对象采集的不同数据是等权的。xy坐标的平均值为:

$ \left\{ \begin{array}{l} \bar x = \frac{1}{n}\sum\limits_{i = 1}^n {{x_i}} \\ \bar y = \frac{1}{n}\sum\limits_{i = 1}^n {{y_i}} \end{array} \right. $ (2)

式中,xiyi为第i次采集得到的点位坐标的x值和y值。用式(2)最终得到的每个节点融合后的坐标替代相应点的坐标。

2.3 同一道路数据的识别

VGI道路数据绝对精度为10 m,事实上不同时段采集的数据之间的差别并不是以绝对精度来衡量的,因为它们之间的位置差别很小。以稍大于采集道路路宽一半的距离3 m作为缓冲区半径,生成每个路段的缓冲区,根据缓冲区XY坐标的范围作为参数判断有可能与选定缓冲区面域存在相交区域的缓冲区,生成缓冲区交集。多次实验结果表明,当交集面积大于200 m2时即可判断出对应的两个线数据属于实地同一道路的不同采集数据。

2.4 路段重采样及融合

首先,设定采样步长为2 m;然后,根据不同道路两个坐标方向的变化情况选取不同的方向进行重采样。包括以下两种情况:①路段起点和终点X方向变化量大于Y方向变化量,在X方向每隔一定步长对同一道路不同数据进行重采样; ②路段起点和终点X方向变化量小于Y方向变化量,在Y方向每隔一定步长对同一道路不同数据进行重采样。重采样之后,可以得到属于同一道路不同数据具有相同折点数的重采样数据,如图 1所示,虚线与路段交点即为重采样之后道路的折点。

图 1 重采样示意图 Figure 1 Sketch Map of Resampling

重采样之后,相应序号的点其中一个方向的坐标已经相同,此时的路段融合仅仅是对另一方向的坐标值进行等权求取平均值。由于采集道路时走向可能不同,需要对首尾点序号进行判断之后再进行融合。

路段融合之后,只需要对融合后生成的节点之间的折点进行顺序连接即可得到各个路段的线数据。

3 数据融合实验

志愿者地理信息的采集者往往是非专业采集人员,所采集的数据重复性大,偏差大,精度不高。因此,本文专门设计并开发了一个原型系统3sdnMap用于道路志愿者地理信息融合。该原型系统包括加载csv格式数据、实现数据类型转换点集转线、求取线段交点、节点融合、路段融合、缓冲区分析等主要功能。

3.1 数据采集

本实验目的是完成志愿者道路数据的融合处理,实验数据采集使用手机APP和手机内置GPS完成,对南京师范大学仙林校区主要道路采用步行或者骑自行车的方式,对每条道路进行不少于5次的重复采集,并用3sdnMap对其进行融合。

3.2 道路数据融合

使用点集转线功能将每个采集的点集转换为线,借助线求交工具对多段线求取交点,即是道路节点。利用打断工具对初始生成的路段进行打断,生成更小的路段。加载多人采集道路数据, 使用删尾按钮删除掉多余采集的路尾线段之后,通过节点融合工具对同名节点进行融合,根据节点之间的距离对属于实地同一节点的数据进行融合。

使用缓冲区工具以路宽的一半3 m为半径对路段建立缓冲区,然后使用缓冲区求交工具对路段的缓冲区求交,根据缓冲区相交部分的面积判断两个路段是否属于实地同一个路段,若属于同一路段,则使用路段融合工具对同名路段进行融合,融合之后得到南京师范大学路网,如图 2所示。

图 2 路段融合结果 Figure 2 Sections Fusion Results

3.3 结果分析

实验结果以百度地图中南京师范大学仙林校区路网数据作为标准数据,将融合后的南京师范大学路网数据与之进行比较分析。首先,截取百度地图中南京师范大学仙林校区北区的路网数据作为标准数据,在ArcGIS中进行配准;然后,将单人采集路网、融合后路网与配准地图同时加载,效果如图 3所示。图 3中较粗实线表示的是融合后路网,较细实线表示的是单人采集路网。

图 3 单人路网、融合路网与百度地图对比图 Figure 3 Comparison of Single Road Network, Fusion Road Network and Baidu Map

根据图 3可得:①融合后的节点位置变化不大,有效削弱了采集过程中误差对结果的影响,能够更好地代表道路节点的实际位置;②重采样之后的各个道路更为平滑,符合道路的实际形态; ③融合后的路网位置处于融合之前各个路网之间,各个道路的走向与实地道路走向相符,可靠性、精度有明显提高; ④部分道路数据偏离实际道路较大,主要是由于道路靠近建筑物,GPS信号不好导致精度不高。

根据测量平差理论,本文数据融合方法属于直接平差。观测值的算术平均值$\hat x $及算术平均值的精度${\sigma _{\hat x}} $分别为:

$ \left\{ {\hat x = \frac{{\sum\limits_{i = 1}^n {{L_i}} }}{n},{\sigma _{\hat x}}_ = {{\hat \sigma }_0}/\sqrt n } \right. $ (3)

式中,Li为测量平差中的第i次采集得到的同精度的观测值;${{\hat \sigma }_0} $为单个观测值的精度。

根据误差传播定律,综合式(3),得到对某个量所做的n个同精度观测值的算术平均值就是该量的平差值,此平差值的权为单个观测值的权的n倍。当n=5时,可得融合后的理论精度大约为4.5 m。

4 结束语

本文提出了一种多人采集道路志愿者地理信息数据的融合处理方法,该方法能够提高VGI数据融合的自动化程度,并在理论上提高数据精度及可靠性,有利于VGI数据应用于路网自动更新。以多人采集的南京师范大学仙林校区道路志愿者地理信息数据为实验数据,使用3sdnMap进行实验,得到了南京师范大学仙林校区路网,结果较单人采集生成的路网精度和可靠性均有所提高,并有效降低了采集过程中人为误差对最终结果的影响。

参考文献
[1] 郭黎, 崔铁军, 吴正升. 多源数字地图融合技术问题的研究——以数字海图与地形图融合为例[J]. 海洋测绘, 2002, 22(2): 22–25
[2] 张桥平, 李德仁, 龚健雅. 地图合并技术[J]. 测绘通报, 2001, (7): 6–8
[3] 童小华, 邓愫愫, 史文中. 数字地图合并的平差原理与方法[J]. 武汉大学学报·信息科学版, 2007, 32(7): 621–625
[4] 臧德彦, 陶本藻, 周世健. 地图合并中基于叠置方法的特征点匹配可靠性检验[J]. 地理与地理信息科学, 2007, 23(5): 15–18
[5] 赵苏霞. 线实体的数字合并方法研究及实现[J]. 科技情报开发与经济, 2008, 18(11): 132–134 DOI: 10.3969/j.issn.1005-6033.2008.11.079
[6] 胡天硕, 毛政元. 线实体候选匹配集的优化方法研究[J]. 测绘科学, 2011, 36(2): 132–135
[7] 李德仁, 钱新林. 浅论自发地理信息的数据管理[J]. 武汉大学学报·信息科学版, 2010, 35(4): 379–383
[8] Goodchild M F, Glennon J A. Crowdsourcing Geographic Information for Disaster Response: A Research Frontier[J]. International Journal of Digital Earth, 2010, 3(3): 231–241 DOI: 10.1080/17538941003759255
[9] Schade S, Díaz L, Ostermann F, et al. Citizen-Based Sensing of Crisis Events: Sensor Web Enablement for Volunteered Geographic Information[J]. Applied Geomatics, 2013, 5(1): 3–18 DOI: 10.1007/s12518-011-0056-y
[10] Spinsanti L, Ostermann F. Automated Geographic Context Analysis for Volunteered Information[J]. Applied Geography, 2013, 43(9): 36–44
[11] 邹进贵, 田径, 陈艳华, 等. 地基SAR与三维激光扫描数据融合方法研究[J]. 测绘地理信息, 2015, 40(3): 26–30