2. 国家基础地理信息中心,北京 100830;
3. 昆明理工大学 国土资源工程学院,云南 昆明 650093
2. National Geomatics Center of China, Beijing 100830, China;
3. Faculty of Land Resources Engineering, Kunming University of Science and Technology, Kunming 650093, China
增量识别是在两期快照数据差异比较的基础上,通过一系列的变化检测指标提取出对同一地物的表达存在真正差异的过程,是变化检测、增量建模、时空分析中的研究热点[1, 2, 3]。在矢量数据增量识别中,难点是如何消除时空目标的边界线不一致造成的伪增量(spurious increments)。以1∶5万基础地理数据为例,2005年、2011年分别完成建库和更新,形成符合测绘成果规范要求的两期快照,但由于目标边界的模糊性、成图精度、量测手段等差异[4],造成未变化的时空目标存在边界不一致性。正确识别、计算及处理由边界不一致性导致的伪增量是增量识别的关键,是实现增量更新从理论研究走向工程实践的重要环节。本文研究的前提是符合成果规范的两期快照数据,不再赘述。
总结现有的矢量增量识别方法,大致分为3种:①时空目标的实体匹配法,如基于新旧目标个数的匹配[5]、几何形状或拓扑相似性度量[6],检测的是整个目标变化与否,而没有针对时空目标的变化部分,基于平面扫描线模型的计算方法,能够识别时空目标变化的内部节点[3],但不是针对边界不一致的情况;②顾及不一致性的时空目标位置修订法,通过捕捉节点[7, 8, 9]、构建缓冲区[10]等方法修改目标节点或边界的绝对位置,一方面会导致空间目标定位精度损失[11]、捕捉结果混淆[7],另一方面参与计算的目标位置改变可能造成求差计算产生更多伪增量;③基于形状度量法进行过滤,以“面积较小、形状狭长”作为伪增量的形状特征,采用面积、周长并衍生出各种参数[7, 12, 13]对求差结果进行过滤,然而,对于一些形状特殊的地物,如河流自身呈狭长状态,“碎小”和“狭长”并不能很好地区分真增量、伪增量。图 1(a)中,虚线、实线分别表示t1、t2时刻的河流目标快照,求差结果包含5个图元,图 1(b)中,分别采用“面积”、“扁率”(面积与周长比)两参数衡量其形状特征如图 1(c),经验证,面积值大的不一定是真增量,如5号图元是由于目标的边界小幅度偏移产生的伪增量;形态狭长的也不一定是伪增量,如4号图元虽然扁率较小,却是河道延长造成的真增量,呈“狭长”形状是河流要素的地理形状特征造成的。可见,对于像河流这样地物特征呈“狭长”状态的地理要素,采用形状度量法并不能完全过滤掉伪增量、且有可能造成真增量被过滤,不能保证提取增量的准确度和精度。
分析知,形状度量法仅能识别狭长多边形,但是无法区分究竟沿哪一方向呈现狭长状态。上述4号图元放大如图 1(d),虽然从β方向上看呈狭长状态,但从时空目标边界的相对位置来看,即在α方向上偏离较大,不属于狭长形状,该图元当属于真增量。究其本质,形状度量法只对求差结果的形状粗略地进行定量分析,而割裂了时空目标边界之间的相对位置关系,从而不能区分伪增量图元究竟在哪个方向上呈狭长状态、也不能对该特定方向上的狭长程度量化描述。其中,决定狭长多边形是否属于伪增量的特定方向即是时空目标边界不一致的方向,目前较少探讨时空目标的边界不一致性对增量识别的影响及其与真伪增量的判断关系。笔者曾采用拓扑量化法[14]解决这一问题,方法简便易操作,但该方法仅对时空目标边界中的一条边界构建缓冲区,而忽略了另一条边界也是造成不一致性的原因之一,识别增量的精度有待提高。
针对这一问题,本文首先分析了快照数据增量识别中,产生时空目标边界不一致性的原因,并研究了它对增量识别的影响;其次,采用距离参数对这种不一致性进行度量计算,并基于更新规范对量化的结果进行判断,从而区分出真增量、伪增量;进一步将此方法应用到1∶5万地理数据的增量识别试验中,验证了该方法的可行性和有效性。
2 时空边界不一致性及其对增量识别的影响以往对空间数据不一致性的研究主要针对同一时刻的快照数据,如单一数据库中邻接或相交目标之间的不一致性[15, 16]、多源数据库中的同名地物之间的不一致性[17, 18],而没有从时间尺度上考虑同名地物间的边界不一致问题,也没有研究这种不一致性对增量识别的影响。
时空目标的边界不一致性是指在多期快照数据的叠加对比中,由于不同时期数据生产中的测量误差,造成时空目标的边界发生了几何位置的偏差。将不同时期的快照数据按垂直时间轴分布,设某一目标在t1、t2时刻的几何图形分别为O(t1)、O(t2),如图 2(a)所示。设两时刻的容限误差分别为e1、e2,则对于O(t1)、O(t2)边界线上的任意点p(t1)、p(t2),其坐标位置分别在((p(t1).x±e1),(p(t1).y±e1))、((p(t2).x±e2),(p(t2).y±e2))范围内波动,将时空目标垂直投影到同一时间轴,时空边界间的相对位置存在某一范围e3的偏离,当e3比较小,如图 2(a)中5处的两条边界,这种由时空边界不一致性产生的相对位置偏离不属于真正的数据变化。
一般来说,矢量数据的增量识别可通过叠置求差计算获取,将时空目标O(t1)、O(t2)的求差结果称为差图元,记为Diff。然而时空边界的不一致性会混淆增量的判别结果,如图 2(b)中包含5个差图元,直观上,很难区分哪些差图元是不一致性造成的伪增量,哪些差图元是地物变化造成的真增量。
可见,时空边界的不一致性是造成快照数据增量识别中产生伪增量的根本原因之一,因而,有必要研究顾及时空边界不一致性情况下的增量识别计算方法。
3 增量识别计算本文将增量识别计算分为两个步骤。
一是对时空目标的边界不一致性进行量化,本文采用时空边界的偏离距离这一参数。首先,给出了时空边界距离的定义;其次,根据第2节分析知,不一致性导致的偏离程度与时空目标的容限误差相关,由此根据方差-协方差传播定律计算得到时空边界的距离值、误差偏离范围。
二是对量化结果进行判断。首先,基于新版快照数据的更新规范,得到数据更新的临界值δ0;其次,构建时空边界距离与临界值δ0间的关系,从而区分真增量、伪增量。
点目标的判断较简单,本文不作考虑;从本质上来看,线、面目标都以边界线进行计算,本文以较复杂的面目标为例,解决面状目标的增量识别问题。
3.1 时空边界不一致性的距离度量对于某一差图元,以图 2为例,分别时空目标O(t1)、O(t2)的边界线记为L1、L2,叠加后其交点序列为〈I1,I2,…,Ik〉,则k个交点将两条边界线分别打断构成两组子线段、。设第i个差图元Diffi,其边界线分别来自于两个时空目标的边界,分别记为l(t1)i、l(t2)i,l(t1)i、l(t2)i分别表示L1、L2中以交点Ii、Ii+1为端点的子线段。如图 3中,1号差图元Diff1的时空边界为l(t1)1和l(t2)2,l(t1)1是处于I1、I2两交点之间且来自于L1的线段,l(t2)1是处于I1、I2两交点之间且来自于L2的线段。
设差图元Diffi的时空边界l(t1)i、l(t2)i对应的坐标点序列分别为〈p(t1)1,p(t1)2,…,p(t1)n〉,〈p(t2)1,p(t2)2,…,p(t2)m〉,则其时空边界的距离为
式中,D(p(t1)k,l(t2)i)表示节点-边界距离,即边界l(t1)i中的某一节点p(t1)k与边界l(t2)i的距离,其定义如图 4,表示以点P(t1)k为圆心且与边界l(t2)i相切的最小圆半径。对于上述时空边界l(t1)i、l(t2)i,共需要计算n+m+2个节点-边界距离,其中,由于首尾节点是交点,即P(t1)0 = P(t2)0 且 P(t1)n = P(t2)m,在交点处的距离为0。以下给出其中其他除首尾端点以外的节点-边界距离计算及误差估计。
设l(t1)i的某一节点坐标p(x0,y0),l(t2)i中与p对应着节点-边界距离的线段记为l(t2)min、l(t2)min两端点坐标分别为(x1,y1)、(x2,y2),根据解析几何原理,得到节点p与边界l(t2)i的节点-边界距离为
式中,A=y2-y1;B=x1-x2;C=x2y1-x1y2。 设Ax0+By0+C≥0、Δy21=y2-y1、Δx21=x2-x1,对式(2)进行线性化后可得 令m =、n=x0Δy21-y0Δx21+x2y1-x1y2,则,求得各系数为令η=[a1 b1 a2 b2 a3 b3],由方差-协方差传播律,可计算p与l(t2)i的节点-边界距离协方差阵
一般情况下,实际工作中的观测点坐标相互独立,且各点坐标分量xi和yi的精度相同,则有σxiyj=0、σyixj=0,且σxi2 = σyi2,(i=0,1,2;j=0,1,2),则σD2为节点-边界距离的误差估计
式(2)和式(6)分别为节点-边界距离的计算和误差估计公式。设点p与l(t2)i的节点-边界距离最大、最小值分别为Dmax、Dmin,该点的节点-边界距离在Dmin~Dmax间波动。其中
计算差图元Diffi的所有节点-边界距离及误差,由式(1)得到其时空边界的距离最小值dmin、最大值dmax分别为
由此,将该差图元的时空边界不一致性量化为,其时空边界的距离偏离幅度为(dmin~dmax)。
3.2 基于更新临界值的真伪增量判断对不一致性进行量化后,需要对其结果进行判断,以区分哪些差图元是真增量、哪些差图元是伪增量。
在探讨判断的依据这一问题时,从数据的更新规范中得到了启示。认为只有在新版数据库的规范中规定了需要更新的那些目标,在叠加求差结果中才表现为真正的增量,而在更新规范中不需要更新的目标,却体现在求差结果中,这种情况下产生的差图元可认为是伪增量。即实际更新工程中,根据不同的数据源、不同的尺度、不同的地物目标以及不同的应用,会存在这样一个指导性的更新临界值。以1∶5万地形数据库为例,从2006年启动第一次更新工程,在综合判调和缩编更新生产实践中,通过不断地试用和完善,规定了需要更新的各种要素的特点:如水系要素中的河流、渠道、湖泊、水库等,当岸线变化偏移图上大于1 mm,或整体上变化明显时,原则上应予更新;街区式居民地实地范围变化距离图上大于0.5 mm需要更新;道路局部改线长度图上大于5 mm,与原路距离图上大于1 mm的应更新。
以此作为判断依据,针对某尺度下的某一数据库,更新规范中对不同地物要素类型的规定,设定某种地物要素类型的更新临界值为δ0,也就是说,数据库中时空边界距离超出δ0的目标,是在更新工程中必须被更新的目标,是地物要素本身发生了变化,产生真增量;反之,时空边界距离小于δ0的部分无需被更新,可认为是边界不一致性造成的伪增量。
上节计算得到的时空边界距离是一个范围值,笔者认为当时空边界距离的最小值超过更新临界值时,则该图元必定是真正的增量;当更新临界值超过时空边界距离的最大值时,则该图元必定是伪增量;若更新临界值处于时空边界的最小值、最小值之间,则该差图元有可能是真增量,也有可能是伪增量,必须结合其他资料进行人工判断才能确定。增量识别的判断函数f如下
3.3 算 例以图 3中的1号差图元为例,对其时空边界的不一致性进行距离度量和判断。设其时空边界l(t1)、l(t2)的节点分别编号为101—115、201—205,如图 5。两期数据的平面位置中误差均设为25 m,表 1给出这些时空边界的节点坐标和精度信息。
boundary | Pt.No. | x/m | y/m | σx/m | σy/m | σxy/m2 |
l(t1) |
|
l(t2) |
|
设当前结点Pt0,另一条边界中距离Pt0点最近的线段端点为Pt1、Pt2,根据式(2)、式(6)分别计算l(t1)中15个节点与l(t2)、l(t2)中5个节点与l(t1)的节点-边界距离D及误差估计σD,由式(7)得到每一节点-边界距离的最小值dmin、最大值dmax,计算结果如表 2。
Pt0.No. | Pt1.No. | Pt2.No. | D/m | σD/m | Dmin | Dmax |
101 | 201 | 201 | 0.00 | 0.00 | 0.00 | 0.00 |
102 | 201 | 202 | 26.02 | 33.63 | 0.00 | 59.65 |
103 | 201 | 202 | 61.36 | 30.69 | 30.67 | 92.05 |
104 | 202 | 203 | 76.98 | 34.97 | 42.01 | 111.96 |
105 | 202 | 203 | 83.30 | 30.87 | 52.43 | 114.18 |
106 | 203 | 204 | 100.31 | 34.17 | 66.14 | 134.48 |
107 | 203 | 204 | 83.53 | 30.67 | 52.85 | 114.20 |
108 | 203 | 204 | 78.93 | 31.21 | 47.72 | 110.14 |
109 | 203 | 204 | 67.91 | 33.35 | 34.56 | 101.26 |
110 | 203 | 204 | 62.73 | 34.58 | 28.14 | 97.31 |
111 | 204 | 205 | 49.28 | 33.61 | 15.67 | 82.90 |
112 | 204 | 205 | 33.29 | 30.65 | 2.64 | 63.95 |
113 | 204 | 205 | 27.19 | 31.95 | 0.00 | 59.14 |
114 | 204 | 205 | 21.76 | 36.11 | 0.00 | 57.86 |
115 | 205 | 205 | 0.00 | 25.00 | 0.00 | 25.00 |
201 | 101 | 101 | 0.00 | 0.00 | 0.00 | 0.00 |
202 | 102 | 103 | 65.55 | 31.68 | 33.87 | 97.23 |
203 | 105 | 106 | 98.08 | 30.96 | 67.12 | 129.04 |
204 | 111 | 112 | 48.26 | 30.84 | 17.42 | 79.11 |
205 | 115 | 115 | 0.00 | 0.00 | 0.00 | 0.00 |
根据式(8)知,基于距离对该差图元的时空边界不一致性进行量化,结果为dmin是67.12 m,最大值dmax为134.48 m。
设该数据的更新临界值为实地距离50 m,由式(9)进行判断,50 m < 67.12 m < 134.48 m,则该差图元必定是真增量。
经计算,图 1中的4号差图元为真增量而其他均是伪增量,篇幅有限,未列出计算过程。
4 试验与分析 4.1 试验数据及步骤试验数据采用同一地区的两期1∶5万基础地理水系数据。2006年,该地区共存在45条常年河,占地11.64 km2,如图 6(a)左图,由于水系支流较细,为图像表达清晰,对虚线框中局部数据的支流做了缓冲区放大处理,显示效果如图 6(a)右图,但在实际计算时仍采用原始数据。2011年包含常年河42条,占地12.26 km2,对应的局部放大效果如图 6(b)所示。
增量识别的步骤如下:首先,以2011年数据为标准,对2006年数据进行格式及投影转换;其次,根据名称、位置等信息对两期数据中对应的时空目标进行匹配;对时空目标进行求差计算,同时标注差图元中的两条时空边界线;按照3.1节对每个差图元的时空边界不一致性进行距离量化计算,其中,两期快照数据的平面位置中误差均为25 m;根据3.2节判断该差图元是真增量还是伪增量,根据1∶5万数据库水系要素更新规范,设定更新临界值为图上1 mm,对应的实地偏移距离为50 m;通过人工判断那些无法自动判断的差图元,最后将伪增量从差图元中剔除,得到结果如图 7(a)。
4.2 结果比较与分析为了验证本文方法的有效性,将试验结果与直接求差(如图 7(b))、求差后形状过滤(如图 7(c))两种方法的提取结果进行比较分析。
经对比,较直接求差结果,本文方法可识别出“沿时空边界线方向上的狭长条带”,如图 7(b)中2号图元时空边界距离的最大值dmax为34 m,小于更新临界值;也可识别出局部摆动的小碎片,如3号图元。1∶5万数据库更新工程规定水体图上面积小于2 mm2但有重要意义的不得舍去,本文设置面积过滤的阈值为5000 m2,并设定扁率过滤经验值为10,对求差结果进行面积过滤、狭长多边形过滤,结果如图 7(c),将4号图元判为伪增量剔除。与图 7(a)比较,采用本文方法计算4号图元时空边界的距离最小值dmin为892 m,远大于更新临界值50 m,虽然也呈现狭长形状,但并非沿时空边界不一致性方向的狭长带条,在客观世界中表示河流下游干涸,反映了较为重要的变化信息,不应舍去,属于真正增量被过度过滤。
对上述3种方法提取的结果统计如表 3。本文方法识别了143个增量图元,面积3.0 km2,另外有6个图元的时空边界距离的最大值和最小值处于更新临界值之间,需要人工确认,自动识别的正确率达到95.8%。直接求差法识别了764个增量图元,面积4.2 km2,其中包括627个伪增量,占所有图元个数的82.07%,而面积1.18 km2,只占了27.83%,可以进一步确认这些伪增量是大量面积狭小的小碎片或狭长条带。对求差结果采用形状度量法进行过滤,剔除了613个图元,识别出151个增量图元,剔除的图元中有43个属于过度过滤的真增量,识别结果中尚有57个伪增量,正确率为68.61%,对这种既存在过度过滤又存在伪增量的情况,本文将正确率定义为实际上正确的识别结果与理论上正确的识别结果之比,计算方法为
|
本文方法 | 143 | 3.06 | 0 | 0 | 6 | 0.02 | 0 | 0 | 95.80% |
直接求差法 | 764 | 4.24 | 627 | 1.18 | 0 | 0 | 0 | 0 | 17.93% |
形状度量法 | 151 | 3.80 | 57 | 0.87 | 0 | 0 | 43 | 0.13 | 68.61% |
通过对比可知,本文方法识别的增量有更可靠的准确度,进而提高了空间变化分析的准确性。
经分析,当时空目标边界存在较长的偏移,此时的伪增量表现为“狭长条带”,当目标边界局部相互交织产生的伪增量表现为“细短碎片”,因此,从本质上看,本文方法识别的也是狭长多边形,然而与形状度量法不同的是,其研究对象是时空边界,从而限定了伪增量不是任意方向呈狭长形态,而是沿时空边界线不一致性的方向上呈狭长条带,实质上是一种定性判断,这是能够进一步精确区分伪增量的优势所在。
5 结 论本文针对快照数据增量识别中时空边界不一致性带来的伪增量识别难题,对时空边界的不一致性进行了距离量化计算,并基于更新临界值对量化结果进行了比较判断。试验表明,这种方法既能有效识别由边界不一致造成的伪增量,又不至于剔除本身呈狭长形状的地物要素,比形状度量等现有方法更合理,有效提高了识别增量的准确度,为空间变化分析、增量发布、增量更新等提供了较为准确的数据支持,有较广泛的应用价值。值得强调的是,这种增量识别方法只适用于快照数据符合成果规范标准的情况。
[1] | CHEN Jun, LIN Yan, LIU Wanzeng, et al. Formal Classification of Spatial Incremental Changes for Updating[J]. Acta Geodaetica et Cartographica Sinica, 2012, 41(1): 108-114. (陈军, 林艳, 刘万增, 等. 面向更新的空间目标快照差分类与形式化描述[J]. 测绘学报, 2012, 41(1): 108-114.) |
[2] | XU Lihua, JIANG Wanshou. Change Detection of Satellite Imagery Considering Projection Difference[J]. Geomatics and Information Science of Wuhan University, 2006, 31(8): 687-690. (徐丽华, 江万寿. 顾及配准误差的遥感影像变化检测[J]. 武汉大学学报: 信息科学版, 2006, 31(8): 687-690.) |
[3] | ZHANG Yun, LI Qingquan, CAO Xiaohang, et al. An Algorithm for Detecting the Geometric Difference between the Road Networks[J]. Acta Geodaetica et Cartographica Sinica, 2008, 37(4): 521-525. (张韵, 李清泉, 曹晓航, 等. 一种道路网信息几何差异检测算法[J]. 测绘学报, 2008, 37(4): 521-525.) |
[4] | LIU Wanzeng. Automatic Detection of Spatial Conflict in GIS Database Updating[M]. Beijing: Surveying and Mapping Press, 2009. (刘万增. GIS数据库更新中的空间冲突自动检测方法[M]. 北京: 测绘出版社, 2009.) |
[5] | ZHANG Xinchang, GUO Taisheng, TANG Tie. An Adaptive Method for Incremental Updating of Vector Data[J]. Acta Geodaetica et Cartographica Sinica, 2012, 41(4): 613-619. (张新长, 郭泰圣, 唐铁. 一种自适应的矢量数据增量更新方法研究[J]. 测绘学报, 2012, 41(4): 613-619.) |
[6] | TANG Luliang, YANG Bisheng, XU Kaiming. The Road Data Change Detection Based on Linear Shape Similarity[J]. Geomatics and Information Science of Wuhan University, 2008, 33(4): 367-370. (唐炉亮, 杨必胜, 徐开明. 基于线状图形相似性的道路数据变化检测[J]. 武汉大学学报: 信息科学版, 2008, 33(4): 367-370.) |
[7] | NCGIA Core Curriculum in GIScience. The Polygon Overlay Operation[EB/OL]. [2012-06-22]. http://www.ncgia.ucsb.edu/giscc/units/u186/u186.html. |
[8] | DENG Min, LIU Wenbao, FENG Xuezhi. Dealing with Inconsistency between Digital Geographic Lines from Multi-data Sources in GIS[J]. Journal of Remote Sensing, 2005, 9(4): 343-347. (邓敏, 刘文宝, 冯学智. GIS中地理边线不一致性的处理[J]. 遥感学报, 2005, 9(4): 343-347.) |
[9] | BURROUGH P A, MCDONNELL R A. Principles of Geographical Information Systems[M]. Oxford: Oxford University Press, 1998. |
[10] | ZHANG Jiangqing, ZHU Lina, PAN Li. River Change Detection Based on Remote Sensing Imagery and Vector Data[J]. Geomatics and Information Science of Wuhan University, 2007, 32(8): 663-666. (张剑清, 朱丽娜, 潘励. 基于遥感影像和矢量数据的水系变化检测[J]. 武汉大学学报: 信息科学版, 2007, 32(8): 663-666.) |
[11] | University Consortium for Geographic Information Science. Research Priorities for Geography Information Science[J]. Cartographic and Geographic Information System, 1996, 23(3): 115-127. |
[12] | FRAKLIN W R, WU P Y F. A Polygon Overlay System in Prolog[C]//Proceedings of AutoCarto 8. Falls Church: ASPRS/ACSM, 1987: 97-106. |
[13] | SHI Wenzhong. Principle of Modelling Uncertainties in Spatial Data and Analysis[M]. Beijing: Science Press, 2005: 283. (史文中. 空间数据与空间分析不确定性原理[M]. 北京: 科学出版社, 2005: 283.) |
[14] | LIN Yan, CHEN Jun, LIU Wanzeng, et al. Topological Quantitatively Method for Spurious Increments Removed of Area Water[J]. Geomatics and Information Science of Wuhan University, 2012, 37(12): 1504-1505. (林艳, 陈军, 刘万增, 等. 面状水系伪增量剔除的拓扑量化法[J]. 武汉大学学报: 信息科学版, 2012, 37(12): 1504-1505.) |
[15] | DAI Honglei, XU Panlin, DU Daosheng. The Analyses of the Positional Error Propagation in Overlay Operation of Polygon Under GIS Environment[J]. Acta Geodaetica et Cartographica Sinica, 1999, 28(2): 148-152. (戴洪磊, 徐泮林, 杜道生. 矢量GIS环境下多边形叠置中位置误差的传播分析[J]. 测绘学报, 1999, 28(2): 148-152.) |
[16] | AI Tinghua, WU Hehai. Consistency Correction of Shared Boundary between Adjacent Polygons[J]. Geomatics and Information Science of Wuhan University, 2000, 25(5): 426-431. (艾廷华, 毋河海. 相邻多边形共享边界的一致化改正[J]. 武汉大学学报: 信息科学版, 2000, 25(5): 426-431.) |
[17] | CASADO M L. Some Basic Mathematical Constraints for the Geometric Conflation Problem[C]//Proceedings of the 7th International Symposium on Spatial Accuracy Assessment in Natural Resources and Environmental Sciences. Lisboa: Instituto Geográfico Português, 2006: 266-274. |