出版日期: 2019-05-25
点击次数:
下载次数:
DOI: 10.11834/jrs.20198013
2019 | Volumn23 | Number 3
上一篇  |  下一篇


技术方法 
遥感影像变化检测样本自动抽样
expand article info 魏东升1,2,3,4 , 周晓光1,3,4
1. 中南大学 地球科学与信息物理学院,长沙 410083
2. 中南林业科技大学 土木工程学院,长沙 410004
3. 有色金属成矿预测与地质环境监测教育部重点实验室(中南大学),长沙 410083
4. 有色资源与地质灾害探查湖南省重点实验室,长沙 410083

摘要

在遥感影像结合矢量数据先验信息的变化检测中,需要从分割后的影像对象中抽取一定数量、具有相同类别属性的样本,其中不可避免地抽到类别属性不一致的样本,如何剔除这些样本是抽样过程中必须解决的重点问题,在目前已有的方法中,一般是通过人工目视判别完成的。样本的自动提取是实现自动变化检测的关键环节,本文提出一种变化检测样本自动抽样方法,主要包括样本的空间布设和异常样本自动检测两个环节。该方法首先利用矢量数据提取抽样图层,用抽样图层分割遥感影像,获取影像对象。其次是根据抽样区域范围、影像对象分布特征和地形特征布设变化检测样本。然后根据样本的先验类别属性构建特征空间向量,计算样本在特征空间的局部可达密度,由局部可达密度计算样本的异常度指数,并根据特征空间密度异常指数剔除异常样本,完成变化检测样本自动提取。最后以耕地、林地和居民地为例进行了抽样试验。结果表明,邻域参数k按样本布设总数的1/5—1/3取值、异常度阈值设定为80%时,可以实现异常样本0漏检率,能够准确、高效实现变化检测样本的自动提取。

关键词

遥感影像, 矢量数据, 抽样, 变化检测, 异常

Automatic sampling of remote sensing image change detection samples based on prior information of vector data
expand article info WEI Dongsheng1,2,3,4 , ZHOU Xiaoguang1,3,4
1.School of Geosciences and Info-Physics, Central South University, Changsha 410083, China
2.College of Civil Engineering, Central South University of Forestry and Technology, Changsha 410004, China
3.Key Laboratory of Metallogenic Prediction of Nonferrous Metals and Geological Environment Monitoring(Central South University), Ministry of Education, Changsha 410083, China
4.Key Laboratory of Non-ferrous Resources and Geological Hazard Detection, Changsha 410083, China

Abstract

Some existing classification vector datasets are available for change detection in many regions, and some prior knowledge—such as position, shape, size, and class—are included in these datasets. The change detection method, which rely on remote sensing images and vector datasets, has become an important research focus. The automatic sampling method for the change detection of samples is the key technology in achieving automatic change detection. Therefore, an automatic sampling method based on the feature space density outlier index is proposed. The change detection of vector data/remote sensing images is realized by focusing on the spectral feature difference between the image objects needed to be detected and the samples. On the one hand, the samples must be able to differentiate the regional environment characteristics in a spatial distribution, and this aspect belongs to the problem realm of the sampling distribution method. On the other hand, the samples must include the image objects with no changes in the posterior class attribute, and this aspect is important in the detection of outlier samples. The automatic sampling method proposed in this study includes the spatial layout of samples and the automatic detection of outlier samples. The reasonable spatial distribution of samples is the precondition for improving the accuracy of change detection results, and an automatic detection method for the outlier samples is an important part of automatic change detection technology. In acquiring the samples for change detection, we initially extract a sampling layer from the vector data and use this layer to segment the remote sensing image. In this manner, the image objects can be extracted. Second, samples are extracted from the image objects, and we determine whether the spatial distribution of these samples directly yet reasonably affects the accuracy of the change detection results. On the one hand, the rationality of the sample space layout should reflect the correctness and uniqueness of the samples in typical normal areas. On the other hand, the sample layout must be able to reflect the overall features of the image objects. The sample layout must also be random and uniform, and the samples should be representative. Thus, we extract samples of the image objects in accordance with the sampling region and by considering the distribution and topographic features of these image objects. Then, we detect the outlier image objects in the samples. Local reachability density (LRD) is applied to quantitatively describe the intensity of an image object relative to its neighborhood’s image objects in the feature space. In particular, the LRD algorithm is used to construct an outlier index that can measure the outlier degree of the sample image objects in the feature space. Feature space vectors are also constructed on the basis of the texture feature parameters. Then, the LRDs of the samples are calculated according to reachability distance. The feature space outlier index (FSOI) is also defined and then used to detect the outlier sample objects. Finally, an experimental research on the proposed sampling method was carried out by using a vector topographic map and a high-resolution remote sensing image. The experimental results indicate that the full detection of outlier samples can be achieved when the k value is set from 1/5 to 1/3 of the total number of samples and the FSOI threshold is set to 80%. The proposed sampling method can effectively achieve automatic sampling of change detection samples.

Key words

remote sensing image, vector data, sampling, change detection, outlier

1 引 言

遥感影像变化检测是全球变化研究的重要内容(Chen 等,2015),已应用于诸多领域,如灾后应急与评估(Samadzadegan和Rastiveisi,2008)、环境变化检测(Varma 等,2014Chen 等,2013)和地理数据更新(Chen 等,2012)。近30年来,国内外许多学者对变化检测方法从不同角度进行了研究(张晓东 等,2006李德仁,2003),总体来讲可以分为两大类:一类是基于两期遥感影像的变化检测方法,主要有直接比较法(Chen 等,2011Bruzzone和Prieto,2000Johnson和Kasischke,1998)、分类后比较法(Post-Classification Comparison)(Barnhart和Crosby,2013Ahmad,2012Serra 等,2003)及其他组合方法(hybrid)(Ghofrani,2014)等;另一类是使用矢量数据和遥感影像相结合的变化检测方法(Sofina和Ehlers,2016Adesina和Mavomi,2014)。由于影响地物光谱特性变化的因素比较复杂,除了地物本身的物理特性之外,成像时间、地域差异、环境和传感器等外在因素都会不同程度地影响地物的光谱特性,基于两期遥感影像的变化检测方法要么存在工作量大、分类误差累积传递到变化信息中,要么存在数据条件要求苛刻、难以充分利用快速发展的多源遥感影像数据等诸多不足(魏东升和周晓光,2017)。近年来,许多应用需求的参考数据中包含了一期分类矢量数据,这些矢量数据包含有位置、形状、大小和类别属性等先验信息,一些学者使用这些先验信息分割遥感影像,通过影像对象纹理特征在空间上的差异性进行变化检测,有效地提高了变化检测结果的精度和效率(魏东升和周晓光,2017Sofina和Ehlers,2016Adesina和Mavomi,2014)。但是,在变化检测中,需要从分割后的影像对象中抽取一定数量、具有相同类别属性的样本,其中不可避免地抽到类别属性不一致的样本,如何剔除这些样本是抽样过程中必须解决的重点问题,在目前已有的方法中,一般是通过人工目视判别完成的(魏东升和周晓光,2017李亮 等,2013)。样本的自动提取是实现自动变化检测的关键环节,因此,解决变化检测样本自动抽样问题具有一定的理论意义和实用价值。

用矢量数据分割遥感影像,获得的影像对象具有清晰完整的边界、空间位置、先验类别和光谱信息。对于具有相同先验类别属性的影像对象而言,它们的光谱特征既具有相似性,也具有差异性,这些差异性有可能是由于地域环境的差异引起的,也有可能是因为影像对象验后类别的变化造成的。判断影像对象是否变化的标准是通过待检测影像对象与样本影像对象由光谱信息表示的特征差异来实现的。因此,用于变化检测的样本,一方面要求在空间分布上必须能够体现出因地域环境差异引起的光谱特征差异,这属于样本布设方法问题;另一方面样本对象无论是空间位置、形状大小,还是验后类别属性都必须是正确的,然而,样本是从含有先验类别属性的影像对象中抽取的,其中可能包含验后类别属性已经变化了的影像对象,由于类别属性的变化,这些影像对象的光谱特征在空间上具有明显的差异,必须从样本中剔除。在抽样过程中,只要选择合适的抽样区域,就可以确保样本布设结果中包含验后类别属性已经变化的影像对象的个数较少,而且变化为同类别的影像对象的个数更少,这类验后类别属性已经变化的影像对象属于异常数据集。由此可知,样本自动提取主要包括样本的空间布设和异常样本的自动检测两个环节,样本空间分布的合理性是提高变化检测精度的前提条件,异常样本的自动检测是实现自动变化检测的关键环节。

样本的空间布设需要考虑两个方面的因素:(1)地域环境差异引起的地物光谱特征差异,这主要体现在影像对象的空间分布和地形差异方面;(2)样本布设结果中变化的影像对象应是少量的,这主要体现在抽样区域的选择方面。因此,可以根据影像对象的空间分布、地形特征和抽样区域范围进行优化样本空间布设。选择合适的抽样区域,能够满足绝大部分样本的验后类别属性没有发生变化,而且变化为同一类别的样本会更少,即未变化的样本属于典型正常区域数据集,而变化的样本属于低密度区域异常数据集。局部可达密度LRD(Local Reachability Density)定量描述了影像对象在特征空间内与其邻域内点的密集程度(Radovanović 等,2015Aggarwal和Yu,2001Breunig 等,2000),一个对象的局部可达密度越大,表示该对象与邻域内对象划分为同一类别的概率就越大。本文运用局部可达密度算法,构建一个衡量样本在特征空间内的异常度指标,进行异常样本检测,自动提取变化检测样本。

2 研究方法

2.1 变化检测样本自动提取流程

在遥感影像结合矢量数据先验信息的变化检测中,变化检测样本的自动提取就是根据影像对象的先验特征信息布设样本,然后根据样本光谱特征描述的纹理特征空间差异性,检测出与先验类别不一致的样本,提取出变化检测样本,主要包括从矢量数据中获取抽样图层、用抽样图层分割遥感影像、从分割后的影像对象中布设变化检测样本和异常样本检测等步骤,变化检测样本提取流程如图1所示。

图 1 变化检测样本自动提取流程图
Fig. 1 Flowchart of the change detection sampling method

首先从基准期矢量数据中提取抽样图层,用抽样图层分割遥感影像,获取影像对象。抽样图层中地理要素的先验信息可作为影像对象样本空间布设的参考信息,而且分割后的影像对象包含有相同的先验类别属性和具有差异性的光谱信息,这些光谱信息表示的特征空间可用于异常样本检测。

其次是从分割后的影像对象中布设样本。为了提高变化检测结果精度,样本必须能够体现影像对象总体的基本特征,所以样本的选取要具有随机性,样本的空间分布要具有合理性。由于影像对象的光谱信息因地域环境变化而有所差异,因此,样本布设应考虑影像对象的空间分布和地形差异。此外,在布设的样本中,验后类别属性变化的样本必须满足异常数据的特征,即在抽样过程中,验后类别属性变化的影像对象被抽中的概率必须是低的,因此,抽样区域必须从局部变化区域扩展到全局区域,以确保异常检测中的典型正常区域数据集就是未变化影像对象,异常数据集就是变化了的影像对象。由此可知,可以根据影像对象的空间分布、地形差异和抽样区域的全局特征来布设变化检测样本。

最后检测异常样本,提取出变化检测样本。由于异常样本与典型正常区域样本有显著的光谱特征差异,因此可以根据异常检测原理对异常样本进行异常检测。其方法是依据样本的光谱信息构建特征空间向量,分别计算各样本间的欧氏距离和各样本的第k距离及其k距离邻域(k为邻域参数,表示一个对象邻域内应包含最少对象的个数,第k距离为包含k个对象邻域内的最远距离),然后计算样本的局部可达密度,由局部可达密度计算样本的异常度指数,并根据异常度指数值大小判断样本的验后类别是否变化,完成变化检测样本自动提取。

2.2 变化检测样本的空间布设

样本的空间分布是否合理直接影响到样本异常检测结果的准确性,进而影响变化检测结果精度。样本空间布设的合理性一方面应体现出典型正常区域数据集表示的正确性和唯一性。因为异常检测方法就是要检测出样本中低密度区域的数据集,如果典型正常区域数据集不能表示样本的先验类别特征、或者具有多类别特征,那么样本数据异常检测结果就不能体现样本的先验类别。由于同一抽样图层中的影像对象具有相同的先验类别属性,样本空间布设只需要考虑样本对象的验后类别与先验类别属性是否一致,而且具有这种一致性的影像对象出现的概率会随着抽样区域的扩大而增加,因此样本布设必须考虑抽样区域的全局特性。另一方面,为了提高变化检测结果精度,样本必须能够体现出总体的数字特征。因此,样本布设必须具有随机性、样本分布要满足均匀性和样本要具有代表性,也就是说,在样本布设中,影像对象密集区域应布设较多样本,相反,稀疏区域应布设较少的样本,而且不同地形范围内样本布设的比利应具有合理性,但是特殊地形区域(如坡度较大区域、唯一影像对象区域)应保证具有一定的样本。

根据上述讨论可知,抽样区域范围、抽样区域内影像对象的分布特征和抽样区域地形特征都对样本空间合理分布产生直接影响,因此,本文采用规则格网进行样本的空间分配和布设。首先将抽样区域划分为 $r \times c$ 个规则的抽样格网,抽样格网大小可以根据抽样区域范围、影像对象总数和样本需求个数进行适当确定;其次将抽样区域按地形差异划分为t个层级,然后根据抽样格网内影像对象个数和地形起伏情况计算抽样格网内布设的样本个数,设 $S{N_{r \times c}}$ 表示抽样格网中位于第 $r$ 行、 $c$ 列格网样本布设的个数,则有

$S{N_{r \times c}} = \sum\limits_{j = 0}^t {\frac{{Ion_{r \times c}^j}}{{Ion}}} \cdot STN$ (1)

式中,IonSTN分别为抽样区域内影像对象总数和样本布设总数, $Ion_{r \times c}^j$ 表示第r行、c列格网内地形特征为第j层级的影像对象个数。从式(1)可知,抽样格网内地形特征为第j层级的影像对象越密集,样本布设个数就越多,反之则越少。如果抽样格网内存在影像对象,但是按式(1)计算的抽样格网内的样本布设个数为0,则抽样格网内应随机布设唯一样本,以确保影像对象稀疏区域内样本的代表性。

图2表示了一抽样格网内耕地样本布设原理,图2(a)为抽样区域内的耕地图层,图2(b)为对应抽样区域内用DEM表示的地形。由图2(b)可知,抽样区域最低海拔高程为652 m,最高海拔高程为719 m,按10 m等高距可将抽样区域划分为7个抽样层级,示例中的抽样格网共包含2个抽样层级,分别为第3、4层级。抽样区域共有耕地类对象1028个,计划布设样本224个,抽样格网中位于第3层级的耕地类对象有21个,第4层级的有15个,则抽样格网中应布设耕地样本总数为6个,其中第3层级样本数为4个,第4层级样本数为2个。

图 2 样本空间布设原理
Fig. 2 The principle of space layout of samples

2.3 样本影像对象特征空间构建

根据矢量数据抽样图层先验信息布设的样本中,存在变化了的样本,但相对于未变化的样本来说,这些变化了的样本的个数是极少的,属于异常数据集。由矢量数据分割遥感影像,获得的影像对象既含有先验类别属性,又包含影像对象的光谱特征信息,如何利用这些特征信息实现对异常样本的自动检测,影像对象特征空间构建是其重要环节。纹理特征作为重要的视觉表达方式已广泛应用于各类高分辨率遥感图像处理中(金晶 等,2014沈小乐 等,2014虞欣,2009),基于像元及其邻域灰度属性的灰度共生矩阵理论已经广泛应用于各种纹理分析中,被理论和实践证明是最有效的纹理分析方法之一,有较强的自适应性和鲁棒性(Zhuang 等,2016Eichkitz 等,2013Ulaby 等,1986)。因此,可以用灰度共生矩阵描述的纹理特征参数来构建影像对象的特征空间,但是这些纹理特征参数多达14种(Haralic 等,1973),而且由于不同纹理特征参数描述同类别影像对象,以及同一纹理特征参数描述不同类别影像对象的纹理都具有差异性,所以在构建影像对象的特征空间时,必须根据影像对象先验类别属性选择最优的纹理特征参数。魏东升和周晓光(2017)依据贡献度指数对纹理特征参数进行加权,设影像对象j的特征空间 ${{F}}sp(o{b_j})$ (Feature Space,Fsp),可以表示为

$ \begin{split} & \qquad {{F}}sp(o{b_j}) = {\left[ {p_1^j{f_1}, p_2^j{f_2}, \cdots, p_{14}^j{f_{14}}} \right]^{\rm T}} \\ & p_i^j = \frac{{GainRat({C_j}, {f_i}) \times 100\% }}{{{{\max }_C}\{ GainRat({C_j}, {f_i})/{{\max }_f}(GainRat({C_j}, {f_i}))\} }} \end{split}$

式中, ${f_i}(i = 1, 2, \cdots, 14)$ 为14种纹理特征参数, $p_i^j(i = 1, 2, \cdots, 14)$ 为影像对象j的第i个纹理特征参数对应先验类别的纹理特征贡献度指数,GainRat $({C_j}, {f_i})$ 为第i个纹理特征参数 ${f_i}$ 对影像对象j对应先验类别 ${C_j}$ 的信息增益率。式中,当贡献度指数低于40%时,就不选择这种纹理特征参数,对应的 $p_i^j = 0$ ,此外,由于各种纹理特征参数值取值区间的差异性, ${f_i}$ 均是经过归一化处理。

2.4 基于局部可达密度的特征空间异常度计算

在遥感影像上,引起地物光谱信息变化的原因很多,既有成像时间、地域环境和传感器等因素,也包括人为因素和突发性地质灾害引起的变化。与前者相比,人为因素和突发性地质灾害造成的变化是变化检测研究的目的和重点,而且在顾及抽样图层先验信息的样本布设中,这些因素引起影像对象特征空间的变化是局部的、具有典型的空间异常特征。Hawkins(1980)Atkinson(1986)先后从不同角度提出了异常(Outlier)的概念,一般来讲,异常是指在数据集中偏离大部分数据的数据,使人怀疑这些数据的偏离并非由随机因素产生,而是产生于不同的机制。在本文中,异常可以定义为特征空间内低密度区域的数据集,这些异常数据与典型正常区域数据不同,但具有相对性。Ramaswamy等(2000)从数据的空间分布特征提出了密度异常概念,首先计算每个数据邻域内点的可达距离,再用可达距离计算每个数据的局部异常因子LOF(Local Outlier Factor),最后根据LOF检测出异常数据集,这对单个的、孤立的异常点数据检验有很好的效果。但是,在需要检测的样本数据中,可能有大量的在特征空间内具有相同特征的异常数据集,如典型正常区域样本数据集是耕地,而样本数据集中包含了大部分的林地,这些林地应属于异常数据集,利用LOF进行异常检测可能会把林地当作典型正常区域数据集,误判为耕地,因此会使自动样本提取失败。为了能更准确地检测出样本数据集中的异常数据,依据局部可达密度原理,考虑样本数据集的全局特征,提出特征空间异常度计算方法,具体算法为

(1)计算样本影像对象在特征空间的可达距离(Reachability Distance)。设 $Rdi{s_k}(o{b_j}, o{b_i})$ 表示对象 $o{b_i}$ $o{b_j}$ 的第k可达距离,则有

$Rdi{s_k}(o{b_j}, o{b_i}) = \max (k - dis(o{b_i}), d(o{b_j}, o{b_i}))$ (3)

式中,k为邻域参数,表示一个样本对象邻域内应包含最少的样本对象个数,设对象 $o{b_i}$ 的第k邻域为 ${N_k}(o{b_i})$ ,则 $k \leqslant {N_k}(o{b_i})$ $d(o{b_j}, o{b_i})$ 表示在特征空间内对象 $o{b_i}$ $o{b_j}$ 的欧氏距离, $k - dis(o{b_i})$ 表示对象 $o{b_i}$ 的第k距离,表示包含k个对象邻域内的最远距离。

图3表示了在三维特征空间内对象 ${{o}}{{{b}}_1}\text{、}{{o}}{{{b}}_2}$ 到对象 $o{b_j}$ 的第5可达距离计算原理。在图3中,对象 ${{o}}{{{b}}_1}$ 的第5距离为 ${{{d}}_1}$ ,对象 ${{o}}{{{b}}_1}$ 到对象 $o{b_j}$ 的欧氏距离为 ${{{d'}}_1}$ ,因为 ${{{d}}_1} > {{{d'}}_1}$ ,所以对象 ${{o}}{{{b}}_1}$ 到对象 $o{b_j}$ 的第5可达距离为 ${{{d}}_1}$ ,而对象 ${{o}}{{{b}}_2}$ 的第5距离为 ${{{d}}_2}$ ,对象 ${{o}}{{{b}}_2}$ 到对象 $o{b_j}$ 的欧氏距离为 ${{{d'}}_2}$ ,且 ${{{d}}_2} < {{{d'}}_2}$ ,所以对象 ${{o}}{{{b}}_2}$ 到对象 $o{b_j}$ 的第5可达距离为 ${d'_2}$

图 3 影像对象在三维特征空间的可达距离
Fig. 3 Reachability distance of image objects in the three-dimensional feature space

(2)计算样本影像对象的局部可达密度。设 $LRD(o{b_j})$ 表示对象 $o{b_j}$ 的局部可达密度,则有

$LRD(o{b_j}) = \frac{{{N_k}(o{b_j})}}{{\sum\limits_{i \in {{{N}}_k}(o{b_j})} {Rdi{s_k}(o{b_j}, o{b_i})} }}$ (4)

局部可达密度 $LRD(o{b_j})$ 表示了对象j的第k邻域内的对象到对象j的平均可达距离的倒数,局部可达密度值越大,表示在特征空间内对象j和邻域内的对象属于同一类别的概率就越大,反之则越小。

(3)由局部可达密度计算影像对象特征空间异常度Fsoi(Feature Space Outlier Index)。设样本对象 $o{b_j}$ 的异常度指数为 ${Fsoi}(o{b_j})$ ,则有

${Fsoi}(o{b_j}) = 1 - \frac{{LRD(o{b_j}) \times 100{\text{%}} }}{{\mathop {\max }\limits_{i \in{{D}}} \left\{ {LRD(o{b_i})} \right\}}}$ (5)

式中,D表示样本对象集合。 $Fsoi(o{b_j})$ 的值介于0到100%之间,其值的相对大小刻画了样本对象的异常程度,值越大表示样本对象的特征空间偏离典型正常样本群体的概率就越大,在给定先验类别属性的样本自动识别中就排除该类对象作为抽样对象。

3 试 验

3.1 研究区域与数据

研究区域位于四川省平昌县某镇,试验数据为一幅矢量地形图和一幅高分辨率的遥感影像图。矢量地形图由GPS-RTK数字化测图获得,测图比例尺为1∶1000,成图时间为2014年04月(图4(a)),包含1954个地理对象和7种地物要素类别,包括耕地、林地、水体、道路、草地、荒地和居民地。影像数据为Google Earth卫星影像,影像获取时间为2016年08月(图4(b)),影像的空间分辨率为0.6 m,包含红、绿、蓝3个波段,影像大小包含2334×2334个像元。由矢量地形图获取高程数据,建立DEM表示研究区域的地形特征,如图4(c),研究区域属于山地地形,地形起伏变化较大,最低海拔高程为652 m,最高海拔高程为719 m。研究区域耕地、林地类要素较多,居民地要素相对较少,都具有明显的变化特征,因此,我们的抽样试验以耕地、林地和居民地为例,来验证本文变化检测样本自动提取方法的有效性。

图 4 变化检测样本抽样数据
Fig. 4 Test data set of sampling

3.2 试验结果与分析

首先从2014年的矢量地图中分别提取耕地、林地和居民地抽样图层,并将抽样区域按实地水平距离100 m×100 m划分为规则的抽样格网。然后用抽样图层分割2016年影像数据,获取影像对象。根据DEM数据(图4(c))表示的地形特征,按10 m等高距将抽样区域划分为7个抽样层级,耕地、林地和居民地影像对象在不同抽样层级中的分布特征如图5所示。

图 5 耕地、林地和居民地空间分布特征
Fig. 5 Spatial distribution features of cultivated land, woodland and building

抽样区域内包含耕地影像对象总数1028个、林地625个、居民地159个,本试验中,在抽样区域内计划布设耕地样本224个、林地样本167个、居民地样本122个。由于抽样区域内居民地影像对象相对较少,所以样本布设比例较高,样本绝对个数还是少于耕地和林地的样本数,但这并不会影响试验结果的有效性。根据耕地、林地和居民地影像对象在各层级的分布特征,首先计算出各抽样格网内每一层级布设的样本个数,然后采用随机抽样方法,对每个格网进行样本布设(图6)。

图 6 耕地、林地和居民地样本布设结果
Fig. 6 The result of space layout of cultivated land, woodland and building samples

图6中的样本布设结果是根据影像对象的先验信息获得的,由于人为的或者突发性灾害因素,这些先验信息在检测期遥感影像上可能已经发生变化,这就导致样本布设结果中包含有发生了变化的影像对象类别。根据抽样区域的全局特性,这些变化的影像对象抽到的概率较小,相对于未变化的样本影像对象而言,变化为同类别样本对象的个数是少量的,属于局部异常数据集。例如在随机布设的224个耕地样本中未变化的有188个,变化的样本仅有36个,而且变化的36个样本中属于同类别的就更少了,耕地变化为居民地的样本仅6个,耕地变化为林地的相对较多一些,有15个。因此,可以根据异常数据检测原理,检测出样本布设中与先验类别不一致的影像对象。

在影像对象异常检测中,首先构建影像对象的特征空间向量,根据影像对象先验类别属性,耕地由角二阶矩ASM(Angular Second Moment)、对比度CON(Contrast)、逆差矩IDM(Inverse Difference Moment)、熵ENT(Entropy)、平方和SSQ(Sum of Squares)、差熵DENT(Difference Entropy)和差方差DVA(Difference Variance)7个特征参数构成特征空间向量,林地由角二阶矩、逆差矩、熵、均值(Mean)、总方差(Sum Variance)和总平均(Sum Average)6个特征参数构成特征空间向量,居民地由逆差矩、熵、对比度、差熵和角二阶矩5个特征参数构成特征空间向量。其次是计算影像对象的第K距离和可达距离,然后计算局部可达密度,并由局部可达密度计算异常度指数。k值的大小体现了一个样本邻域内应包含的最少样本个数,由于邻域内样本个数越多,其隶属于同一类的概率就越小,因此k值的大小,会影响第K距离的大小,进而会影响影像对象的异常度指数。图7表示了在不同k值下样本异常度大小的频率分布直方图,横轴表示异常度指数大小,纵轴表示在给定异常度指数区间内样本出现的频率。

图 7 异常检测频率分布
Fig. 7 Frequency distribution of outlier detection

图7中可以直观看出,随着k值的增大,低异常度样本的个数逐渐增多,高异常度样本的个数逐渐减少。而且当k值达到一定取值区间时(图7(a)k取值在35−90),高异常度样本个数趋于稳定,而当k取值过大时(接近样本总数),样本中几乎全是低异常度样本(图7(c)k取120),则会导致异常检测结果失败。影像对象异常检测就是要去除样本中高异常度的影像对象,因此,由图7中试验数据可知,k值按样本总数的1/5左右选择时,不会影响异常检测结果的准确性。

为了定量分析影像对象异常检测的总体效果,在不同k值和不同异常度阈值下,对异常检测中的误检、漏检和总体精度进行了分析,其中误检指原本为与先验类别一致的样本被误判为异常样本,漏检指原本为异常样本而没有被检测出来。耕地、林地和居民地异常检测结果精度分析见表1

表 1 耕地、林地和居民地异常检测精度分析
Table 1 Accuracy analysis of outlier detection for cultivated land, woodland and building

下载CSV 
k 异常度阈值/% 耕地 林地 居民地
误检率/% 漏检率/% 总精度/% 误检率/% 漏检率/% 总精度/% 误检率/% 漏检率/% 总精度/%
10 90 0 66.7 89.28 0 68.2 86.27 0 71.1 85.29
80 7.4 0 93.75 3.5 0 95.43 0 0 100
70 9.6 0 91.96 9.8 0 92.16 0 0 100
20 90 0 47.2 92.41 0 65.4 88.43 0 69.2 84.88
80 4.9 0 95.98 0 0 100 0 0 100
70 12.2 0 89.73 2.4 0 98.03 0 0 100
35 90 0 11.1 98.20 0 65.8 87.54 0 70.2 83.18
80 2.6 0 97.76 0 0 100 0 0 100
70 11.7 0 90.17 0 0 100 0 0 100
50 90 0 27.7 95.53 0 85.4 82.35 0 80.2 81.35
80 0 0 100 0 0 100 0 0 100
70 6.9 0 94.20 0 0 100 0 0 100
65 90 0 47.2 92.41 0 91.2 82.35 0 81.3 80.24
80 0 0 100 0 0 100 0 14.3 100
70 4.2 0 96.42 0 0 100 0 0 100
90 90 0 58.3 90.62 0 89.8 82.12 0 85.7 79.43
80 0 0 100 0 21.3 94.12 0 32.8 91.23
70 2.6 0 97.76 0 0 100 0 0 100
105 90 0 88.9 85.71 0 94.2 80.11 0 100 76.41
80 0 11.1 98.2 0 23.1 91.32 0 57.2 87.54
70 0 0 100 0 0 100 0 0 100

表1可知,在异常度阈值取80%,k值低于90时,耕地的漏检率为0,林地的漏检率为21.3%,居民地的漏检率为32.8%。在异常度阈值取80%,k值低于65时,林地的漏检率为0, 而居民地只有当k值低于50时,漏检率才为0,其原因是林地的样本总数比耕地少,而居民地的样本总数最少,所以k值相对于样本总数的比例对异常检测结果精度有直接影响。而且,当耕地k在区间50−90取值,林地k在区间20−65取值,居民地k在区间10−50取值,异常度阈值取80%时,误检率和漏检率均为零,总体检测精度为100%。在设定异常度阈值为70%的条件下,无论k取何值时,耕地、林地和居民地的漏检率均为0。在样本影像对象异常检测中,只要能满足所抽取样本的验后类别与先验类别属性一致,则抽样就是成功的。也即是说,在异常检测中我们可以以牺牲一定的误检率来换取0漏检率。因此,为了获得0漏检率和较高的检测精度,一般情况下,k可以按布设样本总数的1/5−1/3取值,异常度阈值可设定为80%。本试验中,耕地取k=50、林地取k=35、居民地取k=20,异常度阈值设定为80%,异常检测结果如图8

图 8 异常检测结果
Fig. 8 The result of outlier detection

4 结 论

在充分利用矢量数据先验信息的基础上,为了实现遥感影像的自动变化检测,对变化检测样本的自动提取方法进行了研究,主要包括样本的空间布设和异常样本探测。样本布设采用分图层、根据地形分层级、按规则格网和影像对象空间分布特征进行随机抽样,从而确保了样本布设结果既具有随机性,也具有代表性和均质性,即既体现了抽样图层中影像对象的总体数字特征,也体现了典型正常区域样本数据集表示的正确性和唯一性。

在异常样本探测中,k的取值会影响样本对象的异常度指数,但是按样本总数的1/5—1/3取值时,异常度指数相对趋于稳定。异常度指数阈值的设定不同也会影响异常样本探测结果精度出现差异,较低的阈值可以获得异常样本较低的漏检率和较高的误检率,而较高的阈值会获得相反的结果。在样本提取结果中,更关心的是漏检率,可以以牺牲一定的误检率来换取0漏检率,一般情况下,将异常度阈值设定在80%或70%时可以获得0漏检率和较高的检测精度。该抽样方法对自动变化检测技术的实现具有一定的理论和实用价值,在灾后应急、地表环境监测等领域有较实用的价值。

然而,样本空间分布的差异性如何影响变化检测结果精度、样本布设结果中异常样本相对个数的多少对异常探测精度有多大影响以及如何选取合适的异常度阈值实现0误检率,这些都需要进一步的研究。

参考文献(References)

  • Adesina G O and Mavomi I. 2014. Landuse and landcover change detection of Jebba Lake Basin Nigeria: remote sensing and GIS approach. Journal of Environment and Earth Science, 4 (5): 119–127.
  • Aggarwal C C and Yu P S. 2001. Outlier detection for high dimensional data. ACM SIGMOD Record, 30 (2): 37–46. [DOI: 10.1145/376284.375668]
  • Ahmad F. 2012. A review of remote sensing data change detection: comparison of Faisalabad and Multan Districts, Punjab Province, Pakistan. Journal of Geography and Regional Planning, 5 (9): 236–251.
  • Atkinson A C. 1986. [Influential observations, high leverage points, and outliers in linear regression]: comment: aspects of diagnostic regression analysis. Statistical Science, 1 (3): 397–402. [DOI: 10.1214/ss/1177013624]
  • Barnhart T B and Crosby B T. 2013. Comparing two methods of surface change detection on an evolving thermokarst using high-temporal-frequency terrestrial laser scanning, Selawik River, Alaska. Remote Sensing, 5 (6): 2813–2837. [DOI: 10.3390/rs5062813]
  • Breunig M M, Kriegel H P, Ng R T and Sander J. 2000. LOF: identifying density-based local outliers. ACM SIGMOD Record, 29 (2): 93–104. [DOI: 10.1145/335191.335388]
  • Bruzzone L and Prieto D F. 2000. Automatic analysis of the difference image for unsupervised change detection. IEEE Transactions on Geoscience and Remote Sensing, 38 (3): 1171–1182. [DOI: 10.1109/36.843009]
  • Chen C F, Son N T, Chang N B, Chen C R, Chang L Y, Valdez M, Centeno G, Thompson C A and Aceituno L A. 2013. Multi-decadal mangrove forest change detection and prediction in Honduras, central America, with Landsat imagery and a Markov chain model. Remote Sensing, 5 (12): 6408–6426. [DOI: 10.3390/rs5126408]
  • Chen J, Chen J, Liao A P, Cao X, Chen L J, Chen X H, He C Y, Han G, Peng S, Lu M, Zhang W W, Tong X H and Mills J. 2015. Global land cover mapping at 30 m resolution: a POK-based operational approach. ISPRS Journal of Photogrammetry and Remote Sensing, 103 : 7–27. [DOI: 10.1016/j.isprsjprs.2014.09.002]
  • Chen J, Chen X H, Cui X H and Chen J. 2011. Change vector analysis in posterior probability space: a new method for land cover change detection. IEEE Geoscience and Remote Sensing Letters, 8 (2): 317–321. [DOI: 10.1109/LGRS.2010.2068537]
  • Chen X H, Chen J, Shi Y S and Yamaguchi Y. 2012. An automated approach for updating land cover maps based on integrated change detection and classification methods. ISPRS Journal of Photogrammetry and Remote Sensing, 71 : 86–95. [DOI: 10.1016/j.isprsjprs.2012.05.006]
  • Eichkitz C G, Amtmann J and Schreilechner M G. 2013. Calculation of grey level co-occurrence matrix-based seismic attributes in three dimensions. Computers and Geosciences, 60 : 176–183. [DOI: 10.1016/j.cageo.2013.07.006]
  • Ghofrani Z, Mokhtarzade M, Reza Sahebi M and Beykikhoshk A. 2014. Evaluating coverage changes in national parks using a hybrid change detection algorithm and remote sensing. Journal of Applied Remote Sensing, 8 (1): 083646 [DOI: 10.1117/1.JRS.8.083646]
  • Haralick R M, Shanmugam K and Dinstein I H. 1973. Textural features for image classification. IEEE Transactions on Systems, Man, and Cybernetics, SMC-3 (6): 610–621. [DOI: 10.1109/TSMC.1973.4309314]
  • Hawkins D M. 1980. Identification of outliers. Biometrics, 37 (4): 860
  • Jin J, Zou Z R and Tao C. 2014. Compressed texton based high resolution remote sensing image classification. Acta Geodaetica et Cartographica Sinica, 43 (5): 493–499. [DOI: 10.13485/j.cnki.11-2089.2014.0086] ( 金晶, 邹峥嵘, 陶超. 2014. 高分辨率遥感影像的压缩纹理元分类. 测绘学报, 43 (5): 493–499. [DOI: 10.13485/j.cnki.11-2089.2014.0086] )
  • Johnson R D and Kasischke E S. 1998. Change vector analysis: a technique for the multispectral monitoring of land cover and condition. International Journal of Remote Sensing, 19 (3): 411–426. [DOI: 10.1080/014311698216062]
  • Li D R. 2003. Change detection from remote sensing images. Geomatics and Information Science of Wuhan University, 28 (S1): 7–12. [DOI: 10.13203/j.whugis2003.s1.003] ( 李德仁. 2003. 利用遥感影像进行变化检测. 武汉大学学报(信息科学版), 28 (S1): 7–12. [DOI: 10.13203/j.whugis2003.s1.003] )
  • Li L, Shu N and Gong Y. 2013. Remote sensing image change detection and change type recognition based on spatiotemporal relationship. Geomatics and Information Science of Wuhan University, 38 (5): 533–537. [DOI: 10.13203/j.whugis2013.05.017] ( 李亮, 舒宁, 龚龑. 2013. 考虑时空关系的遥感影像变化检测和变化类型识别. 武汉大学学报(信息科学版), 38 (5): 533–537. [DOI: 10.13203/j.whugis2013.05.017] )
  • Radovanović M, Nanopoulos A and Ivanović M. 2015. Reverse nearest neighbors in unsupervised distance-based outlier detection. IEEE Transactions on Knowledge and Data Engineering, 27 (5): 1369–1382. [DOI: 10.1109/TKDE.2014.2365790]
  • Ramaswamy S, Rastogi R and Shim K. 2000. Efficient algorithms for mining outliers from large data sets. ACM SIGMOD Record, 29 (2): 427–438. [DOI: 10.1145/335191.335437]
  • Samadzadegan F and Rastiveisi H. 2008. Automatic detection and classification of damaged buildings, using high resolution satellite imagery and vector data. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Vol. XXXVII. Part B8. Beijing, 37 : 415–420.
  • Serra P, Pons X and Saurí D. 2003. Post-classification change detection with data from different sensors: some accuracy considerations. International Journal of Remote Sensing, 24 (23): 4975–4976. [DOI: 10.1080/714110283]
  • Shen X L, Shao Z F and Tian Y J. 2014. Built-up areas extraction of high-resolution remote sensing images by texture driven visual attention mechanism. Acta Geodaetica et Cartographica Sinica, 43 (8): 842–847. [DOI: 10.13485/j.cnki.11-2089.2014.0131] ( 沈小乐, 邵振峰, 田英洁. 2014. 纹理特征与视觉注意相结合的建筑区提取. 测绘学报, 43 (8): 842–847. [DOI: 10.13485/j.cnki.11-2089.2014.0131] )
  • Sofina N and Ehlers M. 2016. Building change detection using high resolution remotely sensed data and GIS. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 9 (8): 3430–3438. [DOI: 10.1109/JSTARS.2016.2542074]
  • Ulaby F T, Kouyate F, Brisco B and Lee Williams T H. 1986. Textural infornation in SAR images. IEEE Transactions on Geoscience and Remote Sensing, GE-24 (2): 235–245. [DOI: 10.1109/TGRS.1986.289643]
  • Varma S, Shah V, Banerjee B and Buddhiraju K M. 2014. Change detection of desert sand dunes: a remote sensing approach. Advances in Remote Sensing, 3 : 10–22. [DOI: 10.4236/ars.2014.31002]
  • Wei D S and Zhou X G. 2017. Changed image objects extraction algorithms considering texture feature contribution. Acta Geodaetica et Cartographica Sinica, 46 (5): 605–613. [DOI: 10.11947/j.AGCS.2017.20160581] ( 魏东升, 周晓光. 2017. 顾及纹理特征贡献度的变化影像对象提取算法. 测绘学报, 46 (5): 605–613. [DOI: 10.11947/j.AGCS.2017.20160581] )
  • Yu X. 2009. A study of texture classification of aerial image using Bayesian networks. Acta Geodaetica et Cartographica Sinica, 38 (4): 375 [DOI: 10.3321/j.issn:1001-1595.2009.04.015] ( 虞欣. 2009. 贝叶斯网络在航空影像纹理分类中的应用研究. 测绘学报, 38 (4): 375 [DOI: 10.3321/j.issn:1001-1595.2009.04.015] )
  • Zhang X D, Li D R, Gong J Y and Qin Q Q. 2006. A change detection method of integrating remote sensing and GIS. Geomatics and Information Science of Wuhan University, 31 (3): 266–269. [DOI: 10.13203/j.whugis2006.03.019] ( 张晓东, 李德仁, 龚健雅, 秦前清. 2006. 遥感影像与GIS分析相结合的变化检测方法. 武汉大学学报(信息科学版), 31 (3): 266–269. [DOI: 10.13203/j.whugis2006.03.019] )
  • Zhuang H F, Deng K Z and Fan H D. 2016. SAR images unsupervised change detection based on combination of texture feature vector with maximum entropy principle. Acta Geodaetica et Cartographica Sinica, 45 (3): 339–346. [DOI: 10.11947/j.AGCS.2016.20150022] ( 庄会富, 邓喀中, 范洪冬. 2016. 纹理特征向量与最大化熵法相结合的SAR影像非监督变化检测. 测绘学报, 45 (3): 339–346. [DOI: 10.11947/j.AGCS.2016.20150022] )