出版日期: 2019-01-25
点击次数:
下载次数:
DOI: 10.11834/jrs.20197500
2019 | Volumn23 | Number 1
上一篇  |  下一篇


  
高分辨率遥感影像建筑物分级提取
expand article info 游永发1,2 , 王思远1,2 , 王斌3 , 马元旭1,2 , 申明1,2 , 刘卫华1,2 , 肖琳4
1. 中国科学院遥感与数字地球研究所 数字地球重点实验室,北京 100094
2. 中国科学院大学,北京 100049
3. 北京交通大学 土木建筑工程学院,北京 100044
4. 辽宁工程技术大学 测绘与地理科学学院,阜新 123000

摘要

高分辨率遥感影像建筑物信息自动提取是遥感应用研究中的一个热点问题,但由于受到成像条件不同、背景地物复杂、建筑物类型多样等多个因素的影响使得建筑物的自动提取仍然十分困难。为此,在综合考虑影像光谱、几何与上下文特征的基础上,提出了一种基于面向对象与形态学相结合的高分辨率遥感影像建筑物信息分级提取方法。该方法首先利用影像的多尺度及多方向Gabor小波变换结果提取建筑物特征点;然后采用面向对象的思想构建空间投票矩阵来度量每一个像素点属于建筑物区域的概率,从而提取出建筑物区域边界;最后在提取的建筑物区域内应用形态学建筑物指数实现建筑物信息的自动提取。实验结果表明,本文方法能够高效、高精度地完成复杂场景下的建筑物信息提取,且提取结果的正确性和完整性都优于效果较好的PanTex算法。

关键词

高分辨率遥感影像, 建筑物提取, Gabor小波变换, 面向对象, 空间投票矩阵, 形态学建筑物指数

Study on hierarchical building extraction from high resolution remote sensing imagery
expand article info YOU Yongfa1,2 , WANG Siyuan1,2 , WANG Bin3 , MA Yuanxu1,2 , SHEN Ming1,2 , LIU Weihua1,2 , XIAO Lin4
1.Key Laboratory of Digital Earth Science, Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100094, China
2.University of Chinese Academy of Sciences, Beijing 100049, China
3.School of Civil Engineering and Architecture, Beijing Jiaotong University, Beijing 100044, China
4.School of Geometrics, Liaoning Technical University, Fuxin 123000, China

Abstract

The precise location and identification of buildings are of importance to many geospatial applications. High-resolution satellite images with multispectral channels contain abundant spectral and structural information about ground objects, making these images more suitable for automatic building detection. However, the automatic detection of buildings is still very difficult owing to many obstacles, such as different imaging conditions, complex background, and various types of buildings. Therefore, this paper proposes a novel hierarchical building extraction method based on object-oriented and morphological models for automatic building detection from high-resolution satellite images captured in complex scenes. The proposed method first extracts build-up areas from high-resolution satellite images and then detects buildings from the extracted build-up areas. In the procedure of build-up areas extraction, the multi-scale and multi-directional Gabor wavelet transform is first applied to high-resolution satellite images. Then, a scale-invariant feature point detection algorithm that considers the multi-scale and multi-directional texture properties of build-up areas is proposed for the detection of building feature points. Subsequently, watershed segmentation algorithm with threshold mark is utilized to obtain homogeneous regions, and a spatial voting matrix is computed based on these homogeneous regions and the detected feature points to obtain confidence map. Finally, build-up areas are extracted by segmenting the confidence map using adaptive thresholding algorithm. In the procedure of building extraction, the morphological building index (MBI) is first applied to the extracted build-up areas, and then the initial building results are obtained by performing threshold segmentation on the MBI feature image. Finally, shape attributes such as length–width ratio are used to further refine the initial building extraction results. The performance of the proposed method is evaluated using three high-resolution satellite images captured in complex environments. Evaluation results show that the proposed method can efficiently and accurately detect buildings in complex scenes with an overall accuracy and Kappa coefficient greater than 90% and 0.8, respectively. The proposed method also improves the omission and commission errors by 10.03% and 6.86% on average, respectively, as compared with the performance of the PanTex algorithm. A novel hierarchical building extraction method based on object-oriented and morphological models is proposed in this study. The experimental results highlight the advantages of the hierarchical extraction strategy and demonstrate that the proposed method outperforms the PanTex algorithm. However, good performance of the proposed method relies heavily on the detection of built-up areas, and further improvements should be performed in the future.

Key words

high resolution remote sensing imagery, building extraction, Gabor wavelet transform, object-oriented method, spatial voting matrix, morphological building index

1 引 言

建筑物信息作为国家基础地理信息的重要组成部分,其对于数字城市建设、土地利用调查、生态环境监测以及灾害应急评估等具有重要意义。采用人工测绘方式提取建筑物信息虽然准确率较高,但效率低且耗费成本大,同时其现势性不能满足应用需求。高分辨率遥感影像能够清楚地表达地物目标的纹理细节与空间结构特征,因此基于高分辨率遥感影像自动提取建筑物信息逐渐成为学者们研究的热点。

根据是否使用训练数据,目前已有的高分辨率遥感影像建筑物提取方法可以分为两大类:监督式与非监督式(Liu 等,2013)。采用监督式方法提取建筑物信息需要构建训练样本及提供先验知识,该过程不仅费时费力,而且人为因素会对提取结果造成很大影响(Inglada,2007Turker和Koc-San,2015Konstantinidis 等,2017Alshehhi 等,2017谭衢霖,2010吴炜 等,2012郭庆胜 等,2017孙金彦 等,2017)。采用非监督式方法提取建筑物信息根据使用特征的不同又可分为3种情况:(1)基于纹理特征的提取方法,如Pesaresi等人(2008)基于各向异性纹理测度构建了一种建筑物存在指数,即PanTex。该指数的基本思想是建筑物与其投射的阴影之间具有较强的局部对比度,因此可利用灰度共生矩阵的对比度特征来计算PanTex。该指数对不同季节、不同传感器以及不同场景下获取的遥感影像均具有较强的鲁棒性,同时也能取得较高的精度,但提取的建筑物边界不准确,并且容易将稀疏林地与建筑物混淆。另外,Gabor变换(Sirmacek和Unsalan,2010)、非下采样轮廓波变换(沈小乐 等,2014)等纹理特征也被用于建筑物信息的提取。(2)基于几何特征的提取方法,主要包括基于边缘特征(Hu 等,2013Wang 等,2015)、基于角点特征(Sirmacek和Unsalan,2009Li 等,2015陶超 等,2014)以及二者融合的方法进行建筑物信息提取(林祥国和宁晓刚,2017)。(3)基于辅助特征的提取方法,如结合DEM数据的提取(Tournaire 等,2010)、结合阴影信息的提取(Ok,2013)等。以上非监督式方法虽然能够实现建筑物的自动提取,但其存在计算效率低、边界提取不精确以及需要辅助信息等缺点。近年来,Huang和Zhang(2011)提出了形态学建筑物指数(Morphological Building Index,MBI)用于建筑物的自动提取,该指数虽然能够取得较高的精度,也不需要辅助信息,但其对于城市区域效果较好,而对于郊区、农村及复杂山地区域效果较差。

鉴于此,本文提出了一种基于面向对象与形态学相结合的高分辨率遥感影像建筑物信息分级提取方法,该方法包括两个关键过程:(1)基于建筑物区域的复杂纹理特征在大幅遥感影像上准确识别出建筑物区域边界;(2)在识别的建筑物区域内应用形态学建筑物指数实现建筑物细节信息的精细提取。该方法有望总体提高建筑物的提取效率与精度。

2 建筑物分级提取方法

本文提出的建筑物分级提取方法主要包括两个处理过程。在第一个过程中,首先对高分辨率遥感影像进行多尺度及多方向Gabor小波变换,然后应用一种新的尺度不变特征点检测算法提取建筑物特征点,接着对影像进行阈值标记分水岭分割获得影像对象,同时以影像对象作为基本计算单元结合高斯函数构建空间投票矩阵获得建筑物区域置信图,最后对建筑物区域置信图进行自适应阈值分割实现大幅遥感影像上建筑物区域边界的准确识别。在第二个过程中,首先对前一过程提取的建筑物区域内的影像计算形态学建筑物指数,然后对计算结果进行阈值分割及形状特征约束等后处理实现小区域内建筑物细节信息的精细提取。具体技术流程如图1所示,关键技术将在下面进一步阐述。

图 1 建筑物分级提取流程图
Fig. 1 Flowchart of hierarchical building extraction

2.1 基于尺度不变特征点检测算法的建筑物特征点提取

高分辨率遥感影像上的建筑物区域相比其他自然地物(如林地、耕地等)具有更加丰富的局部纹理细节以及空间结构特征,Gabor小波变换(Lee,1996)能够捕获图像中不同地物纹理及结构特征的差异,且其具有优良的方向选择和时频局部特性,因此本文对高分辨率遥感影像进行多尺度及多方向Gabor小波变换来反映建筑物区域与其他自然地物不同的纹理及结构特征变化。

由于在进行多尺度及多方向Gabor小波变换时每个单一尺度都会对同一局部图像结构对应的特征点重复检测,而这些特征点的位置仅存在微小差异,因此会造成特征冗余现象(侯毅 等,2013)。同时由于Gabor小波在一些灰度梯度和曲率变化较大的位置处也容易产生虚假响应,因此在这些位置处也会检测出部分虚假特征点。对此,本文提出了一种新的尺度不变特征点检测算法。该算法基于多个尺度的能量累积图检测建筑物特征点,同时利用显著性指数对特征点集进行优化,从而能在很大程度上抑制虚假特征点及特征冗余现象。该算法的基本步骤如下:

(1) 针对多尺度及多方向Gabor小波变换结果 ${{{\psi }}_{\mu, \nu }}\left(z \right)$ ,将各方向上所有尺度层的变换结果进行叠加,从而得到各方向上的能量累积图

${{{\psi }}_\mu }\left(z \right) = \sum\limits_{i = 1}^V {{{{\psi }}_{\mu, {\nu _i}}}\left(z \right)} $ (1)

式中, $\mu $ $\nu $ 分别表示Gabor小波核的方向与尺度, $V$ 表示总尺度数。为了使能量累积图满足光滑性,在叠加前使用等尺度的高斯函数对其进行平滑,确保提取的特征点更具尺度适应性。

(2) 基于Otsu算法对各方向上的能量累积图 ${{{\psi }}_\mu }\left(z \right)$ 进行自适应阈值分割得到二值化后的Gabor特征 ${{{B}}_\mu }\left(z \right)$ ,同时去除 ${{{B}}_\mu }\left(z \right)$ 中面积小于30像素的标记区域,然后在八邻域范围内搜索 ${{{B}}_\mu }\left(z \right)$ 前景标记区域内能量累积图的局部极大值,从而获得各方向上的建筑物初始特征点集 ${{{D}}_\mu }$

(3) 因各方向上的Gabor特征能够完整的表达Gabor小波核在该方向上捕获的局部显著特征,因此本文将检测到的各方向初始特征点集 ${{{D}}_{{\mu }}}$ 进行叠加,得到综合各方向特性的特征点集合

${{D}} = \bigcup\limits_{i = 1}^U {{{{D}}_{{\mu _i}}}} $ (2)

式中, $U$ 表示Gabor小波变换的方向数。

(4) 由于Gabor小波在一些灰度梯度和曲率变化较大的位置处也会检测到部分虚假特征点,为此通过借鉴Hu等人(2013)提出的纹理显著性指数,本文提出一种新的显著性指数SI对特征点集合D进行优化,该指数是基于特征点的局部密度与空间分布均匀性构建的,其与Hu等人(2013)提出的纹理显著性指数计算公式类似,但它们的作用与参与计算的对象完全不同。给定某一特征点 ${z_0} = \left({{x_0}, {y_0}} \right)$ ,其显著性指数 $SI$ 定义如下

$SI\left({{{\textit{z}}_0}} \right) = {P_{\rm{d}}}\left({{{\textit{z}}_0}} \right) \cdot {P_{\rm{e}}}\left({{{\textit{z}}_0}} \right)$ (3)

式中, ${P_{\rm{d}}}\left({{{\textit{z}}_0}} \right) = {N_{\rm{p}}}/{N_{\rm{w}}}$ 表示 ${{\textit{z}}_0}$ 点的局部密度, ${N_{\rm{p}}}$ 表示以 ${{\textit{z}}_0}$ 点为圆心,半径为 $r$ 的圆形窗口内特征点的数量, ${N_{\rm{w}}}$ 表示圆形窗口内所有像素点的数量; ${P_{\rm{e}}}\left({{{\textit{z}}_0}} \right) = \min \left({{{{N}}_i}} \right)/mean\left({{{{N}}_i}} \right)$ 表示 ${{\textit{z}}_0}$ 点的空间分布均匀性, ${{{N}}_i}\left({i = 1, 2, 3, 4} \right)$ 表示圆形窗口内每个象限的特征点数量,若某一象限中没有特征点存在,则 ${P_{\rm{e}}}\left({{{\textit{z}}_0}} \right)$ 的值为0。该指数确保了只对纹理复杂区域内的特征点输出非零值,同时圆形窗口中特征点的数量越多、分布越均匀,则该特征点的显著性指数值越大,其属于建筑物区域的概率也越高。

(5) 对计算得到的各特征点显著性指数采用Otsu算法进行自适应阈值分割,从而将显著性指数值低的虚假特征点剔除,将显著性指数值高的特征点作为最终代表建筑物的特征点。

图2(a)显示了空间分辨率为1 m,影像大小为2300像素×2230像素的高分二号影像,图2(b)显示了应用本文提出的尺度不变特征点检测算法提取的建筑物特征点。从图2中可以看出,本文算法在建筑物区域检测出了大量特征点,而在非建筑物区域几乎没有特征点存在。结果表明本文算法能够有效地对建筑物特征点进行检测,同时能在很大程度上抑制虚假特征点及特征冗余现象。

图 2 本文算法各关键步骤处理结果示意图
Fig. 2 The schematic diagram of committed steps

2.2 基于面向对象的空间投票矩阵构建算法提取建筑物区域边界

利用尺度不变特征点检测算法得到的特征点集在建筑物区域分布密集,在非建筑物区域呈稀疏分布。基于这一特性,Sirmacek和Unsalan(2010)定义了空间投票矩阵来计算每一个像素点属于建筑物区域的概率。该方法的基本思想是像素点距离特征点越近,其属于建筑物区域的概率也越大。换言之,对于建筑物区域内的某一像素点,由于检测到的特征点在其周围密集分布,因此它到这些特征点的总距离相比非建筑物区域内的像素点到这些特征点的总距离要小得多。该方法能够实现建筑物区域边界的提取,但其计算效率很低且边界提取不准确。为此,本文通过借鉴基于超像素投票的思想(Li 等,2015)提出了一种面向对象的空间投票矩阵构建算法来提取建筑物区域边界。该算法以影像对象作为基本分析单元,结合高斯函数对建筑物特征点构建空间投票矩阵获取建筑物区域置信图,然后对建筑物区域置信图进行自适应阈值分割获得建筑物区域边界信息。由于利用影像对象作为基本分析单元,因此该算法能在很大程度上提高计算效率,同时提取的建筑物区域边界更准确且更符合人眼的视觉感知特性。面向对象的空间投票矩阵构建算法基本步骤如下:

(1)建筑物特征点集的稀疏处理。由于基于尺度不变特征点检测算法获取的建筑物特征点集合 ${{D}}$ 基数太大,为提高计算效率,本文首先在八邻域范围内搜索特征点影像的连通区域 ${{\varOmega }}$ ,然后统计每个连通区域内包含的特征点数量 $N$ 作为该连通区域的权重,最后采用连通区域的重心坐标 $\left({X, Y} \right)$ 代表该连通区域内的特征点 $\left({x, y} \right)$ 参与计算。以第 $i$ 个连通区域 ${{{\varOmega }}_{{i}}}$ 为例,其重心坐标 $\left({{X_i}, {Y_i}} \right)$ 的计算公式如下

$ \left\{ \begin{aligned} &{X_i} = \frac{1}{{{N_i}}}\sum\limits_{p = 1}^{{N_i}} {{x_p}} \\ & {Y_i} = \frac{1}{{{N_i}}}\sum\limits_{p = 1}^{{N_i}} {{y_p}} \end{aligned} \right. $ (4)

式中, $\left({{x_p}, {y_p}} \right) \in {{{\varOmega }}_{{i}}}$ ${N_i}$ 为连通区域 ${{{\varOmega }}_{{i}}}$ 的权重,即包含的特征点数量。 $i = 1, 2, {K}, M$ M表示特征点影像中连通区域的数量。

(2) 影像对象的获取。本文采用了阈值标记分水岭分割算法(张海涛和李雅男,2015)对原始影像进行分割,从而获得影像对象。该算法首先计算影像的多尺度形态学梯度,然后基于2维最大熵算法从梯度图像的低频成分中自动获取标记阈值,接着利用标记阈值对标记区域进行扩展最小值变换从而提取出标记图像,同时利用强制极小值标定技术将提取的标记图像作为梯度图像的局部极小值,最后对修改后的梯度图像进行分水岭分割获得影像对象。

(3) 建筑物区域置信图的获取。基于高斯函数结合建筑物特征点与影像对象构建空间投票矩阵,从而获得建筑物区域置信图。面向对象的空间投票矩阵数学模型定义如下

${{V}}\left(j \right) = \sum\limits_{i = 1}^M {\frac{1}{{2{\text{π}} \sigma _i^2}}\exp \left({ - \frac{{{{\left({{X^j} - {X_i}} \right)}^2} + {{\left({{Y^j} - {Y_i}} \right)}^2}}}{{2\sigma _i^2}}} \right)} $ (5)

式中, ${{V}}\left(j \right)$ 表示第 $j$ 个影像对象的空间投票值, $j = 1, 2, \cdots, K$ $K$ 为影像对象的个数; ${\sigma _i} = 20 \times {N_i}$ 表示第 $i$ 个连通区域的容差参数,它与连通区域的权重成正比,即权重值越大,该连通区域对空间投票矩阵的影响范围越广; $\left({{X^j}, {Y^j}} \right)$ 表示第 $j$ 个影像对象的重心坐标; $\left({{X_i}, {Y_i}} \right)$ 表示第 $i$ 个连通区域的重心坐标。

由于基于面向对象的空间投票矩阵构建算法获取的置信图中建筑物区域的投票值较高,非建筑物区域的投票值较低,因此本文采用Otsu算法对建筑物区域置信图进行自适应阈值分割,从而提取得到建筑物区域边界信息。图2(c)显示了阈值标记分水岭分割的结果;图2(d)显示了面向对象的空间投票矩阵构建算法获取的建筑物区域置信图,其中红色区域表示高投票值,蓝色区域表示低投票值,投票值越高其属于建筑物区域的概率也越大;图2(e)显示了对建筑物区域置信图进行自适应阈值分割后得到的建筑物区域,其中青色轮廓线代表建筑物区域边界提取的参考结果。从图中可以看出,本文算法提取的建筑物区域边界与地面参考轮廓十分接近,提取效果很好。

2.3 基于形态学建筑物指数的建筑物细节信息精细提取

形态学建筑物指数MBI(Huang和Zhang,2011)针对高分辨率遥感影像上建筑物具有高亮度、各向同性以及高对比度等特点,基于一系列形态学运算来提取建筑物信息。该算法的基本思想是将建筑物的亮度、对比度、方向、尺寸等光谱及结构特征用重建、粒度、差分、顶帽变换等形态学运算来表示,从而建立一种以数学形态学为基础的建筑物提取方法。形态学建筑物指数的计算步骤如下:

(1) 亮度值计算。由于建筑物屋顶的反射率一般比较高,因此可通过亮度值来反映建筑物与邻近地物的反射率差异。亮度值的计算公式如下

${{b}}\left({\textit{z}} \right) = \mathop {\max }\limits_{1 \leqslant l \leqslant L} \left({{{{E}}_k}\left({\textit{x}} \right)} \right)$ (6)

式中,b(z)表示像素点z的亮度值, ${{{E}}_l}\left({\textit{z}} \right)$ 表示像素 ${\textit{z}}$ 在第 $l$ 波段的像素值, $L$ 表示多光谱影像的波段数。

(2) 形态学白帽重构。顶帽变换能够检测到尺寸小于或等于结构元素大小的明亮对象,同时去除其他较暗像素,顶帽值可反映结构元素区域内的像素与其邻近像素的亮度值差异,因此可对亮度图像进行顶帽变换来反映建筑物的高对比度特性。顶帽变换的计算公式如下

${{TH}}{{{R}}^s}\left({{b}} \right) = {{b}} - \gamma _{{\rm{RE}}}^s\left({{b}} \right)$ (7)

式中, ${{THR}}$ 表示基于重建的顶帽变换, $\gamma _{{\rm{RE}}}^s$ 表示基于重建的开运算, $s$ 表示结构元素的尺寸。

(3) 多方向性的顶帽变换。由于建筑物相比于其他地物(如道路)具有各向同性特征,而线性结构元素能够有效地考虑地物结构的方向性,因此可利用多个方向的线性结构元素进行顶帽变换来对建筑物与其他地物进行有效区分。多方向性的顶帽变换用其均值来表示,计算公式如下

$\overline {{{TH}}{{{R}}^s}} \left({{b}} \right) = \mathop {mean}\limits_{{{dir}}} \left({{{TH}}{{{R}}^{s, {{dir}}}}\left({{b}} \right)} \right)$ (8)

式中, ${{dir}}$ 表示线性结构元素的方向集合。因建筑物具有各项同性特征,因此其在所有方向上的顶帽值均比较大,利用多方向性的顶帽变换可对其进行有效区分。

(4) 多尺度顶帽变换。由于影像上的建筑物通常具有不同的尺寸大小,因此可对亮度图像进行多尺度顶帽变换来考虑这一特性。多尺度顶帽变换基于差分形态学属性建立,其定义如下

$\left\{ \begin{aligned} &{{TH}}{{{R}}_{{\rm{DMP}}}} = \left\{ {{{THR}}_{{\rm{DMP}}}^{{{{S}}^{\min }}},{{THR}}_{{\rm{DMP}}}^{{S}},{{THR}}_{{\rm{DMP}}}^{{{{S}}^{\max }}}} \right\}\\ & {{THR}}_{{\rm{DMP}}}^{{S}} = \left| {{{\overline {{{THR}}} }^{{{S}} + \Delta {{S}}}}\left( {{b}} \right) - {{\overline {{{THR}}} }^{{S}}}\left( {{b}} \right)} \right|\\ & {{{S}}{min }} \leqslant {{S}} \leqslant {{{S}}{max }} \end{aligned} \right.$ (9)

式中, ${{THR}}_{{\rm{DMP}}}^{{{{S}}^{\min }}}$ ${{THR}}_{{\rm{DMP}}}^{{S}}$ ${{THR}}_{{\rm{DMP}}}^{{{{S}}^{\max }}}$ 表示基于差分形态学建立的不同尺寸的线性结构元素的顶帽值;SminSmax分别表示线性结构集合S中的最小与最大尺寸; $\Delta {{S}}$ 表示尺寸间隔,其取值与影像中建筑物的大小及影像分辨率有关。

(5) MBI计算。前几个步骤对建筑物的亮度、对比度、方向和尺寸特征进行了处理,基于以上处理结果定义了形态学建筑物指数MBI,其计算公式如下

${\rm{MBI}} = \mathop {mean}\limits_{{S}} \left({{{TH}}{{{R}}_{{\rm{DMP}}}}} \right)$ (10)

式中,MBI的值越大,其属于建筑物的概率也越高,因此本文设定阈值 $t$ 对MBI计算结果进行阈值分割,从而获得建筑物的初步提取结果。

(6) MBI后处理。基于MBI算法得到的建筑物初步提取结果中仍存在部分道路和类似噪声的小斑块,对此本文采用长宽比和面积两个形状特征对提取结果进一步处理,从而获得最终的建筑物细节信息提取结果。

图2(f)显示了在提取的建筑物区域内应用MBI算法提取的建筑物结果。由于采用了本文提出的建筑物分级提取方法,有效地避免了裸地、耕地等干扰地物对提取结果造成的影响,因此建筑物的误提现象得到了极大改善,提取结果更准确且精度更高。

3 实验结果与分析

3.1 实验数据

本文选取了不同场景下的3幅高分影像数据对本文提出算法的有效性及精度进行分析验证。原始影像如图3(a)所示。其中影像1与影像2均为经过NNDiffuse Pan Sharpening融合后的高分二号卫星影像,空间分辨率为1 m,影像1的大小为2800像素×2100像素,影像2的大小为1600像素×1200像素;影像3为Pleiades卫星影像,空间分辨率为0.5 m,影像大小为1900像素×1600像素。3幅影像数据中包含了多种分布类型的建筑物(如密集型、稀疏型、规则型等),同时影像中还包含裸地、耕地、林地、水体、公路、农村道路、施工用地等多种地物类型,地物环境比较复杂。实验使用的计算机配置为Intel Core(TM) i7-4790 3.6 GHz CPU,8 GB RAM,操作系统为Windows7,程序开发环境为Matlab 2012。

图 3 实验比较
Fig. 3 Experimental comparison

3.2 结果与分析

图3(b)显示了基于面向对象的空间投票矩阵构建算法提取的建筑物区域边界,图3(c)显示了建筑物提取的参考结果,图3(d)显示了本文算法提取的建筑物结果,图3(e)显示了使用PanTex算法提取的建筑物结果。图4显示了各实验数据建筑物提取的局部效果对比,它们分别对应于图3(a)黄色矩形区域(编号R1—R6),其主要对各影像建筑物提取效果较好与效果稍差的部分进行了局部放大。本文算法的相关参数取值如表1所示。其中Gabor小波变换的方向数设为4,每个通道的方向带宽均为45°,与人类视觉皮层细胞的中值方向带宽42°基本一致。PanTex算法中影像1与影像2的窗口大小均设为15×15,分割阈值设为70,影像3的窗口大小设为25×25,分割阈值设为60。

表 1 本文算法参数设置
Table 1 The parameter settings of the proposed method

下载CSV 
实验数据 Gabor方向U Gabor尺度V 窗口半径r 结构体方向数 结构体尺寸数 剖面间距 $\Delta s$ MBI阈值t 面积约束 长宽比约束
影像1 4 5 28 4 10 5 9 50 4
影像2 4 5 26 4 10 5 8 50 5
影像3 4 5 52 4 10 5 6 100 4

图3可以看出,本文算法提取的建筑物整体效果很好,其与参考结果十分接近,同时本文算法提取的建筑物区域边界与地面参考轮廓也很吻合。从图4中各区域的局部放大结果来看,R1、R3、R5为本文算法提取效果较好的区域,所提取的建筑物与参考数据比较相符;R2、R4、R6为提取效果稍差的区域,提取结果中存在部分误提或漏提错误。其中,造成R2区域部分建筑物误提的原因主要是由于该区域为施工用地,许多位置处的纹理与几何结构特征都十分显著,因此本文算法容易把它当成建筑物错误提取出来。造成R4区域部分建筑物漏提的原因主要是由于这些建筑物的尺寸相比于其他建筑物要大很多,同时其分布也相对稀疏,因此在该位置处检测到的建筑物特征点非常少,从而在提取建筑物区域时容易将其识别为非建筑区,导致后续在应用形态学建筑物指数时无法将该位置处的建筑物检测出来。造成R6区域部分建筑物漏提的原因主要是由于这些建筑物的亮度值很低,且其对比度也相对较低,因此在应用形态学建筑物指数时容易将该部分建筑物遗漏。从PanTex算法的建筑物提取结果来看,其具有较好的建筑物提取能力,但相比于本文算法还存在以下不足:(1)易将周围林地、裸地等地物判别为建筑物;(2)提取的建筑物边界不精确。

图 4 局部细节对比图(R1—R6分别对应于图3(a)R1—R6标记的区域)
Fig. 4 Comparison of partial details (R1—R6 in Fig. 4 corresponds to the area labelled by R1—R6 in Fig.3(a))

为了定量评价算法的性能,本文在各组试验数据上随机选取了建筑物样本点与背景样本点各700个,然后采用漏分误差OE(Omission Error)、错分误差CE(Commission Error)、总体精度OA(Overall Accuracy)和Kappa系数4个定量评价指标对本文算法与PanTex算法提取建筑物的精度进行了评价,得到的结果如表2所示。从表2可以看出,本文算法所有试验数据的总体精度均大于90%,Kappa系数均大于0.8,最大的漏分误差为11.99%,最大的错分误差为8.95%,由此表明本文算法能以较高的精度对建筑物与背景地物进行区分,同时能以较高的完整率与准确率提取建筑物信息。对比分析两种算法的精度评价结果可以看出,本文算法中所有试验数据的4个指标值均优于PanTex算法。就平均值而言,本文算法相比PanTex算法的漏分误差降低了10.03%,错分误差降低了6.86%,总体精度提高了7.66%,Kappa系数提高了0.156。由此表明,本文算法相比PanTex算法能够更加完整、准确地完成建筑物信息提取。其中,本文算法能够取得较好效果的原因主要有以下两个方面:首先,本文使用了建筑物分级提取方法来提取建筑物信息,该方法通过在影像上准确识别出建筑物区域边界,然后在建筑物区域内实现建筑物细节信息的精细提取,它可以有效地避免邻近地物(如裸地、耕地等)对提取结果造成的干扰,因此提取精度更高;而PanTex算法直接在整幅影像上提取建筑物信息,其提取结果会在很大程度上受到其他地物的干扰,因此精度相对更低。其次,PanTex算法采用了固定的窗口大小来提取建筑物信息,而影像上的建筑物通常具有不同的尺寸大小,因此它无法对所有建筑物取得最优结果;而本文算法使用了多尺度及多方向的线性结构元素进行计算,其不仅考虑了影像上建筑物具有不同尺寸大小的特性,同时也能对道路和建筑物进行有效区分,因此提取精度也更高。

表 2 建筑物提取的精度评价结果
Table 2 The quantitative evaluation results of building extraction

下载CSV 
实验数据 方法 OE/% CE/% OA/% Kappa系数
影像1 本文算法 11.99 8.95 90.17 0.803
PanTex算法 21.63 12.65 84.61 0.688
影像2 本文算法 7.57 6.50 93.00 0.860
PanTex算法 15.00 16.08 84.36 0.687
影像3 本文算法 10.49 4.36 93.27 0.864
PanTex算法 23.50 11.66 84.48 0.685

由于准确提取建筑物区域边界是本文算法的应用前提,因此通过借鉴相关研究成果(Li 等,2015),本文采用准确率(Precision)、查全率(Recall)和F度量(F-measure) 3个指标对建筑物区域边界提取的精度也进行了定量评价。3个指标的定义如下

$ {\rm{Precision}} = \frac{{TP}}{{TP + FP}} $ (11)
$ {\rm{Recall}} = \frac{{TP}}{{TP + FN}} $ (12)
$ F = \frac{{\left( {1 + \alpha } \right) \times {\rm{Precision}} \times {\rm{Recall}}}}{{\alpha \times {\rm{Precision}} + {\rm{Recall}}}} $ (13)

式中, $TP$ 表示提取结果中正确的建筑物区域像素数量, $FP$ 表示提取结果中错误的建筑物区域像素数量, $FN$ 表示被遗漏的建筑物区域像素数量, $\alpha $ 的值设为1,表示均衡考虑准确率与查全率的影响。

采用准确率、查全率和F-measure 3个指标对建筑物区域边界提取的精度进行评价得到的结果如表3所示。从表3可以看出,3组试验数据的准确率均大于87%,查全率均大于91%,F-measure值均大于92%,由此表明本文算法能够比较完整、准确地提取建筑物区域边界。

表 3 建筑物区域提取的精度评价结果
Table 3 The quantitative evaluation results of building area extraction

下载CSV 
实验数据 准确率/% 查全率/% F-measure
影像1 87.48 97.68 0.923
影像2 95.32 91.29 0.933
影像3 98.97 94.87 0.969

4 结 论

本文提出了一种基于面向对象与形态学相结合的高分辨率遥感影像建筑物分级提取方法。该方法的关键是基于建筑物区域的复杂纹理特征在大幅遥感影像上准确提取出建筑物区域边界,然后在建筑物区域内完成建筑物细节信息的精细提取。实验结果表明,本文方法能够高效、高精度地提取复杂场景中的建筑物信息,且提取效果明显优于PanTex算法。本文方法的优势如下:

(1) 提出了一种新的尺度不变特征点检测算法,该算法充分考虑了建筑物区域纹理的多尺度及多方向特性,同时利用了显著性指数对特征点进行优化,可在很大程度上抑制虚假特征点及特征冗余现象。

(2) 以影像对象作为基本分析单元,融入面向对象的思想构建空间投票矩阵提取建筑物区域边界,该方法提取的边界信息更准确且更符合人眼视觉感知特性。

(3) 采用分级提取策略提取建筑物信息,一方面可以实现大范围遥感影像上建筑物信息的快速提取,另一方面能够有效地避免其他地物对提取结果造成的干扰,因此提取效率与精度也更高。

(4) 不需要选取地物样本,可实现建筑物信息的自动化提取。

需要说明的是,本文方法在影像地物复杂、建筑物小而分散、信息模糊的情况下提取效果稍差,因此需要在下一步研究工作中考虑融合辅助地理信息等多种特征,以提高建筑物提取的精度。

参考文献(References)

  • Alshehhi R, Marpu P R, Woon L W and Mura M D. 2017. Simultaneous extraction of roads and buildings in remote sensing imagery with convolutional neural networks. ISPRS Journal of Photogrammetry and Remote Sensing, 130 : 139–149. [DOI: 10.1016/j.isprsjprs.2017.05.002]
  • Guo Q S, Wei Z W, Wang Y and Wang L. 2017. The method of extracting spatial distribution characteristics of buildings combined with feature classification and proximity graph. Acta Geodaetica et Cartographica Sinica, 46 (5): 631–638. [DOI: 10.11947/j.AGCS.2017.20160374] ( 郭庆胜, 魏智威, 王勇, 王琳. 2017. 特征分类与邻近图相结合的建筑物群空间分布特征提取方法. 测绘学报, 46 (5): 631–638. [DOI: 10.11947/j.AGCS.2017.20160374] )
  • Hou Y, Zhou S L, Lei L and Zhao J. 2013. Invariant feature with multi-characteristic scales using Gabor filter bank. Acta Electronica Sinica, 41 (6): 1146–1152. [DOI: 10.3969/j.issn.0372-2112.2013.06.016] ( 侯毅, 周石琳, 雷琳, 赵键. 2013. 基于Gabor滤波器组的多特征尺度不变特征提取方法. 电子学报, 41 (6): 1146–1152. [DOI: 10.3969/j.issn.0372-2112.2013.06.016] )
  • Hu X Y, Shen J J, Shan J and Pan L. 2013. Local edge distributions for detection of salient structure textures and objects. IEEE Geoscience and Remote Sensing Letters, 10 (3): 466–470. [DOI: 10.1109/LGRS.2012.2210188]
  • Huang X and Zhang L P. 2011. A multidirectional and multiscale morphological index for automatic building extraction from multispectral GeoEye-1 imagery. Photogrammetric Engineering and Remote Sensing, 77 (7): 721–732. [DOI: 10.14358/PERS.77.7.721]
  • Inglada J. 2007. Automatic recognition of man-made objects in high resolution optical remote sensing images by SVM classification of geometric image features. ISPRS Journal of Photogrammetry and Remote Sensing, 62 (3): 236–248. [DOI: 10.1016/j.isprsjprs.2007.05.011]
  • Konstantinidis D, Stathaki T, Argyriou V and Grammalidis N. 2017. Building detection using enhanced HOG–LBP features and region refinement processes. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 10 (3): 888–905. [DOI: 10.1109/JSTARS.2016.2602439]
  • Lee T S. 1996. Image representation using 2D Gabor wavelets. IEEE Transactions on Pattern Analysis and Machine Intelligence, 18 (10): 959–971. [DOI: 10.1109/34.541406]
  • Li Y S, Tan Y H, Deng J J, Wen Q and Tian J W. 2015. Cauchy graph embedding optimization for built-up areas detection from high-resolution remote sensing images. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 8 (5): 2078–2096. [DOI: 10.1109/JSTARS.2015.2394504]
  • Lin X G and Ning X G. 2017. Extraction of human settlements from high resolution remote sensing imagery by fusing features of right angle corners and right angle sides. Acta Geodaetica et Cartographica Sinica, 46 (1): 83–89. [DOI: 10.11947/j.AGCS.2017.20160389] ( 林祥国, 宁晓刚. 2017. 融合直角点和直角边特征的高分辨率遥感影像居民点提取方法. 测绘学报, 46 (1): 83–89. [DOI: 10.11947/j.AGCS.2017.20160389] )
  • Liu G, Xia G S, Huang X, Yang W and Zhang L P. 2013. A perception-inspired building index for automatic built-up area detection in high-resolution satellite images//Proceedings of 2013 IEEE International Geoscience and Remote Sensing Symposium. Melbourne, VIC: IEEE: 3132–3135 [DOI: 10.1109/IGARSS.2013.6723490]
  • Ok A O. 2013. Automated detection of buildings from single VHR multispectral images using shadow information and graph cuts. ISPRS Journal of Photogrammetry and Remote Sensing, 86 : 21–40. [DOI: 10.1016/j.isprsjprs.2013.09.004]
  • Pesaresi M, Gerhardinger A and Kayitakire F. 2008. A robust built-up area presence index by anisotropic rotation-invariant textural measure. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 1 (3): 180–192. [DOI: 10.1109/JSTARS.2008.2002869]
  • Shen X L, Shao Z F and Tian Y J. 2014. Built-up areas extraction by textural feature and visual attention mechanism. Acta Geodaetica et Cartographica Sinica, 43 (8): 842–847. [DOI: 10.13485/j.cnki.11-2089.2014.0131] ( 沈小乐, 邵振峰, 田英洁. 2014. 纹理特征与视觉注意相结合的建筑区提取. 测绘学报, 43 (8): 842–847. [DOI: 10.13485/j.cnki.11-2089.2014.0131] )
  • Sirmacek B and Unsalan C. 2009. Urban-area and building detection using SIFT keypoints and graph theory. IEEE Transactions on Geoscience and Remote Sensing, 47 (4): 1156–1167. [DOI: 10.1109/TGRS.2008.2008440]
  • Sirmacek B and Unsalan C. 2010. Urban area detection using local feature points and spatial voting. IEEE Geoscience and Remote Sensing Letters, 7 (1): 146–150. [DOI: 10.1109/LGRS.2009.2028744]
  • Sun J Y, Huang Z J, Zhou S G, Xu N, Qian H M, Wang C L. 2017. Building outline vectorization from high spatial resolution imagery. Journal of Remote Sensing, 21 (3): 396–405. [DOI: 10.11834/jrs.20176127] ( 孙金彦, 黄祚继, 周绍光, 徐南, 钱海明, 王春林. 2017. 高分辨率遥感影像中建筑物轮廓信息矢量化. 遥感学报, 21 (3): 396–405. [DOI: 10.11834/jrs.20176127] )
  • Tan Q L. 2010. Urban building extraction from VHR multi-spectral images using object-based classification. Acta Geodaetica et Cartographica Sinica, 39 (6): 618–623. ( 谭衢霖. 2010. 高分辨率多光谱影像城区建筑物提取研究. 测绘学报, 39 (6): 618–623. )
  • Tao C, Zou Z R and Ding X L. 2014. Residential area detection from high-resolution remote sensing imagery using corner distribution. Acta Geodaetica et Cartographica Sinica, 43 (2): 164–169, 192. [DOI: 10.13485/j.cnki.11-2089.2014.0024] ( 陶超, 邹峥嵘, 丁晓利. 2014. 利用角点进行高分辨率遥感影像居民地检测方法. 测绘学报, 43 (2): 164–169, 192. [DOI: 10.13485/j.cnki.11-2089.2014.0024] )
  • Tournaire O, Brédif M, Boldo D and Durupt M. 2010. An efficient stochastic approach for building footprint extraction from digital elevation models. ISPRS Journal of Photogrammetry and Remote Sensing, 65 (4): 317–327. [DOI: 10.1016/j.isprsjprs.2010.02.002]
  • Turker M and Koc-San D. 2015. Building extraction from high-resolution optical spaceborne images using the integration of support vector machine (SVM) classification, Hough transformation and perceptual grouping. International Journal of Applied Earth Observation and Geoinformation, 34 : 58–69. [DOI: 10.1016/j.jag.2014.06.016]
  • Wang J, Yang X C, Qin X B, Ye X and Qin Q M. 2015. An efficient approach for automatic rectangular building extraction from very high resolution optical satellite imagery. IEEE Geoscience and Remote Sensing Letters, 12 (3): 487–491. [DOI: 10.1109/LGRS.2014.2347332]
  • Wu W, Luo J C, Shen Z F and Zhu Z W. 2012. Building extraction from high resolution remote sensing imagery based on spatial-spectral method. Geomatics and Information Science of Wuhan University, 37 (7): 800–805. [DOI: 10.13203/j.whugis2012.07.022] ( 吴炜, 骆剑承, 沈占锋, 朱志文. 2012. 光谱和形状特征相结合的高分辨率遥感图像的建筑物提取方法. 武汉大学学报(信息科学版), 37 (7): 800–805. [DOI: 10.13203/j.whugis2012.07.022] )
  • Zhang H T and Li Y N. 2015. Watershed algorithm with threshold mark for color image segmentation. Journal of Image and Graphics, 20 (12): 1602–1611. [DOI: 10.11834/jig.20151205] ( 张海涛, 李雅男. 2015. 阈值标记的分水岭彩色图像分割. 中国图象图形学报, 20 (12): 1602–1611. [DOI: 10.11834/jig.20151205] )