2. 北京师范大学 减灾与应急管理研究院,北京 100875;
3. 河南理工大学 测绘与国土信息工程学院,河南 焦作 454000;
4. 河南理工大学 矿山空间信息技术国家测绘地理信息局重点实验室,河南 焦作 454000
2. Academy of Disaster Reduction and Emergency Management,Beijing Normal University,Beijing 100875,China;
3.School of Surveying and Land Information Engineering,Henan Polytechnic University,Jiaozuo 454000,China;
4. Key Laboratory of Mine Spatial Information Technologies of National Administration of Surveying,Mapping and Geoinformation,Henan Polytechnic University,Jiaozuo 454000,China
1 引 言
随着卫星与传感器技术的迅速发展,高分辨率遥感影像的可获取性日益增强,使得在较小的空间尺度上观察地表的细节变化、进行大比例尺遥感制图以及监测人为活动对环境的影响成为可能。高分辨率遥感影像已经在城市规划[1]、地形图更新[2]、地籍调查[3]、精准农业[4]、灾害监测[5, 6]等方面被证明有巨大的应用潜力。
但是由于成像方式的特殊性,高分辨率遥感影像在提供丰富的地表细节信息[7]的同时,也往往表现出显著的同物异谱和异物同谱现象。因此当传统的基于像素的影像分类解译方法应用于高分辨遥感影像时,分类结果表现为类内差异性变大,类间差异性变小,斑点噪声严重等[8]。因此,充分挖掘像素间的空间关系已成为高分辨率遥感影像自动解译的关键之一[9]。
目前,以Ecognition软件为代表的面向对象分析技术是高分辨率遥感影像分析的主流方法之一。其蕴含的基本思想是:首先通过影像分割获得同质均一的区域图斑,即所谓的“对象”,并以此为后续分析的基元,然后利用监督或非监督学习方法实现信息提取与分类[10]。本质上,通过“对象”的生成,该类方法实现了“对象”内像素间的空间一致性约束,因此往往能够保证分类结果拥有较好的平滑性。虽然基于分割的面向对象分析技术从理论和实践上都被证明不失为一种用于高分辨率遥感影像分析的好的选择,但是多尺度分割技术仍是其制约瓶颈[11],具体表现为尺度的划分难以把握,因而效率低;如何分割出语义上有意义的对象块也尚未形成有效的策略。相对于“先分割后识别”的方法,另外一种顾及像素间空间相关关系的方式是定义特定形式的邻域模式来对影像的结构特征进行建模,从而实现影像目标的分割识别的一体化过程。此类算法一般以像素为分析基元,但通过构建面向对象的特征,将空间上下文信息融入到分类过程中。相关研究包括基于共生矩阵或Gabor小波的纹理特征提取[12, 13]、基于数学形态学的特征提取[14]、基于形状构造(点状、线状或面状)的特征提取[15]、基于马尔可夫随机场(MRF)模型[16]等。因此,如何有效地挖掘邻域特征成为该类方法的关键。
基于以上难点和不足,本文引入和借鉴机器学习领域中的特征选择方法和Adaboost集成学习思想,提出一种基于空间像素模板的高分辨率遥感影像河流提取方法。首先基于特征选择方法自动生成能够度量空间邻域模式的空间像素模板,继而构建具有面向对象特征的多维特征向量,然后利用Adaboost集成学习方法实现多维特征的加权集成利用,从而精确地提取河流。
2 空间像素模板的生成空间像素模板被定义为表征像素间空间相关关系特征的邻域模式。区别于传统的广泛应用于图像滤波等处理中的基于中心像素的矩形窗口[17],它考虑泛化的邻域特征,即在给定正方形窗口内任何的一簇像素组合都是空间邻域特征的一类模式。如图 1(a)所示为5×5窗口内的空间像素模板的一种特定形式。
在给定大小的窗口范围内确定最佳的空间像素模板,实际对应一个特征选择问题[18]。即依据一定的相关性度量准则,在限定窗口内选择出那些与中心位置相关度高的位置组合,从而构成有效的邻域模式,充分考虑像素间的空间关系。
本文采用基于过滤式特征选择的空间像素模板的生成方法。过滤式特征选择首先定义一个特征评价指标,并基于该指标构建一个评价标准(即过滤器),依次判断每个特征是否符合标准,不符合的特征被筛除,符合的特征则被保留,从而最终获得一个特征子集[19]。以数学语言描述,即首先定义一个对象O,该对象的所有可能的特征为全集{Fn|1≤n≤N};构建一个度量特征与对象之间关联程度的相关性函数Cn=f(Fn,O),1≤n≤N,其中,Cn为第n个特征与对象的相关性;计算获得该对象与所有特征的相关性指标值{Cn|1≤n≤N}。定义一个过滤器filter,filter(Cn)=,其中,Th为相关性的阈值;如果第n个特征的相关性大于等于该阈值,那么该特征通过过滤器时将被保留;反之,如果第n个特征的相关性小于该阈值,那么该特征通过过滤器时将被筛除;特征全集经过过滤器筛选之后,得到被选择的特征子集{Fm|1≤m≤M},1≤M≤N。
针对确定空间像素模板的具体问题,在行列数均为2D+1的空间像素模板中,对象O对应模板的中心位置S(D+1,D+1),所有特征全集{Fn|1≤n≤N}对应与中心位置间距小于等于D的相对位置集合{S(i,j)|1≤i≤2D+1,1≤j≤2D+1},所有特征的个数N=(2D+1)2,度量各个特征与中心像素之间相关程度的函数可抽象为Cn=f(Fn,O),1≤n≤N,对应到一个特定位置S(i,j),其与中心位置的相关性函数表示为C(i,j)=f(S(i,j),S(D+1,D+1)),1≤i≤2D+1,1≤j≤2D+1。
空间像素模板中,每个相对位置与中心位置的关联程度,需要利用一个相关性函数来度量,本文采用差值函数。
对于K个采样像素{Pk(i0,j0)|1≤k≤K},基于左侧毗邻位置的像素灰度值向量与中心位置的像素灰度值向量来定义左侧毗邻位置与中心位置的相关性函数
对于单个像素,其左侧毗邻位置的像素灰度值与中心位置的像素灰度值的差值越接近于零,表示左侧毗邻位置与中心位置的相关性越大;对于采样像素集合,其左侧毗邻位置的像素灰度值向量与中心位置的像素灰度值向量的差值向量中,接近零值的元素数量越多,表示左侧毗邻位置与中心位置的相关性越大。因此,所获得差值向量ΔV′(i0,j0-1)中各元素可以被认为是服从均值为0,方差为δ2的高斯分布,以ΔV(i0,j)即
将单个相对位置的差值向量推广到(2D+1)×(2D+)1的空间像素模板,每个相对位置与中心位置的差值向量为
式中,差值向量各元素ΔV′(i,j)服从N(0,σ2i,j)。当相对位置(i,j)与中心位置(D+1,D+1)的相关性越显著时,则相对位置上相应的像素值越逼近中心像素值,因此标准差σi,j也应该越小。故参数C(i,j)=σi,j可作为度量相对位置与中心位置相关性的指标。根据同类像素的类内方差小于异类像素的类间方差,空间相关像素模板内差值向量的方差σ2i,j应当不大于图像的总体方差σp2。因此,本文以σp2作为阈值,过滤掉给定方形窗口中相对位置差值向量方差大于σp2的候选位置,从而获得最终的空间像素模板。
空间像素模板确定后,以像素模板遍历整幅影像,影像中各波段每个像素对应一个列特征向量,即按照一定的次序将模板对应位置的像素值堆叠成列向量,从而得到新的特征空间。图 1(a)所示为将模板套在某个像素之上,(b)为特定波段对应位置像素取值,则图 1(a)最中间的框所示像素对应的列特征向量为[a1a2…a13]T。因此,对于d个波段遥感影像,假设空间像素模板中像素个数为m,则影像中每个像素对应d×m的特征矩阵。
3 基于Adaboost算法的集成学习文献[20]最早提出将Adaboost算法用于人脸识别。其基本思想是针对不同的训练集训练同一个基本分类器,即弱分类器,然后把这些弱分类器进行加权集成,从而构成所谓的强分类器。理论证明,只要每个弱分类器的分类性能不低于随机猜测,当其集成数量趋向于无穷大时,强分类器的错误率趋近于零。Adaboost算法中不同训练集的生成是通过不断调整训练样本的权重实现的。初始化时,给定每个样本相同的权重,进行弱分类器训练。如果每个样本点已经被正确地分类,那么在下一轮训练中,它的权重被降低;相反,那些误分的样本则被提高权重。通过这种方式,Adaboost算法能够总是“聚焦于”那些区分起来较为困难的样本上,因此具有突出的泛化能力。
图 2为Adaboost算法利用空间像素模板构建的多维特征向量进行集成学习的流程图。
Aaboost算法的具体描述如下:
假定X表示样本空间,Y表示样本类别标识集合。对于二值分类问题,Y∈{-1,+1}。则训练集可表示为{(x1,y1),(x2,y2),…,(xn,yn)}。其中xi∈X,yi∈Y。
(1)初始化N个样本的权重D0(xi,yi)=1/N,i=1,2,…,N。
(2)训练循环:对于t=1,2,…,T(T是最大循环次数),有
1.对于每个特征j,训练一个弱分类器hj。相对于样本权重Dt(xi,yi),计算错误率εj=,在本文中采用决策树作为弱分类器。
2.在所有特征训练的弱分类器中,选择错误率最小的弱分类器ht作为本轮训练的最终弱分类器。
3.如果εt≥1/2,停止。
4.如果εt<1/2,计算。
5.更新样本权重,其中Zt是归一化常数,以保证Dt(xi,yi)为完全的概率分布,。
(3)输出强分类器:。
4 试验结果分析与讨论 4.1 试验数据在本文的试验中,采用两幅不同分辨率、获取于不同卫星传感器的高分辨率遥感影像,即一幅1235像素×852像素的IKONOS多光谱遥感影像(3个波段,分辨率4m,如图 3(a)所示)和一幅1000像素×1000像素的EROS-B全色影像(分辨率0.6m,如图 4(a)所示)。
通过目视解译,人工勾画出两幅影像对应的河流地表真实值,作为评价不同方法河流提取结果有效性的依据。地表真实值分别如图 3(b)和图 4(b)所示,其中白色区域表示河流,黑色区域表示背景(后面各种算法自动提取的结果图颜色意义相同)。
4.2 试验设计和比较为了验证本文方法的正确性和有效性,笔者将其与现有的已证明比较有效的几种分类或目标识别方法进行比较,这几种方法分别是:
(1)支持向量机SVM方法。
(2)SVM+过分割投票方法[21]。该方法综合SVM分类的结果和原始影像过分割结果,获得一个更加平滑的分类图。其本质是利用过分割体作为一种自适应的邻域来捕捉像素间的空间关系,通过分割体内像素类别的投票来决定分割体的类别归属。
(3)基于高斯混合模型+MRF方法[22]。
其中后两种方法是考虑了空间上下文信息的目标提取方法。
4.3 结果分析 4.3.1 IKONOS多光谱影像本幅遥感影像的场景为山区,影像中分布有明显的山体阴影,且其光谱值与河流存在一定的重叠。如图 3(c),选择一定数量的训练样本。利用第二部分介绍的特征选择方法自动生成空间像素模板,如图 3(d)所示。各种方法河流提取的结果分别如图 3(e)~(h)所示。
由于山体阴影和河流光谱值的相似性,SVM算法在未考虑空间关系时,容易将部分山体阴影误识别为河流;此外,由于SVM方法基于像素分析的特点,提取的河流结果,斑点噪声严重。相反地,基于空间像素模板的Adaboost方法、SVM+过分割投票方法和基于高斯混合模型+MRF方法由于考虑了像素间的空间相关性,其结果更加紧凑,孤立的像素簇较少。本文方法利用像素间空间关系的机制,与另外两种方法不尽相同,基于空间像素模板的Adaboost方法能够通过空间像素模板来获取不同类别之间的共存关系,因此在区分光谱接近的不同地物(如河流和山体阴影)时,它能够利用邻近像素的类别来辅助判定待识别目标(河流),从而提高识别精度。基于SVM+过分割投票方法和基于高斯混合模型+MRF方法利用空间关系的本质是在SVM算法或高斯混合模型的基础上加入一个先验性约束:即邻近像素应该具备相同的类别,因此尽管这两种方法也能够保证目标提取结果的空间一致性,但是其内在模型决定它们并没有区分同谱异物(如河流和山体阴影)的能力。表 1列出了各种方法的总体精度和Kappa系数,表明本文方法优于其他几种方法。
本文提出 的方法 | SVM | SVM+过分割 投票方法的 河流提取结果 | 基于高斯 混合模型 +MRF | |
总体精度/(%) | 99.7190 | 98.8091 | 99.4922 | 99.4965 |
Kappa系数 | 0.9238 | 0.7451 | 0.8796 | 0.8749 |
本幅遥感影像为分辨率更高的全色影像,场景为农村地区,影像中河流光谱与农田有一定的重叠,另外河流部分地区中有明显的波浪。
如图 4(c),选择一定数量的训练样本。根据特征选择方法自动生成空间像素模板,如图 4(d)所示。各种方法的河流提取的结果分别如图 4(e)~(h)所示。
通过目视比较,基于像素的SVM算法,河流提取结果斑点严重,且对农田和河流的区分很差;SVM+过分割投票方法的河流提取结果空间平滑性得到大大提高,但是仍然将农田误分为河流;基于高斯混合模型+MRF方法基本上将农田和河流区分开来,但是河流提取结果存在着明显的过平滑;基于空间像素模板的Adaboost方法河流提取结果能够保证一定的空间一致性,且能够将绝大部分的农田同河流分开,因此,本文方法优于其他几种方法。表 2列出了各种方法的总体精度和Kappa系数,也进一步验证了本文方法的优越性。
本文提出 的方法 | SVM | SVM+过分割 投票方法的 河流提取结果 | 基于高斯 混合模型 +MRF | |
总体精度/(%) | 96.1234 | 92.7948 | 94.2917 | 95.4992 |
Kappa系数 | 0.8968 | 0.8090 | 0.8523 | 0.8780 |
高分辨率遥感影像分析中,如何有效顾及像素之间的空间关系,成为提高影像解译精度的关键。考虑到传统基于图像分割的面向对象分析方法受限于多尺度分割的瓶颈以及难以分割出语义上有意义的对象块,本文提出一种基于像素层面但是却能够同时保证邻近像素间的空间一致性约束的高分辨率遥感影像河流提取方法。该方法首先定义一种泛化的邻域窗口,即所谓的空间像素模板来保证像素间空间关系的引入,并基于特征选择方法实现像素模板的自动生成,继而形成具有面向对象特征的多维特征向量,最后利用Adaboost集成学习算法实现多特征的加权集成利用,从而精确地提取河流。试验表明,本文所提出的方法在保证河流提取结果空间平滑性和区分与河流同谱异物的地物方面有一定的优越性。
[1] | MATHIEU R, FREEMAN C, ARYAL J. Mapping Private Gardens in Urban Areas Using Object-oriented Techniques and Very High-resolution Satellite Imagery[J]. Landscape and Urban Planning, 2007, 81(3): 179-192. |
[2] | HOLLAND D A, ROYD D S, MARSHALL P. Updating Topographic Mapping in Great Britain Using Imagery from High-resolution Satellite Sensors[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2006, 60(3):212-223. |
[3] | ZHOU W, TROY A, GROVE M. Object-based Land Cover Classification and Change Analysis in the Baltimore Metropolitan Area Using Multitemporal High Resolution Remote Sensing Data[J]. Sensors, 2008, 8(3): 1613-1636. |
[4] | COLOMBO R, BELLINGERI D, FASOLINI D, et al. Retrieval of Leaf Area Index in Different Vegetation Types Using High Resolution Satellite Data[J]. Remote Sensing of Environment, 2003, 86(1): 120-131. |
[5] | SAITO K, SPENCE R, GOING C, et al. Using High-resolution Satellite Images for Post-earthquake Building Damage Assessment: A Study Following the 26 January 2001 Gujarat Earthquake[J]. Earthquake Spectra, 2004, 20(1): 145-169. |
[6] | NICHOL J E, SHAKER A, WONG M. Application of High-resolution Stereo Satellite Images to Detailed Landslide Hazard Assessment[J]. Geomorphology, 2006, 76(1-2): 68-75. |
[7] | GONG P, LI X, XU B. Interpretation Theory and Application Method Development for Information Extraction from High Resolution Remotely Sensed Data[J]. Journal of Remote Sensing, 2006, 10(1): 1-5. (宫鹏,黎夏,徐冰. 高分辨率影像解译理论与应用方法中的一些研究问题[J]. 遥感学报, 2006, 10(1): 1-5. ) |
[8] | ZHANG L, HUANG X. Advanced Processing Techniques for Remotely Sensed Imagery[J]. Journal of Remote Sensing, 2009, 13(4): 559-568. |
[9] | BLASCHKE T, LANG S, HAY G. Object-based Image Analysis-spatial Concepts for Knowledge-driven Remote Sensing Applications[M]. Berlin: Springer, 2008. |
[10] | TAN Qulin. Urban Building Extraction from VHR Multi-spectral Images Using Object-based Classification[J]. Acta Geodaetica et Cartographica Sinica, 2010,39(6):618-623. (谭衢霖. 高分辨率多光谱影像城区建筑物提取研究[J]. 测绘学报, 2010,39(6):618-623. ) |
[11] | LUO J, MING D, SHEN Z, et al. Multi-scale Information Extraction from High Resolution Remote Sensing Imagery and Region Partition Methods based on GMRF-SVM[J]. International Journal of Remote Sensing, 2007, 28(15): 3395-3412. |
[12] | WANG Min, ZHANG Xingyue. Extracting Texture Features from Remotely Sensed Imagery with Fast Gabor Filters Implemented with Kernel Decomposing and Recursive Filtering[J]. Acta Geodaetica et Cartographica Sinica, 2009,38(6):488-493. (汪闽, 张星月. 基于模板分解与递归式滤波的遥感图像快速Gabor文理特征提取[J]. 测绘学报, 2009,38(6):488-493. ) |
[13] | TAO Chao, TAN Yihua, PENG Bifa, et al. A Probabilistic Latent Semantic Analysis Based on Classification for High Resolution Remotely Sensed Imagery[J]. Acta Geodaetica et Cartographica Sinica, 2011,40(2):156-162. (陶超,谭毅华,彭碧发,等. 一种基于概率潜在语义模型的高分辨率遥感影像分类方法[J]. 测绘学报, 2011,40(2):156-162. ) |
[14] | TAO Chao, TAN Yihua, CAI Huajie, et al. Object-oriented Method of Hierarchical Urban Building Extracting from High-resolution Remote-sensing Imagery[J]. Acta Geodaetica et Cartographica Sinica, 2010,39(1):39-45. (陶超, 谭毅华,蔡华杰等. 面向对象的高分辨率遥感影像城区建筑物分级提取方法[J]. 测绘学报, 2010,39(1):39-45. ) |
[15] | LEI Xiaoqi, WANG Weixing, LAI Jun. A Method of Road Extraction from High-resolution Remote Sensing Images Based on Shape Features[J]. Acta Geodaetica et Cartographica Sinica, 2009,38(5):457-465. (雷小奇,王卫星,赖均. 一种基于形状特征进行高分辨率遥感影像道路提取方法[J]. 测绘学报, 2009,38(5):457-465.) |
[16] | CHEN Rongyuan, ZHENG Chen, WANG Leiguang, et al. A Region Growing Model under the Framework of MRF for Urban Detection[J]. Acta Geodaetica et Cartographica Sinica, 2011,40(2):163-168. (陈荣元,郑晨,王雷光, 等. MRF框架下的区域增长模型在城镇识别中的应用[J]. 测绘学报, 2011,40(2):163-168. |
[17] | LI Yingqi, HE Mingyi. A New Fast Adaptive Algorithm for Despeckling SAR Images[J]. Journal of Image and Graphics, 2008, 13(2): 214-218. (李应岐, 何明一. 一种新的SAR图像快速自适应去斑算法[J]. 中国图像图形学报, 2008, 13(2): 214-218.) |
[18] | GUYON I, ELISSEEFF A. An Introduction to Variable and Feature Selection[J]. Journal of Machine Learning Research, 2003, 3: 1157-1182. |
[19] | MAO Yong, ZHOU Xiaobo, XIA Zheng, et al. A Survey for Study of Feature Selection Algorithms[J]. Pattern Recognition and Artificial Intelligence, 2007, 20(2): 211-218. (毛勇, 周晓波, 夏铮, 等. 特征选择算法研究综述[J]. 模式识别与人工智能, 2007, 20(2): 211-218.) |
[20] | FREUND Y. Boosting A Weak Learning Algorithm by Majority[J]. Information and Computation, 1995, 121(2): 256-285. |
[21] | TARABALKA Y, BeNEDIKTSSON J, Chanussot J. Spectral-spatial Classification of Hyperspectral Imagery Based on Partitional Clustering Techniques[J]. IEEE Transactions on Geoscience and Remote Sensing, 2009,47(8): 2973-2987. |
[22] | SZELISKI R, ZABIH R, SCHARSTEIN D, et al. A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-based Priors[J]. IEEE Transactions on Pattern Recognition and Machine Intelligence, 2008, 30(6): 1068-1080. |