文章信息
- 高国龙, 杜华强, 韩凝, 徐小军, 孙少波, 李雪建
- Gao Guolong, Du Huaqiang, Han Ning, Xu Xiaojun, Sun Shaobo, Li Xuejian
- 基于特征优选的面向对象毛竹林分布信息提取
- Mapping of Moso Bamboo Forest Using Object-Based Approach Based on the Optimal Features
- 林业科学, 2016, 52(9): 77-85
- Scientia Silvae Sinicae, 2016, 52(9): 77-85.
- DOI: 10.11707/j.1001-7488.20160909
-
文章历史
- 收稿日期:2015-07-06
- 修回日期:2016-03-23
-
作者相关文章
竹林是我国亚热带重要的森林资源,在维护生态平衡、防止水土流失、涵养水源、减少碳排放及全球碳平衡等方面发挥着重要作用,竹林资源的生态、社会、经济效益越来越受到重视(周国模等,2004)。然而,我国竹林资源的监测技术还比较传统,监测周期长、效率低、精度差,无法实时、快速、客观地完成大面积竹林资源的清查和监测;而采用遥感等空间信息技术对竹林资源及生态系统进行长期定位观测、监测,实现竹林资源的数字化、信息化管理,是我国乃至世界竹林经营管理的前沿和必然趋势(杜华强等,2012)。
目前,遥感影像森林分类多基于像元光谱信息,但随着遥感影像空间分辨率的提高,高分辨率遥感影像中同类地物内部光谱差异更加明显,使得基于像元的分类方法往往导致分类错误且分类结果过于破碎,其中一个重要的原因是忽略了高分辨率遥感影像表达地物形状、大小、纹理和地物之间空间关系等优势(明冬萍等,2005)。而面向对象的分类方法可以综合利用影像对象的光谱特征、几何特征、纹理特征以及其他对象特征进行分类,为高分辨率遥感影像分类提供了新的途径。该方法通过影像分割技术,将具有相同或者相似特征的相邻像元合并成一个对象,并以对象为影像处理的基本单元进行分类,使得对象与实际地物更加契合,因此,更适合于高空间分辨率影像地物信息提取(韩凝,2011; 孙晓艳等,2013)。
为了充分利用影像对象的光谱与空间特征,面向对象的分类方法往往设置众多特征参与分类(Han et al.,2014); 但随着特征维数的增加,常常会造成Hughes现象,即“维数灾难”(张俊等,2011)。如果所有设置的特征都参与分类,不仅运算变得复杂,处理速度大大下降,而且在有限的训练样本情况下,还会导致分类精度降低(张秀英等,2009),因此,如何从大量原始特征中选择少量最优特征参与分类就成为面向对象分类方法首先要解决的问题。张秀英等(2009)基于IKONOS影像,通过相关性分析、计算J-M类间距离和K-L变换方法,实现特征空间的压缩,提高了面向对象分类方法的处理效率; 吴波等(2009)基于QuikBird数据,采用互信息最大关联、最小冗余准则(mRMR)获取优选的特征子集,提高了遥感影像的分类精度; 吴健生等(2013)基于高分辨率影像采用遗传算法进行特征分类规则提取,使土地分类精度显著提高。这些算法为特征筛选提供了很好的参考,但不同特征优化方法对目标识别差异也较大,且尚未形成统一的定论。
Relief算法是Filter模型中的代表性算法,具有运算速度快、泛化能力强的特点(张新峰等,2004)。该方法筛选特征的基本思路是根据各个特征和类别的相关性赋予特征不同的权重,当权重小于某一阈值时,特征将被移除。算法的具体过程是:1)从训练集D中随机选择1个样本R,并从与R同类的样本中寻找最近邻样本H(称为Near Hit),从与R不同类的样本中寻找最近邻样本M(称为Near Miss); 2)根据以下规则更新每个特征的权重:如果R和H在某个特征上的距离小于R和M上的距离,则表明该特征容易区分同类与不同类,增加该特征的权重,反之则表明该特征不易区分同类与不同类,降低该特征的权重; 3)重复以上过程,最后得到各特征的平均权重。特征的权重越大,表示该特征的分类能力越强; 反之,表示该特征分类能力越弱。
由于Relief算法局限于2种类别的数据,因此Kononenko(1994)将其扩展为可以处理多类别问题的算法,即ReliefF算法,其在特征优选中具有运行效率高的特点(黄莉莉等,2012)。本研究以浙江省安吉县山川乡为研究区,以SPOT5高分辨率遥感影像为数据源,并设置计算了42个对象特征,基于ReliefF算法对特征进行优选,采用面向对象方法提取山川乡毛竹(Phyllostachys edulis)林信息,为解决面向对象森林资源遥感分类提供参考。
1 研究区概况与研究方法 1.1 研究区概况山川乡位于安吉县南部,南连临安市,东临余杭市,西北与天荒坪接壤。该区域属于亚热带季风性气候,水源充沛,降雨量1 700 mm,以低山丘陵为主要地貌类型。山川乡森林资源丰富,山林总面积42 466 hm2,森林覆盖率为88.8%,其中毛竹林面积1 686 hm2。
1.2 遥感数据及预处理遥感数据为2012年4月22日获取的高分辨率SPOT5影像,包括空间分辨率为2.5 m的全色波段(波长范围0.48~0.71 μm)和空间分辨率为10 m的4个多光谱波段,即绿波段0.50~0.59 μm、红波段0.61~0.68 μm、近红外波段0.78~0.89 μm和短波红外波段0.78~0.89 μm。
以安吉县1∶50 000地形图为参考图,选取32个地面控制点,对全色波段采用2次多项式进行几何校正,校正总误差为0.29个像元;再以全色波段为参考对多光谱波段进行几何校正,校正总误差为0.2个像元。
1.3 面向对象毛竹林分布提取方法 1.3.1 SPOT5影像多尺度分割影像分割是面向对象分析方法的第一步(Han et al.,2014)。分割是对影像中目标设置阈值,并基于对象内部像元异质性最小原则,将光谱信息类似的相邻像元合并组成1个对象,分割后使得对象间的异质性达到最大(黄慧萍等,2004)。分割参数包括尺度参数、图层选择、光谱因子、形状因子等,其中尺度参数对分割效果最重要,尺度参数越大,得到的对象面积越大。
本研究参与分割的遥感信息源包括SPOT5影像的4个多光谱波段和通过波段运算得到的NDVI植被指数。经过多次分割对比,确定研究区最佳分割尺度为20,光谱参数为0.9,平滑度为0.1。
1.3.2 分类特征的设置与优选在分割的基础上,设置包括每个波段的8个灰度共生矩阵纹理、每个波段及NDVI的平均值和标准差等42个对象特征,如表 1所示。研究区土地利用类型包括毛竹林(moso bamboo forest,MBF)、针叶林(coniferous forest,CF)、阔叶林(broad-leaved forest,BLF)、水体(water,W)、农田(farmland,FL)、建筑用地(building land,BL)、道路(road,R)和裸露地(bare area,BA)8个类别。对每个类别选取40~50个样本(共370个样本),然后采用ReliefF算法计算42个对象特征的权重,并通过相关性分析减少特征间冗余,从而选出最优特征。
在最优特征选择的基础上,利用最近邻分类方法实现基于面向对象的毛竹林信息提取。最近邻法是最小距离分类的扩展,是将训练集中的每个样本作为判别依据,寻找距离待分类样本最近的训练集中的样本,以此为依据进行分类。
1.3.4 精度评价与对比分析为保证所有地物类型都有检验样本,本研究精度验证点包括以500 m 500 m作为单元网格的176个交点(Sun et al.,2014)、GPS野外实测110个毛竹林验证点以及70个随机样本点,如图 1所示。通过验证样本点建立混淆矩阵,对分类结果进行精度评价。
为进一步评价基于最优特征面向对象毛竹林信息提取结果,采用CART(classification and regression tree)决策树提取毛竹林,对比分析2个分类结果的差异。
CART决策树是通过对特征属性和目标变量构成的训练数据集的循环分析而形成的二叉树决策树结构。在相同的分割层次和分割参数设置的基础上,本研究根据370个样本数据和42个对象特征建立分类决策树,实现毛竹林信息提取。
2 结果与分析 2.1 最优特征选择基于ReliefF算法计算得到42个对象特征的特征权重如图 2a所示。由图 2a可知,1~4,9~16,34,35,38,39以及41等17个特征具有较高的权重,对本研究区土地类型的分类能力可能较强。然而,特征之间的相关性也会影响分类精度(张秀英等,2009),因此,本研究继续对所有特征进行两两相关性分析,并从相关系数大于0.8的2组特征中删除权重小的特征,而保留权重大的特征,得到12个特征,如图 2b所示。由于选择特征的多少直接关系到分类时的计算效率,因此为了进一步降低特征维数,提高运算速度,将图 2b中12个特征的权重由大到小排序,并选择前5个特征作为ReliefF算法选择的最优特征,这5个最优特征分别为红波段均值、绿波段均值、红波段均质性纹理、红波段纹理熵、NDVI植被指数均值。
图 3a,b分别是根据特征优选5个最优特征并采用面向对象土地利用分类和毛竹林信息提取结果,通过精度评价样点并结合目视判读,建立混淆矩阵对分类结果进行评价,结果如表 2所示。由表 2可知,研究区土地类型分类总精度为92%,Kappa系数为0.89,根据Kappa系数的统计意义,分类效果极为满意,而毛竹林的用户精度和生产者精度分别为97%和95%,表明基于最优特征的面向对象分割能够很好地提取研究区毛竹林遥感信息。
所构建的CART分类决策树如图 4所示。由图 4可知,决策树包括绿波段均值、红波段均值、短波红外均值、NDVI均值、红波段第二角力矩、短波红外均质性和短波红外均值7个特征,即由这7个特征通过决策树可以实现研究区土地利用分类,分类图及毛竹林遥感信息提取结果如图 5所示。
表 3是基于决策树的分类精度评价结果。由表 3可知,基于CART决策树的总分类精度为87%,Kappa系数为0.81,尽管分类也达到了较为满意的效果,但分类精度总体低于基于最优特征的分类结果(表 2);基于决策树的毛竹林用户精度和生产者精度分别为94%和93%,也低于最优特征的毛竹林信息提取结果。
采用面向对象分割技术,能够从5个最优特征中精确地提取出研究区毛竹林信息,用户精度和生产者精度分别达到97%和95%。图 6 是ReliefF特征优选后5个最优特征与原始全部特征对370个样本的判别精度对比。由图 6可知,特征优选后,毛竹林的判别精度有了大幅提高,而易与毛竹林错分的阔叶林、农田等土地利用类型的精度(表 2)也有一定提高。因此,基于ReliefF算法优选后的特征其分类能力大大提高,这是基于特征优选面向对象毛竹林信息提取精度高的重要原因。
分析表 2和表 3,基于最优特征和CART决策树的毛竹林信息提取精度都在90%以上,说明这2种方法筛选的特征均能很好地提取毛竹林信息,但基于最优特征的毛竹林信息提取精度高于决策树,其最主要原因是在CART决策树中,毛竹林与针叶林和阔叶林之间的误分相对更为严重,如针叶林中16个样本有4个被误分为阔叶林,5个毛竹林被分为针叶林,6个阔叶林样本被分为毛竹林(表 3)。图 7为基于最优特征和CART决策树研究区分类结果的局部对比,从图中可以更加清晰、直观地看出CART决策树分类结果在局部区域毛竹林以及其他土地利用类型之间严重误分的情况。
另一方面,CART决策树主要根据NDVI均值、近红外均值和绿波段均值实现毛竹林、针叶林和阔叶林的分类,然而,分析这3种森林类型在CART决策树选择的7个特征上的特征值曲线(图 8a)可以发现,在NDVI均值和近红外均值2个特征上,毛竹和针叶、针叶和阔叶之间的特征值非常接近,因此,它们之间极易造成误分。而由毛竹、针叶和阔叶在ReliefF算法筛选的5个特征上的特征曲线(图 8b)可见,除NDVI均值和绿波段均值对区分3种森林类型发挥重要作用外,红波段均值以及红波段均值纹理也能识别3种森林类型,这在很大程度上降低了3种森林类型之间的误分。
先前研究主要基于标准差大小选择了红、绿、蓝3个波段均值纹理、方差纹理和反差等9个特征参与分割,其毛竹林遥感信息提取的用户精度和生产者精度均在92%左右(孙晓艳等,2013),比本研究基于ReliefF算法优选得到的5个特征所提取的毛竹林信息精度低。基于标准差的特征选择主要依据影像信息所包含信息量的大小,而土地类型遥感分类除了需要考虑信息量外,同一地物间的内部联系和不同地物之间的差异是关键,ReliefF算法主要通过特征分类能力的强弱筛选特征,凸显了特征对不同类别与同一类别的判别能力(张新峰等,2004)。另外,为达到最佳分类结果,本研究还在ReliefF算法特征优选的基础上进一步做了去相关处理,因此,采用ReliefF算法筛选的特征更为科学合理,能够更精确地提取毛竹林信息。
4 结论本研究以SPOT5高分辨率遥感影像为数据源,在ReliefF算法对设置的42个对象特征进行优选的基础上,采用面向对象方法提取山川乡毛竹林信息,主要得到以下结论:
1) 基于ReliefF算法和去相关分析选择的红波段均值、绿波段均值、红波段均质性纹理、红波段纹理熵和NDVI植被指数均值5个最优特征,大幅提高了毛竹林样本的分类精度,与特征优选前相比,毛竹林样本分类精度由68%提高到88%。
2) 采用面向对象分割技术,能够从5个最优特征中精确提取研究区的毛竹林分布信息,其用户精度和生产者精度分别达到97%和95%。
3) 基于CART决策树面向对象的研究区土地利用分类总精度和毛竹林提取精度均低于基于最优特征分类结果,而毛竹林、针叶林和阔叶林之间的误分是CART决策树毛竹林信息提取精度低于基于最优特征的主要原因。
ReliefF算法特征优选注重特征的分类能力,特征筛选更加科学合理,其筛选的特征通过面向对象分割提取的毛竹林信息高于同类研究,为基于面向对象森林资源遥感分类时特征的筛选提供了一个较好方法。当然,ReliefF算法在特征优选时也会受到样本选择、抽样次数等因素的影响,如果样本选择不够准确,会影响到特征选择的结果和最终分类结果,这一点需要在研究中注意。
[1] |
杜华强, 周国模, 徐小军. 2012. 竹林生物量碳储量遥感定量估算. 北京: 科学出版社 .
( Du H Q, Zhou G M, Xu X J. 2012. Satellite-based biomass/carbon stock estimation for bamboo forest. Beijing: Science Press . [in Chinese] ) |
[2] |
韩凝.2011.空间信息在面向对象分类方法中的应用——以IKONOS影像香榧树分布信息提取研究为例.杭州:浙江大学博士学位论文. ( Han N.2011.Application of spatial information in object-based classification:a case study on delineating Torreya using IKONOS imagery.Hangzhou:PhD thesis of Zhejiang University.[in Chinese][in Chinese]) |
[3] |
黄慧萍, 吴炳方. 2004. 基于区域合并影像分割技术的多尺度地表景观分析. 地理科学进展 , 23 (3) : 9–15.
( Huang H P, Wu B F.2004. Landscape multi-scale image analysis based on the region growing segmentation. Progress in Geogeraphy , 23 (3) : 9–15. [in Chinese] ) (0) |
[4] |
黄莉莉, 汤进, 孙登第, 等. 2012. 基于多标签ReliefF的特征选择算法. 计算机应用 , 32 (10) : 2888–2890.
( Huang L L, Tang J, Sun D D, et al.2012. Feature selection algorithm based on multi-label ReliefF. Journal of Computer Applications , 32 (10) : 2888–2890. [in Chinese] ) (0) |
[5] |
明冬萍, 骆剑承, 周成虎, 等. 2005. 高分辨率遥感影像信息提取及块状基元特征提取. 数据采集与处理 , 20 (1) : 34–39.
( Ming D P, Luo J C, Zhou C H, et al.2005. Information extraction from high resolution remote sensing image and parcel unit extraction based on features. Journal of Data Acquisition&Processing , 20 (1) : 34–39. [in Chinese] ) (0) |
[6] |
孙晓艳, 杜华强, 韩凝, 等. 2013. 面向对象多尺度分割的SPOT5影像毛竹林专题信息提取. 林业科学 , 49 (10) : 80–87.
( Sun X Y, Du H Q, Han N, et al.2013. Multi-scale segmentation,object-based extraction of moso bamboo forest from SPOT5 imagery. Scientia Silvea Sinicae , 49 (10) : 80–87. [in Chinese] ) (0) |
[7] |
吴波, 朱勤东, 高海燕, 等. 2009. 面向对象影像分类中基于最大化互信息的特征选择. 国土资源遥感 (3) : 30–34.
( Wu B, Zhu Q D, Gao H Y, et al.2009. Feature selection based on maxmal mutual information criterion in object-oriented classification. Remote Sensing for Land&Resources (3) : 30–34. [in Chinese] ) (0) |
[8] |
吴健生, 林倩, 李卫锋, 等. 2013. 基于特征选择的土地整理地物识别规则的动态提取. 遥感技术与应用 , 28 (5) : 799–806.
( Wu J S, Lin Q, Li W F, et al.2013. The dynamic extraction of classification rules for land consolidation through object-oriented features space optimization. Remote Sensing Technology and Application , 28 (5) : 799–806. [in Chinese] ) (0) |
[9] |
张俊, 于庆国, 朱晓东, 等. 2011. 面向对象的高分辨率影像特征选择研究. 测绘科学 , 36 (3) : 141–143.
( Zhang J, Yun Q G, Zhu X D, et al.2011. Object-oriented features space optimization of high spatial resolution remote sensing image. Science of Surveying and Mapping , 36 (3) : 141–143. [in Chinese] ) (0) |
[10] |
张秀英, 冯学智, 江洪. 2009. 面向对象分类的特征空间优化. 遥感学报 , 13 (4) : 664–669.
( Zhang X Y, Feng X Z, Jiang H.2009. The feature space optimization based on object. Journal of Remote Sensing , 13 (4) : 664–669. [in Chinese] ) (0) |
[11] |
张新峰, 沈兰荪. 2004. 模式识别及其在图像处理中的应用. 测控技术 , 23 (5) : 28–32.
( Zhang X F, Shen L S.2004. Pattern recognition and its application in image processing. Measurement&Control Technology , 23 (5) : 28–32. [in Chinese] ) (0) |
[12] |
周国模, 姜培坤. 2004. 毛竹林的碳密度和碳储量及其空间分布. 林业科学 , 40 (6) : 20–24.
( Zhou G M, Jiang P K.2004. Density storage and spatial distribution of carbon in Phyllostachys pubescens forest. Scientia Silvae Sinicae , 40 (6) : 20–24. [in Chinese] ) (0) |
[13] | Han N, Du H Q, Zhou G M, et al.2014. Object-based classification using SPOT-5 imagery for moso bamboo forest mapping. International Journal of Remote Sensing , 35 (3) : 1126–1142. DOI:10.1080/01431161.2013.875634 (0) |
[14] | Kononenko I.1994. Estinating attributes:analysis and extensions of RELIEF. Proceedings of the 1994 European Conference on Machine Learning LNCS 784,Berlin Springer : 171–182. (0) |
[15] | Sun X Y, Du H Q, Han N, et al.2014. Synergistic use of Landsat TM and SPOT5 imagery for object-based forest classification. Journal of Applied Remote Sensing , 8 (1) : 083550. DOI:10.1117/1.JRS.8.083550 (0) |