林业科学  2018, Vol. 54 Issue (8): 88-98   PDF    
DOI: 10.11707/j.1001-7488.20180810
0

文章信息

张莹, 张晓丽, 李宏志, 黎良财
Zhang Ying, Zhang Xiaoli, Li Hongzhi, Li Liangcai
基于改进转换分离度特征选择规则的土地覆盖分类比较
A Comparison of Landcover Classification Based on the Improved Transformed Divergence Analysis
林业科学, 2018, 54(8): 88-98.
Scientia Silvae Sinicae, 2018, 54(8): 88-98.
DOI: 10.11707/j.1001-7488.20180810

文章历史

收稿日期:2017-06-08
修回日期:2018-05-22

作者相关文章

张莹
张晓丽
李宏志
黎良财

基于改进转换分离度特征选择规则的土地覆盖分类比较
张莹1,2, 张晓丽1,3,4, 李宏志1,3,4, 黎良财1,3,4     
1. 北京林业大学 北京 100083;
2. 中国交通通信信息中心 北京 100011;
3. 北京林业大学精准林业北京市重点实验室 北京 100083;
4. 北京林业大学省部共建森林培育与保护重点实验室 北京 100083
摘要:【目的】提出一种考虑样本概率的可分离距离与波段相关系数结合的特征选择方法,以提高土地覆盖分类的正确率。【方法】以中亚热带区域的福建省将乐县为研究区,从Landsat-8 OLI影像中获取植被指数和纹理特征,利用改进方法和传统方法选择出最佳特征,通过比较最佳特征参与下植被类别的可分离值,判别2种方法在特征选择时的准确度;采用支持向量机分类方法(SVM)分别对原始光谱和改进方法选择的最佳特征进行分类,探索最佳植被指数和纹理特征在提高地区土地覆盖分类中的作用。【结果】改进可分离性判据在避免选择冗余波段的同时,能准确选择出具有更高区分度的特征;对于植被指数和纹理特征,单一特征均不能使植被类别可分性达到最大,而2个特征组合可明显提高植被类别的可分性;比值植被指数及小窗口的反差、协方差和二阶矩纹理特征比同窗口其他纹理对提高研究区植被分类精度具有更重要的价值;植被指数加入原始光谱并没有明显提高研究区的整体分类精度,而纹理特征与原始光谱结合对提高植被分类精度相当有价值,最佳植被指数、最佳纹理特征和原始光谱结合可取得最佳分类结果,整体分类精度提高7.41%,Kappa系数(OKA)提高8.5%。【结论】基于改进转换分离度特征选择规则的土地覆盖分类方法能平衡所有类别间的可分性,较好避免选择相互冗余的特征,从而保证选择出具有较高的多类别可分性且冗余较小的特征,提高类别分类的正确率。
关键词:OLI影像    最佳植被指数    最佳纹理特征    改进可分离分析    支持向量机分类    
A Comparison of Landcover Classification Based on the Improved Transformed Divergence Analysis
Zhang Ying1,2, Zhang Xiaoli1,3,4 , Li Hongzhi1,3,4, Li Liangcai1,3,4    
1. Beijing Forestry University Beijing 100083;
2. China Transport Telecommunications & Information Center Beijing 100011;
3. Beijing Key Laboratory of Precision Forestry, Beijing Forestry University Beijing 100083;
4. Key Laboratory for Silviculture and Conservation of Ministry of Education, Beijing Forestry University Beijing 100083
Abstract: 【Objective】A feature selection method is proposed for improving the accuracy of land cover classification, which considers the combination of separable distance of sample probability and band correlation coefficient.【Method】The several derived vegetation indices and texture characteristics used were extracted from Landsat-8 OLI data in Jiangle county of Fujian Province. Then the optimal features were identified by traditional feature selection method and improved method, respectively. By comparing the separable values of vegetation types based on the best features, the accuracy of feature selection based on two methods was determined. The different scenarios based on primary spectral data, selected vegetation indices and textural images were classified by support vector machine classification algorithm to explore selected features on improving the land cover classes.【Result】The improved separability method can more accurately select the features with higher discrimination while avoiding the selection of redundant bands. For vegetation index and texture features, a single feature cannot maximize the separability of vegetation classes while two feature combinations can significantly improve vegetation separability. Compared with the other texture features in the same window sizes, the ratio vegetation index and the texture features based on contrast, variance and the second moment with small window sizes had a better performance in improving the vegetation classification accuracy. The combinations of optimal vegetation indices as extra bands into OLI multi-spectral bands did not significantly improve overall classification performance (OCA). The combination of textural images and primary spectral bands improved the OCA, which was especially valuable for improving vegetation classification accuracy. The combination of both vegetation indices and textural images with multi-spectral bands provided the best classification performance. The overall classification accuracy and overall Kappa coefficient (OKA) were increased by 7.41% and 8.5%, respectively.【Conclusion】The feature selection method based on improved transformation divergence can balance the separability among all classes, better to avoid redundant features. So, the selected features by the improved method can increase accuracy of specified classes in the study area.
Key words: OLI remote sensing image    optimal vegetation index    optimal texture feature    improved divergence analysis    support vector machine (SVM) classification    

在地表覆盖分类研究中,由于存在“同物异谱”和“同谱异物”现象,单纯利用地物的反射光谱特征会造成分类混淆或错误,因此许多特征被综合考虑以提高分类精度,如光谱特征、植被指数、几何特征、图像变换和纹理信息等(Lu et al., 2008)。然而过多特征参与分类,不仅计算机运行速度下降,而且还会影响地物提取进而降低分类精度,准确选择合适的特征对提高地表覆盖分类精度至关重要(Chen et al., 2004Haralick et al., 1973Price et al., 2002潘琛等,2010)。

在植被分类研究中,植被指数是最常用的特征,大量研究关注植被指数与各种生物物理特征间的相关性,建立了许多植被指数(Bannari et al., 1995Justice et al., 1998Lu et al., 2004)。而灰度共生矩阵(gray level co-occurrence matrix,GLCM)被广泛用于地表覆盖分类(Dian et al., 2015Li et al., 2012Lu et al., 2008),研究表明, 选择合适的GLCM纹理有利于提高森林植被分类精度,恰当地确定最佳特征及其数目直接影响分类结果,合适的特征选择规则是提高分类精度的重要环节(Bruzzone et al., 1995Chen et al., 2004Gong et al., 1992Haralick et al., 1973Rao et al., 2002)。

目前,filter(过滤式)和wrapper(封装式)是2类主要的特征选择方法。wrapper进行特征选择时与特定的分类器关联(Bermejo et al., 2011夏道平等,2016),而filter在构造特征选择规则时一般直接利用所有训练数据的统计性能评估特征,速度较快,具有较强的灵活性,被广泛用于机器视觉和模式识别中。特征选择规则是filter方法的重要部分,类别可分性是构造特征选择规则的常用方法,一般用离散度及其变换形式(TD)、光谱角、Jeffreys-Matusita(JM)距离、Bhattacharyya距离和基于分散矩阵的可分性度量来表征(Fang et al., 2015Garg et al., 1996李海峰等,2003齐敏等,2009夏道平等,2016),其中基于转换离散度(TD)的类别可分性度量较为简单且鲁棒性较好,常用于特征选择规则的构建(Landgrebe,2005Mausel et al., 1993)。在分类研究中,不同类别可以被区分是因为其所属类别在特征空间中的不同区域,这些区域重叠的部分越小或者没有重叠,类别间的可分性越好(齐敏等,2009)。然而TD距离是针对2个类别进行计算的,当存在多个类别时,常将两两类别间可分距离的平均值作为多类别可分性的判定依据(Lu et al., 2008),这种判据计算简单,虽然合理但不是最优准则。类别间可分距离取平均,易于掩盖分离度小的类别的影响,进而不能准确选择出可分性最佳的特征。为了改善这一情况,本研究从模式识别的特征选择理论出发,将样本的先验概率(即权重)考虑进去,平衡所有类别间的可分性,扩大可分离度小的类别的敏感性,从而确定可分性最优的特征。

考虑到不同类别TD可分距离差别大以及许多特征相关性高的问题,本研究提出一种新的基于改进TD距离与波段相关系数结合的特征选择方法。首先计算每2个类别的TD距离,然后将参与计算的每个类别的先验概率作为权重,获取多类别的可分距离,最后结合波段相关系数,挑选出最佳的特征变量。主要研究目标如下:1)利用Landsat-8 OLI多光谱数据,通过考虑样本权重影响的改进TD距离与波段相关系数结合的方法选择出提高植被分类精度的最佳特征;2)对于不同类型的特征,确定参与分类的最佳特征数目;3)比较改进方法和传统方法选定的特征对植被类别可分性的影响,探讨改进方法的可靠性;4)采用SVM方法对原始光谱与最佳特征结合的不同情况进行分类,通过精度验证结果探讨改进方法及不同特征提高研究区分类精度的性能。

1 研究区概况与数据采集 1.1 研究区概况

福建省三明市将乐县(图 1)地处闽西北山区,具有独特的喀斯特地形地貌,海拔400~800 m,土壤肥沃,红壤分布广泛。该地区属中亚热带气候,雨量充沛,热量充足,年降雨量1 613.96 mm,年均气温19.47 ℃。植被主要为人工林,其中亚热带针叶林以马尾松(Pinus massoniana)林和杉木(Cunninghamia lanceolata)林为主,以及少量的柳杉(Cryptomeria fortune);亚热带常绿阔叶林以木荷(Schima superb)、火力楠(Michelia macclurei)、樟树(Cinnamomum camphora)、苦槠(Castanopsis sclperophylla)等为主。林下灌木主要有大叶紫珠(Callicarpa macrophylla)、短尾越桔(Vaccinium carlesii)、豆腐柴(Premna microphylla)、长叶冻绿(Rhamnus crenata)等。

图 1 研究区:福建省三明市将乐县 Figure 1 Study area: Jiangle county, Sanming city of Fujian Province
1.2 数据收集与处理 1.2.1 样地数据和分类系统确定

采用随机抽样和样地调查方法采集样地数据,样地调查点如图 1所示,主要包括针叶林、阔叶林、针阔混交林、采伐区和农田,每种地物类型调查24~40块样地。2013年6月开始采集样地数据,2014年7月补充部分样地。外业测定前,在实验室根据高分数据WorldView-2目视解译确定大致采样区域,主要沿道路两边设置。每块样地都用手持GPS精确测定坐标,记录样地植被的林分结构,包括优势树种、林分平均高、胸径和冠层覆盖度;同时根据样地调查点的光谱特征并结合高分辨率WorldView-2图像,获取大部分非植被样地点。共获取研究区237块样地(表 1),每一地物类型包含9~16块训练样地,选择95块样地作为训练样地参加分类,剩余142块验证样地用于对不同分类结果进行精度验证。

表 1 实测样地、训练样地和验证样地数 Tab.1 Number of surveyed samples, training samples and validation samples

根据研究目标和实地调查情况,参考以往研究对福建森林植被的划分方法(章志都等,2010),本研究将研究区划分为针叶林、阔叶林、针阔混交林和农田4个植被类别以及城镇、裸地、采伐区和水体4个非植被类别,采伐区为林地采伐后基本都种植了冠层覆盖度小的幼林。

1.2.2 图像数据收集和预处理

因合适的光谱和空间分辨率及长时序数据的完整性,Landsat系列数据仍是常用的土地覆盖分类数据源,而近年来发射的Landsat-8卫星携带的OLI传感器包括TM传感器所有波段并对原有TM波段进行了优化,其中OLI全色波段Band 8波谱范围较窄,可以更好地区分植被和无植被特征。本研究选用2014年10月17日获取的Landsat-8数据(行列号:120/42),太阳高度角为50.308 8°,太阳方位角为149.440 5°,研究区云量为0。在ENVI5.1中对影像进行辐射定标、几何精度校正(校正精度在0.351个像素内)、地形校正和FLAASH大气校正(Cooley et al., 2002杨校军等,2008),选择校正后的OLI band 2-band 8进行植被指数和纹理特征的提取。

2 方法 2.1 最佳特征变量选择方法

转换分离度(transformed divergence,TD)是相对较好的可分性指示因子(Landgrebe,2003Mausel,1990),本研究采用TD方法分析类别间的可分性,其取值范围为0~2,若可分离值大于1.9表示2个类别间具有较好的可分性;若可分离值小于1.7表示2个类别间可分性不佳。2个类别ij间的TDij距离函数如下:

$ \begin{array}{l} {\rm{T}}{{\rm{D}}_{ij}} = 2\left[{1-{\rm{exp}}(\frac{{-{D_{ij}}}}{8})} \right];\\ {D_{ij}} = \frac{1}{2}{\rm{tr}}[({C_i}-{C_j})({C_i}^{-1}-{C_j}^{ - 1})] + \\ \frac{1}{2}{\rm{tr}}[({C_i}^{-1}-{C_j}^{-1})({\mu _i} - {\mu _j}){({\mu _i} - {\mu _j})^T}]。\end{array} $ (1)

式中:Dij为2个类别间的离散度;CiCj为类别ij的协方差矩阵;μiμj为类别ij的平均矢量。

考虑不同类别样本量权重的影响,本研究采用改进的多个类别间的距离(TDbh)表示特征的可分性,该方法具有更可靠的可分性判别能力(齐敏等,2009)。当选择2个或多个特征组合时,采用改进的TDbh距离与波段相关系数结合的方法识别最佳波段组合(OBC),公式如下:

$ {\rm{T}}{{\rm{D}}_{bh}} = \sum\limits_{i = 1}^N {\sum\limits_{j > i}^N {\sqrt {p({w_i}) \times p({w_j})} \times {\rm{T}}{{\rm{D}}_{ij}}} } ; $ (2)
$ {\rm{OBC}} = \sum\limits_{i = 1}^m {{\rm{T}}{{\rm{D}}_{{\rm{bh}}}}} /\sum\limits_{j = 1}^m {{R_{ij}}} 。$ (3)

式中:Rij为特征变量ij之间的相关系数;N为土地覆盖类别数;m为特征组合数;p(ωi)和p(ωj)分别为类别ij的先验概率,由表 1中的训练样地计算,即每个类别训练样地像素数与总样地像素数的比值。

2.2 分类特征选择

选择特征变量是为了使植被类别间的可分性达到最佳,本研究选择针叶林、阔叶林、针阔混交林和农田的训练样地进行可分性分析,识别出最佳特征变量。

2.2.1 植被指数特征选择

许多植被指数被用于估测各种生物物理参数(Bannari et al., 1995Viña et al., 2011田庆久等,1998)和植被分类。国外曾有研究者分析了植被指数与森林参数(林分胸径、平均高和地上生物量)的关系,发现含有短波红外波段TM 5(1.55~1.75)的植被指数与林分参数有较高的相关系数(Li et al., 2011Lu et al., 2004),因此本研究尽量选择含有OLI 6(1.57~1.65)波段的植被指数(表 2)进行改进TD距离分析,进而选择最佳植被指数。

表 2 研究所用植被指数 Tab.2 Vegetation indices used in the research
2.2.2 纹理特征选择

Lu等(2005)研究证明,来自高分辨率影像的纹理特征相比低分辨率影像可以提供更为有用的分类信息,因此本研究从OLI全色影像中获取GLCM的8个纹理变量(Mean、Variance、Homogeneity、Contrast、Dissimilarity、Entropy、Second moment和Correlation),选取8个纹理窗口(3×3、5×5、7×7、9×9、11×11、15×15、19×19和25×25)进行分析。同样利用改进的可分离距离计算选择最佳纹理。

2.3 土地覆盖分类方法

支持向量机分类方法(SVM)具有小样本学习、抗噪声性能强、推广性好等优点,已成功应用于大量集成学习方法中,是稳定有效的基分类器之一(杨凯歌等,2016)。为了研究植被指数和纹理特征在提高分类精度方面的作用,本研究采用SVM方法对5种不同的特征组合进行分类,如表 3所示。

表 3 不同图像特征组合的分类 Tab.3 Image classification from different signatures investigated
2.4 精度评定方法

采用误差矩阵对分类结果进行精度评定,误差矩阵中的参数可以帮助分析分类结果,整体分类精度(OCA)和Kappa系数(OKC)可以反映整体分类状况;每一地物类型的生产者精度(PA)和使用者精度(UA)可以反映分类的可靠性(Congalton,1991)。采用相同的142块验证样地对不同特征组合的分类结果进行验证。

3 结果与分析 3.1 最佳特征变量识别

图 2可以看出,不同类型植被指数可分性是有差别的,比值植被指数和部分归一化植被指数的可分离值高于其他特征(图 2a), 尤其是OLI 6/5比值植被指数使得该地区植被可分性达到最大;而单个纹理特征中,纹理窗口和纹理变量不同,其在植被类型间的可分离值有很大区别,由图 2b可看出,5×5、7×7、9×9和11×11窗口的Variance和Second moment纹理比同窗口其他纹理具有更高的植被可分离值,而3×3窗口的Variance、Contrast和Second moment纹理比同窗口其他纹理有更佳的植被可分性,尤其是Contrast纹理在所有纹理中具有最高的植被可分离值,对该地区的植被分类具有更高价值;较大窗口15×15、19×19和25×25的Homogeneity和Second moment纹理比同窗口其他纹理具有更高的植被可分离值;而不同窗口纹理之间,小窗口纹理比大窗口纹理具有相对较高的植被可分离值。

图 2 基于改进TD分析的单个植被指数和纹理特征的TDbh可分离值 Figure 2 TDbh distance values for each vegetation indices and texture features based on improved TD analysis using training samples of vegetation 图 2ax轴的序号与表 1序号对应The number in the x-axis is the sames as the number of the Tab.1.

图 3中的可分离值是相应特征组合对应的可分离值的最大值,可以看出2个特征组合情况下,植被可分性相比单个特征明显增加,但是再增加其他特征变量时,可分离值变化不明显;当特征组合为3~4个时,可分离值不再变化,达到饱和。单一的植被指数或纹理变量不能使研究区植被类别可分性达到最大,当特征组合为2个时,可明显提高植被类别可分性,然而当特征组合为3个或多个时,植被类别可分性并没有显著提高,且可分离值趋于饱和。因此对于植被指数和纹理特征,本研究均选择2个特征组合为最佳变量组合数。

图 3 基于改进TD分析的不同特征组合的TDbh可分离值 Figure 3 TDbh distance values achieved by improved TD analysis using different features combinations x轴序号依次表示1~10个特征组合数The number in the x-axis is number of features combination successively.

特征相关系数分析发现,有些特征包含高度相似的信息,因此需要选择可分性大且相关性小的特征参与分类以提高植被分类精度。将可分离值大于4.84的特征变量保留下来做进一步分析,利用最佳组合度式(3),选出最佳的特征组合。结果发现植被指数ND 6-4和ND 53-67(基于OLI band 4和band 6的归一化植被指数和基于OLI band 5、band 3、band 6和band 7的归一化植被指数)、纹理变量contrast-3×3和Second moment-5×5是最佳特征组合。

3.2 分类结果精度评价

表 4可以看出,OLI原始多光谱波段(6SB)整体分类精度为77.91%,针阔混交林、采伐区和裸地的生产者精度相对较低。城镇包含的地类成分较复杂,明暗不均匀的不透水表面与裸地和采伐区极易混淆,针阔混交林与针叶林和阔叶林的混淆也导致其生产者精度较低。由表 4还可以看出,2种最佳特征变量(2VI或2TF)作为额外波段加入原始光谱参与分类,研究区整体分类精度分别提高1.77%和5.03%,而仅仅植被指数和纹理特征结合(2VI & 2TF)分类精度为66.77%,低于原始光谱(6SB)的分类精度(77.91%)。这说明仅利用特征变量或仅利用原始光谱进行分类均不能获得最佳的分类精度,不同特征和原始光谱都包含有价值的独特信息。而原始光谱、植被指数和纹理特征三者结合(6SB & 2VI & 2TF)获得了最好的分类结果,整体分类精度达85.32%,较原始光谱影像分类精度提高7.41%,针叶林、阔叶林、针阔混交林和农田的生产者精度分别提高9.32%、0.46%、26.36%和0.53%。研究区阔叶林小面积夹杂在针叶林中且分布较少,因而其生产者精度提高较低,这是限制进一步提高整体分类精度的主要原因。

表 4 不同分类方法的SVM精度评价结果对比 Tab.4 Comparison of accuracy assessment results among different scenarios based on SVM

表 5可以看出,所选植被指数间的相关系数为0.11,纹理特征间的相关系数为-0.14;植被指数和纹理特征间的相关系数也较低,ND 6-4与纹理特征Contrast-3×3和Second moment-5×5的相关系数分别为-0.21和0.13,同一特征间的低相关性和不同特征间的低相关性说明所选特征都含有独立的信息,这一点有可能提高研究区植被分类精度。表 5显示植被指数和纹理特征的标准差均较高,可看出特征变量参与分类具有更好的提高植被分类精度的潜能。图 4所示为原始光谱及原始光谱与最佳特征组合的SVM分类结果,可以看出植被指数、纹理特征与原始光谱结合,获得了最佳的分类结果。

图 4 基于不同特征组合的支持向量机分类结果 Figure 4 Comparison of classification results among different features combinations based on SVM a.Landsat-8 OLI 6个波段分类图Six TM spectral bands;b.最佳植被指数和OLI 6个波段分类图Combination of six TM spectral bands and two vegetation indices;c.最佳纹理特征和OLI 6个波段分类图Combination of six TM spectral bands and two texture features;d.最佳植被指数、纹理变量和OLI 6个波段分类图Combination of six TM spectral bands, two vegetation indices and two texture features.
表 5 Landsat-8 OLI和所选最佳特征变量影像的相关系数 Tab.5 Correlation coefficients between selected images consisting of Landsat-8 OLI and optimal feature measures
4 讨论

为了验证改进可分离距离与波段相关系数结合进行特征选择的有效性,本研究对改进方法和传统方法(Lu et al., 2008Peng et al., 2005)所选特征进行比较。改进可分离性判据选择的最佳植被指数是ND 6-4和ND 53-67,最佳纹理特征是Contrast-3×3和Second moment-5×5;而传统TD分析方法选择的最佳植被指数是ND 5-36和ND 53-67,最佳纹理特征是Correlation-5×5和Homogeneity-7×7。图 5所示为不同方法所选特征参与下获取的不同类别间的可分离值,可以看出,对于植被指数,改进方法所选特征可分性相比原始方法稍有增加,而对于纹理特征,改进方法所选特征相比原始方法每一类别的可分离值均有明显增高趋势,这说明样本量多少对特征选择是有影响的。因此,考虑样本权重的改进可分离方法能更合理反映特征的可分性,具有更佳的可分性判别能力。

图 5 改进分离分析方法和原始方法所选特征在两两类别间的TD距离比较 Figure 5 TD distance values for all pair-wise stand comparisons for optimal indices and texture features using original TD analysis and improved TD analysis, respectively 图a、b和c是2种方法选择的最佳植被指数的TD距离;图d、e和f是2种方法选择的最佳纹理特征的TD距离。a和d:针叶林; b和e:阔叶林; c和f:针阔混交林。a, b, and c images were acquired from TD distance for optimal vegetation indices; d, e, and f images were from TD distance for optimal texture features. a and d: Coniferous forest; b and e: Broad-leaved forest; c and f: Mixed forest.

新构造的特征选择规则基于模式识别的特征选择理论,将样本的先验概率(即权重)考虑进去,平衡所有类别间的可分性,扩大可分离度小的类别的敏感性,与波段相关系数结合避免了选取冗余性较大的特征,从而确定出提高类别可分性的最优特征。

5 结论

本研究以中亚热带区域的福建省将乐县为研究区,提出改进可分离性判据与波段相关系数结合的特征选择规则,获得有利于提高植被分类精度的最佳植被指数组合和纹理特征组合。通过该方法探索了基于Landsat-8数据获取的植被指数和纹理特征在该地区土地覆盖分类中的作用,其中最佳植被指数组合为基于OLI band 4(红光波段)和band 6(短波红外)的归一化植被指数ND 6-4及基于OLI band 5(近红外)、band 3(绿光)、band 6和band 7(短波红外)的归一化植被指数ND 53-67;而最佳纹理特征组合为全色波段OLI band 8获取的3×3窗口的反差纹理和5×5窗口的二阶矩纹理。考虑样本影响的改进方法可以更准确地选择分类特征,纹理特征的加入对提高植被分类精度相当有价值,而最佳植被指数、纹理特征与原始光谱结合获取了最佳分类结果,整体分类精度(OCA)提高7.41%,Kappa系数(OKA)提高8.5%。

改进可分离性分析表明,单一的植被指数或纹理特征均不能使植被类别可分性达到最大,当特征组合为2个时,可明显提高植被类别可分性,然而特征组合为3个或多个时,植被类别可分性并没有显著提高,且可分离值趋于饱和;而小窗口的协方差和二阶矩纹理相比同一窗口其他纹理对植被具有更高的可分性,此外小窗口3×3的反差纹理表现出最大的植被可分性;比值植被指数和部分归一化植被指数的可分性高于其他类型植被指数。

如何选择合适的特征变量是一个巨大的挑战,基于改进转换分离度特征的选择规则考虑了样本权重的影响,均衡了不同类别可分离度的整体敏感性,具有更佳的特征识别能力,能更准确选择出最合适的特征,提高土地覆盖分类的正确率。

参考文献(References)
李海峰, 张建州, 游志胜. 2003. 基于类距离的可分离性判据[J]. 计算机工程与应用, 39(26): 97-99.
(Li H F, Zhang J Z, You Z S. 2003. A separative criterion based on class distance[J]. Computer Engineering and Applications, 39(26): 97-99. DOI:10.3321/j.issn:1002-8331.2003.26.032 [in Chinese])
潘琛, 林怡, 陈映鹰. 2010. 基于多特征的遥感影像决策树分类[J]. 光电子激光, 21(5): 731-736.
(Pan C, Lin Y, Chen Y Y. 2010. Decision tree classification of remote sensing images based on multi-feature[J]. Journal of Optoelectronics. Laser, 21(5): 731-736. [in Chinese])
齐敏, 李大健, 郝重阳. 2009. 模式识别导论北京: 清华大学出版社.
(Qi M, Li D J, Hao C Y. 2009. Pattern recognition theory. Beijing: Tsinghua University Press. [in Chinese])
田庆久, 闵祥军. 1998. 植被指数研究进展[J]. 地球科学进展, 13(4): 10-16.
(Tian Q J, Min X J. 1998. Advances in study on vegetation indices[J]. Advance in Earth Sciences, 13(4): 10-16. [in Chinese])
夏道平, 付元元, 王纪华, 等. 2016. 分散矩阵特征选择方法改进及在高光谱影像植被分类中的应用[J]. 农业工程学报, 32(21): 196-201.
(Xia D P, Fu Y Y, Wang J H, et al. 2016. Improved scatter-matrix-based feature selection method for vegetation classification of hyperspectral image[J]. Transactions of the Chinese Society of Agricultural Engineering, 32(21): 196-201. DOI:10.11975/j.issn.1002-6819.2016.21.026 [in Chinese])
杨凯歌, 冯学智, 肖鹏峰, 等. 2016. 优化子空间SVM集成的高光谱图像分类[J]. 遥感学报, 20(3): 409-419.
(Yang K G, Feng X Z, Xiao P F, et al. 2016. Optimal subspace ensemble with SVM for hyperspectral image classification[J]. Journal of Remote Sensing, 20(3): 409-419. [in Chinese])
杨校军, 陈雨时, 张晔. 2008. Flaash模型输入参数对校正结果的影响[J]. 遥感信息, (6): 32-37.
(Yang X J, Chen Y S, Zhang Y. 2008. Effect on atmospheric correction by inputting parameters of Flaash model[J]. Remote Sensing Information, (6): 32-37. [in Chinese])
章志都, 梁冠巍, 董建文, 等. 2010. 基于植被分布因子主成分分析的福建省植被区划[J]. 东北林业大学学报, 38(3): 61-65.
(Zhang Z D, Liang G W, Dong J W, et al. 2010. Vegetation regionalization for Fujian Province based on principal component analysis of factors affecting vegetation distribution[J]. Journal of Northeast Forestry University, 38(3): 61-65. [in Chinese])
Bannari A, Morin D, Bonn F, et al. 1995. A review of vegetation indices[J]. Remote Sensing Reviews, 13(1/2): 95-120.
Bermejo P, Gámez J A, Puerta J M. 2011. A GRASP algorithm for fast hybrid (filter-wrapper) feature subset selection in high-dimensional datasets[J]. Pattern Recognition Letters, 32(5): 701-711. DOI:10.1016/j.patrec.2010.12.016
Bruzzone L, Pellegretti P, Roli F. 1995. An experimental analysis of the use of grey level co-occurrence statistics for SAR-image classification. Geoscience and Remote Sensing IEEE International Symposium.
Chen D, Stow D A, Gong P. 2004. Examining the effect of spatial resolution and texture window size on classification accuracy:an urban environment case[J]. International Journal of Remote Sensing, 25(11): 2177-2192. DOI:10.1080/01431160310001618464
Congalton R G. 1991. A review of assessing the accuracy of classifications of remotely sensed data[J]. Remote Sensing of Environment, 37(1): 35-46. DOI:10.1016/0034-4257(91)90048-B
Cooley T, Anderson G P, Felde G W, et al. 2002. FLAASH, a MODTRAN4-based atmospheric correction algorithm, its application and validation. Geoscience and Remote Sensing Symposium, 2002 IGARSS'02 2002 IEEE International, 1414-1418.
Dian Y, Li Z, Pang Y. 2015. Spectral and texture features combined for forest tree species classification with airborne hyperspectral imagery[J]. Journal of the Indian Society of Remote Sensing, 43(1): 101-107. DOI:10.1007/s12524-014-0392-6
Fang L, Zhao H, Wang P, et al. 2015. Feature selection method based on mutual information and class separability for dimension reduction in multidimensional time series for clinical data[J]. Biomedical Signal Processing & Control, 21(1): 82-89.
Garg P K, Jazayeri M. 1996. Process-centered software engineering environments. IEEE Computer Society Press.
Gong P, Marceau D J, Howarth P J. 1992. A comparison of spatial feature extraction algorithms for land-use classification with SPOT HRV data[J]. Remote Sensing of Environment, 40(2): 137-151. DOI:10.1016/0034-4257(92)90011-8
Haralick R M, Shanmugam K, Dinstein I H. 1973. Textural features for image classification[J]. Transactions on Systems, Man and Cybernetics, 3(6): 610-621.
Justice C O, Vermote E, Townshend J R G, et al. 1998. The moderate resolution imaging spectroradiometer (MODIS):land remote sensing for global change research[J]. IEEE Transactions on Geoscience and Remote Sensing, 36(4): 1228-1249. DOI:10.1109/36.701075
Landgrebe A D. 2005. Signal theory methods in multispectral remote sensing. J Wiley.
Landgrebe D A. 2003. Signal theory methods in multispectral remote sensing. New Jersey: John Wiley and Sons.
Li G, Lu D, Moran E, et al. 2012. A comparative analysis of ALOS PALSAR L-band and RADARSAT-2 C-band data for land-cover classification in a tropical moist region[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 70(3): 26-38.
Li G, Lu D, Moran E, et al. 2011. Land-cover classification in a moist tropical region of Brazil with Landsat Thematic Mapper imagery[J]. International Journal of Remote Sensing, 32(23): 8207-8230. DOI:10.1080/01431161.2010.532831
Lu D, Batistella M, Moran E, et al. 2008. A comparative study of Landsat TM and SPOT HRG images for vegetation classification in the Brazilian Amazon[J]. Photogrammetric Engineering & Remote Sensing, 74(3): 311-321.
Lu D, Mausel P, Brondízio E, et al. 2004. Relationships between forest stand parameters and Landsat TM spectral responses in the Brazilian Amazon Basin[J]. Forest Ecology and Management, 198(1/3): 149-167.
Lu D, Weng Q. 2005. Urban classification using full spectral information of Landsat ETM+ imagery in Marion County, Indiana[J]. Photogrammetric Engineering & Remote Sensing, 71(11): 1275-1284.
Mausel P, Wu Y, Li Y, et al. 1993. Spectral identification of successional stages following deforestation in the Amazon[J]. Geocarto International, 8(4): 61-71. DOI:10.1080/10106049309354430
Mausel P W. 1990. Optimum band selection for supervised classification of multispectral data[J]. Photogrammetric Engineering & Remote Sensing, 56(1): 55-60.
Peng H, Long F, Ding C. 2005. Feature selection based on mutual information:criteria of max-dependency, max-relevance, and min-redundancy[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 27(8): 1226-1238.
Price K P, Guo X, Stiles J M. 2002. Optimal Landsat TM band combinations and vegetation indices for discrimination of six grassland types in eastern Kansas[J]. International Journal of Remote Sensing, 23(23): 5031-5042. DOI:10.1080/01431160210121764
Rao P V N, Sai M V R S, Sreenivas K, et al. 2002. Textural analysis of IRS-1D panchromatic data for land cover classification[J]. International Journal of Remote Sensing, 23(17): 3327-3345. DOI:10.1080/01431160110104665
Viña A, Gitelson A A, Nguy-Robertson A L, et al. 2011. Comparison of different vegetation indices for the remote assessment of green leaf area index of crops[J]. Remote Sensing of Environment, 115(12): 3468-3478. DOI:10.1016/j.rse.2011.08.010