| 多特征组合的TM影像EnMap-Box土地利用分类 |
2. 西南林业大学林学院,云南 昆明,650224
2. Forestry Collegeof Southwest Forestry University, Kunming 650224, China
遥感卫星在空间上能够连续覆盖和长期连续观测,使之成为了获取土地利用分类数据的主要手段[1]。目前,国内外许多学者对遥感影像分类进行了大量研究,主要分为人工目视解译和计算机分类法。计算机分类法主要包括ISODATA、K-Mean等非监督分类法和平行六面体、最小距离、最大似然等传统监督分类法。近年来,以人工神经网络[2]、模糊分类法[3]、支持向量机法[4]等为代表的智能计算机分类法成为研究主流。支持向量机算法(support vector machines,SVM)可以支持高维特征空间的分类,且算法几乎不受“维数灾难”的影响,能够在高维特征空间中获得较高的精度,较适用于中低分辨率遥感影像分类。遥感影像SVM分类中分类特征的选择是影响分类精度的重要因素之一。由于土地利用类型的复杂性,研究表明只利用一类分类特征的分类结果并不能达到理想的效果。
本文选择云南省洱源县Landsat5影像数据作为分类数据。本文选取了绿度植被指数(greenness vegetation index,GVI)、归一化建筑指数(normalized building index,NDBI)和最佳波段组合(波段541)以及纹理特征构成多特征组合向量,采用EnMap-Box软件对研究区多特征组合向量进行SVM土地利用分类并与其他分类方法对比,探讨多特征组合对提高遥感影像分类精度的作用。为了验证本文提出的多特征组合对提高遥感影像分类精度具有普遍适用性,本文以云南省思茅区作为验证区域。
1 遥感影像分类特征选取 1.1 TM影像数据预处理本文所用的云南省洱源县TM影像来源于地理空间数据云2009年的Landsat5影像,空间分辨率为30 m。由于大气、传感器本身等的影响,获取的遥感数据与真实数据之间存在偏差。利用ENVI5.3对遥感影像进行了大气校正、地形校正等预处理;由于各特征量纲的不同,用EnMAP-Box由德国环境制图与分计划项目组基于IDL(interactive data language)开发的工具包对选取的多特征组合进行归一化处理。本文参照参考文献[5],将研究区主要土地利用类型分为:水体、农业用地、林地、建筑用地、未利用地。根据高清遥感影像数据,选取一定数量的训练样本和检验样本,样本的选择兼顾了代表性和样本间的可分离性。
1.2 最佳波段组合遥感多光谱数据能提供大量的地物光谱特性,地物在各个波段分别反射不同的光谱特征,且不同地物的波谱差异也不一样。波段组合的好坏能提高不同地物类型区分的能力。怎样从遥感数据中快速、有效地获取最佳波段并进行组合,以利于图像解译和信息提取,是图像处理的技术问题之一。通常波段组合选择应遵循3点原则[6]:(1)波段所含信息量要大;(2)波段间的相关性要小;(3)要利于区分地物类型。Chavez等[7]提出的最佳指数法(optimum index factor,OIF)综合考虑了各波段的信息含量及波段间的相关性,更接近于波段选择的原则,且计算简单,易于实现,得到广泛的应用。
本文采用Matlab对该研究区影像(6波段除外)的波段组合进行OIF值计算,其计算结果如表 1所示。
| 表 1 最佳波段组合OIF值 Tab.1 Best Band Combination OIF Value |
![]() |
从表 1可以看出,OIF指数的值从大到小为b145>b457>b345>b157>b245。其中,b145的OIF值为最大,为区分该研究区地物类型的最佳波段组合。
1.3 指数特征选择经研究发现,在指数图像上待分类地物的亮度值较大且较为突显,而背景地物的亮度值则会受到相应程度的抑制。因此,基于指数的图像有利于提高待分类地物的辨识度和信息提取的精度。一般来说,不同的指数特征针对不同的地物提取,如植被指数主要针对植被、水体指数主要针对水体,所以不同地物的识别应选择与其相应的指数。在实际应用中,研究区域难以辨别的地物,通常选择相应的指数图像来提高该类地物的可分离性,从而可提高总体分类精度。经过实验研究,本文选择了绿度植被指数[8]、归一化建筑指数[9, 10]。
1.4 纹理特征通常将纹理定义为图像的某些局部属性或局部区域中像素之间关系的度量。在遥感图像中,像素值仅提供了强度信息,纹理则提供了强度值的局部变异信息,即结构信息[11]。
灰度共生矩阵能计算14种纹理特征[12],本文采用Barald等[13]认为对遥感图像分类效果最好的四种纹理:角二阶矩、熵、同质度和对比度来进行实验对比分析,以选择分类效果最好的纹理特征。首先对原始图像的7个波段进行主成分分析,起到降维、压缩数据和信息增强的目的。主成分变换后得到的第一主成分(PC1)中包含了原始影像中的绝大部分信息,因此利用灰度共生矩阵提取第一主成分的纹理特征,以减少计算量。窗口大小为5×5。经实验反复对比分析,最终选择了分类精度最高的同质度这一纹理特征。
2 EnMAP-Box模型寻优及分类EnMAP-Box工具包[14]中的SVM分类模块是基于台湾大学林智仁教授开发设计的libsvm软件包,其功能模块集成了网格搜索参数优化[15]。工具包中的SVM分类器的核函数是径向基核函数(radial basis function,RBF)。本文选取了最优波段组合(541)、绿度植被指数、归一化建筑指数及同质度6个分类特征构成多特征组合向量。
首先寻优SVM分类最优模型。在ENVI中获取样本信息ROI文件(训练样本500个,测试样本300个)并将其转为适用于EnMAP使用格式的图像文件。使用EnMAP工具的SVC(parameterize SV classifier)功能,设置RBF核函数的惩罚参数C和核参数g的取值范围,用交叉验证的方法对样本集模型进行分类分析,得到分类精度最高的分类模型。
通过反复试验,发现最优分类模型的精度与C和g的取值范围密切相关。在样本空间和遥感数据等特定条件下,C和g参数的初始值范围和步长是影响优化模型精度的关键因素。在可控范围内,要避免参数取值范围出现局部最优解,即优化参数为非临界值,且在优化时间的允许范围内搜索步长应当确保最小,交叉验证的分割数量应大于3。
SVM核参数寻优后得到最优分类模型(*.svc),将最优分类模型运用到多特征组合向量图像中得到分类结果,如图 1。
![]() |
| 图 1 EnMAP遥感影像SVM最优模型分类界面 Fig.1 EnMAP Remote Sensing Image SVM Optimal Model Classification Interface |
3 遥感影像土地利用分类结果
本文利用EnMAP-Box分类软件,对TM影像进行SVM土地利用分类,并进行分类后处理,以提高影像的分类精度。最后,采用混淆矩阵对各分类方法的分类精度进行评价。为了评价和验证本文分类精度利用相同的训练样本(500个)和检验样本(300个)对多特征组合遥感影像进行传统的最大似然分类以及对原始波段影像进行SVM分类。为了验证本文多特征组合对提高影像分类精度具有普遍适用性,选择了云南省思茅区作为验证区域,以此证明该方法的可推广性。计算各分类方法的生产者精度、用户精度、总精度和Kappa系数(表 2)以进行结果比较。遥感影像土地利用分类结果如图 2。
| 表 2 遥感影像土地利用分类精度/% Tab.2 Results of Land Use Classification Accuracy of Remote Sensing/% |
![]() |
![]() |
| 图 2 遥感影像土地利用分类结果 Fig.2 Results of Land Use Classification of Remote Sensing |
从表 2可以看出,基于多特征组合的SVM分类法总体分类精度达到了90.73%,比原始波段SVM的分类结果精度高大约7%左右,比最大似然分类法高13%左右。表明多特征组合提高了遥感影像分类精度,同时也表明了支持向量机分类法比最大似然分类法精度高。从生产者精度和用户精度来看,SVM分类法的林地、水体和农业用地的分类精度较高。而最大似然分类法的林地、水体和未利用地分类精度较高。这可能是不同分类算法受到遥感影像异物同谱或同物异谱的影响或者受稀疏植被、裸地等因素的影响,导致不同分类方法同一地类分类精度高低不一致。
为了验证本文多特征组合的支持向量机分类法其分类结果的提高具有普遍适用性,选择了云南省思茅区作为实验验证区域,如表 2所示。从表中看出,总体分类精度达到了88%左右,符合遥感影像分类的精度要求。说明基于多特征组合的支持向量机在一定程度上对遥感影像分类具有普遍适用性。
4 结束语经实验反复对比分析,对遥感影像进行土地利用分类,多特征的分类精度一般要高于原始波段单类特征。但是,分类的特征越多其分类精度并不一定越高,因此,在遥感影像分类中,应优先选择可分性较高的特征,尽量避免类别可分性较差的特征参与分类从而可能成为噪声而降低影像分类的总体精度。EnMAP-Box工具包中的SVM自动分类模块,为遥感影像SVM分类提供了支撑,SVM分类的最优分类模型取决于C和g的初始范围和步长,而EnMAP网格搜索算法中乘数即步长是直接影响C和g取值密度的重要参数。EnMAP-Box网格搜索参数优化的SVM分类,不需编程和代码,同时其他内置模块为遥感影像数据处理也提供了便利。
本文利用支持向量机对研究区遥感影像进行土地利用分类,选取最优波段组合、纹理信息、绿度植被指数、归一化建筑指数组成多特征组合,并将分类结果与最大似然法和原始波段影像的SVM分类结果进行比较,并以云南省思茅区为实验区进行验证。结果表明,本文提出的多特征组合的SVM分类法总精度最高,在一定程度上具有普遍适用性。
| [1] |
Townshend J R, Masek J G, Huang C, et al. Global Characterization and Monitoring of Forestcover Using Landsat Data; Opportunnies and Challenges[J]. International Journal of Digital Earth, 2012, 5(5): 373-397. DOI:10.1080/17538947.2012.713190 |
| [2] |
韩立群. 人工神经网络[M]. 北京: 北京邮电大学出版社, 2006.
|
| [3] |
Richard O, Duda P E, Hart D G. Pattern Classification, Second Edition[M]. Beijing: China Machine Perss, 2004.
|
| [4] |
万意, 李长春, 赵旭辉, 等. 基于SVM的光学遥感影像分类与评价[J]. 测绘地理信息, 2018, 43(6): 74-77. |
| [5] |
陈百明, 周小萍. 《土地利用现状分类》国家标准的解读[J]. 自然资源学报, 2007, 22(6): 994-1003. DOI:10.3321/j.issn:1000-3037.2007.06.017 |
| [6] |
赵庆展, 刘伟, 尹小君, 等. 基于无人机多光谱影像特征的最佳波段组合研究[J]. 农业机械学报, 2016, 47(3): 242-248. |
| [7] |
Chavez P S, Berlin G L, Sowers L B. Statistical Method for Selecting Landsat MSS Ratios[J]. Journal of Applied Photographic Engineering, 1982, 8(1): 22-30. |
| [8] |
赵英时. 遥感应用分析原理与方法[M]. 北京: 科学出版社, 2013.
|
| [9] |
查勇, 倪绍祥, 杨山. 一种利用TM图像自动提取城镇用地信息的有效方法[J]. 遥感学报, 2003, 7(1): 37-40. |
| [10] |
ZHA Yong, GAO J, Ni S. Use of Normalized Difference Built-up Index in Automatically Mapping Urban Areas from TM Imagery[J]. International Journal of Remote Sensing, 2003, 24(3): 583-594. DOI:10.1080/01431160304987 |
| [11] |
韦玉春, 汤国安, 汪闽, 等. 遥感数字图像处理教程第二版[M]. 北京: 科学出版社, 2014.
|
| [12] |
陈元鹏, 郧文聚, 周旭, 等. 基于MESMA和RF的山丘区土地利用信息分类提取[J]. 农业机械学报, 2017, 48(7): 136-144. |
| [13] |
Barald A, Parminggian F. An Investigation on the Texture Characteristics Associated with Gray Level Co-occurrence Matrix Statistical Parameters[J]. IEEE Trans on Geoscience and Remote Sensing, 1995, 32(2): 293-303. |
| [14] |
Sebastian V D L, Rabe A, Held M, et al. The EnMAP-Box—A Toolbox and Application Programming Interface for En-MAP Data Processing[J]. Remote Sensing, 2015, 7(9): 112-119. |
| [15] |
林海晏, 岳彩荣, 吴晓晖, 等. 基于EnMAP-Box的遥感图像分类研究[J]. 西南林业大学学报, 2014(2): 67-71. DOI:10.3969/j.issn.2095-1914.2014.02.013 |
2019, Vol. 44






