测绘地理信息   2019, Vol. 44 Issue (4): 94-97
0
一种基于多分类器的GF-2卫星影像分类方法[PDF全文]
李志强1, 蔡国印1, 杨柳忠2, 张宁2, 杜明义1    
1. 北京建筑大学测绘与城市空间信息学院,北京,100044;
2. 住房与城乡建设部遥感应用中心,北京,100835
摘要: 以长春市部分GF-2影像为实验数据,探讨了贝叶斯、k-最邻近、支持向量机、分类回归树和随机森林5种不同分类器的分类结果及精度。由于单一分类器的局限性,设计了一种多分类器的组合方法。考虑到Hellden值能够综合评定用户精度和制图精度,选取各地类具有最高Hellden值的分类算法,构建组合分类器,其最终的分类精度优于任何单一分类器的分类结果,达到优化分类器以提升分类结果的目的。
关键词: 高分二号     面向对象     多分类器     Hellden值     组合    
Multi-classifier Based GF-2 Satellite Image Classification
LI Zhiqiang1, CAI Guoyin1, YANG Liuzhong2, ZHANG Ning2, DU Mingyi1    
1. Department of Survey and Urban Spatial Information Beijing University of Civil Engineering and Architecture, Beijing 100044, China;
2. Remote Sensing Application Center, Ministry of Housing and Urban-Rural Development of the People's Republic of China, Beijing 100835, China
Abstract: Based on part of GF-2 images of Changchun city, this paper first probes the classification results of five different classifiers: Bayes, k-nearest neighbor(KNN), support vector machine(SVM), Classification and regression trees(CART), and random forest. The comparisons of the overall accuracy and Kappa coefficient demonstrate that the descending order of these five classifiers in term of precision is as follows: SVM>Bayes>KNN>Random Forest>CART. Then this paper proposes a combined method of multi-classifiers according to the Hellden value. Research shows that the multi-classifier combination is a good method to improve the results of GF-2 image classification.
Key words: GF-2     object-oriented     multi-classifier     Hellden Value     combination    

目前,遥感越来越朝着高空间分辨率方向发展,世界上的亚m级遥感影像如美国的QuickBird、IKONOS、WorldView系列以及法国的Pleiades-1等,都得到了广泛的应用。高分二号(GF-2)作为中国国家高分辨率对地观测系统重大专项,于2014年8月19日发射成功,是中国第一颗分辨率优于1 m的民用陆地卫星,将中国带入了亚m级高分时代[1]

GF-2影像具有一个全色波段和4个多光谱波段,即蓝、绿、红和近红外波段,与国际同类卫星的波段设置基本相同[2]。与WorldView、IKONOS、QuickBird、Pleiades等国际同类型数据相比,GF-2遥感数据应用已经达到或超过国际同类或相近数据的水平,可以实现土地利用动态监测、城乡精细化管理、风景名胜区资源保护、城市园林绿地评价以及城市建筑节能等业务化应用[3]

本实验基于面向对象方法,借助面向目标对象分类的图像处理软件——易康,用同一批样本,同一特征空间,运用贝叶斯(Bayes)、k-最邻近(k-nearest neighbor,KNN)、支持向量机(support vector machine,SVM)、分类回归树(classification and regression tree,CART)、随机森林(random forest,RF)5种方法对影像进行分类。实验结果表明,SVM和Bayes的分类效果较好,而且在道路和建筑_工业类别上Bayes精度更高。考虑到每种分类器都没有绝对的好坏,即使某一种分类器的总体分类精度高于其他分类器,也许它对个别类别的提取并不擅长[4],因此,组合分类器受到了很多学者的厚爱。宋英强等[5]在提取水体信息时运用不同特征组合构造了多个弱分类器,再经AdaBoost M1算法组合成强分类器,得到了较好的提取效果。彭正林等[6]选取分类性能以及多样性好的马氏距离、SVM和最大似然等3种分类器作为子分类器,自定义规则对简单投票法、最大概率类别法以及模糊类别积分法进行组合对航摄数字正射影像分类。方文等[7]采用级联和并联相结合的方式对多种子分类器进行组合,利用改进的基于先验知识的投票表决规则,实现遥感影像分类。本文尝试利用Hellden值作为评估指标,优选出适合于不同地类的面向对象分类方法,构建组合分类器,逐次实现单一地类的提取,进而达到提高GF-2影像分类精度的目的。

1 数据及数据处理

1) 研究区。本实验以长春市北部的部分区域为研究区,覆盖范围为东经125°16′5.74″~125°24′27.76″,北纬43°54′5.27″~43°58′52.62″,如图 1所示。该区域位于城乡交界处,地类特征丰富,包含绿园区、宽城区、二道区部分城区以及周边乡村与农田,长春北湖湿地公园、长春站及长春北站均在该区域内。

图 1 研究区(预处理后的GF-2号卫星标准假彩色影像) Fig.1 Study Area (After Pretreated Standard False Color Image of GF-2 Satellite)

2) 数据及数据处理。本文采用2015年6月15日的GF-2号1A级卫星多光谱和全色影像,以30 m的ASTGTM数据为高程基准对GF-2号全色和多光谱数据进行正射纠正,对纠正后的影像利用Gram-Schmidt算法将多光谱数据和全色数据进行融合处理,对处理后的数据利用研究区矢量图进行裁切,得到研究区0.8 m空间分辨率的多光谱遥感数据。

2 研究方法 2.1 影像分割

面向对象的分类方法将影像分割成含有丰富信息的小斑块,不仅可以利用影像的光谱信息,还能利用影像上地类的形状特征、纹理特征等,同时能在分类中有效地减少基于像素分类带来的椒盐噪声,从而使得分类结果连续性较好,非常适合高分辨率影像的分类。

面向对象分类要对影像进行分割,本文采用多尺度分割算法对GF-2影像进行分割。分割方法是自底向上的区域合并法,先生成种子点,再结合光谱异质性和形状异质性原则来控制图像的分割尺度。其中, 包含尺度参数(scale parameter)、形状因子(shape)和紧致度(compactness)3个参数确定了这3个参数,也就确定了光谱因子和平滑度。本文尝试了多种分割参数,用RF方法对各分割后的影像分类,以分类结果的总体精度和Kappa系数结合分类所耗费时间等作为指标因素来衡量分割效果的好坏,最终选择的分割参数为scale=50,shape=0.1,compactness=0.5,以此分割参数进行后续实验。

2.2 影像分类

本文根据对影像进行目视解译,将影像中地物分为10类,分别是水体、农田、阴影、道路、乔灌、草地、裸地、未知、建筑_工业、建筑_居住,共采集了4 635个样本,利用其中的75%作为训练样本,25%作为验证样本,运用Bayes、KNN、SVM、CART、RF 5种方法,分别基于上述样本对GF-2影像进行面向对象分类与精度评定,并尝试优选适合不同地类的分类算法进行组合分类,以提高影像的分类精度。

本文组合分类器的设计思路是先找出各地类的最佳分类算法,再将各地类的分类精度由高到低排列,采用精度最高的分类器进行逐地类的提取。具体流程如图 2所示。

图 2 组合分类器构建思路流程 Fig.2 Construction Process of Combination Classifier

制图精度(producer accuracy, PA)和用户精度(user accuracy, UA)是衡量每类地物分类好坏的重要指标。易混淆地物之间的PA及UA的相互影响相对较大。若单独以PA或者UA作为精度指标对各地类进行排列,对于PA或UA一高一低的地类来说,势必会导致严重的错分或漏分的情况。为了综合考虑PA及UA,本文采用了Hellden指标(HA),HA是PA和UA的调和平均值,可以作为综合考量PA及UA的指标,HA与PA及UA的函数关系如下:

$ {\rm{HA}}({C_i}) = \frac{{{\rm{PA}}\left( {{C_i}} \right) \times {\rm{UA}}\left( {{C_i}} \right)}}{{\left( {\frac{{{\rm{PA}}\left( {{C_i}} \right) + {\rm{UA}}\left( {{C_i}} \right)}}{2}} \right)}} $

式中,Ci为第i类地物。由于HA和UA是分别针对生产者与用户的精度指标,所关心的兴趣点或者所回答的问题不同,需谨慎使用。而HA作为PA及UA的调和平均数,在一定程度上抵消或补偿了PA及UA之间的不一致,达到了综合PA及UA的效果。因此,本文采用HA作为组合分类器的一个依据。

3 结果及分析 3.1 构建组合分类器

通过运用5种方法对影像分类,得到的分类结果,如图 3所示。通过混淆矩阵计算出分类结果的各项精度指标,从中选出使各类Hellden值最高的分类器,再根据这些Hellden值对10个类别进行降序排序,依次为:阴影(SVM)、草地(SVM)、水体(SVM)、乔灌(SVM)、裸地(Bayes)、建筑_居住(Bayes)、农田(SVM)、未知(SVM)、道路(Bayes)、建筑_工业(Bayes)。因此,本文选择SVM和Bayes作为子分类器来构建组合分类器,如表 1所示。

图 3 5种方法的分类结果 Fig.3 Classification Results of Five Methods

表 1 本文组合分类器地类提取流程 Tab.1 Class Extraction Process of Combination Classifier in This Paper

3.2 精度分析

图 4为本文组合分类器分类结果,表 2为5种分类器和本文组合分类器得到的精度,其组合分类器总体精度比单一分类器中精度最高的SVM提高了2.68%,Kappa系数比SVM提高了3.17%。从整体上看所有类别的分类精度,单一分类器显得不够理想,总有一些类别的用户或制图精度低于80%,有的甚至低于60%。而本文组合分类器的结果显示所有类别的PA均达到80%以上,而UA除工业建筑外也都达到80%以上,这是由于建筑本身是一项难以提取的类别。由于先提取精度高的类别一定程度上可以降低后面低精度类别的错分与漏分,因此,本文组合分类器结果的整体效果要优于任一单一分类器。

图 4 组合分类器分类结果 Fig.4 Classification Results of Combination Classifier in the Paper

表 2 精度评估结果 Tab.2 Result of Accuracy Evaluation

4 结束语

本文基于GF-2卫星影像,分析了5种分类方法在提取不同地表覆盖类型的精度,并依照地类精度由高到低的顺序设计了组合分类器,取得了较好的分类效果:

1) 依据地类精度由高到低逐一提取地类,使精度高的地类保持高精度提取,精度低的地类在一定程度能够提高提取精度;

2) 综合考虑制图精度与用户精度,以Hellden值为参考指标提取出逐类别分类精度最佳的分类器来建立组合分类器以提高分类精度。

本文组合分类器的结果虽在总体精度上较单分类器有明显提高,但没有提高所有单类地物的提取精度,甚至在一定程度还牺牲了一些在单分类器中提取精度高的地类的精度。因此,本文的后续工作将侧重于探求更好的分类器参数以提高单分类器分类精度;根据各地类特有的光谱、形状和纹理等特征为各地类设置特定的特征空间以提高分类精度;寻求更佳的分类器组合方式以减小分类时地类之间的相互影响。

参考文献
[1]
韩启金, 马灵玲, 刘李, 等. 基于宽动态地面目标的高分二号卫星在轨定标与评价[J]. 光学学报, 2015, 35(7): 372-379.
[2]
孙攀, 董玉森, 陈伟涛, 等. 高分二号卫星影像融合及质量评价[J]. 国土资源遥感, 2016, 28(4): 108-113.
[3]
潘腾, 关晖, 贺玮, 等. "高分二号"卫星遥感技术[J]. 航天返回与遥感, 2015, 36(4): 16-24. DOI:10.3969/j.issn.1009-8518.2015.04.003
[4]
Du Peijun, Xia Junshi, Zhang Wei, et al. Multiple Classifier System for Remote Sensing Image Classification:A Review[J]. Sensors, 2012, 12(4): 4764-4792. DOI:10.3390/s120404764
[5]
宋英强, 杨联安, 许婧婷, 等. 基于Landsat-8卫星OLI遥感影像和AdaBoost算法的水体信息提取[J]. 测绘地理信息, 2017, 42(3): 44-47.
[6]
彭正林, 毛先成, 刘文毅, 等. 基于多分类器组合的遥感影像分类方法研究[J]. 国土资源遥感, 2011(2): 19-25.
[7]
方文, 李朝奎, 梁继, 等. 多分类器组合的遥感影像分类方法[J]. 测绘科学, 2016, 41(10): 120-125.