1 引 言
作为遥感信息提取的重要手段,影像分类一直是遥感领域重要的研究内容,为遥感影像的其他应用提供基础分析数据。传统的遥感影像分类方法主要是根据影像中目标(像元或对象)的光谱特征确定其所属类别。由于高光谱数据维数高、数据量大、训练样本数目有限,传统的分类方法已不太适用于高光谱影像分类。
迄今为止,已经发展了许多高光谱影像分类方法。在这些方法中,支持向量机(support vector machine,SVM)[1, 2]已成为解决影像分类所面临的高维数据问题的一个有力工具,并在高光谱分类领域中取得了很好的效果[3, 4]。最初的SVM方法仅利用了影像的光谱信息,并没有加入空间信息,导致分类精度不高,为了进一步提高分类精度,应将光谱信息和空间信息充分结合起来。文献[5]在对高光谱影像进行分类时,先在高光谱数据的主成分图上利用形态学开闭运算提取目标的空间信息,然后将其与光谱信息相结合得到组合特征,最终提高了分类精度。文献[6]在进行高光谱影像分类时,对数据进行了预处理,在特征空间中利用局部线性嵌入的方法增强了空间纹理信息,最终提高了分类器的性能。文献[7]提出一种综合利用原始谱域和空域信息的GA-LFDA分类算法,即将基于特征选择的遗传算法(genetic algorithm,GA)和基于特征投影的局部Fisher判别分析算法(local-fisher’s discriminant analysis,LAFDA)结合起来。
但是,针对高光谱影像提取的空-谱组合特征通常是高维的,直接使用这类特征进行分类,不但计算复杂度高,而且存在信息冗余,因此分类前有必要对组合特征进行降维处理。近些年,随着压缩遥感技术[8, 9]的发展,在高光谱影像的目标识别和分类领域内[10, 11, 12],数据的稀疏表示已被广泛应用于特征降维过程中。对于一个未知的测试样本,可以利用已训练的超完备字典对其进行重构,得到相应的稀疏系数[13, 14],这在保留低层特征最重要信息的同时可以有效地减少信息冗余。
基于以上分析,本文提出了一种空-谱信息与稀疏表示相结合的分类算法:首先,利用最小噪声分离方法(minimum noise fraction,MNF)对原始影像进行降维;然后,对主成分图上局部影像块内的所有像素进行重组,并用排序的方法得到空-谱特征;最后,对空-谱特征进行监督字典学习以得到稀疏的空-谱特征表示,并将其作为最终的像元特征输入到SVM中进行分类。与传统分类方法相比,稀疏化的空-谱特征表示可以在充分利用影像空-谱信息的同时有效地解决高光谱影像高维高冗余问题。使用3幅高光谱影像数据进行试验,结果表明本文方法可以有效提高影像分类精度。
2 旋转不变空-谱特征的提取针对传统的高光谱遥感影像分类中多利用光谱信息,忽视空间信息的问题,首先提出了一种综合光谱信息和空间信息的特征提取方法。由于光谱信息受到大气吸收和散射、地表反照率以及传感器自身的误差等因素的影响,有可能存在同物异谱以及异物同谱的现象,因此仅靠光谱特征进行分类会影响分类精度。为了进一步提高分类精度,应将光谱信息和空间信息有效地结合起来,文献[15, 16]也证明了空间信息的加入可以显著提高分类精度。
高光谱影像具有很高的光谱分辨率,通常包括上百个波段,各个波段相邻谱带间存在较强的相关性,容易造成信息冗余,因此在特征提取之前需要对影像进行MNF降维处理。假定MNF降维后影像I有d个主成分,那么影像上任意像素x0的空-谱特征可由式(1)进行构造
式中,f0∈Rd×1是降维后中心像素x0的光谱矢量;f1、f2、…、fm2-1分别对应中心像素x0所在方形窗口内其余像素的光谱矢量;函数sort()用于将这m2-1个像素的光谱向量按照它们的第一个元素从大到小的顺序进行重组。由于排序后删除了中心像素与周围像素的局部相关位置关系,因此U对于局部影像旋转具有不变特性。然后,将矩阵U按行堆栈起来得到一个1维行向量F0,再对F0进行转置得到列向量F,并将F作为像素x0的空-谱特征。图 1展示了3×3窗口的空-谱特征提取过程。 3 字典学习和稀疏编码高光谱影像提取的空-谱组合特征通常是高维的,占据的储存量大,因此,直接用该特征进行分类不但计算复杂度高,而且存在一定信息冗余。稀疏编码利用已训练的超完备字典对输入特征进行重构,得到相应的稀疏表示,这在保留低层特征最重要信息的同时可以有效地减少信息冗余。因此,本文将影像空-谱信息与稀疏字典学习结合起来,提出一种基于稀疏表示的影像分类方法解决上述问题,具体包括以下3个步骤。
3.1 字典学习传统的字典形成方式主要是无监督字典学习,即训练字典时不加入地物的类别信息,此方法在训练字典时不但耗时,而且用该字典重构样本时重构误差较大,这直接导致分类精度的降低。本文首先通过对每类地物进行有监督学习得到对应各类地物的字典di,然后合并为大字典D={d1,d2,…,dM}。这充分利用了影像的类别信息,与无监督字典学习相比,该字典可以更好地表示影像。
假设一幅影像可被分为M类,第m类有Nm个训练样本。首先,对这些训练样本按上述特征提取方法提取Nm个空-谱特征{F1,F2,…,FNm};然后,利用每类地物的空-谱特征对式(2)进行优化求解,求得每类地物的字典di(i=1,2,…,M);最后,组合所有类的字典,假定每类字典有K个原子,最终得到大小为MK的超完备字典D∈RN×MK={d1,d2,…,dM},MK≥2N,K
式中,Fj∈RN×1为空-谱特征;di∈RN×K为该类地物的字典;K为每类字典中的原子数;r= 为重构误差;sj∈RK×1为稀疏系数;λ1为正则化参数,表示重构误差和稀疏性之间的折中关系。式(2)的具体求解过程如下所示。
输入:空-谱特征Fj(j=1,2,…,Nm);
初始化:di=[F1,F2,…,FK],迭代次数n=1,重构误差r=1;
While r≥0.001 do
(1) 用正交匹配追踪算法(orthogonal match pursuit,OMP)[17]对式(2)进行优化求解,得到稀疏系数snj。
(2) 利用步骤(1)得到的snj更新字典。此时由于稀疏系数snj已知,式(2)变成了一个关于字典的最小平方优化问题,可以用拉格朗日对偶方法[18]对其进行求解,得到dni。
(3)重新计算重构误差。
(4)n←n+1;
end while
输出:该类地物的字典di=dn-1i。
3.2 稀疏编码利用监督学习得到的超完备字典和从样本中提取的空-谱特征对式(3)进行优化求解,求得该样本相对应的稀疏系数sj,并将其作为该样本的最终特征表示
式中,Fj∈RN×1为空-谱特征;D∈RN×MK为超完备字典;MK为超完备字典中的原子总数;sj∈RMK×1为该样本对应的稀疏系数;λ2为正则化参数,表示重构误差与稀疏性之间的折中关系。 3.3 影像分类
假设一幅影像共有M类地物,得到样本的稀疏表示后,本文采用SVM分类器对影像进行判别分类。SVM以结构风险最小化为原则,通过求解一个受不等式约束的二次规划问题获得分类超平面,具体流程如下所示。
步骤1:对于影像中的训练样本xi,i=1,2,…,Nm,提取它们的空-谱特征后,利用已学习的字典对其进行编码,得到相应的稀疏表示si。
步骤2:训练阶段,将稀疏表示si及其对应标签yi∈{1,2,…,M}作为最终特征输入,通过对如下二次规划问题优化求解,求得各个类别的ωk
式中,为高斯径向基核函数,其对应参数σ以及优化问题中涉及的正则化参数C采用交叉验证算法获取其最优值。表示拉格朗日乘子。
步骤3:测试阶段,对于一个未知的测试样本x*,首先在MNF降维后的影像上提取它的空-谱特征,然后将其在已学习的字典里进行编码,得到对应的稀疏表示s*,最后利用已学习的各个类别的ωk,求得该样本对应的样本标签y*。其中bk对于ωk而言是一个常数
4 试验结果和分析
在Matlab R2011b平台下,利用SVM分类器对3幅高光谱遥感影像进行分类试验,通过全局分类精度(overall accuracy,OA)和Kappa系数对分类结果进行评价。试验分析了本文方法中不同窗口大小和不同正则化参数λ对分类精度的影响,并比较分析了本文方法和其他分类方法的分类精度。
4.1 试验数据试验中,将本文方法应用到3幅高光谱遥感影像Pavia University、Pavia Center和Indian Pines中。Pavia数据是由ROSIS-03传感器系统在意大利南部的Pavia市获得的城市影像,共115个光谱波段,波长变化范围为0.43~0.86μm,空间分辨率为1.3m/像素。Pavia University数据大小为610像素×340像素,试验中去除了12个噪声波段,选取了103个光谱波段作为研究对象。Pavia Center数据大小为1096像素×492像素,试验中去除13个噪音波段保留102个光谱波段。Indian Pines是由机载可见/红外成像光谱仪(AVIRIS)获取的高光谱影像数据,共220个光谱波段,波长变化范围为0.2~2.4μm,空间分辨率为20m,数据大小为145像素×145像素,试验中去除20个水吸收波段后,选取了200个光谱波段作为研究对象,原始影像上共16类地物,去除7类训练样本不充足的地物后,最终选取9类进行试验[19]。对这3幅影像MNF降维后均选取12个波段进行试验,3幅影像的训练样本集和测试样本集的数目如表 1所示。
Pavia University | Pavia Center | Indian Pines | ||||||
类别 | 训练集 | 测试集 | 类别 | 训练集 | 测试集 | 类别 | 训练集 | 测试集 |
Asphalt | 548 | 6304 | Asphalt | 678 | 6847 | Corn-notill | 144 | 1290 |
Meadows | 540 | 18146 | Meadows | 797 | 2094 | Corn-mintill | 84 | 750 |
Gravel | 392 | 1815 | Water | 745 | 64533 | Grass/Pasture | 50 | 447 |
Trees | 524 | 2912 | Trees | 785 | 5722 | Grass/Trees | 75 | 672 |
Metal Sheet | 265 | 1113 | Tile | 223 | 2899 | Hay-windrowed | 49 | 440 |
Bare Soil | 532 | 4572 | Soil | 820 | 5729 | Soybean-notill | 97 | 871 |
Bitumen | 375 | 981 | Bitumen | 808 | 6479 | Soybean-mintil | 247 | 2221 |
Bricks | 514 | 3364 | Bricks | 485 | 1667 | Soybean-clean | 62 | 552 |
Shadows | 231 | 795 | Shadows | 195 | 1970 | Woods | 130 | 1164 |
总数 | 3921 | 40002 | 总数 | 5536 | 97940 | 总数 | 938 | 8407 |
本文通过将不同窗口内的像素的光谱信息按照一定原则进行重组得到空-谱特征,图 2为不同窗口大小对OA的影响以及相应的运行时间图,此处的运行时间为特征的稀疏重构时间和最终的分类时间之和(每个数据均为10次相同试验取均值)。
从图 2(a)中可以看出,对于Pavia University数据,随着窗口的增大,OA也随之提高,但增加幅度逐渐减小,当窗口为9×9时达到最高,为99.91%。对于Pavia Center影像,OA普遍很高,均在99.5%以上,随着窗口的增大,OA也呈现增加的趋势,但在一定范围内对分类精度影响不大。对于Indian Pines影像,随着窗口的增大,OA先增加后减少,当窗口为7×7时达到最高,为99.65%。由此可以得出,当窗口过小时特征表达不完整,分类精度较低,但当窗口过大时则易造成对象的异质性增加,降低特征的可区分性,进而也会降低分类精度。另外,从图 2(b)窗口与运行时间关系曲线来看,随着窗口的增大,运行时间急速增加,对于Pavia Center数据尤其明显。最终,对于这3幅影像,在保证较好的分类精度下,同时考虑试验运行效率,本文均选取7×7的窗口。
4.3 正则化参数对分类精度的影响本文通过限制正则化参数的大小,来权衡数据的重构误差和稀疏性之间的折中关系,图 3展示了Pavia University影像的字典学习阶段和稀疏编码阶段正则化参数取值相同和取值不同时对OA的影响(每个数据均为10次相同试验取均值),选择7×7的窗口大小作试验,其中λ1为字典学习阶段的正则化参数,λ2为稀疏编码阶段的正则化参数。
从图 3中可以看到,对于Pavia University影像而言,当λ1和λ2均取0.2时,分类精度最高,为99.88%;当λ1和λ2取值不同时,分类精度有一个起伏的变化,相差都不是太大,但均不如两阶段参数取值相同时的分类精度高,因此,关于两个阶段的正则化参数,本文最终均选取了0.2。另外也可以看到,无论λ1和λ2取值是否相同,分类精度都比较高,且相对稳定,这说明本文方法受正则化参数的影响较小。
本文也对另外两幅影像作了上述试验,并从试验中得出,对于Pavia Center影像而言,两阶段正则化参数均取0.2时,分类精度最高,而对于Indian Pines影像来说,两阶段正则化参数均取0.1时,分类精度最高。
4.4 本文方法和其他分类方法的分类精度为了验证本文方法的有效性,与其他分类方法进行了比较,主要包括:①基于光谱特征的SVM分类方法(Spectral);②基于复合核的SVM分类方法(SVM-CK)[11],通过加权求和内核将谱域信息与空域信息结合在一起;③扩展的形态学空间信息与核化的PCA相结合的分类方法(EMP+KPCA)[20];④核化的子空间追踪方法(KSSP)[21],首先通过联合稀疏模型得到空域信息,然后再利用核化的方法将谱域信息和空域信息结合在一起;⑤未排序的空-谱特征分类方法。对于这6种方法使用相同的训练样本集和测试样本集以进行一个公平的比较,结果如表 2所示。
从表 2中可以看到,对于3个试验数据而言,基于空-谱特征的分类结果明显优于仅用光谱信息进行分类的结果。与其他5种空-谱特征分类方法相比较,可以看出,本文基于排序策略的空-谱特征分类方法获得了较好的分类表现,这说明本文的特征提取方法描述特征的能力更强、更稳定。Pavia University数据的分类精度为99.88%,Pavia Center数据的分类精度高达99.96%,Indian Pines数据的分类精度也达到了99.86%。而且,排序的空-谱特征分类方法较之于不排序的空-谱特征分类方法,精度亦有所提高,这说明了排序特征的旋转不变性增加了特征的可区分性。
分类方法 | Pavia University | Pavia Center | Indian Pines | |||||
OA/(%) | Kappa系数 | OA/(%) | Kappa系数 | OA/(%) | Kappa系数 | |||
Spectral | 87.65 | 0.840 | 97.82 | 0.960 | 88.67 | 0.867 | ||
SVM-CK | 88.29 | 0.846 | 98.02 | 0.966 | 94.82 | 0.942 | ||
EMP+KPCA | 96.31 | 0.952 | 98.95 | 0.982 | 95.28 | 0.946 | ||
KSSP | 90.45 | 0.875 | 98.22 | 0.969 | 97.46 | 0.971 | ||
本文方法(不排序) | 98.34 | 0.978 | 99.69 | 0.995 | 99.63 | 0.996 | ||
本文方法(排序) | 99.88 | 0.998 | 99.96 | 0.999 | 99.86 | 0.998 |
本文基于排序空-谱特征分类方法的分类结果如图 4、图 5和图 6所示,其中图 4(c)、图 5(c)和图 6(c)为标记样本的分类结果,图 4(d)、图 5(d)和图 6(d)为整幅影像的分类结果。
5 结 论
本文针对传统的高光谱遥感影像分类中多利用光谱信息、忽视空间信息以及提取的特征维数高的问题,提出了一种空-谱信息与稀疏表示相结合的分类算法。本文方法的优点为:①空-谱特征提取算法简单,对于局部影像旋转具有不变特性;②分类学习字典,与无监督的字典学习方法相比,由于加入了地物的监督信息,因此得到的字典可以更好地表示特征;③空-谱特征的稀疏表示,这在保留低层特征最重要信息的同时可以有效地减少信息冗余。
当然,本文方法还存在有待改进的地方。例如,空-谱特征提取时的不同类地物的边缘处理问题,由于本文的空-谱特征是以窗口为对象进行提取的,并没有针对影像的边缘像素点进行特殊编码处理,因此对于影像边缘可能有误分的现象。在下一步研究中,将把本文结果与面向对象的分割结果结合起来,以期得到一个更好的分类结果。
[1] | LI Hui, WANG Yunpeng, LI Yan, et al. Numixing of Remote Sensing Images Based on Support Vector Machines and Pairwise Coupling[J]. Acta Geodaetica et Cartographica Sinica, 2009, 38(4): 319-323. (李慧, 王云鹏, 李岩, 等. 基于SVM和PWC的遥感影像混合像元分解[J]. 测绘学报, 2009, 38(4): 319-323.) |
[2] | HUANG Xin, ZHANG Liangpei, LI Pingxiang. Classification of High Spatial Resolution Remotely Sensed Imagery Based upon Fusion of Multiscale Features and SVM[J].Journal of Remote Sensing, 2007, 11(1): 48-54. (黄昕, 张良培, 李平湘. 基于多尺度特征融合和支持向量机的高分辨率遥感影像分类[J]. 遥感学报, 2007, 11(1): 48-54.) |
[3] |
LI Haitao, GU Haiyan, ZHANG Bing, et al. Research on Hyperspectral Remote Sensing Image Classification Based on MNF and SVM[J]. Remote Sensing Information, 2007(5): 12-15. (李海涛, 顾海燕, 张兵, 等. 基于MNF和SVM的高光谱遥感影像分类研究[J]. 遥感信息, 2007(5): 12-15.) |
[4] |
YANG Guopeng, YU Xuchu, LIU Wei, et al. Research of Hyperspectral Image Classification Based on Support Vector Machine[J]. Computer Engineering and Design, 2008, 29(8): 2029-2032. (杨国鹏, 余旭初, 刘伟, 等. 基于支持向量机的高光谱影像分类研究[J]. 计算机工程与设计, 2008, 29(8): 2029-2032.) |
[5] |
FAUVEL M, BENEDIKTSSON J A, CHANUSSOT J, et al. Spectral and Spatial Classification of Hyperspectral Data Using SVMs and Morphological Profiles[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008, 46(11): 3804-3814. |
[6] |
VELASCO-FORERO S, MANIAN V. Improving Hyperspectral Image Classification Using Spatial Preprocessing[J]. IEEE Transactions on Geoscience and Remote Sensing Letters, 2009, 6(2): 297-301. |
[7] |
CUI Minshan, PRASAD S, LI Wei, et al. Locality Preserving Genetic Algorithms for Spatial-spectral Hyperspectral Image Classification[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2013, 6(3): 1688-1697. |
[8] |
LIU Jixin, SUN Quansen. Multi-scale Fractal Compressed Sensing Remote Sensing Imaging[J]. Acta Geodaetica et Cartographica Sinica, 2013, 42(6): 846-852. (刘佶鑫, 孙权森. 多尺度分形压缩感知遥感成像方法[J]. 测绘学报, 2013, 42(6): 846-852.) |
[9] |
WANG Fan, WEI Chao, LIU Zhi, et al. Fusion of Remote Sensing Image with Compressive Sensing Based on FFT Spares[J]. Journal of Geomatics Science and Technology, 2013, 30(1): 58-62. (王番, 魏超, 刘智, 等. 基于FFT稀疏压缩感知域内遥感图像融合[J]. 测绘科学技术学报, 2013, 30(1): 58-62.) |
[10] | JIN Jing, ZOU Zhengrong, TAO Chao. Compressed Texton Based High Resolution Remote Sensing Image Classification[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(5): 493-499. (金晶, 邹峥嵘, 陶超. 高分辨率遥感影像的压缩纹理元分类[J]. 测绘学报, 2014, 43(5): 493-499.) |
[11] |
CHEN Yi, NASRABADI N M, TRAN T D. Simultaneous Joint Sparsity Model for Target Detection in Hyperspectral Imagery[J]. IEEE Transactions on Geoscience and Remote Sensing Letters, 2011, 8(4): 676-680. |
[12] |
CHEN Yi, NASRABADI N M, TRAN T D. Hyperspectral Image Classification Using Dictionary-based Sparse Representation[J]. IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(10): 3973-3985. |
[13] |
CHEN Yi, NASRABADI N M, TRAN T D. Sparse Representation for Target Detection in Hyperspectral Imagery[J]. IEEE Journal of Selected Topics in Signal Processing, 2011, 5(3): 629-640. |
[14] |
SONG Xiangfa, JIAO Licheng. Classification of Hyperspectral Remote Sensing Image Based on Sparse Representation and Spectral Information[J]. Journal of Electronics and Information Technology, 2012, 34(2): 268-272. (宋相法, 焦李成. 基于稀疏表示及光谱信息的高光谱遥感图像分类[J]. 电子与信息学报, 2012, 34(2): 268-272.) |
[15] |
LI Jiayi, ZHANG Hongyan, HUANG Yuancheng, et al. Hyperspectral Image Classification by Nonlocal Joint Collaborative Representation with a Locally Adaptive Dictionary[J]. IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(6): 3707-3719. |
[16] |
TARABALKA Y, BENEDIKTSSON J A, CHANUSSOT J. Spectral-spatial Classification of Hyperspectral Imagery Based on Partitional Clustering Techniques[J].IEEE Transactions on Geoscience and Remote Sensing, 2009, 47(8): 2973-2987. |
[17] |
WANG Xiaoling, DU Peijun. Spatial and Spectral Classification Based on Morphology Using SVM[J]. Bulletin of Surveying and Mapping, 2012(12): 18-22. (王晓玲, 杜培军. 基于形态学的空间信息和光谱信息SVM影像分类[J]. 测绘通报, 2012(12): 18-22.) |
[18] |
TROPP J A, GILBERT A C. Signal Recovery from Random Measurements via Orthogonal Matching Pursuit[J]. IEEE Transactions on Information Theory, 2007, 53(12): 4655-4666. |
[19] |
JIN Yixiong, CHENG Haozhong, YAN Jianyong, et al. Improved Particle Swarm Optimization Method and Its Application in Power Transmission Network Planning[J]. Chinese Journal of Electrical Engineering, 2005, 25(4): 46-50. (金义雄, 程浩忠, 严健勇, 等. 改进粒子群算法及其在输电网规划中的应用[J]. 中国电机工程学报, 2005, 25(4): 46-50.) |
[20] |
CAMPS-VALLS G, BANDOS T V, ZHOU Dengyong. Semi-supervised Graph-based Hyperspectral Image Classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 45(10): 3044-3054. |
[21] |
FAUVEL M, TARABALKA Y, BENEDIKTSSON J A, et al. Advances in Spectral-spatial Classification of Hyperspectral Images[J]. Proceedings of the IEEE, 2013, 101(3): 652-675. |
[22] |
CHEN Yi, NASRABADI N M, TRAN T D. Hyperspectral Image Classification via Kernel Sparse Representation[J]. IEEE Transactions on Geoscience and Remote Sensing, 2013, 51(1): 217-231. |