为了解决高光谱遥感影像分类中单一尺度特征无法有效表达地物类间差异和区分地物边界的不足,提高影像分类精度和改善分类目视解译效果,提出了采用引导滤波提取多尺度的空间特征的方法。首先,利用主成分分析对高光谱影像进行降维,移除噪声并突出主要特征;然后,将第1主成分作为引导影像,将包含信息量最多的若干主成分分别作为输入影像,应用依次增加的滤波半径分别进行引导滤波处理提取多个尺度的特征,获得影像不同尺度的结构信息;最后,将多尺度特征输入分类器中进行影像监督分类。采用仿真数据和帕维亚大学(Pavia University)、帕维亚城区(Pavia Centre)等3幅高光谱实验数据,提取了基于引导滤波的多尺度特征、多尺度形态特征和多尺度纹理特征,输入到支持向量机、随机森林和K近邻分类器中,进行了实验。实验结果表明:采用支持向量机分类Pavia University数据,相对于采用多尺度形态特征的分类结果,引导滤波特征的总体精度提高了6.5%;Pavia Centre和Salinas两幅影像最高分类精度均由引导滤波特征实现,分别达到98.51%和98.39%。实验证实基于引导滤波提取的多尺度特征能有效地描述地物结构,进而获得更高的分类精度和改善目视解译效果。
高光谱影像, 引导滤波, 多尺度特征, 分类, 空间信息
Features extracted from a single scale cannot effectively express differences among land objects and recognize object boundaries.Thus, hyperspectral image classification suffers from low classification accuracy and the " pepper-and-salt” phenomenon. In this context, we propose a set of multi-scale spatial features that is based on guided filtering to improve the performance of image classification in quantitative accuracy and visual interpretation. The structure-transferring property of the guided filtering is investigated to appropriately represent land objects with different sizes. The proposed feature extraction and classification algorithm consists of three steps. First, Principal Component Analysis (PCA) is used to reduce the dimensionality of hyperspectral images and remove noise. Second, the first several principal components that have the most amount of information are guided by the first principal component to obtain filtered features. Multi-scale features are extracted by guided filtering with increasing radii, which can represent structures of different land cover types. Finally, the feature set is fed into classifiers for image classification. We operated experiments on one synthetic and three hyperspectral datasets, namely, Pavia University, Pavia Center, and Salinas. Multiple multi-scale features, including multi-scale features based on guided filtering, multi-scale morphological, and multi-scale texture features, were extracted. Three advanced classifiers, namely, Support Vector Machine(SVM), Random Forest(RF), and K-Nearest Neighbor(KNN), were considered for comparison. The results of the experiments conducted on the synthetic data set showed that the proposed feature extraction method could better smooth the inner pixels of land objects while preserving object boundaries compared with multi-scale morphological features. Compared with the combination of multi-scale morphological features and SVM, the combination of multi-scale guided filtering features and SVM achieved a 6.5% increment in overall accuracy on the Pavia University dataset. The highest classification accuracies for the Pavia Centre and Salinas images were 98.51% and 98.39%, respectively.These resultswere achieved by the proposed multi-scale guided filtering method. A single scale cannot effectively represent the spatial information of land objects. Thus, multi-scale features are extracted using guided filtering. These features can preserve the spatial structures transferred from the guidance image and smooth the details of the input image due to the structure-transferring property of guided filtering. Land objects with various scales can also be effectively described by these multi-scale filtering features by setting different filtering window sizes. The quantitative results and visual inspection showthat multi-scale filtering features can effectively describe the structures of land objects in comparison with morphological and texture features and thus result in high classification accuracy and better visual quality. The proposed feature is suitable for analyzing land scenes with complicated structures, such as urban areas.
Key words
hyperspectral image, guided filter, multi-scale feature, classification, spatial information
1 引 言
高光谱遥感采用数十个乃至数百个很窄光谱波段对地物进行遥感成像,从而获取高光谱分辨率的影像(张春森 等,2015)。相比于其他影像,高光谱的特性使其在地物鉴别及影像分类上更具优势。随着高光谱影像在很多相关领域应用越来越广泛,处理方法也越来越多。主要处理步骤包括影像的特征提取或特征选择,其目的是在保留影像中主要特征的同时尽可能移除高光谱影像的冗余信息(Quesada-Barriuso 等,2014)。
由于高光谱影像往往还具有较高的空间分辨率,将空间及光谱特征结合应用于高光谱影像分类中已经成为高光谱影像解译主要方法之一(Mura 等,2011)。本文中所指“空间特征”是指由像素及其邻域内像素通过数学运算获取的反映影像局部空间特性的数值。如Ji等人(2014)提出使用空间光谱约束的方法进行影像分类。Shen等人(2011)将多频段和方向的Gabor纹理特征与光谱特征融合用于高光谱影像分类,分类精度得到提升。Huang等人(2007)从多个窗口提取基于灰度共生矩阵的特征,并加以特征融合,实现了全色影像的高效分类。Benediktsson等人(2005)提出应用拓展形态特征与光谱特征结合的分类方法,其分类结果要优于纯光谱分类方法。刘纯等人(2015)通过分割得到多尺度区域特征,融合光谱及像元形状指数,输入支持向量机分类器,优化了影像分类结果。郑晨等人(2013)提出一种多尺度区域粒度特征,能够从大尺度上提取出地物整体信息,从小尺度上获取地物细节特征。季江等人(2015)提出一种多尺度窗口的噪声平滑方法,对光谱有良好的平滑效果。
综合来看,影像空间特征主要包含区域形状特征(刘纯 等,2015;黄昕 等,2007)、纹理特征(Huang 等,2007;刘萌萌 等,2014;余旭初 等,2014;尹明 等,2015)及形态滤波特征(Benediktsson 等,2005;Licciardi 等,2012)等。其中,形态滤波利用事先定义好形状及大小的结构元素对影像进行开或闭运算,能够较好地滤除噪声和保留地物空间结构特征,近年获得了广泛的关注。但是,这类多尺度滤波方法多采用多向同性的滤波器,不能同时实现地物平滑和有效地保留地物的结构信息。
引导滤波建立了引导影像和输出的局部线性模型,并通过输入与输出影像间差异函数的求解,隐式地完成对输入影像的滤波(He 等,2013)。除了能实现基本的平滑滤波功能,引导滤波还能将引导影像中的空间边缘信息较完整的转移到输出影像中。引导滤波算法已在影像融合(Li 等,2013;Zhao 等,2015)和影像增强(He 等,2013)等方面报道了应用。考虑引导滤波的这一特性,同时考虑到单一尺度特征难以表达高分辨率高光谱遥感影像中地物的多尺度结构信息的不足,本文提出一种基于引导滤波的多尺度空间特征提取方法,并采用多种分类器进行分类验证。该方法利用引导滤波提取影像中地物不同尺度的空间信息,可有效提高分类精度。
2 本文方法
2.1 引导滤波原理
引导滤波是近年来出现的一种性能优异的边缘保存滤波器,能够使输出影像同时保留被滤波影像特征和较好的载入引导影像的边缘信息(He 等,2013)。
${q_i} = {{a}_k}{I_i} + {b_k}\;\forall i \in {{\omega}_k}\begin{array}{*{20}{c}}, &{{q_i} \in {q}}\end{array}$ | (1) |
$E\left({{{{a}}_k}, {b_k}} \right) = \sum\limits_{i \in {{\omega} _k}} {\left({{{\left({{{{a}}_k}{{{I}}_i} + {b_k} - {p_i}} \right)}^2} + \varepsilon {{a}}_k^2} \right)} $ | (2) |
最后,采用岭回归技术(Hastie 等,2009) 进行参数估计。通过最小化代价函数式(2),可求解出系数
${{{a}}_k} = \frac{1}{{\left| \omega \right|}}\frac{{\displaystyle\sum\limits_{i \in {{\omega} _k}} {{{{I}}_i}{p_i} - {{{\mu }}_k}{{\overline p }_k}} }}{{\sigma _k^2 + \varepsilon }}$ | (3) |
${b_k} = {p_k} - {a_k}{\mu _k}$ | (4) |
${\overline p _k} = \frac{1}{{\left| \omega \right|}}\sum\limits_{i \in {{\omega}_k}} {{p_i}} $ | (5) |
${q_i} = \frac{1}{{\left| \omega \right|}}\sum\limits_{i \in {{\omega} _k}} {\left({{{{a}}_k}{{{I}}_i} + {b_k}} \right)} = \overline {{{{a}}_i}} {{{I}}_i} + \overline {{b_i}} $ | (6) |
2.2 基于引导滤波的多尺度特征提取与分类
理论上,由于地物本身具有尺度属性,其空间特征也往往需要在不同尺度上加以度量。特征提取的多尺度可以通过不同频率和方向的滤波器模板(Shen和Jia,2011;张刚和马宗民,2010),不同大小的提取窗口(Huang 等,2007),不同大小的结构元素(Benediktsson 等,2005, 2003)以及不同大小的分割区域(刘纯 等,2015;Wang 等,2015)实现。
对波段Bi分别采用半径为1–r的窗口进行引导滤波,获得的多尺度引导滤波特征MGFF(Multi-scale guided filter features)可表示为
${{MGFF}}\left({{{{B}}_i}} \right) = \left\{ {W_G^1\left({{{{B}}_i}} \right), W_G^2\left({{{{B}}_i}} \right), \cdots, W_G^r\left({{{{B}}_i}} \right), {{{B}}_i}} \right\}$ | (7) |
${{MGFF = }}{\left\{ {{{MGFF}}\left({{{{B}}_i}} \right)} \right\}_{i = 1 \cdots d}}$ | (8) |
以高光谱数据Pavia University(Gamba 等,2016)的第二主成分(PC2)为输入图像(图1(a)),图1给出了拓展形态滤波特征(Benediktsson 等,2005)和多尺度引导滤波特征的对比。采用窗口半径分别为2,4,6,8的圆形结构元素,形态滤波特征如图1(b)—(e)。采用窗口半径r为2,4,6,8的方形窗口,以第一主成分(PC1)为引导影像(图1(f)),引导滤波特征如图1(g)—(i)。图1(k)—(m)以3维显示的方式,对比了采用相似尺度滤波后地物结构的保留情况。其中,X,Y坐标为影像的行列号,Z坐标为影像像元的灰度值。
基于上述多尺度引导滤波特征,整体分类流程如图2所示。首先,对高维度的高光谱影像原始数据进行主成分变换(PCA),得到包含98%以上信息的若干个主成分波段PC1—PCn;然后,将包含信息最多的第1主成分波段PC1作为引导影像,将PC1—PCn分别作为输入影像,分别采用[2, 4, 6, 8]4种不同的窗口进行引导滤波运算得到各个尺度下的滤波特征向量,将所有向量与各主成分波段进行堆叠组成多尺度引导滤波特征集;最后,将特征及其对应的类别信息输入分类器中进行模型训练及结果预测。
3 实验结果及分析
为验证特征提取方法的效果,本研究采用一组仿真数据和3幅高光谱数据进行了实验。除了本文提出的多尺度引导滤波特征(MGFF),研究还提取了主成分、多尺度灰度共生矩阵纹理特征MSTF(Multi-Scale Textural Features)(Baraldi和Parmiggiani,1995)和基于拓展形态滤波的多尺度特征EMP(Extended Morphological Profiles)(Benediktsson 等,2003),用于对比。其中,MSTF采用长宽均为[3, 5, 7, 9]的4种正方形窗口,从各主成分的灰度共生矩阵中依次提取。由于实验发现灰度共生矩阵的同质性纹理特征的分类精度在所有提取的纹理属性中分类精度最高,本文提取多尺度同质性纹理特征进行对比实验。EMP通过采用不同大小的结构元素对原始影像进行开闭运算,实现多尺度结构提取。之前的研究结果表明:半径大小相同时,使用圆形结构元素提取特征的分类精度要高于其他类型结构元素的精度(Cao 等,2015)。因此,本研究采用半径为[2, 4, 6, 8]的圆形结构元素提取多尺度空间结构特征。为使得结果具有可比性,本文提出的MGFF也采用相同的半径设置[2, 4, 6, 8]。
4种特征提取后,被输入到支持向量机SVM(Support Vector Machine)(张学工,2010;Chang 等,2011)、随机森林RF(Random Forests)(方匡南 等,2011)和K近邻KNN(K-Nearest Neighbor)(Altman,1992)3种分类器。其中,随机森林分类器通过randomforest-matlab工具箱(Ho,1998)实现,实验中均建立500颗树进行决策,每个节点处选取的特征数则采用该工具包的默认参数。KNN分类器由Matlab2013a中KNN函数实现,近邻数k设置为9,其他参数均采用默认值。评价特征对于地物描述能力通过分类结果的整体精度OA(Overall Accuracy),Kappa系数等分类精度指标,结合目视解译进行整体评价。
3.1 仿真数据实验
3.2 真实高光谱数据介绍
3.3 遥感数据实验结果与分析
表 1 不同提取方法获得的特征维数
Table 1 The dimensions of features obtained by different methods

University | 3 | 15 | 27 | 15 |
Centre | 3 | 15 | 27 | 15 |
Salinas | 3 | 15 | 27 | 15 |
表3给出了基于SVM分类器的多特征分类精度结果。多数情况下,相较于仅仅采用3个主成分的PCA方法,空间特征的加入均显著地提升了分类精度。3种加入空间特征的方法中,MGFF方法的分类精度最高,EMP方法次之,MSTF方法最差。其中,基于MGFF方法的OA及Kappa系数提升最为明显;相比次优的EMP方法,MGFF在Pavia University、Pavia Centre和Salinas数据的OA上的提升分别达到了6.57%、2.97%和4.06%。结合表2,15维MGFF特征获得了比27维EMP特征更高的分类精度;MSTF方法与MGFF方法虽提取出相同维数的特征集,MGFF方法的精度高于MSTF方法。
表 3 不同特征+RF分类器的精度对比
Table 3 Accuracy evaluation of different features based on RF classifier

PCA | MSTF | EMP | MGFF | ||
Pavia University | OA/% | 65.46 | 81.59 | 84.72 | 89.75 |
Kappa | 0.6208 | 0.7754 | 0.8105 | 0.8745 | |
Pavia Centre | OA/% | 96.43 | 94.48 | 97.1 | 98.09 |
Kappa | 0.9502 | 0.9242 | 0.9593 | 0.9732 | |
Salinas | OA/% | 84.47 | 86.08 | 95.97 | 95.84 |
Kappa | 0.8337 | 0.8506 | 0.9557 | 0.9543 | |
注:OA为总体精度。 |
图10还给出Pavia University影像采用不同方法的各类别分类精度对比图。从图10中可以看出:Asphalt(沥青马路)、Gravel(碎石砂砾)和Bare Soil(裸土)3类地物基于MGFF方法的分类精度相对其他3种方法提高的比较明显。考虑到这些类别在影像中均具有较为明显的边界,这体现了引导滤波在具有规则边界的地物的特征提取中具有的优势:很好地保留影像中主要地物空间边缘信息并适当对地物内部进行滤波。
将提取的多种特征分别用于RF分类器时,OA及Kappa精度评价如表3。从表3中可知:对于Pavia University和Centre影像,MGFF方法的OA及Kappa均为最高,OA分别达到89.75%和98.09%,Kappa分别为0.8745和0.9732;而Salinas影像采用MGFF方法的OA值虽然不是最高,为95.84%,但与最高的EMP方法的OA值非常接近,仅相差0.13%,并且明显高于MSTF和PCA方法。这表明,MGFF在包含地物对象结构相对复杂的影像分类中具有优势。
表 4 不同特征+KNN分类器的精度对比
Table 4 Accuracy evaluation of different features based on KNN classifier

PCA | MSTF | EMP | MGFF | ||
Pavia University | OA/% | 67.17 | 68.66 | 80.96 | 85.21 |
Kappa | 0.6342 | 0.6389 | 0.7738 | 0.8207 | |
Pavia Centre | OA/% | 96.07 | 82.76 | 97.22 | 97.62 |
Kappa | 0.9452 | 0.7756 | 0.961 | 0.9667 | |
Salinas | OA/% | 85.1 | 66.97 | 92.29 | 93.69 |
Kappa | 0.84 | 0.6529 | 0.9162 | 0.9311 | |
注:OA为总体精度。 |
图11为Pavia Centre影像采用EMP和MGFF分类结果及细节对比图。从中可以看出:MGFF方法的在区域1中地物的空间细节及轮廓保存完好,也符合该影像真实地表地物;区域2细节图中也反映出Gravel(碎石砂砾)类别的边界保持最好。因此,采用MGFF方法的分类结果无论是精度评价还是视觉效果都要比EMP要好。
不同特征采用KNN分类器,OA及Kappa精度评价如表4。与其他两种分类器情况类似,MGFF方法对于Pavia University 、Centre和Salinas3幅影像的分类精度也是最高的。
4 结 论
志 谢 感谢意大利帕维亚大学P.Gamb教授和F. Dell’Acqua教授提供Pavia University和Centre数据,普渡大学D.Landgrebe教授提供Salinas数据。
