出版日期: 2017-09-25
点击次数:
下载次数:
DOI: 10.11834/jrs.20176239
2017 | Volumn21 | Number 5
上一篇  |  下一篇


基础理论 
小样本的高光谱图像降噪与分类
expand article info 崔宾阁 , 马秀丹 , 谢小云
山东科技大学 计算机科学与工程学院,青岛 266590

摘要

在样本数目稀少情况下实现高光谱图像精细分类是个挑战性的问题。高光谱图像信噪比提高比较困难,噪声大小对分类结果有最直接的影响。利用高光谱图像相邻波段之间的相关性和相邻像素之间的相关性,提出多级降噪滤波的高光谱图像分类方法,通过改进的两阶段稀疏与低秩矩阵分解方法,去除高光谱图像中能量较高的噪声,利用主成分分析方法去除高光谱图像中能量较低的噪声,引导滤波方法去除分类结果图中的“椒盐噪声”。选取两幅真实高光谱图像进行实验,结果表明,两阶段稀疏与低秩矩阵分解法和主成分分析法两种降噪方法具有较强的互补性;引导滤波方法使得分类图更加平滑且分类精度更高。与其他光谱空间分类方法相比,本文方法分类精度更高,且在样本极少时能获得很高的分类精度。

关键词

高光谱图像分类, 特征提取, 稀少样本, 稀疏与低秩, 矩阵分解

Hyperspectral image de-noising and classification with small training samples
expand article info CUI Binge , MA Xiudan , XIE Xiaoyun
College of Information Science and Engineering, Shandong University of Science and Technology, Qingdao 266590, China

Abstract

The fine-grained classification of hyperspectral image with small training samples is a major challenge for all kinds of classifiers. The signal-to-noise ratio of hyperspectral image is usually difficult to improve, and the magnitude of noise has a direct impact on classification results. Thus, noise reduction is one of the most important pretreatment measures for hyperspectral image classification. Employing the strong relevance between adjacent bands of hyperspectral images and the relevance between adjacent pixels in the space, a novel hyperspectral image classification method based on multi-level denoising and filtering is proposed. One two-phase Sparse and Low Rank Matrix Decomposition (SLRMD) method is introduced to remove the noise with high energy. At the first phase, the hyperspectral image is segmented, and each patch will use the SLRMD method to perform noise reduction based on the spectral correlation between the pixels within the same patch. At the second phase, the pixels of all patches will be merged together for noise reduction based on the spectral correlation of the adjacent bands of the hyperspectral image. Secondly, then principal component analysis (PCA) is introduced to remove the noise with low energy. Thirdly, Support Vector Machine (SVM) is used to classify the de-noised and dimension reduced hyperspectral dataset. Finally, guided filter is introduced to remove the " salt and pepper noise” in the classification map. We use the Indian Pines hyperspectral dataset as an example to verify the noise reduction effect of sparse and low rank matrix decomposition methods. The effect of image noise reduction is very obvious, and the bands after noise reduction show very strong correlation. The pixel spectrum of the original image contains a lot of noise information, especially in the first few bands and the last few bands, whereas the pixel spectrum of the low rank image becomes very smooth. The Spectral and Spatial De-Correlation (SSDC) and Local Variance Estimation (LVE) methods were used to evaluate the change of image quality before and after noise reduction. The signal-to-noise ratio of hyperspectral images is significantly improved after low rank matrix decomposition, especially at both ends of the spectral range. Two hyperspectral images, i.e., Indian Pines and University of Pavia, and some related classification methods are used for comparative experiments.The results show that the classification accuracy of our method is 25.85% and 13.2% higher than that of the SVM method, and 6.04% and 5.79% higher than the best method respectively. The two-phase SLRMD method proposed in this paper has better strong noise removal effect than the conventional SLRMD method, and it is more helpful to improve the classification accuracy of hyperspectral image. Moreover, SLRMD, principal component analysis and guided filtering, these three noise reduction and dimension reduction methods are highly complementary, so they should be used together to improve the signal-to-noise ratio of hyperspectral image and make the classification results more natural and smooth.

Key words

hyperspectral image classification, feature extraction, small training samples, sparse and low rank, matrix decomposition

1 引 言

高光谱遥感是在多光谱遥感基础上发展起来的能够同时获取光谱信息和空间信息的遥感技术,其光谱分辨率为纳米级,光谱波段数多达数百个,为地物分类和目标识别提供丰富的光谱信息,因此高光谱图像常用于地物的精细分类(童庆禧 等,2006)。然而,由于Hughes现象,高光谱图像的分类精度随波段数目增加而降低(Hughes,1968)。在训练样本稀少时,研究如何提升高光谱图像分类精度,具有重要的理论意义和应用价值。

由于成像光谱仪波段狭窄导致光成像能量不足,相对于全色和多光谱图像,高光谱图像噪声比较严重。在样本稀少、样本质量较差或可信度较低等情况下,噪声将会对高光谱图像的分类结果造成严重影响。近年来,许多高光谱图像降噪方法被提出,如主成分分析法(PCA)、多维分析法(Liu 等,2012)、全方差法(Yuan 等,2012)等。其中,PCA是一种经典的高光谱图像降维方法,每一个主成分都与前面的主成分线性无关且在剩余成分中包含的信息量(即方差)最大。然而,当噪声的能量较大时,信息量大的主成分分量反而信噪比较低,因此PCA变换并不能保证图像质量更高的主成分分量排在前面(张兵和高连如,2011),可能出现信噪比低的主成分被选为特征波段,而信噪比相对较高的编号较大的主成分被丢弃,导致高光谱图像信息损失和分类精度降低。

为解决这个问题,应该在PCA变换前尽量消除高光谱图像中的强噪声。根据强噪声具有稀疏性的特点,首先利用稀疏与低秩矩阵分解方法将高光谱图像分解成低秩的信号矩阵和稀疏的噪声矩阵,从而将强噪声从高光谱图像数据中分离。然后,利用PCA变换对低秩的信号矩阵降维,同时消除高斯弱噪声。最后,利用边缘保持的滤波方法消除分类结果图的“椒盐噪声”。本文方法通过多级降噪滤波依次去除高光谱图像的强噪声、弱噪声和分类结果图中的噪声,提高高光谱图像的分类精度和质量。

2 图像降噪滤波与高光谱图像分类

2.1 图像降噪滤波方法

本文使用3种图像降噪滤波方法,包括稀疏与低秩矩阵分解方法、PCA方法和引导滤波方法。由于PCA方法的相关资料较多,主要介绍其他两种降噪滤波方法。

2.1.1 稀疏与低秩矩阵分解方法

稀疏与低秩矩阵分解法SLRMD(Sparse and Low Rank Matrix Decomposition)(Wright 等,2009)假设一个2维矩阵 ${{D}} \in {{\bf{R}}^{m \times n}}$ 可以分解为1个稀疏矩阵E和1个低秩矩阵A,分解的数学模型可表示为式(1)的最优化问题

$\begin{array}{*{20}{c}}{\mathop {\rm{min}}\limits_{A,{{E}}} {{\left\| {{A}} \right\|}_*} + \lambda {{\left\| {{E}} \right\|}_1}}\\{\begin{array}{*{20}{c}}{{\rm{s}}{\rm{.t}}{\rm{.}}}&{{{D}} = {{A}} + {{E}}}\end{array}}\end{array}$ (1)

式中, ${\left\| \cdot \right\|_*}$ 是矩阵的核范数,它是矩阵奇异值之和,是矩阵秩的凸近似; ${\left\| \cdot \right\|_1}$ 是矩阵的1范数,它是矩阵各元素绝对值之和,是矩阵0范数的凸近似; $\lambda $ 表示权重系数。

SLRMD的实现方法包括迭代阈值法(Wright 等,2009)、加速邻近梯度法(Beck和Teboulle,2009)、增广拉格朗日乘子法、ALM(Augmented Lagrange Multiplier Method)(Lin 等,2009)等。林宙辰等人提出了两种效率较高的ALM方法,即精确增广拉格朗日乘子法,EALM(Exact ALM)和非精确增广拉格朗日乘子法,IALM(Inexact ALM),后者运算速度可以达到加速邻近梯度法的5倍且同样能够收敛到式(1)中最优化问题的最优解。

增广拉格朗日乘子法(ALM)是针对罚函数法由于罚参数过大引起的数值计算上的困难,结合拉格朗日函数,对非可行点加以惩罚的最优化方法。具体来说,针对式(2)的等式约束最优化问题

$\begin{array}{*{20}{c}}{\min f({{X}})\begin{array}{*{20}{c}}{}&{}\end{array}}\\{\begin{array}{*{20}{c}}{{\rm{s}}{\rm{.t}}{\rm{.}}}&{h({{X}}) = 0}\end{array}}\end{array}$ (2)

构造增广拉格朗日函数

$\begin{array}{l}L({{X}},{{\varLambda}} ,\mu ) = \\f({{X}}) + \left\langle {{\varLambda}} \right.,\left. {h({{X}})} \right\rangle + \displaystyle\frac{\mu }{2}\left\| {h({{X}})} \right\|_{\rm{F}}^2\end{array}$ (3)

式中, $\mu $ 是罚参数, $\mu > 0$ ${{\varLambda}} $ 是拉格朗日乘子, $\left\langle {\left. {{{A}},{{B}}} \right\rangle } \right. = {\mathop{\rm trace}\nolimits} ({{A}}{{{B}}^{\rm{T}}})$ 表示两个矩阵内积。ALM通过迭代获得下面无约束最优化问题的解:

${{X}} = \arg \mathop {\min }\limits_{{X}} L({{X}},{{\varLambda}} ,\mu )$ (4)

针对SLRMD最优化问题(1),令 ${{X}} = ({{A,E}})$ $f({{X}}) = {\left\| {{A}} \right\|_*} + \lambda {\left\| {{E}} \right\|_1}$ $h({{X}}) = {{D}} - {{A}} - {{E}}$ ,构造如下增广拉格朗日函数

$\begin{array}{l}{\mathop{\rm L}\nolimits} ({{A}},{{E}},{{\varLambda }},\mu ) = \\[5pt]{\left\| {{A}} \right\|_*} + \lambda {\left\| {{E}} \right\|_1} + \left\langle {{{{{\varLambda}} ,D}} - {{A}} - {{E}}} \right\rangle + \\[5pt] \displaystyle\frac{\mu }{2}\left\| {{{D}} - {{A}} - {{E}}} \right\|_{\mathop{\rm F}\nolimits} ^2\end{array}$ (5)

在求解式(5)时,首先固定E ${{\varLambda }}$ μ,求解使 ${\mathop{\rm L}\nolimits} ({{A}},{{E}},{{\varLambda }},\mu )$ 最小的A;然后固定A ${{\varLambda}} $ μ,求解使 $L({{A}},{{E}},{{\varLambda }},\mu )$ 最小的E,反复迭代直至算法收敛。为了方便求解计算AE,可以利用软阈值求解公式(Lin 等,2009)

$\begin{array}{l}{{U}}{S_\varepsilon }({{S}}){{{V}}^{\rm{T}}}\\ = \arg \mathop {\min }\limits_{{X}} \varepsilon {\left\| {{X}} \right\|_*} + \frac{1}{2}\left\| {{{X}} - {{W}}} \right\|_{\rm{F}}^2\end{array}$ (6)
${S_\varepsilon }({{W}}) = \arg \mathop {\min }\limits_{{X}} \varepsilon {\left\| {{X}} \right\|_1} + \frac{1}{2}\left\| {{{X}} - {{W}}} \right\|_{\rm{F}}^2$ (7)

式中, $({{U}},{{S}},{{V}}) = svd({{W}})$ $svd$ 是奇异值分解函数; ${S_\varepsilon }(x)$ 的定义如式(8)所示 $(\varepsilon > 0)$ ,是软阈值收缩算子。

${S_\varepsilon }(x) \buildrel\textstyle.\over= \left\{ {\begin{array}{*{20}{c}}{x - \varepsilon } \,\,\,\,\, \quad \\[5pt]{x + \varepsilon } \,\,\,\,\,\, \quad \\[5pt]{0} \,\,\,\,\, \, \quad\end{array}} \right.\begin{array}{*{20}{c}}\!\!\!\!{x > \varepsilon }\\[5pt]{x < - \varepsilon }\\[5pt]{\left| x \right| \leqslant \varepsilon }\end{array}$ (8)

SLRMD方法能够从高光谱图像中分离出低秩的矩阵,而低秩矩阵意味着矩阵的列或行相关性更强、噪声更低,因此许多研究者提出利用SLRMD方法对高光谱图像进行降噪或分类。

2.1.2 引导滤波方法

引导滤波GF(Guided Filter)通过引导图像控制滤波器的输出是一种高效边缘保持滤波方法(He 等,2010)。引导图像可以是输入图像本身,也可以是其他边缘清晰的图像,如PCA变换后的第一主成分分量。引导滤波方法假定在引导图像I和滤波输出q之间存在一个局部线性模型,即在以像素k为中心的窗口 ${{{\omega }}_{{k}}}$ 内,qI的一个线性变换:

$\begin{array}{*{20}{c}}{{{{q}}_i} = {{{a}}_k}{{{I}}_i} + {{{b}}_k},}&{\forall i \in {{{\omega }}_{{k}}}}\end{array}$ (9)

式中, $({{{a}}_k},{{{b}}_k})$ ${{{\omega }}_{{k}}}$ 内是常数。对式(9)的两边求导,可得 $\nabla {{O}} \approx a\nabla {{I}}$ ,这意味着仅当引导图像I有一条边时,滤波输出q中才会有一条边,达到了边缘保持的目的。系数akbk的值可以通过最小化下面的能量函数获得:

${\mathop{\rm E}\nolimits} ({{{a}}_k},{{{b}}_k}) = \sum\limits_{i \in {{{\omega }}_{{k}}}} {({{({{{a}}_k}{{{I}}_i} + {{{b}}_k} - {{{p}}_i})}^2} + \varepsilon {{a}}_k^2)} $ (10)

式中,p是输入图像; $\varepsilon $ 是正则化参数,避免ak的值过大。上式的最优解能够最小化滤波输入p和输出q之间的差异。

由于一个像素i同时包含在多个局部窗口 ${{{\omega }}_{{k}}}$ 内,每个窗口 ${{{\omega }}_{{k}}}$ 计算的qi值都是不同的,因此最终滤波输出可以通过对所有可能的qi值求均值得到,其中 $\left| \omega \right|$ 是窗口 ${{{\omega }}_{{k}}}$ 内像素的数量。

${{{q}}_i} = \frac{1}{\omega }\sum\limits_{k,i \in {{{\omega }}_{{k}}}} {({{{a}}_k}{{{I}}_i} + {{{b}}_k})} $ (11)

引导滤波方法在计算机视觉和计算机图形学等领域应用很广泛,包括图像降噪、细节平滑/增强、图像去雾等。Kang等人(2014a)将引导滤波方法应用于SVM分类结果的后处理,去除分类图中的“椒盐噪声”,使高光谱图像分类精度有显著提高。

2.2 改进的稀疏与低秩矩阵分解方法

现有的SLRMD方法大多是利用高光谱图像波段之间的相关性,即矩阵列之间的高相关性进行低秩矩阵分解(Lu 等,2013Zhang 等,2014Zhao和Yang,2015),但也有利用斑块内部像素之间的相关性,即矩阵行之间的高相关性进行低秩矩阵分解(Xu 等,2015)。本文结合这两种矩阵分解方法的优点,提出了分别利用斑块内部像素之间的相关性和波段之间的相关性进行矩阵分解,也就是两阶段的稀疏与低秩矩阵分解TSLR(Two-phase Sparse and Low Rank matrix decomposition)。具体过程如下:首先,对高光谱图像进行分割,将每个斑块的像素数据组成1个子矩阵,对该子矩阵进行稀疏与低秩矩阵分解;然后,合并所有的低秩子矩阵,对合并后的2维矩阵进行稀疏与低秩矩阵分解。因此,TSLR方法能够充分利用斑块内部像素矩阵的低秩性和高光谱图像光谱矩阵的低秩性,从行和列两个方向上消除高光谱图像中的强噪声。

2.3 基于多级降噪滤波的高光谱图像分类方法

高光谱图像中大多数噪声是随机的能量较低的高斯白噪声,少部分是稀疏的能量较高的强噪声。由于强噪声和高斯白噪声分布模型不同,因此很难用单一的降噪方法同时进行有效的噪声消除。为此,本文提出了应用多种降噪滤波的方法分别消除高光谱图像中不同类型的噪声,获得高信噪比的特征波段,提高高光谱图像的分类精度。由于像素级分类器的分类结果中“椒盐噪声”现象比较严重,本文利用像素类别之间的空间相关性对那些错误标记的像素类别进行校正,同时保持分类结果中的地物边缘与真实地物边缘一致。图1是基于多级降噪滤波的高光谱图像分类方法总体流程图。

图 1 多级降噪滤波的高光谱图像分类流程图
Fig. 1 Hyperspectral image classification flow chart based on multilevel noise reduction

总体流程:首先,利用面向对象的图像分割方法将高光谱图像分割成若干个斑块,这些斑块信息将用于两阶段稀疏与低秩矩阵分解方法对高光谱图像进行降噪,消除图像中的强噪声。然后,利用PCA变换对分解后的低秩矩阵进行降维,去掉后面噪声较多的主成分,保留前n个信噪比较高的主成分。进而,利用SVM分类器和训练样本进行分类,得到一个初步的分类结果。最后,利用第一主成分作为引导图像,对SVM分类器的初步分类结果进行边缘保持滤波,生成最终的分类结果图。

基于多级降噪滤波的高光谱图像分类步骤:

(1) 使用面向对象的分割方法对高光谱图像进行分割,生成分割图 ${{S}} = \{ {{{S}}^{(1)}},{{{S}}^{(2)}}, \cdots ,{{{S}}^{(P)}}\} $ 。(2) 稀疏与低秩矩阵分解(第1阶段):  $\begin{array}{*{20}{c}}{for}&{r = 1:p}\end{array}$  构造矩阵 ${{{D}}^{(r)}} \in {{\bf {R}}^{\left| {{{S}}(r)} \right| \times n}}$ $\left| \cdot \right|$ 表示集合的基数, ${{{D}}^{(r)}}$ 中的每一行对应同质斑块 ${{{S}}^{(r)}}$ 中的一个像素;  ${{{D}}^{(r)}}$ 转置,使矩阵每一列对应一个像素;  $\{ {{{A}}^{(r)}},{{{E}}^{(r)}}\} = {\mathop{\rm IALM}\nolimits} ({{{D}}^{(r)}})$ ,IALM函数表示利用非精确增广拉格朗日乘子法对矩阵做稀疏与低秩分解, ${{{A}}^{(r)}}$ 是分解后的低秩矩阵, ${{{E}}^{(r)}}$ 是分解后的噪声矩阵;  $end$ (3) 稀疏与低秩矩阵分解(第2阶段): 1)构造低秩矩阵 ${{A}} = \{ {{{A}}^{(1)}},{{{A}}^{(2)}}, \cdots ,{{{A}}^{(p)}}\} $ ,将各个斑块的低秩数据组织成图像矩阵A; 2)A转置,使A的每一列对应一个光谱波段; 3) $\{ {{A'}},{{E'}}\} = {\mathop{\rm IALM}\nolimits} ({{A}})$ ,对矩阵A做稀疏与低秩分解;(4) PCA变换: ${{A''}} = {\text{PCA}}({{A'}},dims)$ $dims$ 表示新的特征空间的维数;(5) 利用SVM分类器和训练样本集T对数据集 ${{A''}}$ 分类,得到分类图 ${{M}} = {\mathop{\rm SVM}\nolimits} ({{A''}},{{T}})$ ;(6) 将高光谱图像的第一主成分作为引导图像,对分类图进行引导滤波,去除“椒盐噪声”,输出分类图 $ClassMap = {\rm{GF}}({{M}},{\rm{PCA}}({{D}},1))$

3 实验与分析

3.1 实验数据集

(1) Indian Pines。利用机载可见光/红外成像光谱仪(AVIRIS)获取的来自印第安纳州西北部Indian Pines农业试验场的高光谱图像。主要地物类型包括玉米、大豆、苜蓿、小麦、燕麦、草、树等,部分地物还进行了细分,比如玉米分为免耕法、少耕法和传统耕作法3种类型,总共16种地物。图像空间分辨率为20 m,220个波段,光谱范围为400—2500 nm。Indian Pines图像很多波段噪声严重,从数据集删除20个水吸收严重的波段(104—108, 150—163, 200),最后得到200个波段。图2给出了Indian Pines三波段假彩色图和地面真值图。

(2) University of Pavia。利用反射光学系统成像光谱仪(ROSIS-03)获取的来自帕维亚大学的高光谱图像。主要地物类型包括柏油马路、草地、砂砾、树、金属板、裸露土壤、沥青屋顶、砖地和阴影,总共9种对象。图像空间分辨率为1.3 m,103个波段,光谱范围为430—860 nm。图3给出了University of Pavia三波段假彩色图和地面真值图。

图 2 Indian Pines数据集
Fig. 2 Indian Pines data set
图 3 帕维亚大学数据集
Fig. 3 University of Pavia data set

3.2 高光谱图像降噪实验

以Indian Pines高光谱数据集为例验证稀疏与低秩矩阵分解方法的降噪效果。图4是Indian Pines高光谱图像的第1—3波段,这3个波段都受到噪声污染,第1波段噪声尤其严重。图5是矩阵分解后的低秩图像的第1—3波段。从图5可以看出,图像降噪的效果非常明显,而且降噪后的波段之间表现出较强的相关性。

图 4 Indian Pines高光谱图像的第1—3波段
Fig. 4 Indian Pines hyperspectral image of band 1 to band 3
图 5 低秩矩阵分解后高光谱图像的第1—3波段
Fig. 5 Indian Pines hyperspectral image after low rank matrix decomposition of band 1 to band 3

图6给出了Indian Pines图像在矩阵分解前后某一列像素的光谱,图6(b)图6(c)分别是蓝色实线所在的列像素光谱在矩阵分解前后的结果。根据图6(b)中的地面真值数据,蓝色实线所在的列共包含了5种地物类型,从上到下分别为:免耕玉米、草树混生、少耕大豆、小麦、少耕玉米。从图6可以看出原始图像的像素光谱中包含了很多噪声信息,尤其是在前几个波段和最后几个波段;低秩图像的像素光谱变得非常平滑,除了第2类地物光谱变化比较大之外,其他地物类型的像素光谱都高度相似,因而矩阵是低秩的。第2类地物(红色斑块内)是草和树的混生区,地物分布不均匀导致像素光谱多样化。

3.3 高光谱图像降噪能力分析

信噪比SNR(Signal-to-Noise Ratio)是衡量遥感图像质量的重要指标。由于真实的高光谱图像理论上无法获得对应的无噪声的波段,因此常用的图像信噪比评价指标,如峰值信噪比(PSNR)、结构相似性指数(SSIM)都不能应用。为此,本文引入了光谱/空间维去相关法和局部方差估计法对图像信噪比进行估计。

光谱和空间维去相关法SSDC(Spectral and Spatial De-Correlation method)是一种专门针对高光谱图像的噪声评估方法,它利用高光谱图像空间维和光谱维存在高相关性的特点,通过多元线性回归去除具有高相关性的信号,利用得到的残差图像对噪声进行估算。该方法受地物覆盖类型影响小,并且可以自动执行,是目前较为稳定的高光谱图像噪声评估方法。将高光谱图像波段的平均值与估算得到的噪声值之比转成dB数就是波段的信噪比。

图 6 图像降噪前后某一列像素的光谱变化
Fig. 6 Spectral changes of a column of pixels before and after image noise reduction

另一种图像信噪比的估计方法是计算图像信号与噪声的功率谱之比。但通常功率谱难以计算,可以近似估计图像信噪比,即信号与噪声的方差之比。首先计算图像中所有像素的局部方差,然后将局部方差的最大值认为是信号方差,最小值是噪声方差,求出它们的比值,再转成dB数,最后用经验公式修正(邹谋炎,2001)。该方法通常被称为局部方差估计法LVE(Local Variance Estimation method)。

图7图8分别为采用SSDC方法和LVE方法对Indian Pines高光谱图像信噪比估计的结果。可以看出,尽管SSDC方法和LVE方法的计算原理不同,对图像信噪比估计的结果差异较大,但低秩矩阵分解后高光谱图像的信噪比都有显著的提高,在图像光谱范围的两端尤为明显。

下面分析稀疏与低秩矩阵分解对主成分分析的影响。图9是对原始图像和低秩图像做PCA变换后各个主成分分量的信噪比。由于相邻主成分分量光谱不相关,并且各个主成分分量的均值接近于0,因此只能采用LVE方法来估计信噪比。可以看出,原始图像中某些编号较小/特征值较大的主成分,如第7、8、10主成分信噪比极低,但编号比它们大的某些主成分信噪比较高。如果特征提取是根据编号顺序选择光谱特征,则噪声图像极有可能被包含在特征组合中,从而对图像分类造成严重影响。低秩图像经过PCA变换后,编号较小的主成分信噪比都相对较高,没有出现个别主成分信噪比极低的情况,这是由于强噪声已经从图像中去除,特征值大的主成分信号强度也较大,因此图像信噪比较高。

图 7 采用SSDC方法估计图像信噪比
Fig. 7 Estimation of image SNR using SSDC method
图 8 采用LVE方法估计图像信噪比
Fig. 8 Estimation of image SNR using LVE method

表1是对原始图像和低秩图像做PCA变换后前15个主成分特征值和累加贡献率。可以看出,原始图像PCA变换后前15个主成分累加贡献率为99.823%,而低秩图像PCA变换后前5个主成分的累加贡献率已经达到99.837%。可见,经过SLRMD降噪后图像信息量集中度更高。

图 9 PCA变换后主成分分量的信噪比
Fig. 9 SNR of principal components after PCA transformation

表 1 原始图像和低秩图像的特征值和累加贡献率
Table 1 The eigenvalue and the cumulative contribution rate of the original image and the low rank image

下载CSV 
主成分 原始图像 低秩图像
特征值 累加贡献率/% 特征值 累加贡献率/%
1 25383058 72.488 24917289 72.131
2 8629680 97.133 8894965 97.880
3 606422 98.865 517535 99.378
4 128535 99.232 105838 99.685
5 69273 99.4292 52635 99.837
6 53270 99.582 38544 99.949
7 25983 99.656 7523 99.971
8 13617 99.695 2890 99.979
9 12670 99.731 2136 99.985
10 8335 99.755 1538 99.990
11 6824 99.774 1055 99.993
12 5836 99.791 834 99.995
13 5054 99.805 604 99.997
14 3164 99.814 415 99.998
15 3035 99.823 251 99.999

3.4 高光谱图像分类

本节使用两个高光谱数据集阐述各种图像降噪方法对高光谱图像分类精度的影响。每一种方法都是采用高斯径向基核函数的SVM作为分类器,参数通过五重交叉验证获得。对比的方法包括:像素级SVM、SLRMD(SLR-SVM)、PCA(PCA-SVM)、应用SLRMD和PCA的降噪方法(SLR-PCA-SVM)、两阶段SLRMD降噪方法(TSLR-SVM)、应用TSLR和PCA的降噪方法(TSLR-PCA-SVM)、应用TSLR和PCA对图像降噪处理并对分类结果滤波的方法(TSLR-PCA-GF)。基于图像融合和递归滤波的高光谱图像特征提取方法(IFRF)被用来同本文方法进行对比(Kang 等,2014b)。每次训练样本是从可用样本集中随机选取,剩余所有样本都作为测试样本。所有结果都是通过30次蒙特卡洛运行后计算均值和标准差获得。

对于Indian Pines图像,每个类别中随机选取12个样本作为训练样本,燕麦因为样本数目太少只选取10个训练样本。训练样本占总样本数的1.85%。表2给出了各种方法的总体精度(OA)、平均精度(AA)、Kappa系数和不同地物类型的分类精度(CA)。每一个数据项的左边是30次重复实验的均值,右边是30次重复实验的标准差。从表2中可以看出,由于样本数目太少,大部分分类方法的精度都较低,SVM分类器的总体精度只有58.79%。PCA-SVM方法的总体精度比SVM还要低2.78%,这是因为降维后前15个主成分包含4个噪声严重的图像,从而影响了分类精度。SLR-SVM方法的总体精度比SVM高3.02%,但SLRMD与PCA结合的方法SLR-PCA-SVM总体精度比SVM提高9.51%,说明这两种方法具有互补性。SLRMD方法去除了强噪声之后,前15个主成分中没有噪声严重的图像。TSLR-SVM方法的总体精度比SVM高6.72%,比SLR-SVM方法提高了3.7%,TSLR与PCA结合的方法TSLR-PCA-SVM总体精度比SVM提高了18.71%,这是因为TSLR方法能够更加有效地去除强噪声,减少了强噪声对PCA主成分排序的干扰。TSLR-PCA-GF方法消除了分类图中的“椒盐噪声”,分类精度最高,比SVM方法提高25.85%,比IFRF方法提高6.04%。图10是某一次实验获得的地物分类图,可以看出TSLR-PCA-GF方法的分类结果更平滑且接近于地面真值图。

对于University of Pavia图像,每个类别中随机选取19个样本作为训练样本,训练样本占总样本数的0.4%。表3给出了各种方法的总体精度、平均精度、Kappa系数和每一种地物的分类精度。数据项的左边是30次重复实验的均值,右边是30次重复实验的标准差。从表3中可以看出,由于样本数目太少,SVM分类器的总体精度只有74.12%。PCA-SVM方法的总体精度比SVM还要低1.58%,SLR-SVM方法的总体精度比SVM低0.69%,说明该图像中强噪声较少,SLRMD方法降噪效果不明显,但SLR与PCA结合的方法SLR-PCA-SVM总体精度比SVM提高4.48%,再次验证了这两种降噪方法具有互补性。TSLR-SVM方法的总体精度比SVM提高了3.2%,但TSLR与PCA结合的方法TSLR-PCA-SVM总体精度比SVM提高了13.2%,证明了这两种降噪方法对于高光谱图像分类都是非常重要的。TSLR-PCA-GF方法的分类精度达到了93.11%,比SVM高18.99%。IFRF方法在样本稀少时分类精度不高,总体精度均值只有79.2%。图11是某一次实验获得的地物分类图,可以看出TSLR-PCA-GF方法的分类结果接近于地面真值图。

表 2 Indian Pines高光谱图像不同方法分类精度(30次重复实验,“±”左边是均值,右边是标准差)
Table 2 Classification accuracies (Indian Pines image) in percent for the different methods as an average after 30 repeated experiments (The left of the symbol “±” is the mean value and the right is the standard deviation)

下载CSV 
类别 样本 分类精度/%
训练 测试 SVM SLR-SVM PCA-SVM SLR-PCA-SVM TSLR-SVM TSLR-PCA-SVM IFRF TSLR-PCA-GF
Alfalfa 12 34 38.21±13.16 44.59±17.16 47.52±13.48 67.86±17.69 57.81±22.28 87.54±14.52 78.14±28.26 100.00±0.00
Corn-N 12 1416 49.25±11.29 52.17±8.17 53.57±5.64 72.04±6.06 56.63±8.21 70.54±11.21 75.34±14.29 88.98±6.79
Corn-M 12 818 44.68±11.81 47.41±11.44 27.70±7.31 51.27±11.35 52.38±11.44 72.31±16.47 66.43±12.53 83.65±15.45
Corn 12 225 27.98±5.76 32.24±6.60 21.80±6.85 43.24±7.84 31.94±6.58 45.67±14.18 63.15±10.81 60.22±10.75
Grass-M 12 471 71.94±12.83 75.29±10.93 78.50±8.54 86.27±9.75 77.76±11.94 89.88±8.72 84.92±9.79 96.03±5.84
Grass-T 12 718 85.53±4.83 85.64±4.88 92.78±3.45 94.01±3.29 88.37±5.21 94.42±5.67 92.87±6.85 98.18±3.57
Grass-P-M 12 16 44.95±17.16 52.92±20.11 25.53±9.54 69.07±15.10 60.92±22.07 87.00±19.74 31.72±13.06 90.24±18.75
Hay-W 12 466 97.18±1.94 97.75±1.81 99.17±0.63 99.77±0.30 98.16±1.63 100.00±0.00 99.99±0.04 100.00±0.00
Oats 10 10 23.23±7.53 28.65±9.01 15.73±6.80 41.44±14.96 38.71±14.12 87.59±20.68 24.35±19.04 98.54±7.99
Soybean-N 12 960 49.98±6.69 53.47±6.10 40.45±6.62 52.49±9.43 58.23±6.96 69.90±8.64 68.52±10.21 75.39±11.67
Soybean-M 12 2443 68.54±5.27 72.55±6.50 61.93±8.84 73.09±5.33 75.52±5.99 84.71±7.94 87.52±8.07 88.94±8.63
Soybean-C 12 581 31.58±4.55 33.18±4.56 44.73±8.84 53.52±7.41 37.31±4.55 53.18±9.27 69.43±10.60 66.31±11.20
Wheat 12 193 85.73±4.61 86.67±6.07 84.45±4.62 96.06±2.85 90.71±5.56 99.71±0.87 75.31±14.57 100.00±0.00
Woods 12 1253 91.90±2.78 93.63±2.16 92.33±2.03 93.31±1.78 93.78±3.05 96.16±3.54 98.26±1.18 97.30±2.54
Buildings- G-T-D 12 374 40.90±8.32 40.69±7.88 38.99±7.37 44.59±11.16 45.72±9.09 64.03±13.00 81.13±8.32 69.11±14.89
Stones 12 81 83.19±18.94 85.07±15.58 84.74±13.99 86.44±11.76 81.86±17.92 90.72±12.23 95.92±9.63 93.54±9.26
OA 58.79±3.03 61.81±2.41 56.01±3.96 68.30±3.26 65.51±2.67 77.50±3.39 78.60±3.98 84.64±4.33
AA 58.42±3.10 61.37±2.44 56.87±2.56 70.28±2.67 65.36±2.27 79.74±2.60 74.56±3.46 87.90±2.70
Kappa 53.86±3.21 57.17±2.61 51.14±4.11 64.56±3.49 61.21±2.95 74.68±3.71 75.93±4.35 82.68±4.78
图 10 Indian Pines高光谱图像分类结果(每种地物最多12个训练样本)
Fig. 10 Classification results (Indian Pines image) (Each land cover has up to 12 training samples)

表 3 University of Pavia高光谱图像不同方法分类精度(30次重复实验,“±”左边是均值,右边是标准差)
Table 3 Classification accuracies (University of Pavia) in percent for the different methods as an average after 30 repeated experiments (The left of the symbol “±” is the mean value and the right is the standard deviation)

下载CSV 
类别 样本 分类精度/%
训练 测试 SVM SLR-SVM PCA-SVM SLR-PCA-SVM TSLR-SVM TSLR-PCA-SVM IFRF TSLR-PCA-GF
Asphalt 19 6612 93.69±3.08 93.68±3.34 89.19±3.53 91.81±2.96 95.51±3.25 97.70±2.33 72.91±8.81 96.93±3.30
Meadows 19 18630 91.09±3.04 90.41±3.62 90.00±1.78 93.23±1.60 92.12±3.36 95.68±3.39 96.75±1.61 98.08±1.51
Gravel 19 2080 53.96±8.25 54.22±9.14 47.58±7.20 58.61±6.46 65.24±7.17 85.86±9.26 65.20±8.22 86.42±11.50
Trees 19 3045 68.21±11.21 66.88±11.50 69.67±10.44 68.88±11.32 70.20±12.14 75.88±15.71 68.12±11.91 85.64±11.42
MetalSheets 19 1326 93.54±3.87 92.33±6.05 99.42±1.30 99.99±0.03 93.42±3.63 94.74±4.20 99.60±1.07 100.00±0.00
BareSoil 19 5010 47.27±7.19 46.18±8.92 46.95±6.58 61.92±9.41 50.77±9.78 59.49±12.48 79.40±10.50 86.48±10.98
Bitumen 19 1311 51.71±6.99 53.39±7.51 44.22±6.72 49.51±7.41 58.15±11.64 80.11±12.15 74.18±9.21 93.29±6.75
Bricks 19 3663 75.79±6.87 76.05±8.67 66.28±6.65 71.56±4.91 79.39±5.08 85.65±5.06 56.69±7.88 86.99±4.88
Shadows 19 928 99.86±0.16 99.91±0.13 99.62±0.64 99.91±0.14 99.71±0.30 98.86±1.10 51.26±15.07 99.31±0.79
OA 74.12±3.41 73.43±4.02 72.54±3.71 78.96±3.47 77.32±3.68 87.32±3.01 79.20±3.91 93.11±3.37
AA 75.02±2.20 74.78±2.80 72.55±2.65 77.27±2.37 78.28±2.35 85.34±2.61 73.79±3.49 92.57±2.94
Kappa 67.50±3.69 66.69±4.53 65.30±4.13 73.16±3.98 71.40±4.23 83.55±3.65 73.38±4.55 91.02±4.23
图 11 University of Pavia高光谱图像分类结果(每种地物19个训练样本)
Fig. 11 Classification results (University of Pavia image) (Each land cover has 19 training samples)

4 结 论

本文利用稀疏与低秩矩阵分解、PCA变换和引导滤波3种方法之间的互补性,实现高光谱图像精细分类的多级降噪滤波方法,解决了由于高光谱图像波段狭窄导致信噪比较低和分类结果较差的问题。其中,高光谱图像的强噪声分两个阶段去除:第1阶段是利用斑块内部像素光谱的相关性,通过稀疏与低秩矩阵分解去除像素中的强噪声;第2阶段是利用相邻波段的相关性,通过稀疏与低秩矩阵分解去除波段的强噪声。高光谱图像中的弱噪声将利用PCA去除,而分类结果图中的“椒盐噪声”将利用引导滤波方法去除。实验结果表明,这些降噪方法组合不仅能够显著改善噪声严重波段的图像质量,而且在样本稀少时同样能够获得较高的分类精度。

高光谱图像噪声来源复杂,类型多样,传统降噪方法是以PCA为代表的特征空间变换方法,认为信息量较大的投影方向是图像信号,信息量较小的投影方向是图像噪声。然而,由于高光谱图像中可能存在强噪声,很容易出现噪声方向被当作主成分提取出来,从而严重影响降维后的高光谱图像质量和分类精度。近年来兴起的以稀疏与低秩矩阵分解为代表的降噪方法认为噪声是稀疏的,去除噪声后的图像信号是强相关的,也即是低秩的,因此通过低秩矩阵分解可以将噪声从图像信号中分离出去。实际上,高光谱图像中只有强噪声是稀疏的,能量低的高斯白噪声是普遍存在的,因此上述假设是不完全成立的。在两幅真实高光谱图像上的实验结果也表明,单独使用这两种方法时对分类精度影响不大,甚至还略有下降。然而,本文将这两种互补的降噪方法组合应用后,图像分类精度提高10%和4%左右。将SLRMD方法升级为两阶段SLRMD方法后,分类精度提高19%和13%左右。最后应用引导滤波的目的是对分类结果图进行平滑,结果使图像分类精度进一步提高了6%左右。

本文对高光谱图像中存在的噪声类型划分还较粗糙,只大致分为强噪声和弱噪声两种类型,并给出了不同的处理方法。下一步工作包括细分高光谱图像的噪声类型,分析其信号特征和规律,研究更加有针对性的噪声消除方法,从而进一步提升高光谱图像的质量和提高图像分类精度。

参考文献(References)

  • Beck A and Teboulle M. 2009. A fast iterative shrinkage-thresholding algorithm for linear inverse problems. SIAM Journal on Imaging Sciences, 2 (1): 183–202. [DOI: 10.1137/080716542]
  • He K M, Sun J and Tang X O. 2010. Guided image filtering//Proceedings of the 11th European Conference on Computer Vision. Heraklion, Crete: Springer: 1–14
  • Hughes G. 1968. On the mean accuracy of statistical pattern recognizers. IEEE Transactions on Information Theory, 14 (1): 55–63. [DOI: 10.1109/TIT.1968.1054102]
  • Kang X D, Li S T and Benediktsson J A. 2014a. Spectral-spatial hyperspectral image classification with edge-preserving filtering. IEEE Transactions on Geoscience and Remote Sensing, 52 (5): 2666–2677. [DOI: 10.1109/TGRS.2013.2264508]
  • Kang X D, Li S T and Benediktsson J A. 2014b. Feature extraction of hyperspectral images with image fusion and recursive filtering. IEEE Transactions on Geoscience and Remote Sensing, 52 (6): 3742–3752. [DOI: 10.1109/TGRS.2013.2275613]
  • Lin Z C, Chen M M and Ma Y. 2009. The Augmented Lagrange Multiplier Method for Exact Recovery of Corrupted Low-Rank Matrices. Technical Report UILU-ENG-09-2215. arXiv: 1009.5055 [DOI: 10.1016/j.jsb.2012.10.010]
  • Liu X F, Bourennane S and Fossati C. 2012. Nonwhite noise reduction in hyperspectral images. IEEE Geoscience and Remote Sensing Letters, 9 (3): 368–372. [DOI: 10.1109/LGRS.2011.2169041]
  • Lu X Q, Wang Y L and Yuan Y. 2013. Graph-regularized low-rank representation for destriping of hyperspectral images. IEEE Transactions on Geoscience and Remote Sensing, 51 (7): 4009–4018. [DOI: 10.1109/TGRS.2012.2226730]
  • Tong Q X, Zhang B, Zheng L F. 2006. Hyperspectral Remote Sensing - Principle, Technology and Application. Beijing: Higher Education Press, 1–2 (童庆禧, 张兵, 郑兰芬. 2006. 高光谱遥感——原理、技术与应用. 北京: 高等教育出版社, 1–2)
  • Wright J, Ganesh A, Rao S and Ma Y. 2009. Robust principal component analysis: exact recovery of corrupted low-rank matrices via convex optimization//Proceedings of the 23rd Annual Conference on Neural Information Processing Systems. Vancouver, British Columbia: DBLP: 1–9
  • Xu Y, Wu Z B and Wei Z H. 2015. Spectral-spatial classification of hyperspectral image based on low-rank decomposition. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 8 (6): 2370–2380. [DOI: 10.1109/JSTARS.2015.2434997]
  • Yuan Q Q, Zhang L P and Shen H F. 2012. Hyperspectral image denoising employing a spectral-spatial adaptive total variation model. IEEE Transactions on Geoscience and Remote Sensing, 50 (10): 3660–3677. [DOI: 10.1109/TGRS.2012.2185054]
  • Zhang B and Gao L Y. 2011. Hyperspectral Image Classification and Target Detection. Beijing: Science Press: 52–55 (张兵, 高连如. 2011. 高光谱图像分类与目标探测. 北京: 科学出版社: 52–55)
  • Zhang H Y, He W, Zhang L P, Shen H F and Yuan Q Q. 2014. Hyperspectral image restoration using low-rank matrix recovery. IEEE Transactions on Geoscience and Remote Sensing, 52 (8): 4729–4743. [DOI: 10.1109/TGRS.2013.2284280]
  • Zhao Y Q and Yang J X. 2015. Hyperspectral image denoising via sparse representation and low-rank constraint. IEEE Transactions on Geoscience and Remote Sensing, 53 (1): 296–308. [DOI: 10.1109/TGRS.2014.2321557]
  • Zou M Y. 2001. Deconvolution and Signal Recovery. Beijing: National Defense Industry Press: 185–189 (邹谋炎. 2001. 反卷积和信号复原. 北京: 国防工业出版社: 185–189)