出版日期: 2019-07-25
点击次数:
下载次数:
DOI: 10.11834/jrs.20197475
2019 | Volumn23 | Number 4
上一篇  |  下一篇


技术方法 
综合多特征的极化SAR图像随机森林分类算法
expand article info 徐乔1 , 张霄1 , 余绍淮1 , 陈启浩2 , 刘修国2
1. 中交第二公路勘察设计研究院有限公司 武汉 430056
2. 中国地质大学(武汉) 信息工程学院,武汉 430074

摘要

为抑制相干斑噪声对极化SAR图像分类结果的干扰,本文提出一种综合多特征的极化SAR图像随机森林分类方法。该方法首先利用简单线性迭代聚类(SLIC)算法生成超像素作为分类单元;然后,基于高维极化特征图像,利用训练好的随机森林模型,统计决策树的分类投票数,计算各超像素的类别概率;最后,利用超像素间的空间邻域特征,采用概率松弛算法(PLR)迭代修正超像素的类别后验概率,并依据最大后验概率(MAP)准则得到分类结果;实现综合利用超像素和空间邻域特征,降低相干斑噪声干扰的极化SAR图像分类方法。实验对比结果表明:本文方法能得有效抑制极化SAR图像中相干斑噪声的干扰,得到高精度且光滑连续的分类结果。

关键词

遥感, 极化SAR, 分类, 多特征, 随机森林, 超像素, 概率松弛算法

Multi-feature-based classification method using random forest and superpixels for polarimetric SAR images
expand article info XU Qiao1 , ZHANG Xiao1 , YU Shaohuai1 , CHEN Qihao2 , LIU Xiuguo2
1.China Communications Construction Company Second Highway Consultants Co.Ltd, Wuhan 430056, China
2.Faculty of Information Engineering, China University of Geosciences(wuhan), Wuhan 430074, China

Abstract

The classification technique plays an important role in the analysis of polarimetric synthetic aperture radar (PolSAR) images. PolSAR image classification is widely used in information extraction and scene interpretation or is performed as a preprocessing step for further applications. However, speckle noise appears in PolSAR images because of the coherent interference of waves reflected from elementary scatters. Such inherent speckle noise degrades the classification performance and brings difficulty for PolSAR image classification. Therefore, a novel supervised multi-feature-based classification method was proposed in this study. This method combined polarimetric signature information and spatial context information based on the random forest model. First, a modified simple linear iterative clustering algorithm was utilized to generate superpixels as classification elements by using the Pauli RGB image, which helped reduce speckle noise interference. Second, a high-dimensional polarimetric SAR feature image was constructed by collecting various polarimetric signatures generated by polarimetric decomposition and algebra operations. Then, the random forest model was trained on the basis of the PolSAR feature image by using training samples, and the number of classification votes of each decision tree in the random forest for each pixel was counted to compute the class probabilities of the superpixels. Finally, a neighborhood function was defined to express the spatial relationship among adjacent superpixels quantitatively, and the class probabilities of the superpixels were recalculated by the predefined neighborhood function in a Probabilistic Label Relaxation (PLR) procedure to reduce the interference of speckle noise. The final classification result was obtained by the maximum a posteriori decision rule when the iteration of PLR was terminated. Comparative experiments using different RADARSAT-2 images were conducted to evaluate the validity and applicability of the proposed method. The proposed approach achieved the highest accuracy (94.39% on the Flevoland RADARSAT-2 image and 85.09% on the Wuhan RADARSAT-2 image) and generated accurate and consistent classification results for the experimental images, which was considerably improved compared with those of other methods. Therefore, the proposed method can effectively suppress the interference of speckle noise by using superpixels and spatial context information and obtain accurate and consistent classification results for PolSAR images.

Key words

remote sensing, polarimetric SAR, classification, multifeature, random forest, superpixels, probabilistic label relaxation

1 引 言

合成孔径雷达以其全天时、全天候的成像能力,广泛应用于目标检测和测绘制图等方面。通过发射和接收不同极化状态的电磁波,极化SAR图像能获取丰富的地物信息,因而在地物分类中具有明显优势(Lee 等,2001)。但极化SAR图像特有的相干斑噪声会干扰地物分类的精度,综合利用极化特征和空间邻域特征分类是抑制相干斑噪声提高分类精度的一种有效方法。

表征极化SAR图像信息的极化特征众多,这为地物类别的准确区分提供了可能,同时也给分类带来了困难,极化特征的选择和分类规则集的构建是一个难点。Chen等(2010)采用一种平衡特征维数与精度的SVM特征选择策略,对极化SAR数据的实验表明采用所选特征的分类精度比利用所有特征的分类精度要高;Maghsoudi等(2013)采用以SVM分类精度作为评价准则的封装式特征选择方法,对极化SAR数据的三大类共58个特征进行选择,实验证明加入特征选择能够提高分类的精度;Ataollah等采用一种结合遗传算法和人工神经网络的特征选择方法,结果表明采用所选特征分类精度最好(Haddadi 等,2011)。然而,当前仍较难确定极化特征的重要性,且数据类型及场景条件限制了分类规则集的应用(Blaschke,2010)。

随机森林是一个由多个决策树构成的组合分类器,面对高维特征,可通过少量样本的训练构建分类规则,能抑制过拟合,具有分类表现优异、人工干预少和运算速度快等优点,且对噪声数据具有很好的鲁棒性(Breiman,2001)。目前,随机森林分类算法已被成功应用到极化SAR图像分类中(孙勋 等,2016Wang 等,2017);基于此,本文引入随机森林算法以充分利用极化SAR图像的极化信息。然而,随着极化SAR图像分辨率的提高,相干斑噪声对分类结果的干扰更严重,传统基于像素的分类结果中存在椒盐现象且目视效果差、分类精度低(Benz和Pottier,2001Wu 等,2008)。为克服上述问题,以超像素为分类单元的极化SAR图像分类算法取得较好效果(Liu 等,2013Feng 等,2014)。

近年来,部分学者在极化SAR图像分类中引入马尔可夫随机场(MRF)描述空间领域特征,实验表明利用空间邻域特征能有效提高极化SAR图像的分类精度(Niu和Ban,2012Akbari 等,2013);与经典的马尔可夫随机场相比,概率松弛算法(PLR)能较好描述像素空间邻域关系且计算简单(Reigber 等,2010),本文将PLR引入到极化SAR图像中以定量描述空间相邻特征。为此,本文利用改进的简单线性迭代聚类(SLIC)算法生成的超像素为分类单元,基于随机森林分类框架,利用PLR算法对分类结果修正,实现综合利用极化特征和空间邻域特征的极化SAR图像分类算法。最后使用不同地区的极化SAR数据验证该分类算法的有效性。

2 极化SAR图像特征提取

与单极化SAR相比,极化SAR数据包含更为丰富的地物散射信息。地物目标的极化散射信息常用散射矩阵、相干矩阵或协方差矩阵表达,从中充分提取地物极化信息是影响极化SAR图像分类精度的重要因素。

极化SAR图像特征提取有两种方法,一种是基于测量矩阵的代数运算,主要是通过对测量矩阵进行简单的数学变换,得到一系列极化特征,包括极化功率,相位差,极化相关系数等;另外一种是极化目标分解方法,该方法通过对测量矩阵用不同的分解模型得到对应的极化特征。依据所处理的数据类型,极化目标分解分为相干分解和非相干分解。相干分解适用于散射矩阵,典型方法有Pauli分解和Krogager分解;非相干分解是利用协方差矩阵或相干矩阵,这类方法包括Cloude-Pottier分解,Yamaguchi分解,Freeman分解等。地物的散射机理常采用极化目标分解方法来分析,不同方法可从不同角度描述地物的散射属性,单一的目标分解方法难以适用于不同的分类场景。

为在分类过程中充分利用极化信息,本文利用上述两种方法,提取极化SAR图像特征信息并用于极化SAR图像分类。表1为本文所用的极化特征及其物理意义。

表 1 本文所用极化特征及其物理意义
Table 1 The polarimetric signatures and its physical meanings used in this paper

下载CSV 
极化特征 物理意义
极化总功率 反映地物后向散射总能量大小
各极化通道功率 各自极化组合下的后向散射能量大小
相关系数 反映目标介电常数和表面粗糙度敏感程度
同极化相位差 表面散射值小,二面角散射值大
极化比 包括同极化比和交叉极化比,用于描述地表粗糙度对地表散射的影响
圆极化相关系数 表示左旋极化和右旋极化的相关性
归一化圆极化相系数 反映地物的对称与非对称性,增强非对称性的人工目标
Pauli分解 分解分量表征不同地物散射类型:单次或奇次散射机理,偶次散射机理,45°取向二面角散射体
H-α-A分解 H表征分解目标的统计无序程度;A描述第二与第三散射机理的相对重要性;α表征目标的散射机理与目标的朝向
Yamaguchi分解 分解分量表征不同地物散射类型:表面散射,偶次散射,体散射和螺旋散射

3 综合多特征的随机森林超像素分类

3.1 极化SAR图像SLIC超像素生成算法

超像素是指具有相似纹理、颜色、亮度等特征的一系列空间连续像素的集合;超像素能较好保持地类边界轮廓特征,特别是图像中目标的固有边界轮廓特征。众多超像素生成算法中,SLIC算法利用K均值聚类算法,能生成紧凑、近似均匀的超像素,已在光学遥感影像中得到较好应用(Achanta 等,2012);Fachao等将SLIC算法引入到极化SAR图像中,生成的超像素能够保留极化SAR图像中地物边界的有效信息(Qin 等,2015)。为此,本文利用SLIC算法生成的超像素的作为分类单元,主要步骤如下:

(1)选择初始中心种子点:生成Pauil RGB梯度影像,按步长 $S$ 采样选取 $m$ 个种子点作为超像素初始中心,其中 $S = \sqrt {{N / m}} $ $N$ 为影像的像素数目;然后在局部 $3 \times 3$ 范围内将种子点调整至梯度影像最低点,以避免将噪声点作为种子点。

(2)局部K均值迭代聚类:在每个超像素中心 $2S \times 2S$ 范围内依次计算每个像素到该超像素中心的距离,并将该像素划分到与之最邻近超像素内;计算完成后,更新每个超像素的中心。重复上述步骤直至收敛或者达到最大迭代次数,进而生成大小近似为 $S \times S$ 的超像素。

(3)聚类后处理:为避免存在孤立的像素,将像素数目小于一定数目的超像素合并到与之最邻近的超像素内,得到最终极化SAR图像超像素。

像素与超像素中心之间的距离度量是影响SLIC算法效果的关键因素。光学图像中通常对光谱距离和空间距离加权来度量二者距离。针对极化SAR图像的特点,一些学者利用由Wishart分布推导得到的统计距离来代替光学影像中的光谱距离(Feng 等,2014Qin 等,2015Song 等,2015)。然而,由于超像素内像素数目较少,致使统计距离的计算并不稳定,进而影响到超像素生成的准确性。考虑到目标分解参数是一类描述地类信息的重要特征,其中Pauil分解的3个分量具有明显的物理意义,分别代表奇次散射、偶次散射和体散射,同时Pauli RGB合成图是极化SAR图像的标准显示模式。本文利用Pauli特征代替传统光学影像中的光谱特征,并对Pauli距离和空间距离加权,得到最终的距离度量准则。假设超像素 $i$ 的空间位置为 $\left({{{{x}}_i}, {{{y}}_i}} \right)$ ,Pauli分解的平均特征矢量为 $({{{P}}{{{a}}_i}, {{P}}{{{b}}_i}},$ $ {{P}}{{{c}}_i} ) $ ;像素 $j$ 空间位置 $({{{{x}}_j}, {{{y}}_j}} )$ ,Pauli分解的特征矢量为( ${{{P}}{{{a}}_j}, {{P}}{{{b}}_j}, {{P}}{{{c}}_j}} )$ ,则像素 $i$ 与超像素 $j$ 间的空间距离 ${d_{\rm{s}}}$ 和Pauli距离 ${d_{\rm{p}}}$ 分别为

$ \begin{array}{*{20}{c}} {{d_{\rm{s}}} = \sqrt {{{\left({{{{x}}_i} - {{{x}}_j}} \right)}^2} + {{\left({{{{y}}_i} - {{{y}}_j}} \right)}^2}} } \\ {{d_{\rm{p}}} = \sqrt {{{\left({{{P}}{{{a}}_i} - {{P}}{{{a}}_j}} \right)}^2} + {{\left({{{P}}{{{b}}_i} - {{P}}{{{b}}_j}} \right)}^2} + {{\left({{{P}}{{{c}}_i} - {{P}}{{{c}}_j}} \right)}^2}} } \end{array} $ (1)

则极化SAR图像中像素到超像素之间的距离定义为

$ d = \sqrt {\frac{{{d_{\rm{p}}}}}{{{\rm{max}}\left({{d_{\rm{p}}}} \right)}} + {{\left({\frac{{{d_{\rm{s}}}}}{S}} \right)}^2}} $ (2)

式中, ${\rm{max}}\left({{d_{\rm{p}}}} \right)$ 为上一次迭代过程中,Pauli距离的最大值,并与步长 $S$ 用来对Pauli距离和空间距离归一化。归一化后的Pauli距离和空间距离的相对大小,影响着超像素的形状和大小。空间距离相对越大,生成的超像素越紧凑,反之形状和大小越不规则。借鉴Song等(2015)设置权重系数的经验和实验的结果,本文对Pauli距离和空间距离等值加权后得到的距离能生成最优的超像素。

3.2 基于超像素的概率松弛模型

概率松弛标号PLR(Probabilistic Label Relaxation)是一种考虑像素周围邻域特征迭代标号算法(Richards和Jia,2007)。其基本思想是图像中相邻像素具有一定相关性,并不是完全独立的,并且地物目标的分布具有连续性,每个像素的类别归属信息与该点的观察信息及邻域信息有关,例如当前像素的邻域像素的类别均为林地,则该像素为林地的概率更高。利用这种空间邻域特征的分类方法有助于移除分类结果中因噪声或错分导致的孤立像素,使分类结果在光谱和空间上具有一致性。为此,本文将超像素作为分析单元,并利用PLR算法定量描述超像素间的邻域特征。

在利用概率松弛处理之前,假设已知图像上每个超像素的类别概率。首先定义先验的相容性系数 ${p_{\rm{on}}}\left({{\omega _i}{\rm{|}}{\omega _j}} \right)$ 来描述当邻域超像素 $n$ 属于类别 ${\omega _j}$ ,超像素 $o$ 属于 ${\omega _i}$ 概率。一般来说相容性系数需根据实际场景地物的几何分布信息来确定,在实际情况下这部分信息是未知的,因此利用单个值 ${{\rho }}$ 描述所有的相容性

$ {p_{\rm{on}}}\left({{\omega _i}{\rm{|}}{\omega _j}} \right) = \left\{ {\begin{array}{*{20}{c}} {{{\rho }}\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\omega _i} = {\omega _j}}\\ {1 - {{\rho }}\;\;\;\;\;\;\;\;\;\;\;\;\;{\omega _i} \ne {\omega _j}} \end{array}} \right. $ (3)

式中, ${\rm{\rho }}$ 定量描述了相邻超像素为同类地物和非同类地物的概率, $\,{{\rho }}$ 值越高,分类结果越均匀。则邻域超像素 $n$ ${\omega _j}$ 时对当前超像素 $o$ 类别为 ${\omega _i}$ 的贡献可用如下联合概率密度函数表示

$ {p_{\rm{on}}}({{\omega _i}, {\omega _j}} ) = {p_{\rm{on}}}({{\omega _i}{\rm{|}}{\omega _j}}) \cdot {p_n}({{\omega _j}} ) $ (4)

式中, ${p_n}\left({{\omega _j}} \right)$ 为先验概率。对当前超像素 $o$ 所有邻域以及邻域每个类别的贡献求和,得到最终邻域函数如下式所示

$ \begin{array}{*{20}{c}} {{q_o}\left({{\omega _i}} \right) = \displaystyle\mathop \sum \limits_{n = 1}^N {d_n}\displaystyle\mathop \sum \limits_{j = 1}^M {p_{\rm{on}}}\left({{\omega _i}{\rm{|}}{\omega _j}} \right) \cdot {p_n}\left({{\omega _j}} \right)} \\ {{d_n} = \dfrac{{N{P_n}}}{{N{P_o}}}} \end{array} $ (5)

式中, ${d_n}$ 为邻域权重,用邻域超像素与当前超像素包含的像素数目 $N{P_n}$ $N{P_o}$ 的比值来确定。 ${q_o}\left({{\omega _i}} \right)$ 反映邻域超像素对当前超像素类别总的贡献度;结合当前超像素初始的类别概率,利用超像素间的邻域特征,进而超像素 $o$ 的类别概率可修正为

$ p_o^{t + 1}\left({{\omega _i}} \right) = \frac{{p_o^t\left({{\omega _i}} \right)q_o^t\left({{\omega _i}} \right)}}{{\mathop \sum \nolimits_j p_o^t\left({{\omega _j}} \right)q_o^t\left({{\omega _j}} \right)}} $ (6)

式中,上标t表示迭代次数,在每次迭代过程中更新超像素的类别概率 ${p_o}\left({{\omega _i}} \right)$ ,多次迭代后 ${p_o}\left({{\omega _i}} \right)$ 收敛;该算法采用迭代后超像素类别概率的变化量作为迭代终止条件,其表达式如下

$ C{P^t} = \mathop \sum \limits_{S = 1}^N p_o^t - p_o^{t - 1} $ (7)

当概率变化 $CP$ 的值小于1%时,可认为算法已收敛。

3.3 利用空间邻域特征修正的随机森林超像素分类算法流程

随机森林(Random Forests)算法是由Breiman于2001年提出的一种以决策树为基础分类器的集成机器学习算法(Breiman,2001)。随机森林采用Bagging方法为每棵决策树生成有独立同分布的训练样本集并进行训练,每棵树依赖于一个由训练确定的参数所组成的随机向量,森林中生成的树的参数随机向量也是独立同分布的;分类时随机森林输出每棵树结果的组合。考虑到极化SAR图像特征众多,且随机森林处理高维数据时具有分类表现优异、人工干预少及运算非常快等优点,本文将随机森林算法引入到极化SAR图像分类中。

随机森林是一个由一系列决策树分类器组成的集成分类器,该集成分类器可描述为

$ h\left({{{x}}, {{{\theta}} _k}} \right), k = 1, 2, \cdots , n $ (8)

式中, ${{x}}$ 是输入样本向量, $k$ 为随机森林中决策树的数目, ${{{\theta}} _k}$ 是第 $k$ 棵决策树的参数向量,为独立同分布的随机向量,可通过在bootstrap集上学习确定;被确定的第 $k$ 棵决策树用于对所有输入向量 ${{x}}$ 进行分类。对于输入变量 ${{x}}$ 归属于哪个最合适的类别,每棵决策树投平等的一票。一个输入向量 ${{x}}$ 的类别归属由所有树的输出结果投票综合决定。

随机森林的训练过程如下:(1)对输入的训练样本采用多次随机、可重复的采样,得到多个bootstrap样本集;(2)利用每个bootstrap样本集,根据特征规则将样本迭代分裂到左右两个子集,构造对应的决策树;(3)在每个叶节点处统计训练集中达到此叶节点的分类标签的直方图,进而估计此叶节点上的类分布;(4)重复上述迭代训练过程直到达到设定的最大树深度或者不能通过继续分割获取更大的信息增益为止。

本文以超像素为分类单元,并在分类过程中增加利用空间邻域特征对分类结果修正,分类过程与传统基于像素的随机森林方法不同,主要步骤如下:

(1)利用已训练好的随机森林模型,输入每个像素的极化特征矢量,统计各个决策树的投票结果,进而得到每个像素属于各类类别的票数;

(2)以超像素为单元,根据每个像素的各类别票数,统计超像素属于各类别的票数,从而计算超像素的类别概率;

(3)依据概率松弛模型,利用超像素间的邻域特征,对超像素的类别概率修正;

(4)根据最大后验概率准则,利用修正后的超像素类别概率,对超像素的类别进行划分,得到最终的分类结果。

本文利用SLIC算法生成的超像素作为分类单元,并将PLR算法引入到随机森林模型中,实现极化SAR图像分类,该分类算法的具体流程如图1所示。

图 1 本文算法流程图
Fig. 1 Overview of the proposed method

4 实验与分析

随机森林算法中决策树的个数是影响极化特征利用的重要因素,本文通过实验确定其合适大小;在此基础上采用不同区域的RADARSAT-2数据进行分类实验,并与其他方法比较,验证本文分类算法的有效性。

4.1 决策树个数设置

随机森林中决策树的个数直接影响着极化特征信息的利用。由于每个决策树节点是从 $N$ 个极化特征中随机选择 $\sqrt N $ 个特征进行比较,较少的决策树个数会使得随机森林模型无法充分利用所有极化特征,而决策树个数过多,会降低随机森林的训练效率。为确定随机森林模型中决策树的个数,进行如下实验。分别在荷兰Flevoland地区的RADARSAT-2与湖北武汉地区的RADARSAT-2全极化SAR图像中选择各类典型地物样本,设置不同的决策树个数来训练随机森林模型,并通过袋外数据对该随机森林模型的预测精度进行评价,图2为不同研究区的随机森林模型的预测精度随决策树个数的变化曲线。

图2可知,上述研究区RADARSAT-2数据的随机森林模型的预测精度均随着决策树个数的增加显著提高;但当决策树个数达到一定数量后,极化特征信息已充分利用,此时决策树个数的增加对随机森林模型的预测精度影响较小。因此对荷兰Flevoland地区的RADARSAT-2数据,决策树个数设置为180较为合理,武汉地区RADARSAT-2数据的决策树个数设置为165。

图 2 随机森林模型的预测精度随决策树个数的变化关系曲线
Fig. 2 The prediction accuracy of random forest by using different number of decision trees

4.2 分类实验

为验证本文算法的有效性,实验采用荷兰Flevoland地区C波段星载RADARSAT-2全极化SAR数据,实验数据经过4视处理,图像大小为700 $ \times $ 780像素。实验区主要包含农田、林地、城区建筑物和水体等,实验区的Pauli RGB合成图及地面真实地类分布图如图3所示,其中真实地类分布图为参考相关文献勾绘所得(Feng 等,2014Liu 等,2016)。

图 3 RADARSAT-2数据Pauli RGB图及地面真实地类分布图
Fig. 3 Pauli color-coded image and the ground truth map of the RADARSAT-2 dataset

为验证超像素和空间邻域特征对极化SAR图像分类精度提升的有效性,进行如下分类实验:(a)基于像素的随机森林分类(RF);(b)基于像素利用PLR的随机森林分类(RF-PLR);(c)基于超像素的随机森林分类(RF-SP);(d)基于超像素的RF-PLR分类(RF-SP-PLR),其中方法2)和4)的超像素大小为5×5。图4为4种算法的分类结果,表2为分类精度表。

图 4 不同算法的分类结果图
Fig. 4 Classification results of the RADARSAT-2 image with different methods

表 2 不同算法的分类精度表
Table 2 Classification accuracy table of different methods

下载CSV 
分类方法 水体 农田 林地 建筑区 OA
RF 98.41 88.04 79.18 62.82 84.31
RF-PLR 99.26 91.61 85.35 73.48 88.99
RF-SP 99.13 91.28 84.86 70.38 88.30
RF-SP-PLR 99.38 97.26 90.60 85.74 94.39

从4种算法的分类结果来看,本文提出的RF-SP-PLR算法分类精度最高,达到94.39%,尤其是林地和城区的分类精度与其他算法相比有较大提升,且所提算法分类结果光滑连续,有效抑制了相干斑噪声的干扰。由图4(a)、(b)可知,基于像素的随机森林算法受相干斑噪声的干扰严重,分类结果精度较低,增加利用空间邻域特征后,一定程度上降低了相干斑噪声的干扰,使得总体分类精度从84.31%提高到88.99%;由于极化SAR数据受噪声干扰严重,各地类分布复杂,RF-PLR算法的分类结果仍受相干斑噪声的干扰,尤其是城区、林地。从图4(a)、(c)表2可知,与传统基于像素的分类方法相比,基于超像素的RF-SP分类算法能减少分类结果中噪声的干扰,降低分类结果中的“椒盐现象”,尤其是农田区域,并将总体分类精度从84.31%提升至88.30%,但部分区域的分类结果仍较为破碎,存在较多孤立超像素;由图4(d)可知,在RF-SP算法基础上增加利用超像素间的空间邻域特征后的RF-SP-PLR算法,能显著降低分类中噪声的干扰,消除分类结果中的“椒盐现象”,得到准确连续的分类结果。

由前面的实验结果可知,空间邻域特征对分类结果有着重要影响,为分析空间邻域特征的利用情况,在上述实验的基础上设置PLR算法不同迭代次数,并计算分类精度。实验分类结果如图5所示,分类精度见表3

图5表3可知,随着PLR迭代次数的增加,分类结果中孤立的超像素减少,地物内部更光滑,同时地类边界和点目标如孤立建筑物等依然准确划分,总体分类精度从89.66%提高到93.33%。当PLR迭代到15次时,已充分利用空间邻域特征,迭代次数的增加对分类结果精度影响较小,此时PLR算法已收敛。

图 5 不同PLR迭代次数分类结果图
Fig. 5 Classification results of the RADARSAT-2 image with different PLR step iteration times

表 3 不同PLR迭代次数的分类精度表
Table 3 Classification accuracy table for different number of PLR iterations

下载CSV 
PLR迭代次数 1 5 15 45
OA 89.6646 92.7635 93.9091 94.3251

由Flevoland地区RADARSAT-2数据的分类实验可知,超像素的大小会影响地物的分类精度。超像素过小,较难抑制相干斑噪声对分类结果的干扰,分类结果中易出现“椒盐现象”;超像素过大,会损失部分地物细节信息,降低地类边界分类的准确性,因此合适的超像素的大小对分类精度有重要意义。为此,增加实验分析超像素的大小对分类结果的影响。在SLIC算法生成超像素过程中,将超像素所含像素数目从1×1增加到10×10,采用本文提出的RF-SP-PLR方法对该数据进行分类,并计算分类精度OA,分类精度随着超像素的大小变化曲线如下图6所示。

图6可知,当超像素大小从1×1增加到5×5 时,分类精度OA随着变大,当超像素大小进一步增加到10×10时,分类精度反而降低,且分类精度始终比基于像素的RF-PLR分类精度高。这进一步表明超像素的利用能有效降低相干斑噪声对分类结果的干扰,且超像素为5×5 时,超像素的利用在降低噪声干扰和损失地物细节信息这两方面达到平衡,此时RF-SP-PLR分类精度最高。

图 6 Flevoland地区RADARSAT-2数据分类精度OA随超像素大小变化关系曲线
Fig. 6 OA obtained by applying RF-SP-PLR to the Flevoland RADARSAT-2 image with different sizes of super

为进一步验证本文提出算法的有效性,选取湖北省武汉市青山区2011年11月RADARSAT-2全极化SAR数据进行实验,研究区位于长江边,主要地物类型有居民区、工业用地、水体、农田、植被、鱼塘及荷塘浮草,实验数据大小为800 $ \times $ 800像素。图7为该实验区的Pauli RGB合成图和真实地类分布图。与前文实验相似,利用上述4种算法对研究区的进行分类实验。图8为研究区4种算法的总体分类结果图。为定量分析本文算法的有效性,利用真实地类分布图计算对应区域的分类精度,表4为对应区域的各算法的分类精度。

图 7 武汉RADARSAT-2数据Pauli RGB图及真实地类参考图
Fig. 7 Pauli color-coded image and the ground truth map of the Wuhan RADARSAT-2dataset
图 8 研究区不同算法的分类结果图
Fig. 8 Classification results of the RADARSAT-2 image with different methods

表 4 真实地类分布图区域的分类精度表
Table 4 Classification accuracy table in the area of the ground truth map

下载CSV 
分类方法 RF RF-PLR RF-SP RF-SP-PLR
水体 90.48 96.36 94.34 98.77
工业用地 58.53 66.21 63.43 70.35
居民区 55.49 63.15 59.64 68.23
植被 47.70 54.37 58.11 64.22
农田 71.24 79.34 84.59 90.33
鱼塘 85.26 87.32 83.16 87.24
荷塘浮草 54.38 63.08 56.00 80.15
OA 67.81 78.64 75.33 85.09

图8表4可知,本文提出的RF-SP-PLR算法的分类精度最高,且分类结果光滑连续。对比图8(a)、(c)(b)、(d)可知,以超像素为分类单元有助于降低极化SAR图像中相干斑噪声的干扰,并将图像分类精度分别提升7.52%与6.45%,且分类结果的目视效果更优;图8(a)、(b)(c)、(d)的对比实验也进一步验证了空间邻域信息的利用有助于消除分类结果中因噪声或误分生成的孤立超像素,并提高极化SAR图像分类精度。上述实验结果表明,以超像素为分类单元并在此基础上利用空间邻域特征的方法,有效地抑制了相干斑噪声对极化SAR图像分类精度的干扰。

5 结 论

本文提出的基于超像素综合利用极化特征和空间邻域特征的极化SAR图像分类方法,将SLIC算法生成的超像素作为分类单元,降低了极化SAR图像中相干斑噪声的干扰;基于高维极化特征图利用随机森林算法分类,并增加利用超像素间邻域特征,以移除分类结果中由于噪声或误分生成的孤立超像素,进一步减小了相干斑噪声的干扰,提高了分类结果精度。不同研究区的RADARSAT-2数据的实验结果表明本文算法的有效性,相比基于像素的极化SAR图像分类,本文基于超像素的分类有效避免分类结果中出现椒盐现象;增加利用超像素间的邻域特征,保留点目标的同时,有效提高极化SAR图像分类精度,得到光滑准确的分类结果。极化SAR图像的相干斑噪声具有一定的统计特性,综合利用极化特征和统计特征对极化SAR图像分类是下一步研究的内容。

参考文献(References)

  • Achanta R, Shaji A, Smith K, Lucchi A, Fua P and Süsstrunk S. 2012. SLIC superpixels compared to state-of-the-art superpixel methods. IEEE Transactions on Pattern Analysis and Machine Intelligence, 34 (11): 2274–2282. [DOI: 10.1109/TPAMI.2012.120]
  • Akbari V, Doulgeris A P, Moser G, Eltoft T, Anfinsen S N and Serpico S B. 2013. A textural–contextual model for unsupervised segmentation of multipolarization synthetic aperture radar images. IEEE Transactions on Geoscience and Remote Sensing, 51 (4): 2442–2453. [DOI: 10.1109/TGRS.2012.2211367]
  • Benz U and Pottier E. 2001. Object based analysis of polarimetric sar data in alpha-entropy-anisotropy decomposition using fuzzy classification by ecognition//Proceedings of International Geoscience and Remote Sensing Symposium. Sydney, NSW, Australia: IEEE: 1427-1429 [DOI: 10.1109/IGARSS.2001.976867]
  • Blaschke T. 2010. Object based image analysis for remote sensing. ISPRS Journal of Photogrammetry and Remote Sensing, 65 (1): 2–16. [DOI: 10.1016/j.isprsjprs.2009.06.004]
  • Breiman L. 2001. Random forests. Machine Learning, 45 (1): 5–32. [DOI: 10.1023/A:1010933404324]
  • Chen L J, Yang W, Liu Y and Sun H. 2010. Feature evaluation and selection for polarimetric SAR image classification//Proceedings of the IEEE 10th International Conference on Signal. Beijing, China: IEEE: 2202-2205 [DOI: 10.1109/ICOSP.2010.5656765]
  • Feng J L, Cao Z J and Pi Y M. 2014. Polarimetric contextual classification of PolSAR images using sparse representation and superpixels. Remote Sensing, 6 (8): 7158–7181. [DOI: 10.3390/rs6087158]
  • Haddadi G A, Sahebi M R and Mansourian A. 2011. Polarimetric SAR feature selection using a genetic algorithm. Canadian Journal of Remote Sensing, 37 (1): 27–36. [DOI: 10.5589/m11-013]
  • Lee J S, Grunes M R and Pottier E. 2001. Quantitative comparison of classification capability: fully polarimetric versus dual and single-polarization SAR. IEEE Transactions on Geoscience and Remote Sensing, 39 (11): 2343–2351. [DOI: 10.1109/36.964970]
  • Liu B, Hu H, Wang H Y, Wang K Z, Liu X Z and Yu W X. 2013. Superpixel-based classification with an adaptive number of classes for polarimetric SAR images. IEEE Transactions on Geoscience and Remote Sensing, 51 (2): 907–924. [DOI: 10.1109/TGRS.2012.2203358]
  • Liu H Y, Zhu D X, Yang S Y, Hou B, Gou S P, Xiong T and Jiao L C. 2016. Semisupervised feature extraction with neighborhood constraints for polarimetric SAR classification. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 9 (7): 3001–3015. [DOI: 10.1109/JSTARS.2016.2532922]
  • Maghsoudi Y, Collins M J and Leckie D G. 2013. RADARSAT-2 polarimetric SAR data for boreal forest classification using SVM and a wrapper feature selector. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 6 (3): 1531–1538. [DOI: 10.1109/JSTARS.2013.2259219]
  • Niu X and Ban Y F. 2012. An adaptive contextual sem algorithm for urban land cover mapping using multitemporal high-resolution polarimetric SAR data. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 5 (4): 1129–1139. [DOI: 10.1109/JSTARS.2012.2201448]
  • Qin F C, Guo J M and Lang F K. 2015. Superpixel segmentation for polarimetric SAR imagery using local iterative clustering. IEEE Geoscience and Remote Sensing Letters, 12 (1): 13–17. [DOI: 10.1109/LGRS.2014.2322960]
  • Reigber A, Jäger M, Neumann M and Ferro-Famil L. 2010. Classifying polarimetric SAR data by combining expectation methods with spatial context. International Journal of Remote Sensing, 31 (3): 727–744. [DOI: 10.1080/01431160902897809]
  • Richards J A and Jia X P. 2007. A dempster-shafer relaxation approach to context classification. IEEE Transactions on Geoscience and Remote Sensing, 45 (5): 1422–1431. [DOI: 10.1109/TGRS.2007.893821]
  • Song H, Yang W, Bai Y and Xu X. 2015. Unsupervised classification of polarimetric SAR imagery using large-scale spectral clustering with spatial constraints. International Journal of Remote Sensing, 36 (11): 2816–2830. [DOI: 10.1080/01431161.2015.1043759]
  • Sun X, Huang P P, Tu S T and Yang X L. 2016. Polarimetric SAR image classification using multiple-feature fusion and ensemble learning. Journal of Radars, 5 (6): 692–700. [DOI: 10.12000/JR15132] ( 孙勋, 黄平平, 涂尚坦, 杨祥立. 2016. 利用多特征融合和集成学习的极化SAR图像分类. 雷达学报, 5 (6): 692–700. [DOI: 10.12000/JR15132] )
  • Wang W S, Yang X F, Li X F, Chen K S, Liu G H, Li Z W and Gade M. 2017. A fully polarimetric sar imagery classification scheme for mud and sand flats in intertidal zones. IEEE Transactions on Geoscience and Remote Sensing, 55 (3): 1734–1742. [DOI: 10.1109/TGRS.2016.2631632]
  • Wu Y H, Ji K F, Yu W X and Su Y. 2008. Region-based classification of polarimetric SAR images using Wishart MRF. IEEE Geoscience and Remote Sensing Letters, 5 (4): 668–672. [DOI: 10.1109/LGRS.2008.2002263]