紫金山国家森林公园全极化雷达图像分类比较

http://dx.doi.org/10.13324/j.cnki.jfcf.2016.01.020

文章信息

张密芳, 杨玉峰, 李明阳, 胡曼, 荣媛

ZHANG Mifang, YANG Yufeng, LI Mingyang, HU Man, RONG Yuan

Classification method comparison of PALSAR image based on the Zijin Mountain National Forest Park

森林与环境学报, 2016, 36(01): 124-128

Journal of Forest and Environment, 2016, 36(01): 124-128.

http://dx.doi.org/10.13324/j.cnki.jfcf.2016.01.020

文章历史

收稿日期: 2015-04-13

修订日期: 2015-07-12

引用本文

张密芳, 杨玉峰, 李明阳, 胡曼, 荣媛. 紫金山国家森林公园全极化雷达图像分类比较[J]. 森林与环境学报, 2016, 36(01): 124-128. 复制到剪切板

ZHANG Mifang, YANG Yufeng, LI Mingyang, HU Man, RONG Yuan. Classification method comparison of PALSAR image based on the Zijin Mountain National Forest Park. Journal of Forest and Environment, 2016, 36(01): 124-128. DOI: 10.13324/j.cnki.jfcf.2016.01.020 复制到剪切板

紫金山国家森林公园全极化雷达图像分类比较

张密芳, 杨玉峰, 李明阳 , 胡曼, 荣媛

南京林业大学林学院, 江苏南京 210037

收稿日期: 2015-04-13; 修订日期: 2015-07-12

基金项目: 国家自然科学基金"基于MCAD/GIS的开放式城市风景林可持续经营空间决策方法研究"(31170592)。

作者简介: 张密芳(1991-),女,硕士研究生,从事3S技术应用研究。E-mail:458521273@qq.com。

通讯作者: 李明阳(1967-),男,教授,从事风景林调查规划、森林资源监测、3S技术应用研究。E-mail:lmy196727@126.com。

摘要: 全极化雷达图像的最大优点是能够获取目标的全极化散射特征,从而使其在地表植被的分类和森林参数反演中具有较大的应用价值。以紫金山国家森林公园为研究对象,2011年的全极化雷达数据、典型地类野外调查数据为主要信息源,在PAULI、SINCLAIR、CLOUDE-POTTIER、FREEDMAN-DURDEN四种目标特征值分解基础上,采用最大似然、支持向量机、神经元网络和随机森林4种方法进行监督分类。结果表明,5种组合中12个特征值组成的特征图像的最大似然分类的精度最高,总体分类精度为58.20%,CLOUDE-POTTIER、FREEDMAN-DURDEN总体分类精度较低,分别为51.86%、52.36%;4种分类方法中,12个特征值组合的图像的随机森林分类方法的总体分类精度最高,总体分类精度为74.29%,神经元网络的分类精度较低,总体分类精度为56.98%;6种地类中,针叶林、阔叶林和建筑的分类精度较高,草地、水体和裸地的分类精度较低。

关键词: 极化合成孔径雷达图像分类目标分解随机森林

Classification method comparison of PALSAR image based on the Zijin Mountain National Forest Park

ZHANG Mifang, YANG Yufeng, LI Mingyang, HU Man, RONG Yuan

College of Forestry, Nanjing Forestry University, Nanjing, Jiangsu 210037, China

Abstract: Since the fully polarimetric synthetic aperture radar image has a great advantage of being able to obtain the fully polarized scattering attributes of the target object, it is widely used in classification of forest vegetation and inversion of forest parameters. In the paper, Zijin Mountain National Forest Park in Nanjing was chosen as the case study area, while PALSAR image in 2011 and typical land use field survey data in the same year were collected as the main information source to do supervised classification. Four kinds of target characteristic value decomposition methods namely PAULI, SINCLAIR, CLOUDE-POTTIER, FREEDMAN-DURDEN were conducted, followed by supervised classification on the images comprised from characteristic values of target decomposition using 4 methods of mximum likelihood, support vector machines, neural net and random forest. Research results showed as follows. Among the 5 combinations of characteristic values, the overall classification accuracy of the image comprised of 12 characteristic values was the highest (58.20%), while the classification accuracy of the image from target decomposition of CLOUDE-POTTIER and FREEDMAN-DURDEN was low (51.86% and 52.36%, respectively). Among the 4 classification methods using the image from 12 characteristic values, the overall classification accuracy of random forest was the highest (74.29%), while the classification of Neural Network was the lowest (56.98%). Among the 6 land use types, the classification accuracy of coniferous forest, broadleaf forest and built-up was high while the grass, water and bare soil was low.

Key words: polarimetric synthetic aperture radar image classification target decomposition random forest

合成孔径雷达(synthetic aperture radar,SAR)是一种高分辨率的微波成像系统，不但具有全天时的工作能力，还因为微波本身所具有的穿透性，可以反映地物表面的粗糙度、地物的内部结构和地物介电常数等可见光和红外光难以反应的信息，因此迅速成为了遥感发展的主要方向之一^{[1, 2]}。近20 a来SAR在森林参数反演中得到日益广泛的应用^{[3, 4]}，而将信息从平均测量数据中提取出来，实现全极化数据的分类识别、目标检测、地表地物特征参数反演等，需要对极化数据进行目标分解^[5]。1970年极化雷达数据的目标分解被提出之后，很多学者又做了大量的基础性研究^[6]，所以出现了许多极化图像目标分类与识别的算法，都是以目标分解为基础的^{[7, 8, 9, 10]}。与海洋、地质、军事等领域相比，全极化雷达数据在地表植被的分类和森林参数反演方面的研究得到的成果较少^[11]。以紫金山国家森林公园为研究对象，全极化雷达数据为主要信息源，在不同目标特征值分解基础上，采用最大似然、支持向量机、神经元网络和随机森林4种分类方法进行监督分类，通过精度验证选取最佳的特征值组合和最优的分类方法，从而为全极化雷达数据在森林公园土地利用类型分类中的应用提供科学依据。

1 研究区概况

紫金山国家森林公园位于江苏省南京市东郊，北纬32°01′57″-32°06′15″，东经118°48′00″-118°53′04″，属亚热带季风气候，降水丰富，四季分明。紫金山国家森林公园从太平门向西绵延，面积31 km²，有3个山峰，宁镇山脉之最高峰北高峰居中偏北，海拔448.9 m。

紫金山国家森林公园植物种类多样，主要有马尾松(Pinus massoniana Lamb.)、黑松(Pinus thunbergii Parl.)、麻栎(Quercus acutissima Carruth.)、枫香(Liquidambar formosana Hance.)、黄连木(Pistacia Chinensis Bunge)、刺槐(Robinia pseudoacacia Linn.)等树种及毛竹[Phyllostachys heterocycla (Carr.) Mitford]，景区森林覆盖率78.2%，占南京市森林面积的15.6%，是南京重要的风景资源^[12]。

2 材料与方法 2.1 数据来源与预处理

紫金山国家森林公园2011年3月22日的全极化雷达数据，具有HH、HV、VH、VV四种极化状态，传感器的倾斜角为21.5°，距离向、方位向的空间分辨率分别为9.4、3.5 m，数据的处理级别为L1.1，数据格式为单视复数；2011年7月10日的对地观测卫星遥感数据，多光谱波段空间分辨率为10 m×10 m，全色波段空间分辨率为2.5 m×2.5 m；根据紫金山国家森林公园1∶10 000 地形图制作的数字高程模型，空间分辨率为3.3 m×3.3 m。

为了降低斑点噪声和将像素转换为方形像素，用ENVI SAR scape雷达处理软件对全极化雷达影像进行多视化处理。全极化雷达图像距离向、方位向的多视化处理因子分别为1、7。为获得反向散射图像，对全极化雷达图像进行辐射定标。为降低影像的斑点，采用精致LEE滤波器对图像进行滤波处理。由于全极化雷达图像采用侧视几何投影，容易导致图像失真，为降低地形起伏引发的透视效应，采用3.3 m×3.3 m紫金山国家森林公园数字地形模型对雷达图像进行正射矫正。在图像预处理基础上，通过数据重采样，将处理过的SAR图像的空间分辨率调整到10 m×10 m，依据PAULI、SINCLAIR、CLOUDE-POTTIER、FREEDMAN-DURDEN四个目标分解方法提取了12个特征值。

2.2 极化图像特征分解方法 2.2.1 极化散射矩阵

在全极化SAR系统中，发射的电磁波都是水平极化和垂直极化，为了表示这种关系，通常选择使用一个二维的复数矩阵形式，即极化散射矩阵^[5]，它描述的是入射波和散射波的一种关系，即JONES矢量之间的关系。

2.2.2 PAULI分解

PAULI分解是基于PAULI基矩阵的分解，将各个像素所对应的散射矩阵进行分解，得到4个PAULI基矩阵，且可叠加为对应的散射矩阵^[13]。

$\begin{gathered} S = \left[\begin{gathered} {S_{hh}}{S_{hv}} \hfill \\ {S_{vh}}{S_{vv}} \hfill \\ \end{gathered} \right] = \left[\begin{gathered} a + b{\text{ }}c - jd \hfill \\ c + jd{\text{ }}a - b \hfill \\ \end{gathered} \right] = \hfill \\ a\left[\begin{gathered} 1{\text{ }}0 \hfill \\ 0{\text{ }}1 \hfill \\ \end{gathered} \right] + b\left[\begin{gathered} 1{\text{ }}0 \hfill \\ 0{\text{ }} - 1 \hfill \\ \end{gathered} \right] + c{\text{ }}\left[\begin{gathered} 0{\text{ }}1 \hfill \\ 1{\text{ }}0 \hfill \\ \end{gathered} \right] + d\left[\begin{gathered} 0{\text{ }} - j \hfill \\ j{\text{ }}0 \hfill \\ \end{gathered} \right] \hfill \\ \end{gathered} $

(1)

式中：S为4个PAULI基矩阵互相正交形成的散射矩阵。4个矩阵分别对应的是奇次散射、二面角反射、有45°方位角且包含了植被体漫散射的二面角反射、以及散射矩阵中的非对称成分。复数a、b、c、d表示各个基矩阵对散射矩阵S的贡献大小。在回波中某种散射机制的功率大小是系数的模值的平方。目标散射回波被分解为奇次散射、偶次散射和漫散射分量的叠加即为PAULI分解。

2.2.3 CLOUDE-POTTIER分解

最早将特征值分解引入到极化分解领域，依据矩阵的特征分解理论，3×3的特征矩阵T被表示为^{[13, 14]}

$\left\langle T \right\rangle = U \cdot E \cdot {U^{ - 1}} = \sum\limits_{i = 1}^3 {{\lambda _i} \cdot {{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\rightharpoonup}$}} {U} }_i}} \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\rightharpoonup}$}} {U} _i^H$

(2)

式中：T表示3×3的特征矩阵；＜＞表示求集合平均；H表示共轭转置；E表示特征矩阵；酉矩阵U是特征向量组成的3×3矩阵。

2.2.4 FREEDMAN-DURDEN分解

以目标散射模型的构建为出发点,表面散射、二次散射和体散射3种基本散射的叠加可以近似表示复杂目标的散射回波。FREEDMAN-DURDEN分解表示为^[13]

$\left\langle C \right\rangle = {f_S} \cdot {C_S} + {f_D} \cdot {C_D} + {f_V} \cdot {C_V}$

(3)

式中：＜＞表示求集合平均；C表示协方差矩阵；系数f_S、f_D和f_V分别代表上述3种散射成分的权重。

2.3 遥感分类方法

最大似然分类法是图像处理中最常用的一种监督分类方法。假设各类的分布函数就是一个正态分布，在多变量空间中分布着形成的椭圆或椭球，在不同方向上，散布的情况不一样，最后用最大似然判别规则，根据正态分布规律进行判断，得到一个准确率比较高的分类结果^[14]。

支持向量机分类是以统计学理论中的VAPNIK Chervonenkis Dimension理论和结构风险最小原理为基础的，当向量被映射到一个更高维数的空间里，建立一个间隔最大的超平面，在两边建立2个相互平行的超平面，选用合适的方向分割超平面，使2个与之平行的超平面之间的距离达到最大，相互平行的超平面间的距离越大，分类器的总误差越小。

人工神经元网络中的突触为连接一个神经元与多个神经元的结点。输入是进入到突触的信号，被突触进行“加权”，所有权重输入的总效果就是输入的加权总和，当总和的值等于或大于神经元的阈值，神经元就会被激活；否则，就不会被激活。

随机森林由许多互不关联、随机的决策树组成，也称为随机决策树。测试的数据进入到随机森林时，各棵决策树开始分类，最终结果就是在决策树中分类最多的那类，因此在随机森林中有很多个决策树，其输出的类别，即最终的结果，是由个别树输出的类别的众数所决定的。

3 结果与分析 3.1 主要极化特征分析

采用PAULI、SINCLAIR、CLOUDE-POTTIER、FREEDMAN-DURDEN这4种目标分解方法对紫金山极化SAR图像进行特征值的提取，每种目标分解方法各得到3个特征值，一共得到12个特征值，分别赋予3个特征值红(R)、绿(G)、蓝(B)进行彩色合成，得到4幅特征图像(图1-图4)。

	图 1 PAULI目标分解法的特征图像 Figure 1 Feature image from PAULI target decomposition
图选项

	图 2 SINCLAIR目标分解法的特征图像 Figure 2 Feature image from SINCLAIR target decomposition
图选项

	图 3 CLOUDE-POTTIER目标分解法的特征图像 Figure 3 Feature image from CLOUDE-POTTIER target decomposition
图选项

	图 4 FREEDMAN-DURDEN目标分解法的特征图像 Figure 4 Feature image from FREEDMAN-DURDEN target decomposition
图选项

3.2 不同极化特征组合监督分类精度分析

经过预处理的紫金山国家森林公园极化SAR图像采用PAULI、SINCLAIR、CLOUDE-POTTIER、FREEDMAN-DURDEN四种目标分解方法，得到12个特征值，对每种目标分解方法的特征图像和12个特征值组成的特征图像都进行最大似然分类，将研究区域的土地利用类型划分为阔叶林、针叶林、草地、建筑、裸地、水体6种地类，以2011年先进对地观测卫星(advanced earth observation satellite,ALOS)图像为参考的同年典型地类定位调查数据进行精度验证，得到的分类精度如表1所示。

表 1 不同极化特征组合图像最大似然分类的精度 Table 1 Maximum likelihood classification accuracy of different feature images

特征组合Feature combination	PAULI	SINCLAIR	CLOUDE-POTTIER	FREEDMAN-DURDEN	12个特征值Feature image composed by the 12 eigenvalues
精度Accuracy/%	55.53	55.81	51.86	52.36	58.20

表选项

从表1可以看出，12个特征值组成的图像最大似然法分类精度最高，SINCLAIR分解、PAULI分解和FREEDMAN-DURDEN分解特征值合成的图像分类精度较低，CLOUDE-POTTIER分解的特征值合成的图像分类精度最低。由于PAULI分解和SINCLAIR分解特征值形成的图像中，针叶林和阔叶林、草地和裸地的特征值比较近似，造成总体分类精度较低。CLOUDE-POTTIER分解和FREEDMAN-DURDEN分解的特征值组合图像中，水、草地和森林特征值非常相近，导致在进行监督分类时，总体分类精度不高。12个特征值合成的图像中，6种地类的某一个或几个特征值存在一定的差异性，各种地类的特征值区分度较高。因此，12个特征值合成的图像的最大似然法总体分类精度，高于其他4种目标分解特征值合成的图像的分类精度。

3.3 最佳特征组合图像不同分类方法精度分析

以最大似然法进行监督分类的12个特征值组成的图像为数据源，进行其他不同分类方法精度比较分析，为研究区域极化雷达图像分类方法的优化提供科学依据。选取支持向量机、神经元网络、随机森林3种监督分类方法，并以2011年ALOS图像为参考的同年典型地类定位调查数据为参照，进行精度验证。计算结果表明，神经元网络的分类精度为56.98%，支持向量机的分类精度为57.81%，随机森林的分类精度为74.29%。随机森林法分类精度最高的原因在于，与传统的分类方法相比，随机森林分类法具有很多个决策树，当测试数据进入随机森林时，每一棵决策树进行分类，最后取所有决策树中分类结果最多的那类为最终的结果。

通过精度验证，可以得到分类精度最高的随机森林监督分类各地类混淆矩阵(表2)。分析表2可知，针叶林、阔叶林和建筑的分类精度很高，均达到100%，原因是这3种地类的极化特征值差异较大。草地、水和裸地分类精度不高，分别为73.33%、83.33%、73.33%，原因在于这3种地类的极化特征值比较接近，所以比较容易误分到另外2类中。

表 2 随机森林监督分类各地类混淆矩阵 Table 2 Confusion matrix of different land use categories using random forest

地类Land types	阔叶林Broadleaf forest	建筑Building	针叶林Coniferous forest	草地Grass	裸地Bare land	水体Water
阔叶林Broadleaf forest	30	0	0	0	0	0
建筑Building	0	30	0	0	0	0
针叶林Coniferous forest	0	0	30	0	0	0
草地Grass	0	0	0	22	2	6
裸地Bare land	0	0	0	3	25	2
水体Water	0	0	0	5	3	22

表选项

4 结论与讨论

与传统的被动式遥感获得的图像，如Landsat TM/ETM+相比，全极化SAR图像，由于拥有HH、HV、VH、VV 四种极化状态，可以获得更为丰富的地物信息。全极化SAR图像经过目标分解方法提取的特征值可以比较清晰地反映出明确的地物，因此划分的地类较多，分类精度也有所提高，尤其是“非相干分解”对于较复杂的地物的分解效果比较好。采用全极化SAR数据，在特征分解的基础上进行紫金山国家森林公园土地利用类型监督分类，5种组合中12个特征值组成的特征图像的最大似然分类的精度最高，为58.20%；4种分类方法中，12个特征值组合的随机森林分类的精度最高，为74.29%。

本文只是研究了12个特征值图像的4种分类方法，对其他4种目标特征值合成的图像，仅仅进行了最大似然法监督分类。在最大似然法监督分类基础上，将12个特征值组成的图像，与4种目标特征值合成的图像，进行多种分类方法的精度比较，是下一步研究的重点。

研究发现，全极化SAR图像的预处理过程比较复杂。由于图像空间分辨率较低，给监督分类训练样区的选取带来一定困难。随机森林与其他传统的分类方法相比，由于通过很多的决策树不断地进行分类，可以大大提高分类的精度。但随机森林在运算过程中，需要有更多的训练数据和决策树，所以所需的时间也更多，工作量更大。不同的数据源和不同的分类方法都有优势，也存在一定的缺点。如何充分利用2种数据源的优点，结合不同的分类方法，提高图像的分类精度，需要进一步研究。

参考文献(References)

[1]	张澄波.综合孔径雷达原理、系统分析与应用[M].北京:科学出版社,1989.

[2]	杨士中.合成孔径雷达[M].北京:科学出版社,1981.

[3]	BALZTER H. Forest canopy height and carbon estimation at Monks Wood National Nature Reserve, UK, using dual-wavelength SAR interferometry[J]. Remote Sensing of Environment, 2007,108(3):224-239.

[4]	LIU K, PEI J J, GONG M G. Unsupervised classification of fully polarimetric SAR images based on scattering power entropy and co-polarization ratio[J]. IEEE Geoscience and Remote Sensing Letters, 2012,10(3):622-626.

[5]	SEONG L K, ZVI R, JENS Z. Combined power control and transmission rate selection in cellular[C]. London:Vehicular Technology Conference,1999,50:1 653-1 657.

[6]	CLOUDE S R. Radar target decomposition theorems[J]. Electronics Letter,1985,21(1):22-24.

[7]	CLOUDE S R, POTTIER E. A review of target decomposition theorems in radar polarimetry[J]. IEEE Transactions on Geoscience and Remote Sensing, 1996,34(2):498-518.

[8]	CLOUDE S R, POTTIER E. An entropy based classification scheme for land applications of polarimetric SAR[J]. IEEE Transactions on Geoscience and Remote Sensing, 1997,35(1):68-78.

[9]	ULABY F T, KOUYATE F, BRISCO B, et al. Textural information in SAR images[J]. IEEE Transactions on Geoscience and Remote Sensing, 1986,24(2):235-245.

[10]	王超,张红,刘智,等.全极化合成孔径雷达图像处理[M].北京:科学出版社,2008.

[11]	李春干,代华兵.基于光谱纹理信息和知识挖掘的SPOT5遥感图像分类研究[J].福建林学院学报,2009,29(3):231-236.

[12]	李明阳,刘米兰,刘敏.森林资源与生态监测的空间平衡抽样方法研究[J].西南林学院学报,2010,34(4):1-5.

[13]	何其钰.基于目标分解的极化SAR图像对比增强与分类方法研究[D].成都:电子科技大学,2011.

[14]	JAKOB J, VAN Z. Application of Cloude's target decomposition theorem to polarimetric imaging radar data[C]. San Diego: Proceedings SPIE Conference on Radar Polarimetry,1992,1 748:184-191.

[15]	钱茹茹.遥感影像分类方法比较研究[D].西安:长安大学,2007.

网站导航

文章信息

文章历史