林业科学  2005, Vol. 41 Issue (6): 94-100   PDF    
0

文章信息

王立海, 赵正勇.
Wang Lihai, Zhao Zhengyong.
基于BP神经网络的针阔混交林TM遥感图像自动分类技术研究
Automatically Classifying and Identifying the TM Remote Sensing Images of Forest Mixed with Conifer and Broadleaves Using Improved BP ANN
林业科学, 2005, 41(6): 94-100.
Scientia Silvae Sinicae, 2005, 41(6): 94-100.

文章历史

收稿日期:2005-02-17

作者相关文章

王立海
赵正勇

基于BP神经网络的针阔混交林TM遥感图像自动分类技术研究
王立海 , 赵正勇     
东北林业大学 哈尔滨 150040
摘要: 在对标准BP神经网络试验分析的基础上,通过输入矢量归一化处理、主成分分析、增加验证集、改进训练学习算法、扩大隐层和输出层规模等措施,对BP神经网络自动分类系统进行改进;利用改进后的BP系统对吉林省汪清林业局的典型针阔混交林TM遥感图像进行辩识、分类试验研究。结果表明:改进后的BP网络分类系统自动分类精度提高了19.14%,比传统无监督自动分类精度提高8.55%,达到了区分森林类型的分类要求。研究还显示了该改进系统应用于针阔混交林TM遥感图像自动分类识别的精度随网络规模增大而提高。
关键词: BP神经网络    针阔混交林    TM图像    自动分类    地理信息    
Automatically Classifying and Identifying the TM Remote Sensing Images of Forest Mixed with Conifer and Broadleaves Using Improved BP ANN
Wang Lihai, Zhao Zhengyong     
Northeast Forestry University Harbin 150040
Abstract: The automatically classifying and identifying the TM remote sensing images of forest plays an important role in the monitoring and management of forest resources. In order to improve the performance of BP artificial neural network(BP ANN), many measures, such as standardizing input vectors, increasing verifying set volume, promoting training study algorithm, expanding layers of input-output and main factor analysis, were applied in the TM image data processing. Taking Wangqing Forestry Bureau of Jilin Province as the example study area, the authors studied the automatically classifying and identifying the TM remote sensing images of forest mixed with conifer and broadleaves using the improved BP ANN. The results show that accuracy of automatically classification and identification has been increased significantly, 19.14% higher than that of the traditional ANN method and 8.55% higher than that of traditional unsupervised classifying method respectively. The research also indicates that the classification and identification accuracy rate can be increased further with expanding the BP ANN network volume.
Key words: BP artificial neural network(BP ANN)    mixed forest    TM images    automatically classifying    geographic information    

森林资源信息是国家重要的基础信息资源之一,是林业建设中各项决策的主要依据。遥感技术由于具有宏观性、综合性、可重复性、快递性和经济性等特点,是研究森林资源信息动态变化的强有力工具。图像处理是遥感技术的主要部分。在林业遥感图像处理中,不同属性资源辩识、分类是提取资源信息的关键环节之一。为了提高遥感图像辩识、分类效率与准确程度,本文应用先进的自动辩识、分类技术——神经网络技术对针阔混交林TM图像的辩识、分类进行研究。

人工神经网络(artificial neural network, ANN)简称神经网络,是以模拟人体神经系统的结构和功能为基础建立的一种信息处理系统(张宝光,1998)。它具有大规模并行处理、容错性与壮实性、可学习性(自适应性、自组织性)等特征,在计算机自动分类识别方面不需要基于任何分布假设,综合考虑各种信息,非常适用于光谱值分布规律性弱的林区遥感图像的自动分类识别(Jonathan et al., 1990朱志刚等,1996白黎娜等,2001王任华等,2003杜华强等,2003章杨清等,1994),其中BP神经网络表现得尤为突出。它的神经元采用的可微传递函数,可以实现输入和输出间的任意非线性映射,所以对于“同物异谱”、“同谱异物”现象严重的林区遥感图像的辨识有着良好自动分类效果(李祚泳,1998于秀兰等,1999胡师彦,2001李飞雪等,2003)。但是,人工神经网络系统作为现代应用科学的最前沿,在实际应用过程中不可避免地出现一些不足,如标准BP神经网络应用于自动分类时就存在收敛速度慢、易陷入局部极小值、网络系统稳定性差等缺陷,对遥感图像的自动分类精度影响显著。

本文选择典型针阔混交林的TM遥感图像为分类对象,以区别森林类型为分类目的,在分析标准BP神经网络的基础上,通过输入矢量归一化处理、主成分分析、增加验证集、改进训练学习算法、扩大隐层和输出层规模等措施,对网络进行改进,以达到提高自动分类精度的目的。

1 研究区域概况

研究区域选择在以针阔混交林为主要森林类型的吉林省汪清林业局经营区。该区的温带针阔叶混交林林相在我国东北东部温带山地普遍分布,具有典型性。汪清林业局位于东经129°56′—131°04′,北纬43°05′—43°40′,属长白山系的中低山区,海拔360~1 477 m。全区有3条主要河流的干流通过,两岸地势较陡。随地形、植被和气候条件的变化,其土壤类型也有所不同。暗棕色森林土是主要的土壤类型,其间穿插有一定数量的沼泽土和草甸土。该研究区域植物种类繁多,属长白山植物区系,结构复杂。其中针叶树主要有红松(Pinus koraiensis)、云杉(Picea asperata)和臭松(Symplocarpus foetidus),阔叶树多为椴树(Tilia tuan)、柞树(Quercus mongolicus)、风桦(Betula costata)、色树(Acer mono)和白桦(Betula platyphylla)等。在龄组结构上,中龄林最多。树种组成上,以阔叶树为主。研究区的森林群落其组成结构及发育层次都表现出明显的沿海拔梯度的分布格局, 其树种多样性随海拔的上升均表现出明显的下降趋势(常禹等, 2003姜萍等,2003)。

研究区域典型针阔混交林区的遥感图像具有3个特点:1)在针叶林和阔叶林之间的过渡区大量分布着混交林,导致这一区域的遥感图像光谱值的“同谱异物”现象比较严重;2)此区域绝大部分是高山林地,使得所采集的遥感图像上存在很多地形阴影区。这些阴影区主要由山体相互掩映造成,使同一地类(森林类型)的阳坡和阴坡的光谱值差异很大,“同物异谱”现象比较严重(Skidmore, 1989刘卫国等,1997俞小林, 2000);3)森林的蒸腾作用和山体间的大高差,致使此区域得到的遥感图像普遍质量不高,图像上易出现白云区和云的遮挡在地面造成的阴影区。这些因素影响遥感图像的分类预处理和后期分类效果,在一定程度上增加了自动分类的难度。

2 研究资料及数据预处理

研究资料主要包括一景Landsat 5的TM遥感数字图像、汪清林业局1997年森林二类调查成果资料和1997年汪清林业局1:50 000林相分布图。其中TM遥感数字图像的基本参数为:图像获取时间1997年7月,全景,地球椭圆体为Krasovsky,太阳方位角124°,太阳高度角60°。

数据预处理主要包括:1)建立基于1997年资料的研究区地理信息系统(GIS);2)遥感数字图像的分类预处理。其中遥感图像预处理的过程为:先对图像进行几何校正和研究区裁减,然后进行直方图光谱校正、郎伯体地形光谱校正和光谱值线性拉伸,最后进行光谱增强变换。试验表明:对遥感图像的预处理能在很大程度上增大图像上不同地物的光谱值差异,提高图像的可分辨能力。

3 研究方法 3.1 建立改进型BP神经网络遥感图像自动分类系统 3.1.1 BP神经网络及其改进

应用BP神经网络进行图像处理,一般在标准BP神经网络基础上,针对具体应用对象进行若干改进。所谓的标准BP神经网络是误差反向传播(back-propagation)算法的一种,它是以网络权值和阈值沿着网络误差变化的负梯度方向进行调节为自学习算法的一种三层神经网络(输入层、隐层和输出层)。它的基本思想是:在正向传播过程中,每一层神经元的状态只影响到下一层神经元网络。如果输出层不能得到期望输出,则反向逐次对网络各神经元的权值和阈值进行调节,过程反复进行,当网络误差达到极小值或最小值,网络学习结束(邬永革等,1995)。

由于BP网络学习训练时误差是沿负梯度方向传递,导致了一些不足,主要体现在(许东等,2002):1)具有梯度下降算法的固有缺陷,易陷入局部极小值,无法保证每次训练的网络全局最优性;2)网络的训练效率低;3)网络迭代步长和惯性系数的选取是凭经验确定的,选取不当可引起网络振荡甚至导致网络不能收敛,极大影响网络的建立;4)网络推广能力差。

针对以上分析标准BP神经网络的不足,提出以下针对本文研究对象的改进措施,以达到优化BP神经网络、实际应用于针阔混交林遥感图像分类识别的目的。1)对输入数据进行预处理,即把遥感图像的数据流文件进行归一化处理和主成分分析,压缩数据维数,减小输入层规模,提高网络训练、运行效率。2)改进网络训练算法,应用自适应学习速率动量梯度下降反向传播算法。自适应学习速率动量梯度下降反向传播算法是动量梯度下降算法和自适应学习速率梯度下降算法的组合,其数学公式表达如式(1)。它具有动量梯度下降算法和自适应学习速率梯度下降算法的优点,既能通过网络性能对学习速率进行自适应调整,从而提高网络训练准备效率,又能利用设置的动量因子来降低网络性能对参数调整的敏感性,有效地抵制了局部极小现象,使网络保持较好的稳定性。3)增加验证集提高网络推广能力,由于“过度训练”易导致网络推广能力差,所以在训练时增加验证集,监控网络训练进程,控制训练进程。

(1)

式中:dW为网络权值或阈值的调整量,gW为网络性能对于网络权值的梯度矢量,mc为动量因子,lr为学习速率。

3.1.2 应用BP神经网络技术解决TM遥感图像针阔叶混交林自动分类的基本步骤

首先,建立改进型的BP神经网络,具体步骤见图 1a;然后,将上述改进型BP神经网络应用于TM针阔叶林自动分类试验研究,具体步骤见图 1b

图 1 建立神经网络分类系统的技术路线图 Fig. 1 Flowchart of methodology for establishing ANN of classifying system
3.2 分类试验

以区分森林类型为目的,把研究区地物类型进行4级划分,划分的目的地物类型为非林地、针叶林地、混交林地和阔叶林地。按照图 1的技术路线,建立BP神经网络分类系统,对预处理后的TM遥感图像进行自动分类试验。

3.2.1 分类样本数据预处理

输入数据:选取TM1、TM2、TM3、TM4、TM5、TM7共6个遥感波段图和高程、坡向、坡度和土壤4幅GIS图像的背景、非林地、针叶林、混交林和阔叶林5种典型地物若干块。其中,选取的针叶林样本数据见图 2。对构造的10个输入数据进行归一化和主成分分析处理(最小能量比系数为0.02),最终压缩成4维输入数据。输出数据:分为灰度图输出(单元)和RGB彩色输出(三元)2种。

图 2 针叶林样本的图像数据 Fig. 2 Images data samples for conifer forest
3.2.2 网络参数的确定和建立网络

BP神经网络的隐层层数和每层神经元个数的确定没有确切的规律;但总体来说,层数和神经元个数越多,网络越稳定,最终网络性越好,但网络规模也随之增大,建立网络的时间和网络运行时间呈指数级递增。综合上述各种因素,为评价改进措施的分类效果,特确定以下2种方案。

方案一:设定网络层数为输入层、隐层、输出层3层。输入层的神经元个数为原始的10类分类数据,隐层为20个,输出层为1个(即灰度图)。训练学习算法采用标准BP算法,即梯度下降反向传播算法。传递函数为tansig函数和线性函数。网络最大训练次数为5 00 0次,最长训练时间不超过48 h,误差目标(均方误差)为1 000,其余网络参数为默认值。方案一结构见图 3a

图 3 2种方案的BP神经网络结构图 Fig. 3 Frame of BP ANN b. for scheme 1 and scheme a.标准BP神经网络Standard BP ANN; b.改进型BP神经网络Ameliorative BP ANN.

方案二:输入层为压缩后的4维数据,隐层规模增大到30个神经元,输出层为3个(RGB彩色合成图)。改进训练学习算法为自适应学习速率动量梯度下降反向传播学习算法,其余参数同方案一。方案二结构见图 3b

3.2.3 对遥感图像的自动分类识别

2种方案分类系统在MATLAB的支持下,分别编程完成。网络程序经编译后,网络通过自学习获取到各神经元的网络权植和阈值,建立起遥感图像的自动分类识别系统。采用2种方案分别对研究区域TM1、TM2、TM3、TM4、TM5、TM7共6个波段遥感图像,以及高程、坡向、坡度和土壤4幅GIS图像输入2种自动分类,结果见图版Ⅰ-12

图版Ⅰ   Plate Ⅰ  
3.2.4 神经网络分类后处理

分析BP神经网络自动分类识别系统分类后的结果图,发现输出结果不是理想的纯目标专题颜色。其原因有3个:1)构造输入、输出样本时,样本与背景之间存在过渡色,即输入、输出样本不纯;2)神经网络是多维非线性映射,输出了非目的数,即映射输出不纯;3)网络使用的是double数据(双精度数据),而分类专题图是uint8数据(8位无符号整数),两者之间相互转化引入非目的数据,即转化输出不纯。

由于分类输出结果不纯,不能直接对其进行精度评价,需要进行分类后处理,进一步纯化输出。对输出图进行数据统计分析过程中发现,虽然输出数据不纯,但每一类的数据都呈正态分布,明显聚类。所以,本研究采用对输出图进行最大似然规则的监督分类,进行重编码处理,得到分类效果专题图(图版Ⅰ-34)。

另外,为了与传统自动分类技术进行对比,本研究还做了TM图像7个波段的主成分变换无监督分类。由于此方法无法对遥感图像中的白云区和云阴影区进行自动分类,所以只好采用数字化方法,将白云区和阴影区作为2个特殊分类,展现在它的分类专题图中(图版Ⅰ-5)。

4 分类精度分析 4.1 分析方法

遥感图像分类精度的分析方法可分为非位置精度分析和位置精度分析(彭望琭等,2002)。非位置精度分析以一个简单的数值,如面积、像元数目等表示分类精度,由于未考虑位置因素,类别之间的错分结果彼此平衡,在一定程度上抵消了分类误差,使分类精度偏高。位置精度分析是将分类的类别与其所在的空间位置进行统一检查。目前普遍采用混淆矩阵的方法,即以总分类精度和Kappa系数分析整个分类图的精度,以条件Kappa系数分析单一类别的精度。应用混淆矩阵进行分类精度的检验方法是1960年由Cohen提出的(Skidmore, 1989)。以后有许多学者在Kappa系数的算法和应用方面作出了大量工作,逐渐发展成遥感分类的精度分析主要方法。

本研究拟采用混淆矩阵分析法,以混淆矩阵的总体分类精度、生产者精度、用户精度、总体Kappa系数和各类别的条件Kappa系数5个参数进行综合评价。以往研究表明,Kappa系数与遥感图像地物分类质量存在着密切关系(表 4)(彭望琭等,2002)。

表 4 Kappa系数与分类质量之间的关系 Tab.4 Kappa index and classification quality

研究区域的遥感图像分类精度分析应用分层随机采样的方法。对照数据以1997年二类森林资源调查数据建立的研究区林相分布图(图版Ⅰ-6)为主,以地形图为辅,同时,参考2003和2004年研究区域实地调查结果。对每个采样点逐点人工确定实际地物类别真值,再把采样各点对应分类专题图的地物种类计算值与其真值进行比较和统计分析,得出各自动分类技术的分类专题图精度分析数据结果如表 123所示。

表 1 主成分变换无监分类混淆矩阵及评价参数表 Tab.1 Confusion matrix and assessment parameters for PCI transform unsupervised classification
表 2 标准BP神经网络分类混淆矩阵及评价参数表 Tab.2 Confusion matrix and assessment parameters for standard BP NN
表 3 改进型BP神经网络分类混淆矩阵及评价参数表 Tab.3 Confusion matrix and assessment parameters for optimizing BP NN
4.2 分析结果与讨论

分析时随机在经过主成分变换后第1、第2、第3分量RGB合成遥感图像的无监分类专题图中选择700个点(非林地150,云阴影50,白云50,针叶林150,混交林150,阔叶林150)进行评价。对于采用BP神经网络分类系统进行的分类,随机选取600个样点。样点在各种地物中分布见表 23

经过计算分析,无监分类结果如表 1所示。该分类方法的总体分类精度为67.45%,总体Kappa指数为0.598 0,分类精度一般。其中混交林、针叶林和阔叶林的用户精度分别为5 1.01%、60.26%、60.62%,条件Kappa指数为0.359 9、0.487 6、0.533 2,说明这种自动分类技术对区分TM遥感图像上的针阔混交林森林类型比较困难。

表 2可得,标准BP神经网络分类系统分类的总体分类精度为56.86%,总体Kappa指数为0.437 1,分类精度较低。其中,阔叶林和混交林的条件Kappa指数为0.125 0和0.1 96 8,分类精度非常低。而针叶林的条件Kappa指数却高达0.684 2,分析其原因,主要是大部分其他类型都错分为针叶林的结果。对森林类型的分类结果很不理想,网络必须改进。

值得注意的是此方法能应用输入的地学知识(高程、坡向、坡度和土壤4幅GIS图像)对TM图像的白云区和云阴影区分类效果较好。

分析表 3,改进型BP神经网络分类识别系统的总体分类精度为76.00%,总体Kappa指数为0.680 0,分类精度较好。其中,非林地的分类精度最高,用户精度为98.67%,条件K appa指数也达到了0.981 8,说明此分类方法能非常好地把有林地与非有林地自动分离出来;针叶林、混交林和阔叶林的用户精度分别为60.00%、69.33%和76.00%,条件Kappa指数分别为0.488 3、0.592 0和0.673 5,分类效果也比较好,达到了区分针叶林、混交林和阔叶林的分类目的。

同时,分类专题图还显示出,输入矢量的归一化和主成分分析后的输入保存了原输入数据中的地学信息,通过复杂的内部非线性映射,也实现了对白云区和云阴影区的分类。而且分析针叶林的60个错分点和混交林的46个错分点中,只有41个点是位于地形阴影区,说明地形阴影区对分类精度影响也变小了,系统性能有很大改善,提高了分类精度。这一方面说明了BP神经网络分类识别系统能比较好地应用于林区的TM遥感图像自动分类识别,同时又验证了该系统分类精度有随隐层网络规模增大而提高的趋势。

5 结论与讨论

通过对东北林区的典型针阔混交林TM遥感图像自动分类试验研究认为:

1) 改进型BP神经网络分类识别系统在该林相TM遥感图像的自动分类上有广阔的应用前景。研究对标准BP神经网络分类识别系统进行改进,通过输入矢量的归一化和主成分分析、增加验证集、改进训练学习算法、扩大隐层和输出层规模等措施,使改进的分类识别系统的分类精度有了比较明显的提高。研究区TM遥感图像针阔叶林分类试验的总体分类精度达到76.00%,总体Kappa指数为0.680 0,比改进前提高了19.14%,比传统无监督分类提高8.55%。针叶林、混交林和阔叶林的用户精度分别为60.00%、69.33%和76.00%,条件Kappa指数分别为0.488 3、0.592 0和0.673 5,达到区分针叶林、混交林和阔叶林的分类目的。既展示其应用于针混交林TM遥感图像自动分类识别的能力,又验证了该系统分类精度具有随网络规模增大而提高的发展潜力。

2) 采用适当数据预处理方法能够减弱阴影对林业遥感图像分类效果的影响。试验结果表明:通过对原始遥感图像进行直方图校正、线性拉伸等辐射校正和朗伯体反射模型地形校正法等地形光谱校正,以及彩色合成和光谱增强等技术应用,比较显著地削弱地形阴影产生的负面影响,在很大程度上提高了遥感图像的可识别能力,为进一步分类处理提供了良好的数据源。

在进行样地调查时,作者发现《森林资源规划设计调查主要技术规定》中规定的针叶林地、阔叶林地和混交林地之间的划分标准与遥感光谱解译结果不匹配。即《规定》上的森林类型的划分标准从本质上不适用于遥感图像的森林类型区分。因此,建立一套适合于遥感图像分类的森林类型新标准具有实际应用意义。

参考文献(References)
白黎娜, 李增元, Fabio M, 等. 2001. 应用遥感数据识别意大利沿海松林灾害级别. 林业科学研究, 14(5): 479-483. DOI:10.3321/j.issn:1001-1498.2001.05.003
常禹, 布仁仓, 胡远满. 2003. 利用GIS和RS确定长白山自然保护区森林景观分布的环境范围. 应用生态学报, 14(5): 671-675. DOI:10.3321/j.issn:1001-9332.2003.05.005
杜华强, 范文义. 2003. Matlab自组织神经网络在遥感图像分类中的应用. 东北林业大学学报, 21(4): 51-53. DOI:10.3969/j.issn.1000-5382.2003.04.019
胡师彦. 2001. 混合遗传BP算法在图象识别中的应用. 淄博学院学报(自然科学与工程版), 3(4): 21-24.
李飞雪, 李满春, 赵书河. 2003. 基于人工神经网络与决策树相结合模型的遥感图像自动分类研究. 遥感信息, (3): 23-26. DOI:10.3969/j.issn.1000-3177.2003.03.007
李祚泳. 1998. 用BP神经网络实现多波段遥感图像的监督分类. 红外与毫米波学报, 17(2): 153-156. DOI:10.3321/j.issn:1001-9014.1998.02.013
刘卫国, 吕鸣伦. 1997. 地理信息系统和遥感技术支持下的山地环境梯度分析方法研究. 地理研究, 16(3): 63-69.
姜萍, 赵光, 叶吉, 等. 2003. 长白山北坡森林群落结构组成及其海拔变化. 生态学杂志, 22(6): 28-32. DOI:10.3321/j.issn:1000-4890.2003.06.006
彭望琭, 白振平, 刘湘南, 等. 2002. 遥感概论. 北京: 高等教育出版社, 274-276.
邬永革, 赵健, 黄炯. 1995. 基于人工神经网络的图像压缩方法. 计算机应用研究, 6: 15-16.
王任华, 霍宏涛, 游先祥. 2003. 人工神经网络在遥感图像森林植被分类中的应用. 北京林业大学学报, 25(4): 1-5.
许东, 吴铮. 2002. 基于MATLAB6. X的系统分析与设计——神经网络. 西安: 西安电子科技大学出版社, 40-49; 86-88.
俞小林. 2000. 多光谱影像中消除地形和环境影响的新方法. 遥感信息: 27-30.
于秀兰, 钱国蕙, 周建林, 等. 1999. 多光谱遥感图像BP网分类器学习样本选取法的研究. 红外与毫米波学报, 18(6): 451-454.
张宝光. 1998. 人工神经网络在遥感数字图像分类处理中的应用. 国土资源遥感, 35(1): 21-27.
章杨清, 刘政凯. 1994. 利用分维向量改进神经网络在遥感模式识别中的分类精度. 环境遥感, 9(1): 68-72.
朱志刚, 徐光祜, 席浩军. 1996. 视觉导航的旋转不变性图象获取和神经元网络识别方法研究. 中国图象图形学报, 1(5): 361-367.
Jonathan L, Ronald C W, Sailes K S. 1990. A neural network approach to cloud classification. IEEE Trans on Geo and Remote Sensing, 28(5): 1311-1317.
Skidmore A K. 1989. An expert system classifies Eucalyptus forest types using Thematic Mapper data and a digital terrain model. PE & RS, 55(10): 1449-1469.