林业科学  2015, Vol. 51 Issue (1): 140-149   PDF    
DOI: 10.11707/j.1001-7488.20150117
0

文章信息

郭云, 李增元, 陈尔学, 田昕, 凌飞龙
Guo Yun, Li Zengyuan, Chen Erxue, Tian Xin, Ling Feilong
甘肃黑河流域上游森林地上生物量的多光谱遥感估测
Estimating Forest Above-Ground Biomass in the Upper Reaches of Heihe River Basin Using Multi-Spectral Remote Sensing
林业科学, 2015, 51(1): 140-149
Scientia Silvae Sinicae, 2015, 51(1): 140-149.
DOI: 10.11707/j.1001-7488.20150117

文章历史

收稿日期:2014-01-23
修回日期:2014-08-18

作者相关文章

郭云
李增元
陈尔学
田昕
凌飞龙

甘肃黑河流域上游森林地上生物量的多光谱遥感估测
郭云1, 2, 李增元1, 陈尔学1, 田昕1, 凌飞龙2    
1. 中国林业科学研究院资源信息研究所 北京 100091;
2. 福州大学空间数据挖掘与信息共享教育部重点实验室 福州 350002
摘要【目的】以黑河流域上游祁连山森林保护区为研究区,利用133个森林样地调查数据、Landsat-5 TM影像和ASTER GDEM产品为数据源,探讨地形对该流域森林地上生物量(above-ground biomass, AGB)估测的影响,以及选择合适的遥感估测方法反演该流域的森林AGB。【方法】首先利用青海云杉特殊的生境范围和绿色植被对比值植被指数(ratio vegetation index,RVI)的灵敏程度,及不同地物对纹理特征的不同响应,制定相应的决策树分类器,将研究区的土地覆盖类型分为两大类:森林(青海云杉)-非森林,并利用133个森林样地调查数据和Google Earth高分辨率影像的12 722个采样点对分类结果进行验证(总体分类精度达到 90.39%,Kappa 系数为 0.81);然后运用多元线性逐步回归估测法,以及结合随机森林算法(random forest, RF)优化后的k最近邻分类法(k-nearest neighbors, k-NN)进行森林AGB的遥感估测,对比SCS+C地形校正前后青海云杉森林AGB的估测结果,同时比较2种不同估测方法的反演效果;最后利用得到的最优估测方法反演整个研究区的森林AGB,生成黑河流域上游祁连山森林保护区的森林AGB的等级分布图。【结果】SCS+C地形校正前多元线性逐步回归的估测精度为R2 =0.31,RMSE=34.41 t·hm-2,地形校正后多元线性逐步回归的估测精度为R2 =0.46,RMSE=30.51 t·hm-2;而基于 SCS+C地形校正后的k-NN的交叉验证精度不仅明显高于地形校正前的精度,且显著优于多元线性逐步回归的估测结果,达到R2 =0.54,RMSE=26.62 t·hm-2;另外基于最优的k-NN 估测模型(窗口为 7×7,采用马氏距离,k=3)反演的该流域青海云杉在2009年总的森林地上生物量为8.4×107 t,平均森林地上生物量为96.20 t·hm-2【结论】在地形复杂地区,运用SCS+C模型对地形进行适当校正,能够有效地消除太阳入射角变化引起的地表反射亮度的差异,使影像能够更准确地反映地表信息,提高森林AGB的遥感估测精度;在样本有限的情况下,相对于以大数定律作为理论基础的多元线性逐步回归估测法,k-NN能够避免发生过学习现象和样本不平衡问题,更适于该研究区青海云杉的森林AGB的估测。
关键词Landsat-5 TM    SCS+C地形校正    多元线性逐步回归    k-NN    森林地上生物量    遥感估算    
Estimating Forest Above-Ground Biomass in the Upper Reaches of Heihe River Basin Using Multi-Spectral Remote Sensing
Guo Yun1, 2, Li Zengyuan1, Chen Erxue1, Tian Xin1, Ling Feilong2    
1. Institute of Forest Resources Information Techniques, CAF Beijing 100091;
2. Key Laboratory of Spatial Data Mining & Information Sharing of Ministry Education, Fuzhou University Fuzhou 350002
Abstract: [Objective]Forest biomass is the main source of energy and nutrients of the forest ecosystem operation. Qilian Mountain forest reserve at the upper reaches of Heihe River Basin was selected as the research area. The forest inventory data, Landsat-5 TM images and ASTER GDEM products were used as data sources. The purpose of this paper is to explore the effect of terrain on the estimation of forest above-ground biomass (AGB) and select appropriate method for the inversion of forest AGB. [Method]First, a decision-tree classifier was constructed by taking into account of the special habitat of Picea crassifolia and the sensitivity of the green vegetation for ratio vegetation index, and the different responses of various objects on the texture features. The land-cover types of the research area was divided into two categories: forest (Picea crassifolia)—non-forest. The accuracy assessment of classification map was obtained by using field inventory data and high-resolution image of Google Earth (The overall accuracy of the classification is 90.39%, and the Kappa coefficient is 0.81). Then, the forest AGB was estimated using the multiple linear stepwise regression and k-NN. The k-NN was implemented by combining with RF algorithm. The change of the estimation accuracy before and after the topographic correction was analyzed. And the estimation accuracy of two different retrieval methods were compared with the forest survey data. Finally, the grade distribution of regional forest AGB was performed by the optimal estimation method. [Result]The estimation accuracy of multiple linear regression was R2=0.31, RMSE=34.41 thm-2 before SCS + C topographic correction. But it was R2=0.46, RMSE=30.51 thm-2 after SCS + C topographic correction. The optimal k-NN produced higher cross-validation accuracy (R2=0.54, RMSE=26.62 thm-2) by using the data after SCS + C topographic correction than the outcome before SCS + C topographic correction. At the same time, it performed better than the effect of the multiple linear stepwise Regression. The regional forest AGB which was performed by the optimized k-NN (window sampling size was 7×7; distance measures was Mahalanobis Distance; k was 3) showed that the total of forest AGB of Picea crassifolia was 8.4×107 t in this region, and the average was 96.20 thm-2. [Conclusion]The appropriate terrain correction with SCS + C model could effectively eliminate the influence of the change of incident angle of the sun in complex terrain area. It could improve the estimation accuracy of the models. Compared with multiple linear stepwise regression, the optimal k-NN could avoid the phenomenon of learning and the problem of sample imbalances in the case of limited samples.
Key words: Landsat-5 TM    SCS+C terrain correction    multiple linear stepwise regression    k-NN    forest above-ground biomass(AGB)    estimation of remote sensing    

碳是重要的生命元素,地球上主要包括大气、海洋和陆地三大碳库。海洋深水中的碳含量约为4万Gt,大气中的碳贮量约为720 Gt,陆地生态系统总的碳贮量为2 000 Gt(陶波等,2001);其中,植被中约含600 Gt,陆地土壤中约含1 600 Gt(李银鹏等,2001)。作为陆地生态系统的主体,森林不仅具有改善和维护区域生态环境的功能,而且在全球碳平衡中的作用巨大,储存了陆地生态系统有机碳地上部分的76%~98%(刘华等,2005)。据理论估计,化石燃料每年的燃烧量为5.5 Gt,海洋每年从大气中吸收的CO2为2.5 Gt,而陆地生态系统的年碳交换量约为120 Gt,其中,森林与大气之间的年碳交换量占陆地生态系统总量的90%(Melillo et al.,1996李银鹏等,2001)。显而易见,森林控制着全球碳循环的动态。森林地上生物量(above-ground biomass,AGB)是固碳能力的重要标志,是评估森林碳收支的重要参数,是系统发挥其他生态功能的物质基础,是进行陆地生态系统碳循环的重要指标。因此,准确估测森林AGB的时空格局是全球碳循环及气候变化研究的基础和核心内容。

甘肃黑河流域的森林绝大部分分布于上游地区,在水土保持、水源涵养和水文调节、生物固碳及生物多样性保护等方面具有重要作用,是维系该流域生态平衡的天然屏障。因此,研究和估测上游地区的青海云杉(Picea crassifolia)森林AGB,能为有效地保护生态环境和合理利用森林资源提供科学数据,从而有效抑制该流域的土地荒漠化、土地盐碱化、河道断流、水质污染和草地退化等问题的进一步恶化,另外对实现人与自然和谐发展和促进经济社会的全面协调可持续发展也具有十分重要的意义。

传统的森林AGB估测方法具有一定的局限性,不仅费时、费力,而且无法实时反映区域尺度森林AGB的动态变化及森林生态环境状况(袁野等,2011Eisfelder et al.,2012)。随着遥感技术应用日益成熟,利用遥感技术进行大面积、快速准确、无破坏的森林AGB估测已成为主要趋势(娄雪婷等,2011)。根据所用数据源不同,目前基于遥感技术的森林AGB反演包括光学数据反演、合成孔径雷达反演、激光雷达反演和多源数据反演等(张志等,2011汤旭光等,2012)。面对当前的国际环境形势,国内对森林AGB的估测也进行了大量研究。李虎等(2008)利用遥感和地面调查数据提取新疆西天山不同年龄阶段的云杉(Picea asperata)林信息,对其生物量进行计算分析,对比分析1986,1996及2007年3期的森林生物量监测数据,对云杉林生物量的时空分布变化进行评价。李明诗等(2006)利用纹理测度来提高森林AGB估算精度,虽然大多数纹理测度与生物量的关系不紧密,但是少数纹理特征在森林生物量估算上是有效并且是重要的。许东等(2008)在吉林省延边朝鲜族自治州的白河林业局调查取样,基于遥感和地理信息系统技术提取光谱信息及地形信息作为估测的自变量,利用k近邻法进行森林蓄积量的估测。陈尔学等(2008)基于多源数据,研究了k-NN法用于小面积统计单元的森林蓄积量估测,并利用交叉验证的方法评估其有效性。Reese等(2002)以瑞典的lvsbyn,Vsterbotten,Dalarna,Gvleborg和Uppl and 为研究区,结合多源遥感影像和森林清查资料为数据源,采用k-NN对研究区的森林参数(森林蓄积量、林龄和生物量)进行了反演。何祺胜等(2009)以黑河流域祁连山大野口典型森林区为研究区,采用高密度LiDAR小脚印点云数据对森林平均树高、冠幅等主要森林结构参数进行了反演研究。

目前,国内对森林AGB的研究多是利用遥感波段值及植被指数,结合传统的多元统计分析法建立回归方程(郭志华等,2002徐天蜀等,2007李亦秋等,2009王红岩等,2010王光华等,2012),但是这种方法受限于遥感信息间的复共线性。因此,尽可能多地选取植被指数、地学信息及影像纹理信息等与森林AGB相关的因子,并采用先进的建模方法,是提高森林AGB估测的有效途径。本文以黑河流域上游作为研究区,该地区地形复杂(谷地、湖盆、山地和平原等)、景观破碎,因此利用SCS+C模型对遥感影像进行地形辐射校正,从而探讨了地形辐射校正对森林AGB估测的影响,最后比较了多元线性逐步回归方法和k-NN对区域森林AGB的估测效果。

1 研究区概况和数据 1.1 研究区概况

黑河是我国西北地区第二大内陆河,发源于祁连山北麓中段,流域范围介于97°24′—102°10′E,37°41′—42°42′N之间,面积约为13万km2。整个流域由三大地貌组成:南部祁连山、中部河西走廊和北部阿拉善高原,面积广阔,地形复杂多变。黑河流域位于欧亚大陆中部,远离海洋,周围高山环绕,流域气候主要受中高纬度的西风带环流控制和极地冷气团影响,气候干燥,降水稀少而集中,日照充足,太阳辐射强烈,昼夜温差大。黑河上游位于青藏高原北缘的祁连山地,是黑河流域的发源地和产流区(李林等,2006)。该流域上游祁连山森林由青海云杉构成,主要分布在2 400~3 300 m之间的阴坡区域(王金叶等,1998),其中夹杂着少量的垂枝祁连圆柏(Sabina przewalsk),阳坡则栖息着稀疏的草地。长期以来,由于人口的增长和经济的发展,对水资源和森林的过度开发,导致了流域内生态环境日趋恶化:森林带下限逐渐退缩,水源涵养林、草日渐退化,生物多样性减少,生物链失衡,鼠害猖獗,森林面积急剧萎缩(李军辉等,2011)。

1.2 研究数据及预处理

本研究获取2008年黑河综合遥感联合试验的森林样地调查数据,其中包含14个固定样地;一个沿山坡走势设置的100 m×100 m的超级样地,这个超级样地被划分出16个25 m×25 m的子样地;以及一个沿北偏东115°方位设置的1 km样带,样带上每隔30 m有一个20 m×20 m样地,共布设了20个样地(Tian et al.,2012)。由于这3种样地的空间分布相对集中于黑河综合遥感联合试验的重点试验区(航空遥感飞行区),代表性较差,所以获取了试验区同期的83个临时样地数据。共计获取了133块样地的调查数据,样地的森林类型均为青海云杉次生天然林,调查因子包含样地经度(99°33′—100°19′E)、纬度(38°26′—38°51′N)、海拔(2 612~3 257 m)、树高(2.2~41.5 m)和胸径(4~160 cm)等。基于王金叶等(1998)的生物量模型计算出每个样地的单位面积森林AGB。经统计,样地生物量分布于18.85~220.65 t·hm-2之间。

另外,分别从美国地质勘探局(http://glovis.usgs.gov/ )和日本地球遥感观测数据分析中心(http://gdem.ersdac.jspacesystems.or.jp/)下载了覆盖研究区的TM影像(30 m)和ASTER GDEM产品(GDEM,30 m)。为了降低数据对估测结果的影响,选择成像时间与森林调查数据获取时间相近的4景TM影像,其成像时间分别为2009年8月11日、2009年7月17日、2009年8月11日和2009年8月11日,4景影像的投影和坐标系均为通用横轴墨卡托投影和WGS-84坐标系。

复杂的山区地形的变化,使得相同地物的像元所接收到的有效光照可能存在较大差别,从而导致其光谱信息存在差异,降低遥感图像地表信息表征的可靠性。而森林AGB的遥感反演,通常以地表反射率为基础建立反演模型,因此,在定量遥感研究中,消除地形对植被反射率的影响十分必要。故在对影像进行辐射定标和大气校正之后,采用SCS+C模型(Soenen et al.,2005)对4幅影像进行地形辐射校正。

2 研究方法 2.1 森林-非森林分类

由于该研究区地形复杂、景观破碎,为了避免草地、农田和灌木等地类对青海云杉区域森林AGB反演结果的影响,利用经过预处理的TM影像和GDEM产品提取出青海云杉区域。

对于绿色植物而言,由于叶绿素引起的红光吸收和叶肉组织引起的近红外强反射使其红光波段灰度值与近红外波段灰度值具有较大的差异,比值植被指数(ratio vegetation index,RVI)高于2,而对于无植被的地面,RVI低于2(赵英时,2003);经过对比分析发现,对于森林区域,影像第4波段的均值纹理特征小于2.5,而菜地、农田具有高于2.5的均值;根据前面2点,再加上青海云杉特殊的生境范围,制定了如图 1所示的决策树分类规则。最后利用133个森林样地调查数据和基于Google Earth高分辨率影像的12 722个采样点对分类结果(图 2)进行验证(表 1),其总体分类精度为90.39%,Kappa系数为0.81。

图 1 森林-非森林分类的决策树 Fig. 1 Decision tree for forest and non-forest classification
图 2 研究区的森林-非森林分类 Fig. 2 Forest and non-forest classification of study area
表 1 分类结果的精度验证 Tab.1 The accuracy table of classification result
2.2 随机森林

随机森林(r and om forest,RF)算法是Leo Breiman在2001年提出的组合分类算法。其基本思想是:首先,利用bootstrap抽样从原始训练集抽取与其样本容量一样的k个样本;然后,对抽取的每个样本单独建立决策树模型,从而得到k种分类结果;最后,依据k种分类结果对每条记录进行投票表决,决定其最终分类(方匡南,2011)。该算法的实质是传统决策树算法的扩展,通过将多个决策树进行组合来提高预测精度。

在现有的研究应用中,RF主要用于分类和回归问题。然而作为一种集成机器学习方法,RF具有分析复杂相互作用分类特征的能力,其对变量重要性的度量可以作为高维数据的特征选择工具(姚登举等,2012)。鉴于RF的这种能力,本文结合Java语言,应用RF算法进行光谱特征向量的选择,最终选择特征向量组合:高程变量、第2主成分、第4波段的二阶矩纹理特征、第5波段的均值纹理特征以及第7波段的方差纹理特征和相异性纹理特征向量组合。

2.3 多元线性逐步回归估测法

多元线性逐步回归法是最常用的经典参数估测法。本文对TM影像分别进行缨帽变换和主成分变换,并获取各单波段灰度值及不同波段灰度值之间的线性和非线性组合(包括各种植被指数)。采用灰度共生矩阵,以9×9的窗口,分别提取6个波段的8种纹理信息——均值、方差、均匀性、对比度、相异性、熵、二阶矩和相关性。由于研究区的地形多变,遂提取GDEM产品中的海拔、坡度和坡向信息。为比较地形辐射校正对森林AGB估测的影响,针对多元线性逐步回归估测方法,本文随机选取了133个样本中的88个进行建模。利用SPSS19.0软件,从77个遥感定量反演所可能涉及的特征因子中选取在显著性水平0.05条件下与森林AGB显著相关的因子,然后采用多元逐步线性回归分析法分别建立地形校正前后森林AGB的回归模型,比较SCS+C地形校正对森林AGB估测的影响。

2.4 k-NN估测法

k-NN作为一种非参数化方法,其思路非常简单直观。如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别(徐新良等,2006)。基于k-NN算法进行森林AGB的遥感估测与利用k-NN算法分类的原理相似,具体流程为:通过计算待测像元与实测样本所在像元间的光谱距离,得到与待测像元最近的k个样本;然后对得到的k个样本的森林AGB进行加权平均计算,其中距离待测像元越近的样本权重越大。可采用式(1)计算待测像元的AGB(Reese et al.,2002):

${W_p}=\sum\limits_{i=1}^k {{W_{i,p}} \times {W_{pi;}}} $ (1)
${W_{pi,p}}=\frac{{D_{pi,p}^2}}{{\sum\limits_{i=1}^k {\frac{1}{{D_{i,p}^2}}} }}。$ (2)

式中:p为待测像元;pi为参考点;Wp为待测像元的森林AGB;Dpi,p为两点之间的光谱距离;Wpi,p为权重值;参考点pi的森林AGB和森林类型都是已知的,光谱空间中距离待测像元p最近的k个样地点为p1,p2,…pk

参考点和目标点之间的光谱距离可以采用多种度量方法进行计算,如欧氏距离式(3)、马氏距离式(4)和模糊距离式(5)等(Chirici et al., 2008):

${D_{pi,p}} = \sum\limits_{i = 1}^n {{{\left( {{X_{pi}} - {X_p}} \right)}^2}} ;$ (3)
${D_{pi,p}}=\left({{X_{pi}} - {X_p}} \right){H^{ - 1}}{\left({{X_{pi}} - {X_p}} \right)^T};$ (4)
${D_{pi,p}}=\left({{X_{pi}} - {X_p}} \right){H^{ - 1}}{\left({{X_{_{pi} - {X_p}}}} \right)^T}。$ (5)

式中:Xp表示待测像元p的光谱向量;Xpi表示样地所在像元的光谱向量;H表示样本的协方差矩阵;H*表示样本的模糊协方差矩阵。

k-NN法估测森林参数时受模型参数的影响,模型参数包括光谱特征向量、特征向量信息提取窗口大小、光谱距离的度量标准以及最近邻k值的大小。因此,通过分析比较选择不同的参数组合(表 2)对于k-NN估测法的影响,建立最优的k-NN森林AGB估测模型森林AGB。

表 2 k-NN估测法的不同参数组合 Tab.2 Different parameter sets of k-NN
3 结果与分析 3.1 多元线性逐步回归估测结果

使用未经过地形辐射校正的TM影像数据建模得到的回归拟合方程(6),其模型的相关系数(R2)为0.41,均方根误差(RMSE)为30.13 t·hm-2;而利用经过SCS+C地形校正TM影像进行建模,得到的回归拟合方程(7),其相关系数明显提高,达到0.44,均方根误差降为29.22 t·hm-2

${\rm{Y=688}}{\rm{.530 - 0}}{\rm{.199dem+1}}{\rm{.280Slope - 12}}{\rm{.207M7;}}$ (6)
$Y{\rm{=2 284}}{\rm{.116 - 0}}{\rm{.173dem - 56}}{\rm{.069M7+24}}{\rm{.764E7}}{\rm{。}}$ (7)

式中: dem为海拔高;Slope为坡度;M7为TM影像第7波段的均值纹理特征;E7为第7波段的熵纹理特征。利用拟合方程(6)和(7),反演黑河流域上游地区的森林AGB,并用剩下的45个样本数据进行验证,其验证结果如图 3。可以发现,经过SCS+C地形辐射校正后的回归结果明显优于未经过地形校正的回归结果;不管地形校正与否,回归方程涉及的TM遥感因子都仅为第7波段的信息。这是由于TM第7波段对植被水分相当敏感,而该地区属于西北寒旱地区,水分是该地区植被演变的主要限制因素,与植被生物量大小关系密切。

图 3 森林AGB实测值与多元线性逐步回归估测值的拟合结果 Fig. 3 Fitting results of measured value and predicted value which are based on multiple linear stepwise regression 虚线为1∶1拟合线; a.地形校正前;b.SCS+C地形校正后。Dotted line is 1:1 fiiting; a.before SCS+C correction; b. after SCS+C correction.
3.2 k-NN估测结果

对RF选出的特征向量组合进行归一化处理,然后结合马氏距离进行窗口大小的选择。运行比较的结果如图 4。从图中可以发现窗口为7×7的估算结果较其他大小的窗口好,所以本文选取窗口为7×7的结果进行分析比较其他模型参数的影响。

图 4 k-NN不同窗口得到的R2和RMSE Fig. 4 R2 and RMSE from different variable sets of k-NN

将窗口大小设为7×7,利用RF选出的特征变量组合,可得到基于不同距离和k值的估测结果(R2和RMSE)如图 5所示。图 5分别体现了随着k值的增加,利用不同距离计算方法对森林AGB进行估测时R2和RMSE的变化趋势。可以看出,无论是否经过SCS+C地形校正,欧氏距离的估测精度都比马氏距离和模糊距离的估测精度低,这与Chirici等(2008)得到的结论一致。另外可以看到,经过SCS+C地形校正后,马氏距离和模糊距离的估测精度都升高了,而欧氏距离的估测精度反而降低了,这是由于地形校正后加大了林区像素间的相关性,马氏距离和模糊距离引入了样本协方差,排除了像素间的相关性干扰,而欧氏距离采用的是简单的差值平方,无法排除此干扰。

图 5 SCS+C校正前后3种距离估测结果的R2和RMSE Fig. 5 R2 and RMSE of three distance estimations based on before and after SCS+C processed images ED为欧氏距离,MD为马氏距离,FD为模糊距离,a,c为地形辐射校正前,b,d为地形辐射校正后。
ED is Euclidean distance, MD is Mahalanobis distance, FD is Fuzzy distance. a and c. before SCS+C correction, b and d. after SCS+C terrain correction.

图 5cd不难看出,校正前的RMSE随着k值增大呈现先降低后趋于平缓的趋势;校正后的RMSE则随着k值增大先下降后波动性增加,且马氏与模糊距离的RMSE变动较大。这可归结于2点: 1)本研究区样地森林AGB分布区间较大,且AGB区间高/低值占比重较大;2)同前所述,林区像素间相关性得到增强。因此,当选取的近邻样本(k)增加时,往往会造成过高或过低估测值。

图 5bd可知,利用地形校正后的影像特征因子,k值取3,采用马氏距离作为距离的度量标准时的估测精度达到最高。因此,窗口大小设为7×7,以马氏距离作为距离的度量标准,k值取3,采用RF选出的经过SCS+C地形校正的影像的相关特征变量组合,对研究区森林AGB进行估算,最后得到基于133个样本的交叉验证结果(图 6): R2=0.54,RMSE=26.62 t·hm-2

图 6 k-NN估算的交叉验证结果 Fig. 6 Cross-validation results of k-NN estimation 虚线为1∶1拟合线。Dotted line is 1∶1 fitting.
3.3 区域森林AGB反演

多元线性逐步回归的交叉验证结果如图 7所示,其中R2=0.35,RMSE=31.82 t·hm-2。将其与k-NN的交叉验证结果(图 6)进行对比可发现,k-NN的估测精度明显优于逐步回归。因此,采用k-NN估测法反演整个研究区的森林AGB,其中,窗口大小为7×7,以马氏距离作为距离的度量标准,k值取3,结合RF所选的特征变量组合生成研究区的森林AGB的等级分布图(图 8),计算可得2009年该青海云杉区域的森林地上总生物量共计8.4×107t,平均森林地上生物量为96.20 t·hm-2。从图 8可以发现,随着海拔的增加,森林AGB逐渐降低;经度越高,森林AGB越大;纬度越高,森林AGB越低。这个估测结果与彭守璋等(2011)的研究结果相同。

图 7 线性逐步回归的交叉验证结果 Fig. 7 Cross-validation results of multiple linear stepwise regression
图 8 研究区的森林AGB等级分布 Fig. 8 Grade distribution of forest AGB of the study area
4 结论与讨论

本文利用TM-5影像、高程数据和样地调查数据,结合多元线性逐步回归估测法和k-NN估测法反演了研究区的森林AGB。根据研究可知,由于研究区地形复杂、景观破碎,使得TM影像在该地区的应用受到一定的限制,而SCS+C地形校正能够有效地消除由于太阳入射角变化所引起的地表反射亮度的差异,提高空间纹理信息,使其能够更准确地反映地表信息,从而提高森林AGB遥感反演的精度。另外本文中的森林-非森林类型图是根据青海云杉特殊的植被特征得到的,其简化了青海云杉林的分布规律,对生物量的反演结果会产生一定的影响,但是整体来讲,影响很小。多元线性逐步回归估测法是以大数定律作为理论基础的,只有当样本数目趋近于无穷大时,样本的规律才能被统计出来,而在样本有限的情况下,模型会发生过学习现象。k-NN是非参数化的方法,它是利用已知样本建立非线性模型,使模型的非线性估测能力大幅提升,克服了多元线性逐步回归的缺点;在用于生物量估测时只与极少量的相邻样本有关,可以避免样本的不平衡问题。结合RF进行k-NN算法优化,利用留一法对比优化后的k-NN算法的估测结果(R2=0.54,RMSE=26.62 t·hm-2)和多元线性逐步回归的估测结果(R2=0.35,RMSE=31.82 t·hm-2)可知,在样本有限的情况下,k-NN估测法更适于该研究区的青海云杉的森林AGB的估测。

参考文献(References)
[1] 陈尔学, 李增元, 武红敢, 等. 2008. 基于 k-NN 和 Landsat 数据的小面积统计单元森林蓄积估测方法. 林业科学研究, 21 (6):745-750.
(Chen E X, Li Z Y, Wu H G, et al. 2008. Forest volume estimation method for small areas based on k-NN and landsat data. Forest Research, 21(6): 745-750 [in Chinese]).(1)
[2] 方匡南, 吴见彬, 朱建平, 等. 2011. 随机森林方法研究综述. 统计与信息论坛, 26(3): 32- 38.
(Fang K N, Wu J B, Zhu J P, et al. 2011. A review of technologies on random forests. Statistics & Information Forum, 26(3): 32-38 [in Chinese]).(1)
[3] 郭志华, 彭少麟, 王伯荪. 2002. 利用TM数据提取粤西地区的森林生物量. 生态学报, 22(11): 1832-1839.
(Guo Z H, Peng S L, Wang B S. 2002. Estimating forest biomass in western Guangdong using landsat TM data. Acta Ecologica Sinica, 22(11): 1832-1839 [in Chinese]).(1)
[4] 何祺胜, 陈尔学, 曹春香, 等. 2009. 基于LIDAR数据的森林参数反演方法研究. 地球科学进展, 24(7): 748-755.
(He Q S, Chen E X, Cao C X, et al. 2009. A study of forest parameters mapping technique using airborne lidar data. Advances in Earth Science, 24(7): 748-755 [in Chinese]).(1)
[5] 李银鹏, 季劲钧. 2001. 全球陆地生态系统与大气之间碳交换的模拟研究. 地理学报, 56(4): 379-389.
(Li Y P, Ji J J. 2001. Simulations of carbon exchange between global terrestrial ecosystem and the atmosphere. Acta Geographica Sinica, 56(4): 379-389 [in Chinese]).(2)
[6] 李虎, 慈龙骏, 方建国, 等. 2008. 新疆西天山云杉林生物量的动态监测. 林业科学, 44(10): 14-19.
(Li H, Ci L J, Fang J G, et al. 2008. Dynamic monitoring of Picea schrenkiana forest biomass in west Tianshan Mountain region of Xinjiang. Scientia Silvae Sinicae, 44(10): 14-19 [in Chinese]).(1)
[7] 李明诗, 谭莹, 潘洁, 等. 2006. 结合光谱、纹理及地形特征的森林生物量建模研究. 遥感信息, 21(6): 6-9.
(Li M S, Tan Y, Pan J, et al. 2006. Modeling forest aboveground biomass by combining the spectrum, textures with topographic features. Remote Sensing Information, 21(6): 6-9 [in Chinese]).(1)
[8] 李林, 王振宇, 汪青春. 2006. 黑河上游地区气候变化对径流量的影响研究. 地理科学, 26(1): 40-46.
(Li L, Wang Z Y, Wang Q C. 2006. Inflence of climatic change on flow over the upper reaches of Heihe river. Science Geographica Sinica, 26(1): 40-46 [in Chinese]).(1)
[9] 李军辉, 齐广平, 张恒嘉, 等. 2011. 黑河流域水资源持续利用与生态环境现状及对策. 现代农业科技, 40 (21): 265-266.
(Li J H, Qi G P, Zhang H J, et al. 2011. The sustainable utilization of water and the current situation and countermeasures of ecological environment over Heihe River Basin. Modern Agricultural Science and Technology, 40(21): 265-266 [in Chinese]).(1)
[10] 李亦秋, 冯仲科, 邓欧, 等. 2009. 基于3S技术的山东省森林蓄积量估测. 林业科学, 45(9): 85-93.
(Li Y Q, Feng Z K, Deng O, et al. 2009. Forest volume estimate based on 3S technologies in Shandong Province. Scientia Silvae Sinicae, 45(9): 85-93 [in Chinese]).(1)
[11] 刘华, 雷瑞德. 2005. 我国森林生态系统碳储量和碳平衡的研究方法及进展. 西北植物学报, 25(4): 835-843.
(Liu H, Lei R D. 2005. Research methods and advances of carbon storage and balance in forest ecosystems of China. Acta Botanica Boreali-Occidentalia Sinica, 25(4): 835-843 [in Chinese]).(1)
[12] 娄雪婷, 曾源, 吴炳方. 2011. 森林地上生物量遥感估测研究进展. 国土资源遥感, 23(1): 1-8.
(Lou X T, Zeng Y, Wu B F. 2011. Advances in the estimation of above-ground biomass of forest using remote sensing.Remote Sensing for Land & Resources, 23(1): 1-8 [in Chinese]).(1)
[13] 彭守璋, 赵传燕, 郑祥霖, 等. 2011. 祁连山青海云杉林生物量和碳储量空间分布特征. 应用生态学报, 22(7): 1689-1694.
(Peng S Z, Zhao C Y, Zhen X L, et al. 2011. Spatial distribution characteristics of the biomass and carbon storage of Qinghai Spruce(Picea crassifolia) forests in Qilian Mountains. Chinese Journal of Applied Ecology, 22(7): 1689-1694 [in Chinese]).(1)
[14] 汤旭光, 刘殿伟, 王宗明, 等. 2012. 森林地上生物量遥感估算研究进展. 生态学杂志, 31(5): 1311-1318.
(Tang X G, Liu D W, Wang Z M, et al. 2012. Estimation of forest aboveground biomass based on remote sensing data: a review. Chinese Journal of Ecology, 31(5): 1311-1318 [in Chinese]).(1)
[15] 陶波, 葛全胜, 李克让, 等. 2001. 陆地生态系统碳循环研究进展. 地理研究, 20(5): 564-575.
(Tao B, Ge Q S, Li K R, et al. 2001. Progress in the studies on carbon cycle in terrestrial ecosystem. Geographical Research, 20(5): 564-575 [in Chinese]).(1)
[16] 王红岩, 高志海, 王琫瑜, 等. 2010. 基于TM遥感影像丰宁县森林地上生物量估测研究. 安徽农业科学, 38(32): 18472-18474, 18517.
(Wang H Y, Gao Z H, Wang F Y, et al. 2010. Estimation of forest biomass in Fengning County by TM satellite images. Journal of Anhui Agricultural Sciences, 38(32): 18472-18474, 18517 [in Chinese]).(1)
[17] 王光华, 刘琪璟. 2012. 基于TM影像估算北京山区乔木林生物量. 福建林学院学报, 32(2): 120-124.
(Wang G H, Liu Q J. 2012. Estimating arbor forest biomass in mountainous terrain in Beijing using landsat TM data. Journal of Fujian College of Forestry, 32(2): 120-124 [in Chinese]).(1)
[18] 王金叶, 车克钧, 傅辉恩, 等. 1998. 祁连山水源涵养林生物量的研究. 福建林学院学报, 18(4): 319-323.
(Wang J Y, Che K J, Fu H E, et al. 1998. Study on biomass of water conservation forest on north slope of Qilian Mountains. Journal of Fujian College of Forestry, 18(4): 319-323 [in Chinese]).(2)
[19] 许东, 代力民, 邵国凡, 等. 2008. 基于RS、GIS 及K-近邻法的森林蓄积量估测. 辽宁工程技术大学学报:自然科学版, 27(2): 195-197.
(Xu D, Dai L M, Shao G F, et al. 2008. Stand volume estimation based on RS, GIS and K-nearest neighbor methods. Journal of Liaoning Technical University(Natural Science Edition), 27(2): 195-197 [in Chinese]).(1)
[20] 徐新良, 曹明奎. 2006. 森林生物量遥感估算与应用分析. 地球信息科学, 8(4): 122-128.
(Xu X L, Cao M K. 2006. An analysis of the applications of remote sensing method to the forest biomass estimation. Geo-information Science, 8(4): 122-128 [in Chinese]).(1)
[21] 徐天蜀, 张王菲, 岳彩荣. 2007. 基于PCA的森林生物量遥感信息模型研究. 生态环境, 16(6): 1759-1762.
(Xu T S, Zhang W F, Yue C R. 2007. Remote-sensing information model of forest biomass based on principal components analysis. Ecology and Environment, 16(6): 1759-1762 [in Chinese]).(1)
[22] 袁野, 李虎, 刘玉峰. 2011. 基于改进型B-P神经网络的西天山云杉林生物量估算. 福建师范大学:自然科学版, 27(2): 124-132.
(Yuan Y, Li H, Liu Y F. 2011. Picea schrenkiana forest biomass estimate in the west Tianshan Mountain based on improved B-P neural network. Journal of Fujian Normal University(Natural Science Edition), 27(2): 124-132 [in Chinese]).(1)
[23] 姚登举, 杨静, 詹晓娟. 2012. 基于随机森林的特征选择算法. 吉林大学学报: 工学版, 42: 1-5.
(Yao D J, Yang J, Zhan X J. 2012. Feature selection algorithm based on random forest. Journal of Jilin University (Engineering and Technology Edition), 42: 1-5 [in Chinese]).(1)
[24] 赵英时. 2003. 遥感应用分析原理与方法. 北京: 科学出版社,373.
(Zhao Y S. 2003. Analysis principle and method of remote sensing applications. Beijing: Science Press, 373.[in Chinese])(1)
[25] 张志, 田昕, 陈尔学, 等. 2011. 森林地上生物量估测方法研究综述. 北京林业大学学报, 33(5): 146-152.
(Zhang Z, Tian X, Chen E X, et al. 2011. Review of methods on estimating forest above ground biomass. Journal of Beijing Forestry University, 33(5): 146-152 [in Chinese]).(1)
[26] Chirici G, Barbati A, Corona P, et al. 2008. Non-parametric and parametric methods using satellite images for estimating growing stock volume in alpine and Mediterranean forest ecosystems. Remote Sensing of Environment, 112(5):2686-2700.(1)
[27] Eisfelder C, Kuenzer C, Dech S. 2012. Derivation of biomass information for semi-arid areas using remote-sensing data. International Journal of Remote Sensing, 33(9): 2937-2984.(1)
[28] Melillo J M, Prentice I C, Faquahar G D, et al. 1996. Terrestrial biotic response to environmental change and feedbacks to climate// Houghton J T, Filho L G M, Callander B B, et al. Climate Change 1995. The science of Climate change, University press, Cambridge. 449-481.(1)
[29] Reese H, Nilsson M, Sandstrom P, et al. 2002. Applications using estimates of forest parameters derived from satellite and forest inventory data. Computers and Electronics in Agriculture, 37(1/3): 37-55.(2)
[30] Soenen S A, Peddle D R, Coburn C A. 2005. SCS+C: A Modified Sun-Canopy-Sensor Topographic Correction in Forested Terrain. IEEE Transactions on Geoscience and Remote Sensing, 43(9): 2148-2159.(1)
[31] Tian X, Su Z B, Chen E X, et al. 2012. Estimation of forest above-ground biomass using multi-parameter remote sensing data over a cold and arid area. International Journal of Applied Earth Observation and Geoinformation, 14(1): 160-168.(1)