林业科学  2011, Vol. 47 Issue (10): 16-20   PDF    
0

文章信息

范文义, 李明泽, 杨金明
Fan Wenyi, Li Mingze, Yang Jinming
长白山林区森林生物量遥感估测模型
Forest Biomass Estimation Models of Remote Sensing in Changbai Mountain Forests
林业科学, 2011, 47(10): 16-20.
Scientia Silvae Sinicae, 2011, 47(10): 16-20.

文章历史

收稿日期:2010-06-15
修回日期:2010-08-25

作者相关文章

范文义
李明泽
杨金明

长白山林区森林生物量遥感估测模型
范文义, 李明泽, 杨金明    
东北林业大学林学院 哈尔滨 150040
摘要: 采用黑龙江长白山地区TM图像和143块森林资源连续清查固定样地数据及野外调查补充样地数据,选择包括各波段灰度值、不同波段灰度值之间的线性和非线性组合(包括11种植被指数)、纹理信息以及环境因子在内的75个自变量,分别采用逐步回归分析法和偏最小二乘回归法建立黑龙江长白山林区森林生物量遥感估测模型:逐步回归法采用5个自变量所建模型平均拟合精度为76.5%,均方根误差为19.12 t·hm-2,样地生物量真实值与预测值相关系数为0.543 4;偏最小二乘回归法采用10个自变量所建模型平均拟合精度85.8%,均方根误差9.92 t·hm-2,样地生物量真实值与预测值相关系数0.860 3,偏最小二乘回归法要优于逐步回归法。利用建立的偏最小二乘回归模型计算得到黑龙江长白山2007生物量等级分布图,采用29个检验样本对反演结果进行检验,计算得到29个样本的平均预测精度为83.73%。
关键词:TM    森林生物量    逐步回归    偏最小二乘回归    bootstrap    长白山    
Forest Biomass Estimation Models of Remote Sensing in Changbai Mountain Forests
Fan Wenyi, Li Mingze, Yang Jinming    
College of Forestry, Northeast Forestry University Harbin 150040
Abstract: Models weere established with the stepwise regression and partial least-squares regression based on TM imagery and a survey of 143 plots in Changbai Mountain area of Heilongjiang to estimate the forest biomass. As much as 75 independent variables were selected out, including gray value of each band, the linear and nonlinear combinations between different bands of gray value (including 11 vegetation index), texture information and environmental factors. The stepwise regression equation was used to establish a model with five independent variables. The model had a standard fitting accuracy of 76.5%, the root-mean-square error of 19.12 t·hm-2, and the correlation of the prediction values with the model and factually observed values was 0.860 3. Partial least squares method was used to establish a model with 10 independent variables. The model had a standard fitting accuracy of 85.8%, and the root-mean-square error of 9.92 t·hm-2, and the correlation of the prediction values and observed values was 0.860 3. The results indicated that partial least squares method was better than the stepwise regression equation in this study.Total 2007 distribution maps of hierarchical of biomass in Changbai Mountain area were obtained by using the model established with the partial least squares. The mean prediction accuracy was 83.73% for 29 samples which had been evaluated by a test of inversion result of the samples.
Key words: TM    forest biomass    stepwise regression    PLS    bootstrap    Changbai Mountain    

森林生态系统在全球碳循环过程中起着重要作用。森林生物量约占整个陆地生态系统生物量的90%(刘广义,2007)。研究森林生物量对全球碳循环及全球气候变化研究具有重要意义(赵士洞等,2001Brown et al., 1996)。目前,对于以省、流域、国家乃至全球尺度的区域森林生物量估计方法主要有2类:基于森林资源清查数据的估计方法和基于遥感信息技术的估计方法(方精云等,1996徐新良等, 2006; Hame et al., 1997; Dong et al., 2003)。基于遥感信息技术的方法包括遥感信息参数与生物量拟合、遥感数据与过程模型融合、基准样地法(KNN方法)以及人工神经网络模型法(徐新良等, 2006)。Myneni等(2001)Dong等(2003)利用NOAA/AVHRR NDVI数据建立了森林生长季内的累积NDVI值与各省森林生物量总量之间的拟合方程;Hame等(1997)利用TM3和TM4波段及其组合与森林材积的关系估算了芬兰北部地区的森林碳储量并分析了其时空格局;郭志华等(2002)以Landsat TM为数据源建立了粤西阔叶林和针叶林材积的遥感光谱估算模型;国庆喜等(2003)采用多元回归分析方法建立了TM各个波段以及归一化植被指数(NDVI)、比值植被指数(RVI)和环境植被指数(EVI)与森林生物量的遥感光谱模型。国内外学者多采用部分遥感波段值及植被指数(Ⅵ)与森林生物量建立回归方程,且构建方法多采用传统的多元统计分析法。综合考虑各种森林生物量相关因子并采用先进的建模方法是目前提高森林生物量反演精度的有效途径之一。本研究尽可能多地选取植被指数、地学信息及影像纹理信息等可能与森林生物量有关的变量,并利用逐步回归法和偏最小二乘回归分析法建立森林生物量遥感估测模型,择优对2007年黑龙江长白山林区的森林生物量进行反演。本研究方法将为森林生物量模型的构建提供新的途径,研究结果对于了解黑龙江长白山林区的森林生物量分布具有重要意义。

1 研究区概况

研究区位于黑龙江省东南部长白山区(129°04′39″—132°02′21″E, 43°49′53″—45°54′29″N),平均海拔517 m,属北温带大陆性季风气候区, 夏季短促, 秋季早霜, 冬季漫长多雪。年均气温-7~3 ℃,1月份平均气温-20 ℃。年日照时数2 270 h, 年无霜期100天左右。年降水量700~1 400 mm,6—9月份降水量占全年降水量的60%~70%。主要乔木树种有柞树(Quercus mongolica)、黑桦(Betula davurica)、紫椴(Tilia amurensis)、山杨(Populus davidiana)、色木槭(Acer mono)、长白落叶松(Larix olgensis)、樟子松(Pinus sylvestris var. mongolica)和红松(Pinus koraiensis)等。主要灌木有毛榛子(Corylus mandshurica)、胡枝子(Lespedeza bicolor)和杜鹃(Rhododendron dauricum)等,主要草本植物有苔草(Carex caespitosa)和细叶蒿草(Murdanniae simplicis)等。

2 TM图像及样地数据处理

本研究采用2007年6月至9月美国Landsat陆地资源卫星TM数据。黑龙江长白山林区涉及14景TM影像,其行列号分别是:114条带的27, 28和29行;115条带的28, 29和30行; 116条带的28, 29和30行; 117条带的28, 29和30行;118条带的28和29行。对14景TM影像分别进行几何校正、辐射定标及FLAASH大气校正,然后将其拼接到一起,最后用研究区的边界矢量图进行裁切,得到研究区地表反射率图像。本研究所用TM影像所用波段为TM1, TM2, TM3, TM4, TM5和TM7,投影方式均为UTM/WGS84, 空间分辨率为28.5 m。

收集研究区域内的2005年森林资源连续清查固定样地数据及野外调查补充样地数据,共计143块,每块样地面积为0.06 hm2。根据样地每木检尺数据及表 1提供的各树种及器官生物量模型计算每株树木生物量,最终求得样地总生物量。模型中的树高H由树高胸径方程(表 2)估计,该方程的建模数据主要来源于东北林业大学帽儿山实验林场的样地实测数据。样地总生物量除以样地面积得到不同样地的单位面积的乔木生物量。在TM影像上提取样地中心点所在像元及其相邻的上下左右4个像元的灰度值, 求出其平均值作为样地遥感信息源。按照建模样本与检验样本4:1的比例随机将143块样地分为2部分,其中114块样地用于建立回归方程,29块样地用于检验。

表 1 生物量模型 Tab.1 Biomass model
表 2 树高模型 Tab.2 Tree height model
3 自变量选择

本研究尽可能多地选出各种自变量用于估算森林生物量,包括各波段灰度值、不同波段灰度值之间的线性和非线性组合(包括各种植被指数)、纹理信息以及非生物因子栅格化所形成的辅助波段如海拔、坡度、坡向等,其中纹理信息采用灰度共生矩阵法,3×3像元窗口,步长为1像元,水平方向。初步选出75个自变量因子, 将这些因子与对应样地生物量作相关系数显著性检验,结果见表 3。各种植被指数计算公式分别为式中:ρnir为近红外波段反射率;ρred为红波段反射率;ρmidir为中红外反射率。

表 3 自变量因子与样地生物量相关系数 Tab.3 Correlation coefficient of variable factor and plot biomass
4 逐步回归法建模

对样本进行标准化处理,利用SPSS13.0软件,采用逐步回归法建立多元线性回归模型。通过检验的变量为郁闭度、高程、横坐标X、Band3和Cor1,经2倍标准化残差删除特异样本后剩余93个样本。模型决定系数为0.785,平均拟合精度为76.5%,均方根误差为19.17 t·hm-2。模型形式如下:

B=125.665 808 337 3+18.295 435 592 137 3×C+0.057 520 824 213 7×H-0.000 152 288 891 68×X-0.018 402 208 333 4×Band3+0.292 933 138 75×Cor1式中:B为样地生物量;C为郁闭度;H为高程。样地生物量拟合值与实测值的对比如图 1

图 1 样地生物量实测值与逐步回归模拟值 Figure 1 Observed and stepwise regression fitted sample biomass
5 偏最小二乘回归法建模

本研究采用的Bootstrap变量筛选法及偏最小二乘方法均使用MATLAB7.1编程实现。

5.1 Bootstrap变量筛选

Bootstrap变量筛选法是近30年来发展的一种新的统计方法,是由美国斯坦福大学统计系教授倚佛侬(Efron)于1979年提出的一种再抽样方法,也称为自助法(王惠文等,2006)。

设置检验水平α=0.3,取试验次数为1 000次,Bootstrap样本为93个(徐小军,2009)。利用Bootstrap变量筛选法对75个变量进行筛选,有48个自变量未通过显著性检验,对剩余的27个变量继续采用bootstrap方法进行筛选(参数设置同上),直到所有变量均通过检验为止,最终有10个变量通过检验(表 4),其拒绝域临界值如表 4

表 4 拒绝域临界值 Tab.4 Critical value of rejection region
5.2 偏最小二乘回归建模

偏最小二乘回归(partial last-squares regression, 简称PLS回归)是一种新型的多元统计数据分析方法,它于1983年由伍德和阿巴诺等首次提出。偏最小二乘应用了主成分分析的基本思想,并且区别于主成分回归考虑了主成分与因变量之间的相关性,因此它能解决以往普通多元回归无法解决的问题,如自变量之间的多重相关性问题和样本数量不宜太少等问题。在许多情况下,偏最小二乘回归并不需要采用全部的成分t1, t2, …, tA进行建模,因为采用过多的成分会破坏对统计趋势的认识,因此在应用偏最小二乘回归建模时必须要进行交叉有效性检验,以确定提取成分数m(m < A)。偏最小二乘回归的具体计算步骤请参考《偏最小二乘回归的线性与非线性方法》(王惠文等,2006)。

对93个样地生物量数据及bootstrap筛选出的10个自变量进行偏最小二乘回归。当提取13个有效成分时模型的决定系数为0.876 8,拟合精度85.8%,均方根误差为9.92 t·hm-2。偏最小二乘回归的相对误差如图 2。模型最终表达式为:

图 2 建模样本相对误差 Figure 2 Relative error of modeling sample

B=122.804 864 746 712+31.831 494 595 417×C+0.084 388 236 955×H-0.989 315 215 123 526×S-0.060 540 808 151 196×A-0.062 459 356 371×Band5+5.432 994 757 786 59×SR+16.488 314 761 240×Sec1-8.802 806 658 279 32×Dis5+10.039 548 236 955×Ent4+27.509 979 436 251 72×Hom5。式中:S为坡度;A为坡向。

6 黑龙江长白山区森林生物量反演

2种模型采用了随机抽取的114个样本中的93个样本进行建模。逐步回归法利用75个自变量中的5个建立模型,拟合精度为76.5%,偏最小二乘方法采用10个自变量建立模型,拟合精度达到85.8%,说明偏最小二乘方法对生物量的预测明显优于逐步回归方法。分析自变量之间的相关性可知,NDVI与SAVI、Con1与Dis1、Con1与Hom1、Con2与Dis2、Con2与Hom2等51对自变量之间的相关系数达到了0.9以上,而偏最小二乘回归应用了主成分分析的基本思想,能够很好地解决自变量之间的多重相关性问题,因此偏最小二乘回归建模结果要优于逐步回归法建模结果。

利用偏最小二乘方法建立的样地生物量模型对黑龙江长白山地区2007年的TM影像进行反演,计算每个像元的生物量值,生成生物量等级分布图(图 3)。

图 3 黑龙江长白山2007年生物量等级分布图 Figure 3 Grade distribution of biomass of Changbai Mountain in Heilongjiang in 2007

从长白山2007年生物量分布图中将29块检验样地的生物量预测值提取出来,提取时只提取样地坐标落入的像元的灰度值。将预测值与实际值进行比较,计算得29个检验样本的偏最小二乘预测精度为83.73%,其相对误差见图 4

图 4 检验样本相对误差 Figure 4 Relative error of test sample
7 结论

1) 分别采用逐步回归分析法和偏最小二乘回归法建立了黑龙江长白山林区森林生物量遥感估测模型。逐步回归法采用5个自变量所建模型平均拟合精度为76.5%,均方根误差为19.12 t·hm-2,样地生物量真实值与预测值相关系数为0.543 4。偏最小二乘回归法采用10个自变量所建模型平均拟合精度85.8%,均方根误差9.92 t·hm-2,样地生物量真实值与预测值相关系数0.860 3。因此偏最小二乘回归法要优于逐步回归法。

2) 利用建立的偏最小二乘回归模型计算得到了黑龙江长白山2007生物量等级分布图,采用29个检验样本对反演结果进行了检验,计算得到29个样本的平均预测精度为83.73%。

3) 本研究尽可能多地考虑与森林生物量有关的各种变量,包括与遥感信息相关的各种植被指数和波段值之间的组合以及纹理信息,为研究区的森林生物量遥感反演提供了尽可能多的信息。

4) 针对众多的具有多重相关性的变量利用bootstrap方法成功进行了筛选,采用筛选出的10个变量利用偏最小二乘方法建模取得了较好的效果。

参考文献(References)
陈传国, 朱俊凤. 1989. 东北主要林木生物量手册[M]. 北京: 中国林业出版社.
陈灵芝. 1997. 暖温带森林生态系统结构与功能的研究[M]. 北京: 科学出版社.
丁宝永, 孙继华. 1989. 红松人工林生态系统生物生产力及养分循环研究[J]. 东北林业大学学报, 17(S2): 18-19.
方精云, 刘国华, 徐嵩龄. 1996. 我国森林植被生物量和生产力[J]. 生态学报, 16(4): 497-508.
国庆喜, 张锋. 2003. 基于遥感信息估测森林的生物量[J]. 东北林业大学学报, 31(2): 13-16.
郭志华, 彭少麟, 王伯苏. 2002. 利用TM数据提取粤西地区的森林生物量[J]. 生态学报, 22(11): 1832-1839. DOI:10.3321/j.issn:1000-0933.2002.11.006
刘广义. 2007. 森林与碳循环[J]. 现代农业科技, (19): 218-220. DOI:10.3969/j.issn.1007-5739.2007.19.155
罗天祥. 1996. 中国主要森林类型生物生产力格局及其数学模型. 中国科学院国家计划委员会博士学位论文.
王惠文, 吴载斌, 孟洁. 2006. 偏最小二乘回归的线性与非线性方法[M]. 北京: 国防工业出版社.
徐小军. 2009. 基于LANDSAT TM影像毛竹林地上部分碳储量估算研究. 浙江林学院硕士学位论文.
徐新良, 曹明奎. 2006. 森林生物量遥感估算与应用分析[J]. 地球信息科学, 8(4): 122-128.
赵士洞, 汪业勖. 2001. 森林与碳循环[J]. 科学对社会的影响, (3): 38-41.
Brown S, Sathaye J, Canell M, et al. 1996. Mitigation of carbon emission to the atmosphere by forest management[J]. Commonw For Review, 75(1): 80-91, 109, 111-112.
Dong J R, Kaufmann R K, Myneni R B, et al. 2003. Remote sensing estimations of boreal and temporate forest woody biomass: carbon pools, sources, and sinks[J]. Remote Sensing of Environment, 84(3): 393-410. DOI:10.1016/S0034-4257(02)00130-X
Hame T, Sallli A, Andersson K, et al. 1997. A new methodology for the estimation of biomass of conifer-dominated boreal forest using NOAA AVHRR data[J]. International Journal of Remote Sensing, 18(15): 3211-3243. DOI:10.1080/014311697217053
Malthouse E C, Thmhana A C, Mah R S H. 1997. Nonlinear partial least squares[J]. Journal of Computational Chemistry, 21(8): 875-890. DOI:10.1016/S0098-1354(96)00311-0
Myneni R B, Dong J, Tucker C J, et al. 2001. A large carbon sink in the woody biomass of Northern forests[J]. Proceedings of the National Academy of Sciences, 98(26): 14784-14789. DOI:10.1073/pnas.261555198