林业科学  2011, Vol. 47 Issue (9): 1-6   PDF    
0

文章信息

徐小军, 周国模, 杜华强, 董德进, 崔瑞蕊, 周宇峰, 沈振明
Xu Xiaojun, Zhou Guomo, Du Huaqiang, Dong Dejin, Cui Ruirui, Zhou Yufeng, Shen Zhenming
基于Landsat TM数据估算雷竹林地上生物量
Estimation of Aboveground Biomass of Phyllostachys praecox Forest Based on Landsat Thematic Mapper Image
林业科学, 2011, 47(9): 1-6.
Scientia Silvae Sinicae, 2011, 47(9): 1-6.

文章历史

收稿日期:2010-06-13
修回日期:2011-08-05

作者相关文章

徐小军
周国模
杜华强
董德进
崔瑞蕊
周宇峰
沈振明

基于Landsat TM数据估算雷竹林地上生物量
徐小军1, 周国模1,2, 杜华强1,2, 董德进1, 崔瑞蕊1, 周宇峰1, 沈振明3    
1. 浙江农林大学环境与资源学院 浙江省森林生态系统碳循环与固碳减排重点实验室 临安 311300;
2. 亚热带森林培育国家重点实验室培育基地 临安 311300;
3. 临安市林业技术服务总站 临安 311300
摘要: 结合Landsat TM遥感数据和雷竹林样地调查数据,采用偏最小二乘回归法(PLS)建立雷竹林地上生物量估算模型,利用该模型估算临安市雷竹林地上部分生物量。结果表明:雷竹单株地上部分生物量与胸径及雷竹林地上部分生物量与株数之间都呈极显著相关(P<0. 01);通过PLS-Bootstrap法筛选自变量能够提高模型精度; 模型预测的雷竹林地上生物量均方根误差为3. 45 t·hm-2,满足大范围估算的精度要求; 临安市雷竹林地上生物量为13 ~ 25 t·hm-2,均值为19. 52 t·hm-2
关键词:雷竹林    地上生物量    Landsat TM遥感数据    偏最小二乘回归    
地面调查及资料收集得到临安市林业局领导及相关科研人员的大力支持,谨此致谢
Estimation of Aboveground Biomass of Phyllostachys praecox Forest Based on Landsat Thematic Mapper Image
Xu Xiaojun1, Zhou Guomo1,2 , Du Huaqiang1,2, Dong Dejin1, Cui Ruirui1, Zhou Yufeng1, Shen Zhenming3    
1. School of Environment and Resource, Zhejiang Agriculture and Forestry University Zhejiang Provincial Key Laboratory of Carbon Cycling in Forest Ecosystems and Carbon Sequestration Lin'an 311300;
2. Nurturing Station for State Key Laboratory of Subtropical Silviculture Lin'an 311300;
3. Forestry Technical Service Station of Lin'an Lin'an 311300
Abstract: Based on data collected with Landsat Thematic Mapper (TM), a remote sensing technique, and a field survey, a model established with the partial least squares (PLS) regression was used to estimate aboveground biomass (AGB) of Phyllostachys praecox forest in Lin'an City, Zhejiang Province. Results showed that AGB of individual Phyllostachys praecox was significantly correlated with diameter at breast height and AGB of Phyllostachys praecox forest was significantly correlated with culms density. The predicted accuracy of the PLS model has be improved through PLSBootstrap variable selection method, with a root mean square error (RMSE) of 3. 45 t·hm-2. The PLS model is an effective way of estimating AGB of Phyllostachys praecox forest in a large area. Most of Phyllostachys praecox in the forested area had AGB values between 13 and 25 t·hm-2, and the average AGB density was 19. 52 t·hm-2.
Key words: Phyllostachys praecox forest    aboveground biomass    Landsat TM data    partial least squares regression    

雷竹(Phyllostachys praecox)属于禾本科(Poaceae)竹亚科(Bambusoideae)刚竹属(Phyllostachys),主要分布在中国长江以南各省(区),以浙江省面积最大(周国模等,2010)。雷竹易栽培,其笋营养丰富、味道鲜美(朱永军等,2003)。随着雷竹林经济效益增加,雷竹林面积逐渐增加,从1983到2002年仅临安市雷竹林面积就增加了3. 13万hm2,增幅达101% (朱永军等,2003)。目前,在雷竹林栽培技术、引种、光合特性和土壤活性有机碳等方面已有深入研究(金爱武等,2000; 饶国才,2000; 黄必恒等,2001; 郑炳松等,2001; 姜培坤等,2005; 杨芳等,2006),但有关雷竹林生物量的研究还很少,仅金爱武等(1999)研究了雷竹各器官生物量模型。

传统的样地调查方法费时费力,而且难以精确了解大范围雷竹林状况。遥感技术能够大范围监测地物,已被成功应用到森林生物量估算中(Foody et al.,2003; Hall et al.,2006; Lu,2006; 张慧芳等,2007)。本研究基于Landsat TM遥感数据和雷竹林样地调查数据,采用偏最小二乘回归法构建临安市雷竹林地上生物量估算模型,绘制出研究区雷竹林地上生物量空间分布图。通过雷竹林地上生物量空间分布图不仅可以评价雷竹长势和经营管理水平,而且可用于分析雷竹林对区域气候变化的影响。

1 研究区概况

研究区位于浙江省临安市(118° 51'— 119°52'E,29°56'—30°23' N),临安是全国十大“竹子之乡”之一。该区属亚热带季风性湿润型气候,雨水充沛。森林植被属亚热带东部常绿阔叶林,森林覆盖率76. 55%。全市毛竹(Phyllostachys edulis)林面积2. 18万hm2,雷竹林面积2. 16万hm2,占竹林面积的38. 8%。

2 样地调查与数据处理

2009年8月下旬至9月初,通过典型抽样,在临安市设置20 m × 20 m的样地41块,记录样地的地理坐标和雷竹总株数。剔除被云遮挡的3块样地,共38块样地参与遥感建模。

在尽量包含不同径阶的前提下,从每个样地选取1 ~ 3株样竹,共94株样竹,伐倒后称取样竹地上部分鲜质量,并采样、烘干计算样竹含水率,从而得到样竹地上生物量。采用幂函数建立雷竹样竹地上生物量与胸径的关系模型,其决定系数(R2)达到0. 86,呈极显著水平(P<0. 01) (图 1)。

图 1 单株雷竹地上生物量与胸径的关系模型 Figure 1 Relationship between Phyllostachys praecox individual aboveground biomass and DBH

在每个样地内按对角线法设置5块3 m × 3 m样方,共调查205块样方,记录样方内雷竹总株数和每株胸径,采用雷竹样竹地上生物量与胸径关系模型(图 1),估算出每块样方的总地上部分生物量。然后,建立雷竹林地上部分生物量与株数关系模型,2者决定系数(R2)达到0. 61,呈极显著水平(P<0. 01) (图 2)。

图 2 雷竹林地上生物量与株数的关系模型 Figure 2 Relationship between aboveground biomass of Phyllostachys praecox forest and number of individuals in sample plot

采用雷竹林地上部分生物量与株数关系模型(图 2),估算出样地地上部分生物量。根据样地调查数据统计,雷竹胸径约90%分布在3 ~ 5 cm径阶,可见雷竹胸径分布具有高集中性的特点,据此可以认为小范围内地上生物量与面积成正比。因此,将20 m × 20 m的样地地上生物量换算成30 m × 30 m像元尺度下的地上生物量。实测样地雷竹林地上生物量为13 ~ 22 t·hm-2

3 TM数据处理

本研究采用的Landsat5 TM影像接收于2008年7月5日。影像经过几何精校正、绝对辐射校正(6S模型)和地形校正(改进的C校正方法) (黄微等,2005)。几何精校正精度控制在1个像元之内,重采样后像元大小为30 m × 30 m。根据临安市森林资源分布图,目视解译提取雷竹林分布图。

为了降低实测样地与影像的配准误差,将实测样地中心点坐标与其最近邻的9个像元中心点坐标之间的欧式距离的倒数作为权重,加权平均该实测样地的最近邻的9个像元变量值作为实测样地对应像元的变量值,最近邻的9个像元内的地物如果不是雷竹,则将该像元的权值记为0 (范渭亮等,2010)。

共构建了20个初始变量用于估算雷竹林地上生物量,初始自变量及其与雷竹林地上生物量的相关系数(r)见表 1

表 1 初选自变量及其与雷竹林地上生物量的相关系数 Tab.1 Correlation coefficients between original independent variables and aboveground biomass
4 自变量筛选

当初始自变量个数较多时,部分自变量对模型来说可能是冗余信息,对模型的贡献不大,甚至会降低模型的预测精度,因此需要对初始自变量进行筛选。以实测地上生物量为因变量,20个遥感因子作为初始自变量,采用逐步回归法和偏最小二乘回归法结合Bootstrap(PLS-Bootstrap)法对初始自变量进行筛选。

逐步回归法筛选自变量:考虑自变量与雷竹地上生物量的相关性较低,当自变量的F检验水平小于0. 1时,该自变量入选,当自变量的F检验水平大于0. 15时被剔除。最终有2个自变量入选: TM3/ (1 + 2 + 3 + 4 + 5 + 7)和PCA1。

偏最小二乘回归法于1983年由伍德和阿巴诺等人首次提出,是一种集多元线性回归分析、典型相关分析和主成分分析于一体的新型的多元统计数据分析方法,被密西根大学的弗耐尔教授称为第二代回归分析方法(王惠文等,2006; 琚存勇等,2007)。近十年来,因其可以较好地解决传统多元回归难以解决的问题而在林分属性因子估算中得到广泛应用(琚存勇等,2007; 杜晓明等,2008; Wolter et al.,2008; Xu et al.,2011)。其具体算法见文献(Ehsani et al.,1999;王惠文等,2006)。

PLS-Bootstrap法在自变量筛选上已经得到成功应用并有很多优点(Lazraq et al.,2003;王惠文等,2006; 琚存勇等,2007; 杜晓明等,2008; Xu et al.,2011)。PLS-Bootstrap方法的主要步骤如下: 1)在原始样本中有放回地抽取ns (nsn)个样本,求出偏最小二乘的系数,重复上述过程B次,共得到B组回归系数{β1(1)β2(2),…,βj(B)} (j为自变量个数); 2)将这B组系数减去由原始样本得到的回归系数,将从小到大排列,设置检验水平α,取B × (1 -α)处的值βα(j)作为拒绝域临界值,如果则表明βj显著不为0,即自变量xj通过显著性检验。当检验水平α取不同值时,PLS-Bootstrap法所筛选的自变量有较大的差别且对模型精度有较大的影响。对于本研究α取0. 3时筛选出的自变量所构建的模型精度较高。本研究取B = 200次,Bootstrap样本ns= 38个。对20个初始自变量进行PLS-Bootstrap法筛选,直到没有自变量被剔除为止。20个初始自变量中经第1次筛选留下的为变量集1,然后对变量集1作自变量筛选,得到变量集2,依次类推,共经过6次自变量筛选后无自变量被剔除,停止自变量筛选。最终选取了3个自变量: IIVI,EVI和TM4 × 3/7。以不同变量集构建的PLS模型的RMSE变化趋势见图 3。从图 3可以看出,模型的RMSE随自变量筛选呈递减趋势,用变量集6所构建模型的RMSE(3. 45 t· hm-2)比以变量集1构建模型的RMSE (3. 73 t· hm-2)降低了7. 7%,即经过PLS-Bootstrap自变量筛选,模型的预测精度有所提高。

图 3 不同变量集构建的PLS模型的RMSE变化 Figure 3 Changes of RMSE with different variable sets
5 偏最小二乘模型

分别以逐步回归法及PLS-Bootstrap法筛选的自变量构建雷竹林地上生物量估算模型。结果表明:以PLS-Bootstrap法筛选出的自变量构建的模型误差(RMSE = 3. 45 t· hm-2)低于以逐步回归法筛选出的自变量构建的模型误差(RMSE = 3. 69 t· hm-2),即PLS-Bootstrap自变量筛选法优于逐步回归筛选法。

以PLS-Bootstrap法筛选的自变量所构建的PLS模型预测精度最高,其数学表达式为AGBPLS = -34. 58 -105. 16IIVI + 54. 44EVI + 71. 75(TM4 × 3/ 7),AGBPLS为雷竹林地上部分生物量。图 4为以PLS-Bootstrap法筛选的自变量所构建PLS模型预测值与观测值的散点图。通过留一法交叉验证评价(Geisser,1974; Stone,1974; Wold et al.,1984),该模型预测值与观测值的相关关系达到0. 624,RMSE为3. 45 t·hm-2 (图 4),模型预测效果较好。模型标准残差图表明样本的残差基本上全部在2倍标准残差之内,在低和高生物量区模型残差较大(图 5)。从标准残差图(图 5)可以看出,在高生物量区模型会低估实际生物量。

图 4 地上生物量PLS模型预测值与观测值散点图 Figure 4 Scatter graph of estimated aboveground biomass and observed aboveground biomass
图 5 PLS模型预测值与观测值标准残差 Figure 5 Standardized residuals of estimated aboveground biomass and observed aboveground biomass
6 模型应用

将整个研究区2008年自变量影像数据代入公式AGBPLS = -34. 58 -105. 16IIVI + 54. 44EVI + 71. 75(TM4 × 3/7),估算出整个研究区的雷竹林地上生物量(图 6)。统计结果表明,2008年临安市东部17个雷竹主要分布乡镇的雷竹地上总生物量为3. 71 × 106 t。研究区雷竹林地上生物量为13 ~ 25 t·hm-2,平均为19. 52 t·hm-2,估算结果出现小部分小于7 t· hm-2的数值(图 6),而实测样地中没有小于7 t·hm-2的数值,这可能与雷竹分类误差有关。当然也不能排除这些小于7 t· hm-2的像元是雷竹与其他地类组成的混合像元。在以后的研究中应提高样地坐标与遥感影像的配准精度以及雷竹林的分类精度。

图 6 临安市雷竹林地上生物量空间分布 Figure 6 Spatial distribution of aboveground biomass of Phyllostachys praecox forest in Lin'an City
7 结论与讨论

本研究采用胸径与单株地上生物量建立指数模型,模型决定系数高达0. 86,精度高于以秆高、胸径、留盘数、冠长和立竹度这5个因子为自变量构建的多元线性模型(金爱武等,1999)。在估算雷竹单株地上生物量时,以胸径单个因子作为自变量来构建模型已经能够满足精度要求,可减少调查业务并节省时间。分析结果还发现雷竹林地上生物量与株数存在极显著相关(R2= 0. 61,P<0. 01),这与雷竹胸径分布有密切关系(调查数据表明雷竹胸径约90%分布在3 ~ 5 cm径阶范围)。

样地坐标与TM影像相应像元的配准误差以及雷竹林分类误差将影响到估算结果的准确性。坐标配准出错时,会导致影像特征不能准确地体现实测样地地上生物量信息,进一步会影响到遥感因子与雷竹地上生物量的相关关系,最终会使所构建的模型精度不高。因此,在构建模型之前需要检查所有样地相应的影像像元是否落在实测样地区域。雷竹分类误差会引起一部分非雷竹林被当成雷竹林,由于不同地物之间光谱特征存在差异性,估算结果可能会出现一些负值或特别大的数值。为了消除该方面的误差,应尽量提高分类精度。

PLS-Bootstrap自变量筛选法能够有效提高估算精度。本研究中,用变量集6构建的模型精度比用变量集1构建的模型精度高(图 3),说明经过自变量筛选能够提高模型精度。在应用遥感估算生物量时,往往可以根据遥感原始波段数据派生出很多自变量因子,在初始自变量较多的情况下,选择一些对解释生物量有用的自变量至关重要。目前常用的自变量筛选方法有逐步回归法和相关性分析法(Lu,2006)。逐步回归法和相关性分析法很相似,都要求自变量与因变量具有显著的相关性。从表 1中可以看出,雷竹林地上生物量与遥感数据的相关性较弱,在20个初始自变量中相关性最高的为PCA1 (r = 0. 57)。在不降低自变量筛选阈值的前提下,通过逐步回归法或相关性分析法很难筛选出自变量。通过对比PLS-Bootstrap法和逐步回归法,结果表明PLS-Bootstrap法在自变量筛选上优于逐步回归法。这主要是由于PLS-Bootstrap法能够克服自变量之间的多重共线性。从临安市雷竹林地上生物量空间分布图(图 6)可见,基于遥感数据PLS回归法能够有效估算出大面积雷竹林地上生物量。

参考文献(References)
杜晓明, 蔡体久, 琚存勇. 2008. 采用偏最小二乘回归方法估测森林郁闭度[J]. 应用生态学报, 19(2): 273-277.
范渭亮, 杜华强, 周国模, 等. 2010. 大气校正对毛竹林生物量遥感估算的影响[J]. 应用生态学报, 21(1): 1-8.
黄必恒, 方伟, 许加意. 2001. 中国雷竹引种与适生区域[J]. 浙江林学院学报, 18(1): 10-14.
黄微, 张良培, 李平湘. 2005. 一种改进的卫星影像地形校正算法[J]. 中国图象图形学报, 10(9): 1124-1128. DOI:10.11834/jig.200509205
姜培坤, 徐秋芳. 2005. 施肥对雷竹林土壤活性有机碳的影响[J]. 应用生态学报, 16(2): 253-256.
金爱武, 周国模, 马跃, 等. 1999. 雷竹各器官生物量模型研究[J]. 浙江林业科技, 19(2): 7-9.
金爱武, 郑炳松, 陶金星, 等. 2000. 雷竹光合速率日变化及其影响因子[J]. 浙江林学院学报, 17(3): 271-275.
琚存勇, 邸雪颖, 蔡体久. 2007. 变量筛选方法对郁闭度遥感估测模型的影响比较[J]. 林业科学, 43(12): 33-38. DOI:10.3321/j.issn:1001-7488.2007.12.006
饶国才. 2000. 雷竹栽培技术要点[J]. 林业科技通讯, (4): 41.
王惠文, 吴载斌, 孟洁. 2006. 偏最小二乘回归的线性与非线性方法[M]. 北京: 国防工业出版社.
杨芳, 吴家森, 钱新标, 等. 2006. 不同施肥雷竹林土壤微生物量碳的动态变化[J]. 浙江林学院学报, 23(1): 70-74.
张慧芳, 张晓丽, 黄瑜. 2007. 遥感技术支持下的森林生物量研究进展[J]. 世界林业研究, 20(4): 30-34.
郑炳松, 金爱武, 程晓建, 等. 2001. 雷竹光合特性的研究[J]. 福建林学院学报, 21(4): 359-362.
周国模, 姜培坤, 徐秋芳. 2010. 竹林生态系统中碳的固定与转化[M]. 北京: 科学出版社: 140-159.
朱永军, 程爱兴, 何钧潮. 2003. 临安竹产业实现跨越式发展的目标和对策[J]. 竹子研究汇刊, 22(3): 8-12.
Ehsani M R, Upadhyaya S K, Slaughter D, et al. 1999. A NIR technique for rapid determination of soil mineral nitrogen[J]. Precision Agriculture, 1(2): 217-234.
Foody G M, Doreen S, Boyd D S, et al. 2003. Predictive relations of tropical forest biomass from Landsat TM data and their transferability between regions[J]. Remote Sensing of Environment, 85(4): 463-474. DOI:10.1016/S0034-4257(03)00039-7
Hall R J, Skakun R S, Arsenault E J, et al. 2006. Modeling forest stand structure attributes using Landsat ETM + data: application to mapping of aboveground biomass and stand volume[J]. Forest Ecology and Management, 225(1/3): 378-390.
Geisser S. 1974. A Predictive approach to the random effect model[J]. Biometrica, 61(1): 101-107. DOI:10.1093/biomet/61.1.101
Lazraq A, Cléroux R, Gauchi J P. 2003. Selecting both latent and explanatory variables in PLS1 regression model[J]. Chemometrics and Intelligent Laboratory Systems, 66(2): 117-126. DOI:10.1016/S0169-7439(03)00027-3
Lu D. 2006. The potential and challenge of remote sensing-based biomass estimation[J]. International Journal of Remote Sensing, 27(7): 1297-1328. DOI:10.1080/01431160500486732
Stone M. 1974. Cross-validatory choice and assessment of statistical predictions[J]. Journal of Royal Statistical Society, 36(1): 111-133.
Wolter P T, Townsend P A, Sturtevant B R, et al. 2008. Remote sensing of the distribution and abundance of host species for spruce budworm in Northern Minnesota and Ontario[J]. Remote Sensing of Environment, 112(10): 3971-3982. DOI:10.1016/j.rse.2008.07.005
Xu X, Du H, Zhou G, et al. 2011. Estimation of aboveground carbon stock of moso bamboo (Phyllostachys heterocycla var. pubescens) forest with a landsat thematic mapper image[J]. International Journal of Remote Sensing, 32(5): 1431-1448. DOI:10.1080/01431160903551389