文章信息
- 曾伟生, 夏忠胜, 朱松, 罗洪章
- Zeng Wei sheng, Xia Zhong sheng, Zhu Song, Luo Hong zhang
- 贵州省人工马尾松立木材积和地上生物量方程研建
- Establishment of Tree Volume and Aboveground Biomass Equations for Masson Pine Plantation in Guizhou Province
- 林业科学, 2011, 47(3): 96-101.
- Scientia Silvae Sinicae, 2011, 47(3): 96-101.
-
文章历史
- 收稿日期:2010-09-25
- 修回日期:2010-10-20
-
作者相关文章
2. 贵州省森林资源管理站 贵阳 550001
2. Forest Resources Administration Office of Guizhou Province Guiyang 550001
由于森林生态系统在应对全球气候变化中具有不可替代的作用,森林生物量监测越来越得到普遍重视。开展森林生物量监测和评估,建立适合较大区域范围的通用性立木生物量模型是一项重要的基础工作。近年来,有不少学者在积极探索建立适合国家、区域乃至全球水平的通用性生物量模型或立木材积模型(Hansen,2002; Chojnacky,2002; Jenkins et al., 2003; Snorrason et al., 2006; Vallet et al., 2006; Repola et al., 2007; Muukkonen,2007; Case et al., 2008; Návar,2009)。Case等(2008)对加拿大中西部地区10个树种的不同尺度(地方的、区域通用的、全国通用的)材积和生物量方程进行比较后发现,随着方程通用性水平的提高,用于局部地区的预估误差也相应增大。目前我国正在积极推进全国森林生物量调查建模,部分省份也结合自身条件和实际需求,陆续开展本省森林生物量表和材积表等相关数表的研建工作。在建立省级通用性模型的同时,是否需要再分亚区(如中心区和一般区)建立较小尺度的通用性模型,是需要考虑的一个问题,而混合模型和哑变量模型方法为解决这一问题提供了可能途径。
混合模型方法是改进参数估计的一种实用统计技术,近20年来在很多研究领域得到了应用,而在林业方面的应用则相对较迟。Lappi等(1988)阐述了基于Richards模型的非线性混合效应生长曲线的使用,用来在样地和样木2个水平上预估优势木和亚优势木的树高; Grégoire等(1995)以2个固定样地数据为基础,建立了考虑重复测定数据之间的协方差和样地随机效应的线性混合模型; Zhang等(2004)为了提高对美国乔治亚州集约经营的火炬松(Pinus taeda)林立木生物量的估计精度,在建立立木生物量方程时采用了混合模型方法; Calegario等(2005)建立了巴西沿海地区人工桉树(Eucalyptus)林按不同无性系和不同立地的优势高非线性混合生长模型,并认为非线性混合模型方法是一种灵活而精准的方法; Meng等(2008)基于非线性混合模型方法,建立了加拿大艾尔伯塔省黑松(Pinus contorta var.latifolia)按不同树冠级和不同风速影响下的树高-直径关系模型; Fehrmann等(2008)在建立芬兰的挪威云杉(Picea abies)和欧洲赤松(Pinus sylvestris)立木生物量模型时,对混合模型方法与k-最近邻域方法进行了对比分析。国内近年来关于混合模型在林业方面的研究比较具代表性的有:考虑样地和树冠类型随机影响的林木直径与航片冠幅线性混合模型(郎璞玫,2008)、考虑样地及样木之间随机影响的单木断面积生长混合模型(雷相东等,2009),以及考虑区组间随机效应的杉木林优势木平均高非线性混合模型(李春明等,2010)。
哑变量也称虚拟变量,通常取值为0或1。哑变量处理是对定性因子或分类变量进行处理的一种常用方法,统计分析中的各种数量化方法都要涉及到哑变量处理的问题(唐守正等,2002; 2008; 李丽霞等,2006); 在各种回归分析和建模实践中也经常用到哑变量模型方法(李希菲等,1997; 李河等,2008)。关于哑变量方法与混合模型方法究竟哪种更合适,Wang等(2008)以建立优势高模型为例进行了对比分析,认为2种方法都适用于建立带有特定参数或地方参数的模型,而且二者的效果基本相当; 就拟合效果而言,哑变量方法可能略好; 就预估效果而言,混合模型方法也许更合适。
本文将从建立贵州省立木材积和生物量模型的实际需求出发,以180株人工马尾松(Pinus massoniana)样木数据为基础,建立省级总体平均模型和以区域作为特定参数的哑变量模型及线性混合模型,分析2类区域性模型与省级总体平均模型之间的差异,以及区域分布对立木材积和生物量估计的影响,并用另外115株样木数据对2类模型进行检验,最终对模型进行评价。
1 数据本文所用数据为贵州省人工马尾松的立木材积和地上生物量实测数据,共295株样木,采集时间为2007年,采集地点涉及全省马尾松分布区,具有广泛的代表性,其中黎平、从江、榕江、雷山、台江、剑河、锦屏、天柱、丹寨、三都10县为中心分布区,样木数量为148株; 其他县为一般分布区,样木数量为147株。全部样木都实测胸径和冠幅,将样木伐倒后,测量树干长度(树高)和活树冠长度(冠长),在树高的0,0.05,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9长度处将树干区分为11段,测量每一段的下部直径并按区分求积法计算树干材积; 同时分干材、干皮、树枝、树叶称鲜质量,并分别抽取样品带回实验室,在85 ℃恒温下烘干至恒重,根据样品鲜质量和干质量分别推算样木各部分干质量并汇总得到地上部分干质量。
将中心区和一般区的样木分别按直径和树高排序,按径阶分为6(4 ~ 8),10(8 ~ 12),14(12 ~ 16),18(16 ~ 20),22 (20 ~ 24),26 (≥24) cm以上6个组,每个径阶组按中心区和一般区各随机挑选15株样木,共计180 (6 × 15 × 2)株样木用于建模; 剩余的115株样木用于对模型进行检验。建模样本和检验样本的有关统计指标见表 1。
立木材积和生物量模型的通用结构形式可表示为(Parresol,1999) :
(1) |
式中: y为林木材积或生物量,xj为反映林木大小的变量,βj为模型参数,ε为误差项。因为基于胸径和树高的二元模型比较常用(Zianis et al., 2005; Snorrason et al., 2006; Vallet et al., 2006),本文即以下列二元方程作为立木材积和地上生物量的基本模型:
(2) |
式中: M为立木材积(m3)或地上生物量(kg),D为胸径(cm),H为树高(m),a,b,c为参数,ζ为相对误差。将(2)式通过对数转换为如下线性形式:
(3) |
式中: y = ln M,x1 = ln D,x2 = ln H,a0 = ln a,ζ = ln(1 +ζ)。根据(3)式的拟合结果,可由下式得到立木材积或地上生物量的估计值:
(4) |
但是由于对数转换存在偏差,还必需对(4)式进行修正,其中最常用的校正因子为exp (S2 /2)(Baskerville,1972; Flewelling et al., 1981),这时校正后的估计值为:
(5) |
此外,从实用性角度出发,还可以采用Snowdon (1991)提出的比值估计量校正因子,确保其总体平均偏差为0。
林木材积和地上生物量除了随直径D、树高H变化以外,还会受到其他一些因素的影响,如林木的地域分布等。根据经验知道,贵州人工马尾松林木的干形在中心区和一般区存在一定差异。这里把不考虑地域分布、具有3个通用参数(或固定参数)的模型(3)称为总体平均模型。下面再来考虑不同区域条件下的哑变量模型和混合模型,其中区域分为中心区和一般区,类型代码分别为1和2。
2.2 哑变量模型由于只涉及2个区域,哑变量的处理非常简单,仅含1个哑变量z1 :当区域为中心区时取z1 = 1,当区域为一般区时取z1 = 0。基于(3)式的哑变量模型表示为:
(6) |
式中: z1为哑变量,vi为相应的特定参数或局部参数(specific or local parameters),其他符号含义同(3)式。为了区别起见,在哑变量模型中把对应于总体平均模型的参数称为通用参数或全局参数(general or global parameters)。对于(6)式的参数求解,可以采用普通最小二乘法。
2.3 线性混合模型线性混合模型的基本形式为(唐守正等,2002; 2008) :
(7) |
式中: y为因变量,β为固定参数,u为随机参数,x为固定参数设计矩阵,z为随机参数设计矩阵,e为观测误差。与(6)式对应的混合模型可以表示为:
(8) |
其中:随机参数ui的数学期望值为0,且相互独立,即: E(ui) = 0;当i≠j时cov(ui,uj) = 0。
对于前述哑变量模型,在混合模型中将区域作为随机效应变量。对于(7)或(8)式的线性混合模型,可以利用ForStat软件(V2.1) “统计分析”功能模块中的“线性混合模型”求解参数,其中隐含的参数估计方法为限制性极大似然法(唐守正等,2008)。
2.4 模型评价哑变量模型与混合模型之间的对比评价指标采用确定系数R2、残差平方和SSE、均方误差S2、平均预估误差MPE和平均百分标准误差MPSE。其计算公式如下(Parresol,1999; 曾伟生等,1999) :
(9) |
(10) |
(11) |
(12) |
(13) |
式中: yi和
哑变量模型或混合模型与总体平均模型之间的差异对比采用F统计检验。F统计指标按下式计算(Meng et al., 2008) :
(14) |
式中: SSEPA,dfPA分别为总体平均模型的残差平方和与自由度,SSEDM,dfDM分别为哑变量模型或混合模型的残差平方和与自由度。根据F值的大小可判定2个模型之间是否有显著差异,从而对是否需要建立适用于特定区域的模型作出评判。
2.5 模型检验利用建模样本和检验样本对不同模型的预估效果进行检验。主要采用总相对误差TRE和平均系统误差MSE这2项指标,其计算公式如下(曾伟生等,1999) :
(15) |
(16) |
式中符号的含义同(10)式。根据模型检验结果,既可以比较分析总体平均模型和特定区域模型之间的差异,又可以对哑变量模型和混合模型进行对比分析。
3 结果与分析 3.1 模型拟合结果利用贵州省180株人工马尾松样木的立木材积和地上生物量数据,采用ForStat软件先对总体平均模型(3)、哑变量模型(6)和混合模型(8)进行拟合。结果表明:对于立木材积,模型(6)中的特定参数v0和模型(8)中的随机参数u0与0无显著差异,从而在模型中去掉这2个参数; 对于立木生物量,模型(6)中的特定参数v2和模型(8)中的随机参数u1,u2与0无显著差异,从而在模型中去掉这3个参数。最终的拟合结果详见表 2。
从表 2的5项拟合统计指标看:总体平均模型、哑变量模型和混合模型3者之间的差异都不大,其中对材积模型而言,哑变量模型和混合模型比总体平均模型的改进要明显一些。从直接反映模型之间差异的特定参数或随机参数来看,区域分布对材积模型参数的影响在哑变量模型和混合模型中的表现是完全一致的,即中心区的参数b较小、参数c较大,而一般区的参数b较大、参数c较小; 区域分布对生物量模型参数的影响在哑变量模型和混合模型中的表现不完全一致。在哑变量模型中,中心区的参数a较小、参数b较大,而一般区的参数a较大、参数b较小; 但在混合模型中,中心区的参数a较小,而一般区的参数a较大,随机效应对参数b,c的影响趋向于0。
另外,通过利用(14)式,对上述哑变量模型和混合模型与总体平均模型进行差异显著性检验。计算得到的立木材积模型的2个F值分别为15.48和15.39,在0.01水平上与总体平均模型有显著差异; 地上生物量模型的2个F值分别为2.75和1.54,前者在0.10水平上有显著差异,后者与总体平均模型无显著差异。
从拟合统计指标看,哑变量模型和混合模型与总体平均模型之间的差异很小,分区建立模型没有现实意义; 而从差异显著性检验结果看,区域特定的模型与总体平均模型又存在一定差异。对差异显著的材积模型进行分析不难发现,区域之间的差异主要体现在林木干形。以哑变量模型(6)的拟合结果为例,当树高H等于D0.932 45时,中心区和一般区的2个模型的估计值相等; 当树高H大于D0.932 5时,中心区模型的估计值要大; 当树高H小于D0.932 5时,一般区模型的估计值要大。也就是说,高径比大的林木,中心区的材积比一般区大; 高径比小的林木,一般区的材积比中心区大。
3.2 模型预估效果上面已经对模型的拟合统计指标进行了对比分析,也从统计上比较了哑变量模型和混合模型与总体平均模型之间的差异。下面再来进一步对比分析不同模型的预估效果。
利用180株建模样本和115株检验样本数据,分别材积模型和生物量模型对哑变量模型、混合模型与总体平均模型之间的预估效果进行检验。表 3为不同模型的预估效果,其中对数偏差的校正因子采用Snowdon(1991)提出的比值估计量,故针对建模样本总体而言,3个模型的总相对误差TRE均为0。
从表 3可以看出:对于立木材积模型而言,不论是利用建模样本还是检验样本来检验,模型(3),(6),(8)之间的差异都很小,而且不论是针对整个总体还是不同的区域,2项误差指标都在± 1%以内,从材积预估效果来看,哑变量模型和混合模型并不比总体平均模型更好,表明分区域建模没有必要。对于地上生物量模型也是完全类似的结果,只是其误差比材积模型要大一些,2项误差指标大多数在± 5%以内,也有少数在± (5 ~ 8) %之间。
4 结论与讨论本文从建立贵州省人工马尾松立木材积和地上生物量模型的实际需求出发,同时建立了省级总体平均模型和以区域作为特定参数的哑变量模型及线性混合模型,并对中心区和一般区2类区域性模型与省级总体平均模型之间的差异进行了对比分析和预估效果检验。结果表明:对立木材积和地上生物量估计而言,区域特定的模型与总体平均模型没有显著差异,从而不需要分别区域建立模型; 尽管区域材积模型和总体材积模型在统计上存在显著差异,但主要表现为2个指数参数之间的差异。由此反映出马尾松中心区和一般区的林木在干形上有所不同,对于高径比大的林木,中心区的材积比一般区大; 对于高径比小的林木,一般区的材积比中心区大。但由于区域分布对2个指数参数的影响存在正负互补效应,故对总体材积估计值的影响不显著。
另外,建立含特定参数的模型究竟应该选择哑变量模型还是混合模型方法,在生物计量学和统计学领域一直以来都还存在着争论(Wang et al., 2008)。从实用性角度出发,一般可以根据划分类型的数量及每一类型的样本量来决定:如果类型数量少(如10个以下),则选择哑变量模型可能较好; 如果类型数量多,而且每个类型包含的样本量又少,则一般推荐混合模型; 如果每个类型的样本量都较大,则选择哪个模型都无关紧要了(Wang et al., 2008)。就本研究而言,因为只分了2个地域类型,且每个类型的样本量达到90,选择哑变量模型还是混合模型应该无关紧要。结果确实也表明,不论是立木材积模型还是地上生物量模型,哑变量模型和混合模型之间的差异并不显著。
总之,本研究建立的人工马尾松立木材积和地上生物量模型,为贵州省马尾松人工林的蓄积量估计和生物量估计提供了计量依据; 哑变量和混合模型方法为建立含特定参数的模型提供了可行途径,其他通用性模型的建立也可以采用这一方法。
郎璞玫. 2008. 航空像片冠幅与地面直径的线性混合模型[J]. 林业科学, 44(3): 41-44. |
雷相东, 李永慈, 向玮. 2009. 基于混合模型的单木断面积生长模型[J]. 林业科学, 45(1): 74-80. DOI:10.11707/j.1001-7488.20090113 |
李春明, 张会儒. 2010. 利用非线性混合模型模拟杉木林优势木平均高[J]. 林业科学, 46(3): 89-95. DOI:10.11707/j.1001-7488.20100314 |
李河, 麦劲壮, 肖敏, 等. 2008. 哑变量在Logistic回归模型中的应用[J]. 循证医学, 8(1): 42-45. |
李丽霞, 郜艳晖, 张瑛. 2006. 哑变量在统计分析中的应用[J]. 数理医药学杂志, 19(1): 51-52. |
李希菲, 洪玲霞. 1997. 用哑变量法求算立地指数曲线族的研究[J]. 林业科学研究, 10(2): 215-219. |
唐守正, 郎奎建, 李海奎. 2008. 统计和生物数学模型计算(ForStat教程)[M]. 北京: 科学出版社.
|
唐守正, 李勇. 2002. 生物数学模型的统计学基础[M]. 北京: 科学出版社.
|
曾伟生, 骆期邦, 贺东北. 1999. 论加权回归与建模[J]. 林业科学, 35(5): 5-11. |
Baskerville G L. 1972. Use of logarithmic regression in the estimation of plant biomass[J]. Can J For Res, 2(1): 49-53. DOI:10.1139/x72-009 |
Calegario N, Daniels R F, Maestri R, et al. 2005. Modeling dominant height growth based on nonlinear mixed-effects model: a clonal Eucalyptus plantation case study[J]. Forest Ecology and Management, 204(1): 11-21. DOI:10.1016/j.foreco.2004.07.051 |
Case B, Hall R J. 2008. Assessing prediction errors of generalized tree biomass and volume equations for the boreal forest region of westcentral Canada[J]. Can J For Res, 38(4): 878-889. DOI:10.1139/x07-212 |
Chojnacky D C. 2002. Allometric scaling theory applied to FIA biomass estimation ∥ Proceedings of the third annual forest inventory and analysis symposium. GTR NC-230, North Central Research Station, Forest Service USDA, 96-102.
|
Fehrmann L, Lehtonen A, Kleinn C, et al. 2008. Comparison of linear and mixed-effect regression models and a k-nearest neighbor approach for estimation of single-tree biomass[J]. Can J For Res, 38(1): 1-9. DOI:10.1139/X07-119 |
Flewelling J W, Pienaar L V. 1981. Multiplicative regression with lognormal errors[J]. For Sci, 27(2): 281-289. |
Grégoire T G, Schabenberger O, Barrett J P. 1995. Linear modeling of irregularly spaced, unbalanced, longitudinal data from permanentplot measurements[J]. Can J For Res, 25(1): 137. DOI:10.1139/x95-017 |
Hansen M. 2002. Volume and biomass estimation in FIA: National consistency vs. regional accuracy∥ Proceedings of the third annual forest inventory and analysis symposium. GTR NC-230, North Central Research Station, Forest Service USDA, 109-120.
|
Jenkins J C, Chojnacky D C, Heath L S, et al. 2003. National-scale biomass estimators for United States tree species[J]. For Sci, 49(1): 12-35. |
Lappi J, Bailey R L. 1988. A height prediction model with random stand and tree parameters: an alternative to traditional site index methods[J]. For Sci, 38(2): 409-429. |
Meng S X, Huang S, Lieffers V J, et al. 2008. Wind speed and crown class influence the height-diameter relationship of lodgepole pine: nonlinear mixed effects modeling[J]. Forest Ecology and Management, 256(4): 570-577. DOI:10.1016/j.foreco.2008.05.002 |
Muukkonen P. 2007. Generalized allometric volume and biomass equations for some tree species in Europe[J]. Eur J Forest Res, 126(2): 157-166. DOI:10.1007/s10342-007-0168-4 |
Návar J. 2009. Allometric equations for tree species and carbon stocks for forests of northwestern Mexico[J]. Forest Ecology and Management, 257(2): 427-434. DOI:10.1016/j.foreco.2008.09.028 |
Parresol B R. 1999. Assessing tree and stand biomass: a review with examples and, critical comparisons[J]. For Sci, 45(4): 573-593. |
Repola J, Ojansuu R, Kukkola M. 2007. Biomass functions for Scots pine, Norway spruce and birch in Finland. Working Papers of the Finnish Forest Research Institute 53. http://www.metla.fi/julkaisut/workingpapers/2007/mwp053.htm.
|
Snorrason A, Einarsson S F. 2006. Single-tree biomass and stem volume functions for eleven tree species used in Icelandic forestry[J]. Icel Agric Sci, 19: 15-24. |
Snowdon P. 1991. A ratio estimator for bias correction in logarithmic regressions[J]. Can J For Res, 21(5): 720-724. DOI:10.1139/x91-101 |
Vallet P, Dhôte J-F, Le Mogu édec G, et al. 2006. Development of total aboveground volume equations for seven important forest tree species in France[J]. Forest Ecology and Management, 229(1/3): 98-110. |
Wang M, Borders B E, Zhao D. 2008. An empirical comparison of two subject-specific approaches to dominant heights modeling: the dummy variable method and the mixed model method[J]. Forest Ecology and Management, 255(7): 2659-2669. DOI:10.1016/j.foreco.2008.01.030 |
Zhang Y J, Borders B E. 2004. Using a system mixed-effects modeling method to estimate tree compartment biomass for intensively managed loblolly pines—an allometric approach[J]. Forest Ecology and Management, 194(1/3): 145-157. |
Zianis D, Muukkonen P, Mäkipää R, et al. 2005. Biomass and stem volume equations for tree species in Europe. Silva Fennica Monographs 4, 1-63.
|