董利虎, 张连军, 李凤日
Dong Lihu, Zhang Lianjun, Li Fengri
Error Structure and Additivity of Individual Tree Biomass Model
董利虎1, 张连军2, 李凤日1    
1. 东北林业大学林学院 哈尔滨 150040;
2. 美国纽约州立大学环境科学和林业学院 锡拉丘兹 13210
摘要:【目的】 从确定生物量模型误差结构和建立可加性生物量模型2方面进行立木生物量研究,为构建生物量模型提供建议。【方法】 以黑龙江西部平原地区人工林小黑杨为例,利用似然分析法判断总生物量及各分项生物量模型的误差结构,在此基础上利用SAS/ETS模块的非线性似乎不相关回归建立其可加性生物量模型,并采用"刀切法"对生物量模型进行评价。【结果】 经似然分析法判断,人工林小黑杨生物量模型的误差结构都为相乘的,对数转换的可加性生物量模型应当被选用。所建立的人工林小黑杨可加性生物量模型的调整后确定系数Ra2为0.92~0.99,绝大多数模型的平均相对误差以及平均相对误差绝对值都较小,所有模型的预测精度都在85%以上,且总生物量、地上和树干生物量模型效果较好,树根、树枝、树叶和树冠生物量模型效果较差。总的来说,各分项生物量和总生物量模型的拟合效果和预测能力较好。【结论】 模型的误差结构和可加性是构建生物量模型中所存在的2个关键问题,建议在构建生物量模型时考虑并解决这2个问题。
关键词人工林小黑杨    误差结构    似然分析    可加性    "刀切法"检验    
Error Structure and Additivity of Individual Tree Biomass Model
Dong Lihu1, Zhang Lianjun2, Li Fengri1    
1. Forestry College, Northeast Forestry University Harbin 150040;
2. State University of New York, College of Environmental Science and Forestry Syracuse 13210
Abstract: [Objective]Forest biomass is a basic quantity character of the forest ecological system. Biomass data are the foundation of researching many forestry and ecology problems. Therefore, accurate quantification of biomass is critical for calculating carbon storage, as well as for studying climate change, forest health, forest productivity and nutrient cycling, etc. Directly measuring the actual weight of each component (i.e., stem, branch, foliage and root) is undoubtedly the most accurate method, but it is destructive, time consuming, and costly. Thus, developing biomass models is regarded as a better approach to estimating forest biomass. However, some issues are needed to take care when constructing and applying biomass models, such as: 1) some reported biomass models may not hold the additivity or compatibility among tree component models; 2) which model error structure is appropriate for biomass data, i.e., additive error structure versus multiplicative error structure; 3) few models are available for tree belowground (root) biomass. Researchers have been continuously working and debating on these issues over the last decades. Development of the additive system of biomass equations were reported in the literature. However, how to evaluate the model error structure of the biomass equation in forestry have not been well investigated so far. The present paper mainly deals with two parts: evaluating error structure of the biomass model and developing the additive system of biomass equations.[Method]The P. simonii×P. nigra plantation in the west of Heilongjiang Province of China is selected to ensure error structure by likelihood analysis. Nonlinear seemly unrelated regression (NSUR) of SAS/ETS module is used to estimate the parameters in the additive system of biomass equations. The biomass model validation is accomplished by Jackknifing technique.[Result]The multiplicative error structure was favored for the total and component biomass equations for P. simonii×P. nigra plantation by a likelihood analysis, and the additive system of log-transformed biomass equations should be applied. Overall, the Ra2 of all biomass models was between 0.92 and 0.99. The mean relative error and mean absolute relative error were smaller for most biomass models. All models for total and component biomass had the good prediction precision (85 % or more). The effect of total tree, aboveground and stem biomass models are better than root, branch, foliage and crown biomass models. Overall, all models for total and component biomass could be a good predict of the P. simonii×P. nigra biomass.[Conclusion]Although the significance of likelihood analysis is proposed by several studies, it has not been widely applied in forestry. When total biomass is divided into aboveground and belowground biomass, aboveround biomass is divided into stem and crown biomass, crown biomass is divided into branch and foliage biomass, and stem biomass is divided into bark and wood biomass, the additivity of total and component biomass should be taken into account. Overall, the error structure and additivity of biomass models are the two key issues, and should be taken into account when biomass models are constructed. If the two issues are well solved, the constructed biomass models will be more effective.
Key words: P. simonii×P. nigra plantation    error structure    likelihood analyses    additivity    jackknifing technique    

森林生物量作为森林生态系统性质、状态的重要特征,是研究森林碳储量和碳平衡等许多林业与生态问题的基础(王效科等,2001Bond-Lamberty et al., 2004Pregitzer et al., 2004Mu et al., 2013Konopka et al., 2013刘琦等,2013)。目前,估算森林生物量常用生物量模型估算法,该方法利用林木易测因子来推算难以测定的立木生物量,可以减少生物量测定的外业工作(Parresol,1999Bond-Lamberty et al,2002Bi et al,2004Wang,2006)。根据文献统计,过去几十年全世界已经建立了涉及100多个树种的2 300个生物量模型(Lambert et al., 2005Jenkins et al., 2003董利虎等,2011Lai et al., 2013),但很少有人关注地下生物量,其中主要的原因是树根很难挖取(Brown,2002Wang,2006)。

幂函数Y=aXb是一个数学函数,经常被用为生物量模型。在实际中,对数转换的线性回归经常被用来拟合幂函数;然而,一些研究者认为应该用非线性回归来拟合幂函数。选择对数转换的线性回归还是非线性回归主要依赖于幂函数的误差结构。为了评价模型的误差结构,Bi等(2004)提出用非线性回归与对数转换的线性回归的均方误差比值(MSE ratio)法判断幂函数的误差结构;Xiao等(2011)Ballantyne(2013)提出用似然分析法(likelihood analysis)判定幂函数的误差结构。到目前为止,似然分析法已被用于很多领域,但在林业界还很少被人所知(Lai et al., 2013)。与均方误差比值法相比,似然分析法被认为更符合核心统计原则,更适合用来确定模型的误差结构(Ballantyne,2013)。

为了满足立木总生物量等于各分项生物量之和这一逻辑关系,需要各分项生物量模型之间具有可加性,这可以通过很多方法实现,如简单最小二乘法、最大似然法、度量误差法、线性及非线性似乎不相关回归等(Cunia et al., 1984Chiyenda et al., 1984Reed et al., 1985Parresol,19992001Tang et al., 2001),其中,似乎不相关回归(seemingly unrelated regression,SUR)是最灵活、最受欢迎的参数估计方法。

小黑杨(P. simonii×P. nigra)是黑龙江西部地区防护林的主要造林树种。本文以黑龙江省西部人工林小黑杨为例,主要从以下2方面进行立木生物量模型的研究:1)检验哪种误差结构更适合黑龙江省西部人工林小黑杨总生物量及各分项生物量模型;2)构建一个可加性生物量模型。

1 数据调查与收集

2009年,在黑龙江省西部的甘南县和杜尔伯特蒙古族自治县小黑杨人工林内选取14,21,23,25,27,29年生6个年龄段的样地各3块,样地间立地质量差异不大,样地面积均为30 m×30 m,进行每木检尺。将每木测定的结果按径阶2 cm统计分组,分组后按等断面积径级标准木法将林木分为5级,计算各径级的平均直径,并以此为标准在每个年龄段选择5株不同大小的林木作为样木,此外再选取1株优势木进行解析,即每年龄段共选6株样木,全部共36株样木。伐倒选取的样木,按1 m区分段,测定各区分段树干的鲜质量,将树冠分为3层,每层选取3~5个标准枝称其枝、叶的鲜质量。每株样木各区分段的树干和每层的枝、叶都分别取样,带回室内测其含水率。用全挖法采集树根,测定大根(>5 cm)、粗根(2~5 cm)、细根(≤2cm)的鲜质量,并分别取样品测其含水率[由于小于5 mm树根很难获取(Wang,2006),所以本研究中树根不包括此部分]。所采集样品带回室内在80 ℃下烘干至恒质量,根据样品鲜质量和干质量分别推算样木各部分干质量,并汇总得到树冠生物量、地上生物量和总生物量,其样木信息及生物量统计见表 1

表 1 人工林小黑杨解析木生物量统计 Tab.1 Statistics of sampling trees biomass for P. simonii×P. nigra plantation
2 研究方法 2.1 幂函数误差结构分析

通常来说,有2种方法可以拟合幂函数:1)原始数据的非线性回归(non-linear regression,NLR);2)对数转换的线性回归(linear regression,LR)。非线性回归与对数转换的线性回归最本质的区别在于幂函数假设的误差结构不同。在非线性回归中,假设幂函数误差项是正态的、相加的,其形式如下:

$Y\text{=}a{{X}^{b}}+\varepsilon \text{, }\varepsilon \tilde{\ }N(0\text{,}{{\sigma }^{2}});$ (1)


$\ln Y=\ln a+b\ln X+\varepsilon \text{, }\varepsilon \text{ }\!\!\tilde{\ }\!\!\text{ }~N(0\text{,}{{\sigma }^{2}}).$ (2a)

$Y=a{{X}^{b}}{{e}^{\varepsilon }}\text{, }\varepsilon \tilde{\ }N(0\text{,}{{\sigma }^{2}}).$ (2b)



${L_{{\rm{norm}}}} = \prod\limits_{i = 1}^n {\left({\frac{1}{{\sqrt {2\pi \sigma _{{\rm{NLR}}}^2} }}{e^{\frac{{ - {{[{y_i} -({a_{{\rm{NLR}}}}X_{i{\rm{NLR}}}^b)]}^2}}}{{2\sigma _{{\rm{NLR}}}^2}}}}} \right)} ;$ (3)
${L_{\lg n}} = \prod\limits_{i = 1}^n {\left({\frac{1}{{{y_i}\sqrt {2\pi \sigma _{{\rm{LR}}}^2} }}{e^{\frac{{ - {{[lg{y_i} - \lg({a_{{\rm{LR}}}}X_{i{\rm{LR}}}^b)]}^2}}}{{2\sigma _{{\rm{LR}}}^2}}}}} \right)} .$ (4)


${\rm{AICc}} = 2k - 2\lg L + \frac{{2k(k + 1)}}{{N - k - 1}}.$ (5)

2)如果AICcnorm - AICclgn<-2,则幂函数的误差项是相加的,模型应该用非线性回归进行拟合;如果AICcnorm - AICclgn> 2,则幂函数的误差项是相乘的,模型应该用对数转换的线性回归进行拟合;如果|AICcnorm - AICclgn| ≤ 2,则2种误差结构的假设都不合适,此时模型求平均值可能是最好的办法。

对于本研究来说,首先用非线性回归和对数转换的线性回归分别拟合人工林小黑杨总生物量及各分项生物量模型,得出每个模型的参数,并计算出ΔAICC值(AICcnorm - AICclgn)判断模型的误差结构,进而选择是用非线性回归还是对数转换的线性回归拟合生物量模型。

2.2 可加性模型

目前,国内外主要有3种非线性可加性生物量模型(Parresol,1999唐守正等,2000Bi et al., 2004董利虎等,20112013a曾伟生等,2010):1)以总量为基础分级控制可加性生物量模型;2)以总量为基础直接控制可加性生物量模型;3)非线性似乎不相关可加性生物量模型。其中,前2种可加性生物量模型在我国使用较多,而国外研究者主要利用第3种模型来解决生物量的可加性问题。另外,前2种可加性生物量模型只能用加权回归来消除异方差,而第3种模型可以用加权回归或对数转换来消除异方差。总的来说,非线性似乎不相关可加性生物量模型似乎更为灵活,其不仅能解决立木总生物量等于各分项生物量之和这一逻辑关系,而且还考虑同一样木总生物量和各分项生物量之间的内在相关性,因此,本研究用此模型来建立人工林小黑杨生物量模型。



$\left\{ {\begin{array}{*{20}{l}} {{W_i} = {a_i} \cdot {D^{{b_i}}} + {\varepsilon _i}}\\ {{W_{\rm{c}}} = {W_{\rm{b}}} + {W_{\rm{f}}} + {\varepsilon _{\rm{c}}}}\\ {{W_{\rm{a}}} = {W_{\rm{s}}} + {W_{\rm{b}}} + {W_{\rm{f}}} + {\varepsilon _{\rm{a}}}}\\ {{W_{\rm{t}}} = {W_{\rm{r}}} + {W_{\rm{s}}} + {W_{\rm{b}}} + {W_{\rm{f}}} + {\varepsilon _{\rm{t}}}} \end{array}} \right.$ (6)


$\left\{ {\begin{array}{*{20}{l}} {\ln {W_i} = \ln {a_i} + {b_i}\ln D + {\varepsilon _i} = a_i^ * + b_i^ * \ln D + {\varepsilon _i}}\\ {\ln {W_{\rm{c}}} = \ln({W_{\rm{b}}} + {W_{\rm{f}}})+ {\varepsilon _{\rm{c}}}}\\ {\ln {W_{\rm{a}}} = \ln({W_{\rm{s}}} + {W_{\rm{b}}} + {W_{\rm{f}}})+ {\varepsilon _{\rm{a}}}}\\ {\ln {W_{\rm{t}}} = \ln({W_{\rm{r}}} + {W_{\rm{s}}} + {W_{\rm{b}}} + {W_{\rm{f}}})+ {\varepsilon _{\rm{t}}}} \end{array}} \right.$ (7)

以上2种可加性生物量模型用SAS/ETS模块的SUR进行拟合(Bi et al., 2004;SAS Institute,Inc.,2011)。需要指出的是,式(6)中所有方程含有相同的自变量,当其异方差权重一样时,自动满足了可加性性质(Bi et al., 2004Goicoa et al., 2011),因此,如果选择式(6)被拟合的话,则必须进行加权,具体加权方法见文献(曾伟生等,1999Balboa-Murias et al., 2006董利虎等,20112013a)。

2.3 模型评价

众所周知,模型的拟合优度不能完全反映模型的预测能力,因此为了评价模型的预测能力,模型检验必不可少。一些研究表明,分割数据的模型检验法并不能对模型评价提供额外的信息,模型拟合应该用全部数据,而评价模型预测能力应该用“刀切法”(曾伟生等,2011aQuint et al., 2010Li et al., 2013)。也有一些研究认为,仅仅评价模型总平均预测能力不能完全反映模型的预估效果,而通过分析不同径级的预测能力才能更好地反映模型的预估效果(Konopka et al., 2003)。因此,本研究从模型总平均预测能力和不同径级的预测能力来评价人工林小黑杨生物量模型。



$R_{\rm{a}}^2 = 1 -(1 - {R^2})\left({\frac{{N - 1}}{{N - p}}} \right),$


${R^2} = 1 - \frac{{\sum\limits_{i = 1}^N {{{({Y_i} - {{\hat Y}_i})}^2}} }}{{\sum\limits_{i = 1}^N {{{({Y_i} - \bar Y)}^2}} }}.$ (8)


${\rm{RMSE}} = \sqrt {{\rm{MSE}}} = \sqrt {\frac{{\sum\limits_{i = 1}^N {{{({Y_i} - {{\hat Y}_i})}^2}} }}{{N - p}}} .$ (9)


${e_{i,- i}} =({Y_i} - {\hat Y_{i,- i}}).$ (10)


${\rm{ME}}\% = \frac{{\sum\limits_{i = 1}^N {\left({\frac{{{e_{i,- i}}}}{{\bar Y}}} \right)\times 100} }}{N}.$ (11)


${\rm{MAE}}\% = \frac{{\sum\limits_{i = 1}^N {\left({\frac{{|{e_{i,- i}}|}}{{{Y_i}}}} \right)\times 100} }}{N}.$ (12)


${\rm{MPE}}\% = \frac{{{t_\alpha }\sqrt {\frac{{e_{i,- i}^2}}{{N - p}}} }}{{\bar Y\sqrt N }} \times 100.$ (13)
式中:N为样本总数;Yi为第i个观测值;${\hat Y_i}$为Yi的预测值;$\bar Y$为观测值的平均值;${\hat Y_{i,- i}}$为原始数据中删除第i个观测值后按p个参数模型拟合模型计算Yi的预测值;tα为置信水平α(0.05)时的t值。

3 结果与分析 3.1 生物量模型误差结构

首先用式(1)和式(2a)分别拟合人工林小黑杨总生物量及各分项生物量数据,获取AICcnorm和AICclgn。然后,用ΔAICc表示2种模型AICc值的差异(表 2)。结果表明,人工林小黑杨总生物量和各分项生物量模型的ΔAICc都大于2,因此可以认为人工林小黑杨总生物量和各分项生物量模型的误差结构是相乘的,对数转换的线性回归更适合被用来拟合生物量。树枝生物量模型的ΔAICc较大,因此,以树枝生物量模型为例来说明模型误差结构的意义。2种回归模型有着不同的斜率(LR为2.353 7,NLR为2.433 6)和截距[LR为-4.289 6,NLR为ln(0.011 8)=-4.439 7](表 2)。由图 1可知,当对数转换的数据被使用时,非线性回归会略微低估小树的生物量,但会高估大树的生物量(图 1A)。当原始数据被使用时,非线性回归和对数转换的线性回归对于小树(D<10 cm)生物量的估算基本没有明显差异,但对于大树来说,2种模型有着明显的区别(图 1B)。仔细观察图 1,对于大树来说,树枝生物量的绝对偏差较大,但不同径级的绝对偏差百分比相对保持不变,这与似然分析支持对数正态误差结构模型是一致的。由于非线性回归对大树的绝对残差值比较敏感,所以相加的、正态误差结构模型会产生不切合实际的模型预估值;相反,对数转换的线性回归对于描述不同径级的树枝生物量有着明显的优势(图 1)。

表 2 人工林小黑杨生物量模型误差结构似然分析统计信息 Tab.2 Information statistics of likelihood analysis for the additive and multiplicative error structure of biomass models for P. simonii×P. nigra plantation
图 1 人工林小黑杨树枝生物量对数转换数据的观测值和预测值(A)及原始数据的观测值和预测值(B) Fig. 1 The observed data of branch biomass and model predictions on log-transformed scale(A), original scale(B) 实线代表对数转换回归[LR, 式(2a)]的预测值,虚线为非线性回归[NLR, 式(1)]的预测值。 The solid lines represent the model predictions by log-transformed model[LR, eq(2a)], and the dashed lines represents the model predictions by nonlinear or power model[NLR, eq(1)].
3.2 模型拟合与检验

经似然分析法检验,本研究的人工林小黑杨总生物量和各分项生物量模型的误差结构都是相乘的,对数转换的可加性模型式(7)应该被用来拟合生物量。从表 3可以看出,所有生物量模型的Ra2都大于0.9。总生物量、地上和树干生物量模型拟合效果更好,其Ra2都大于0.98,RMSE都小于0.11,而树枝,树叶和树冠生物量模型有着相对较小的Ra2和较大的RMSE(表 3)。因此,选用对数转换的可加性模型不仅能很好地拟合生物量,而且能消除模型的异方差(图 2)。

表 3 对数转换的可加性生物量模型系统参数估计值、参数标准误、拟合优度、校正系数以及偏差百分比 Tab.3 Coefficient estimates, standard error, goodness-of-fit statistics, correction factor and percent bias of log-transformed biomass equations
图 2 人工小黑杨总生物量、地上和地下生物量模型残差 Fig. 2 Residuals of total, aboveground and belowground biomass models of P. simonii×P. nigra plantation A. 总生物量 Total; B. 地上Aboveground; C. 地下 Belowground.

表 4给出了人工林小黑杨对数转换的可加性生物量模型检验结果。从表 4可以看出,对于不同的径级,生物量模型的预测能力是不同的。绝大多数总生物量、地上、地下、树干和树叶生物量模型对大树(D>15 cm)和中等树(10 cm<D<15 cm)生物量的预测能力比对小树生物量的预测能力好,而树枝和树冠生物量模型对小树的预测能力好。从总平均检验指标来看,所有模型的ME%在1.6%~ 2.9%之间,且会略低估生物量值。总生物量、地上和树干生物量模型的MAE%小于10%,而树枝、树叶、树冠和地下生物量模型的MAE%较大,都在10%以上,树枝生物量模型的MAE%甚至达到了23%。总生物量、地上、地下和树干生物量模型的MPE%基本在4%左右,说明其预估精度约96%,而树枝、树叶和树冠生物量模型的平均预估精度较低,但也都在85%以上(表 4)。总的来说,本研究利用式(7)所建立的立木生物量模型曲线与各样本点之间具有较好的切合程度,所建立的可加性生物量模型能很好地对人工林小黑杨生物量进行估计。

表 4 对数转换可加性模型“刀切法”检验结果 Tab.4 Validation of log-transformed biomass equations by jackknifing technique

此外,如果用对数转换的生物量模型[式(7)]去拟合生物量,一个校正系数[CF=exp(S2/2)]通常被用来校正反对数产生的系统偏差(曾伟生等,2011b)。然而,许多研究者发现使用校正系数后会高估生物量,如果模型误差很小,校正系数可以被忽略(Madgwick et al., 1975Zianis et al., 20032011)。在本研究中,人工林小黑杨总生物量及各分项生物量模型的RMSE都较小,其校正系数都小于1.04(表 3),且偏差百分比Bias%(Zianis et al., 2011)较小,在0.4%~3.4%之间。因此,用本研究所建立的生物量模型估计生物量时,校正系数可以被忽略。

4 结论与讨论 4.1 生物量模型误差结构

许多研究表明幂函数的对数转换形式通常被用来拟合生物量(Wang,2006Zianis et al., 20032011董利虎等,2013b),也有一些研究者用幂函数形式直接拟合原始生物量也能提供很好的拟合效果(Parresol,2001Bi et al., 2004Lambert et al., 2005Chan et al., 2013董利虎等,2013c)。似然分析法是判断模型误差结构最好的方法。虽然有时非线性回归和线性回归可能得到非常接近的拟合效果和预测能力,但是许多研究认为在构建生物量模型之前,确定模型的误差结构是有必要的(Xiao et al., 2011Lai et al., 2013)。然而,在国内外林业界,很少有人用似然分析法确定生物量模型的误差结构。本研究利用似然分析法判断人工林小黑杨总生物量及各分项生物量模型的误差结构,结果表明,人工林小黑杨总生物量及各分项生物量模型的误差结构都为相乘的,对数转换的线性回归具有一定的优势。

4.2 可加性生物量模型


当总生物量被分为地上和地下、地上被分树干和树冠、树冠被分为树枝和树叶甚至树干被分为树皮和木材时,所建立的生物量模型应当考虑总生物量及各分项生物量的可加性。目前,国内外有许多构建可加性生物量模型的方法可供选择,具体来说可加性生物量模型具有以下一些优点:1)各分项生物量预测值之和等于总生物量;2)能解决总生物量与各分项生物量之间的内在相关性;3)参数估计更有效;4)可以避免各分项生物量的估计值大于总生物量的估计值(Parresol,19992001Bi et al., 2004Balboa-Murias et al., 2006)。然而,在许多生物量模型中,总生物量等于各分项生物量之和这一逻辑关系依旧没有被考虑。

此外,如果对数转换的线性回归被使用,则校正系数通常被用来消除反对数产生的系统偏差;然而当模型误差足够小时,校正系数可以被忽略。在本研究中,总生物量及各分项生物量模型的校正系数都相当小,因此校正系数可以被忽略,这与许多研究(Zianis et al., 20032011)一致。然而,如果模型误差较大时,模型的校正系数是必需的,如Wang(2006)Zianis等(2003)所报道的生物量模型。


