相容性生物量模型的建立及其估计方法研究

文章信息

唐守正, 张会儒, 胥辉.

Tang Shouzheng, Zhang Huiru, Xu Hui.

相容性生物量模型的建立及其估计方法研究

STUDY ON ESTABLISH AND ESTIMATE METHOD OF COMPATIBLE BIOMASS MODEL

林业科学, 2000, 36(专刊1): 19-27.

Scientia Silvae Sinicae, 2000, 36(专刊1): 19-27.

文章历史

收稿日期：1998-10-21

作者相关文章

唐守正

张会儒

胥辉

引用本文

唐守正, 张会儒, 胥辉. 2000. 相容性生物量模型的建立及其估计方法研究. 林业科学, 36(专刊1): 19-27.

Tang Shouzheng, Zhang Huiru, Xu Hui. 2000. STUDY ON ESTABLISH AND ESTIMATE METHOD OF COMPATIBLE BIOMASS MODEL. Scientia Silvae Sinicae, 36(专刊1): 19-27.

相容性生物量模型的建立及其估计方法研究

唐守正 , 张会儒 , 胥辉

中国林业科学研究院资源信息研究所北京 100091

收稿日期：1998-10-21

本文属于林业部重点课题“我国主要树种二元生物量模型及其相容的一元自适应模型系列的研究” (95-03-02)部分内容。参加此项研究的还有王奉瑜同志，外业调查得到了吉林省红石林业局的大力支持，检验和评价指标是我们与骆期邦和曾伟生等共同提出，在此一并表示感谢!

摘要： 森林生物量是森林生态系统的最基本数量特征，生物量数据是研究许多林业问题和生态问题的基础，因此，准确测定生物量十分重要。建立生物量模型是生物量估测的主要手段。以往所建模型，存在一个严重的缺陷，即各分量模型间不相容。如何解决相容性问题，一直是生物量估计领域所面临的一个难题。本文以长白落叶松为实例，提出了一种新方法———非线性联合估计法，并与比例平差法进行了对比。针对不同建模方法，设计了5种估计方案，经过分析比较，确定了1种方案为最优估计方案。该方案以树干生物量作为控制量，采取两级联合估计。模型构成如下：第一级，W₁=f₂ (x) +f₅ (x), W₂=f₂ (x), W₅=f₅ (x)；第二级，W₃=f₃ (x), W₄=f₂ (x) -f₃ (x)；第三级，W₆=f₆ (x), W₇=f₅ (x) -f₆ (x)。本文中模型选型采用了变量逐步筛选法，参数估计采用了加权最小二乘法，以消除异方差现象。同时，提出了5个指标用于模型评价，即参数变动系数C%、总相对误差RS%、平均相对误差EE%，平均相对误差绝对值RMA%和预估精度P%。

关键词：生物量模型相容性非线性联合估计

STUDY ON ESTABLISH AND ESTIMATE METHOD OF COMPATIBLE BIOMASS MODEL

Tang Shouzheng, Zhang Huiru, Xu Hui

The Research Institute of Forest Resource Information Techniques, CAF Beijing 100091

Abstract: Forest biomass is a basic quantity character of the forest ecological system. Biomass data are foundation of researching many forestry and ecology problems, thus accurate measurement of biomass is very important. Establishing biomass models is a major way to biomass estimation. There were a serious shortcomings in the models established previously, i.e.the results were incompatible for models of each component, in other words, the sum of estimated biomass of wood, bark, branches and foliage was unequal to estimated biomass of total aboveground, the sum of estimated biomass of wood and bark was unequal to estimated biomass of stem, the sum of estimated biomass of branches and foliage was unequal to estimated biomass of crown. There fore how to obtain the compatibility is stile a difficult problem for biomass estimate. A new method, nonlinear joint estimate, was proposed in this paper, and compared with method of adjustment in proportion. To the different methods of establishing models, five alternative methods were designed, then one of them was determined as a optimum method through the analysis and comparison. The optimum method took stem as a basis component and adopted two steps joint estimate, structure of models was as follows; the first step, total abovegroundW₁=f₂ (x) +f₅ (x), stem W₂=f₂ (x), crown W₅=f₅ (x); the second step, wood W₃=f₃ (x), bark W₄=f₂ (x) -f₃ (x); branch W₆=f₆ (x), foliage W₇=f₅ (x) -f₆ (x).In this paper, the progressive variable selection method was used to select models structure, and weighted least squares method was used to estimate parameters for reducing errors of non-homogeneous variance. At meantime, the paper used five indices to evaluate models, they were coefficient of variation for parameters C%, total relative error RS%, average relative error EE%, average absolute value of relative error RMA% and prediction precision P%. All of researches shown above in this paper took Larix olgensis as an example.

Key words: Biomass model Compatibility Nonlinear joint estimate

1 问题的提出

森林生物量是森林生态系统的最基本数量特征。它既表明森林的经营水平和开发利用的价值，同时又反映森林与其环境在物质循环和能量流动上的复杂关系。生物量数据是研究许多林业问题和生态问题的基础，因此，准确测定生物量无论在生产上，还是在理论研究上都有着十分重要的意义，一直为世界生态学家和林学家所重视。

众所周知，森林生物量测定非常困难，而且耗时费力，因此确定一种行之有效而又准确的调查方法是十分重要的。生物量模型估计法是目前比较流行的方法，它是利用林木易测因子来推算难于测定的林木生物量，从而减少测定生物量的外业工作。虽然在建模过程中，需要测定一定数量样木生物量的数据，但一旦模型建立，在同类的林分中就可以利用森林资源清查资料来估计整个林分的生物量，而且有一定的精度保证。特别是在大范围的森林生物量调查中，利用生物量模型能大大减小调查工作量。

关于立木生物量模型的建立，到目前为止一直认为由Kittredge (1944)引进的所谓相对生长方程(Allometric growth equation)是一种较理想的基本模型，其表达式为：W=αx^b，简称为CAR (Constant Allometric Ratio)。Ruark et al. (1987)认为林木各维量的相对生长率随林木大小的变化不是一个常数，进而提出了VAR (Variable Allometric Ratio)模型，其表达式可为：W=αx^be^cx。这两个模型可用于各维量干重和单木总量干重的估计，自变量x根据各维量的特点可选用不同的变量，例如：D²、D²H、D₀² (冠下径)、D₀²H、C_w (冠幅)、Cr (活冠长/树高)等，但只能选择其中一个作为变量，这就限制了模型精度的提高和使用范围的扩大。因而一些研究者又曾先后提出一些不同形式的多项式模型。在研究方法上，国内外研究者普遍采用的是，按林木各分量(干、枝、叶、根)分别进行选型，模型确定后根据各分量实际观测数据分别拟合各自方程中的参数，即各分量之间干重的估计都是独立进行的。因而造成各维量模型间不相容，换句话说，就是木材、树皮、枝、叶4部分干重之和不等于总量，木材和树皮干重之和不等于树干干重，枝和叶的干重之和不等于树冠干重。甚至有的估计结果相差很远。表 1为根据Ker et al. (1981)所建两个树种balsam fir和white spruce各维量模型不相容性举例。

表 1 Balsam fir和white spruce各维量不相容性举例^① Tab.1 An example of incompatibility of various parts for two tree species from ker et al.

从表 1可以看出，总量、树干、树冠与其对应的各分量之和之间存在着不同程度的误差，且误差随着直径、树高和分量方程个数的增大而增大。我国正式出版的唯一一份生物量数表《东北主要林木生物量手册》 (陈传国等，1989)中也存在同样问题。如何解决相容性问题，一直是生物量估计领域所面临的一个难题。而目前国内外文献中还没有见到有关解决此难题的方法的报道。本文以生长于我国东北的重要用材树种长白落叶松(Larix olgensis Henry)为研究对象，研究与我国现行森林蓄积量资源清查方法相结合的相容性单木生物量模型的建立及估计方法。

2 数据来源及整理

本次研究的范围只限于立木地上部分。研究的数据来源于吉林省红石林业局的99株样木。每株样木实测的因子有：年龄、直径、树高、平均冠幅、冠长，材积等。各树种样木概况见表 2。

表 2 样木概况 Tab.2 Survey of sample trees

树干鲜重采用两种方法获得，对于幼树和小树，采用全称重法；对于大树，采用材积密度法。枝、叶的鲜重测定采用全枝称重法。同时在野外对干材、树皮、枝和叶抽取样品，在室内通过测定样品的含水率或密度而推算出各部分的干重。最后，木材和皮的干重相加，就可得到树干的总干重，枝和叶的干重相加，就可得到树冠的总干重，树干和树冠的干重相加，就可得到全树地上部分的总干重，我们称之为总量。

3 研究方法 3.1 模型的评价指标与评价方法

在模型的构建过程中，模型的选型以及最优模型的确定，都需要一套指标来衡量，即要进行模型评价。常用的模型评价指标有：残差平方和Q、剩余标准差S、修正相关系数R，参数变动系数C%、残差分析等。在本研究中，对于模型的评价运用了以下5个指标：

参数的变动系数C%=|S_c/C| (其中S_c为参数标准差，C为参数估计值)

式中：y_i为实测值；为预估值；N为样本数；t_α为置信水平α时的t分布值；T为回归模型中参数个数；为平均预估值，由求出。

在以上指标中，C%反映了模型的稳健性，RS和EE用来检验模型是否存在系统偏差。指标RMA是检验模型与样本点的切合程度的一个重要指标。而指标P则是检验模型用来预测时效果好坏的一个重要指标。

本次研究生物量模型的评价，利用以上指标，进行总体和分组两方面的检验。分组的方法是，先按照直径大小排序，然后根据样本数的多少分成均等的5组。

3.2 相容性生物量模型的建立

以往所建立的生物量模型，造成不相容的现象完全是由于各维量独立建模所致。那么，将各维量进行联合建模，联立求解，就应该能消除不相容性。为此，提出了一种新方法———非线性模型联合估计，较好地解决了模型间相容性的问题。并以此与比例平差法对比。

3.2.1 非线性模型比例平差法

这是解决相容性问题的最简单直观的办法，许多地方都有应用。从相容性的定义出发，要满足各分量之和等于总量，实际上就是满足各分量占总量的比例之和等于1，以此为基础就引出了比例平差法。

设W₁=f₁ (x), W₂=f₂ (x), W₃=f₃ (x), W₄=f₄ (x), W₅=f₅ (x), W₆=f₆ (x), W₇=f₇ (x)，分别为总量、树干、木材、树皮、树冠、枝、叶的独立模型形式[关于独立模型的研建见张会儒等(1999) ]，那么，根据分配层次的不同，可以产生两种方案，由此就得到了解决相容性问题的方案1和方案2。

(1) 方案1:1级比例平差

即由总量直接平差分配给木材、树皮、枝、叶4个维量。此方案保证4个维量之和等于总量。此时，4个维量占总量的比例为：

(1)

(2)

(3)

(4)

有了此比例系数，以总量为控制量，按比例平差分配给4个维量：

(5)

(6)

(7)

(8)

式中：为总量独立模型W₁=f₁ (x)求出的估计值。

(2) 方案2:2级比例平差

即先由总量平差给树干和树冠，然后再由平差得到的树干和树冠的生物量分别平差给木材和皮、枝和叶。此方案不但实现了4个维量之和等于总量，而且还实现了树干和树冠两维量之和等于总量。

第1级：树干和树冠的平差比例为：

(9)

(10)

那么，相应的树干和树冠的平差方程为：

(11)

(12)

第2级：

(13)

(14)

(15)

(16)

(17)

(18)

(19)

(20)

式中：为总量独立模型W₁=f₁ (x)求出的值；、分别为按(11)、(12)式平差得到的树干和树冠的生物量分配值。

3.2.2 非线性模型联合估计

前面按比例平差法中，直接利用了各维量独立回归模型。我们知道，独立回归模型是在不考虑其相容性的情况下给出的最优估计。那么，在考虑了相容性后，可能就不再是最优估计了。由此受到启发，若将各维量独立模型联立进行联合估计，进一步修正模型和参数，就可以得到较比例平差法更优化的结果。由此就引出了非线性模型联合估计方法(唐守正等，1996)。

(1) 模型结构设计

依据上面的思想，结合比例平差法，本研究设计了3种相容的估计方案，分别称为方案3、方案4、方案5。

① 方案3:1级比例拟合分配

此方案与方案1对应，即以总量作控制，木材、树皮、枝、叶联合估计。

将(1)~(4)式化简代入(5)~(8)式中，其中f₁ (x)用总量独立模型估计值代替，就得到以下非线性联立方程组：

(21)

其中：, , 。对此方程组进行联合估计，就可得到4个维量的相容性生物量模型。

② 方案4:2级比例拟合分配

此方案与方案2对应，先以总量作控制，树干和树冠联合估计；再分别以树干和树冠分配结果作控制，对木材和树皮、枝和叶分别进行联合估计。

第1级：将(9)、(10)式化简，分别代入(11)、(12)式，得到下面非线性联立方程组：

(22)

(23)

这里的，为总量独立模型估计值。对此方程组进行联合估计，就可得到树干和树冠的相容性生物量模型。

第2级：将(13)~(16)式化简，分别代入(17)~(20)式中，就得到下面2个非线性联立方程组：

(24)

(25)

(26)

(27)

这里的, 。、分别为第1级得到树干和树冠相容模型的估计值。分别对这2个方程组进行联合估计，就可得到4个维量的相容性生物量模型。

③ 方案5:2级代数和拟合分配

此方案是对比例拟合分配方案的拓广。比例拟合分配方案是从分量比例系数之和等于1入手，而本方案则是直接控制各维量之和等于总量。同时，改变以总量为基础的作法，而以树干生物量为基础。

本方案同样采取两级分配。首先，将总量表示为树干和树冠生物量之和的形式，固定树干生物量模型，对总量和树干进行联合估计，得到树冠的相容性生物量模型。然后，将树皮、叶的生物量分别表示为树干和木材、树冠和枝的生物量相减的形式，再将二者分别与木材、枝的模型进行联合估计，就可得到所有维量的相容性生物量模型。模型构成如下：

第1级：

(28)

(29)

第2级：

(30)

(31)

(32)

(33)

其中：为树干独立模型估计值；为按(29)式得到的树冠生物量估计值。

(2) 模型估计方法

因为生物量模型中干重这一变量在多数情况下是随其他变量的增大而增大的，即存在异方差现象，因此不满足普通最小二乘法要求等方差的假设条件。为了消除异方差，本次采用了加权最小二乘法(Cunia, 1964；张寿等，1984；曾伟生，1996)，并确定用原函数本身来构造权函数，即以原函数的倒数作为权函数：

根据统计学原理，普通最小二乘法估计准则是，使其离差平方和达到最小(唐守正，1984)。本研究采用的加权最小二乘法，则使其加权离差平方和达到最小。对此准则进行推广，对于多个模型的联合估计，可以采用以下准则：

式中：y_ij为第i个方程第j个观测点的观测值；为对应的估计值；为加权估计时的权重；δ_i为第i个方程(即相应的分量)的权重。

δ_i的确定，对于采用普通最小二乘法估计时非常重要，一般与方差成反比，即赋于离差平方和大的方程以较小的权重，赋于离差平方和小的方程以较大的权重。在本研究中，各方程取等权重，即δ_i取相同的值。

在模型估计和选型时，采用变量逐步筛选法，每加权回归一次，都要观察其参数的变动系数和评价指标的变化，决定取舍的变量，直至模型和参数达到最优。参数估计采用Marqurdt算法(唐守正等，1996)。

4 结果与分析 4.1 模型筛选结果

各方案确定的最优相容性模型见表 3。

表 3 落叶松非线性模型联合估计各方案模型筛选结果 Tab.3 Results of model selection for each estimate plan

从表中可以看出，各维量相容性生物量模型结构明了，非常直观地表达了总量与各分量之间的比例关系和量的关系，使其相容性一目了然。各方案中，以方案3的模型最为复杂，参数最多(8个参数)，除此之外，其他方案筛选的各维量模型，结构简单，变量和参数较独立模型有所减少。

4.2 各方案综合评价

(1) 比例平差法两种方案虽然可以解决相容性问题，但效果并不理想。这主要是因为，平差法中直接利用了各维量的独立模型，而各独立模型是有估计误差的，在分级平差的同时，误差随之向下传递，方案1虽然是1级平差，但却受总量及4个分量的模型的估计精度的影响很大。因此，此方法不是一种解决相容性问题的彻底的方法。

(2) 方案3由于变量和参数多(11个参数)，导致模型复杂，参数变动系数大(最大达716%)，因此在预估精度上低于方案4，特别是在分组检验中表现的更为明显，树冠、枝、叶的预估精度大大降低。

(3) 方案4和方案5同为两级分配，但一个以总量为基础，按比例系数分配，一个以树干为基础，按代数和分配。由于独立模型中，树干的预估精度高于总量，因此以此为基础的方案5，不但保证了树干有较高的预估精度，而且还提高了总量及树冠的预估精度。另外，方案5的参数变动系数较方案4小。因此，选择方案5为最优估计方案。两方案的参数估计及检验结果见表 4和表 5。

表 4 方案4和方案5参数估计结果 Tab.4 Results of the parameters estimation for two plans

表 5 方案4和方案5总体及分组检验结果 Tab.5 Examination results of plan 4 and plan 5 in total and in groups

5 结论

本次研究，在建模方法上较以往有了很大的改进。本次采用的变量逐步筛选法，有3方面的优点：1是全面考虑有用信息，避免最优模型的漏选；2是避免重复，减小工作量；3是能够得到模型的最简化形式。特别对于生物量模型，由于变量多，模型结构复杂，以上3点更为明显。因此在建模方法上是一次创新。

解决相容性问题，一直是生物量估计领域所面临的一个难题。本文提出的新方法———非线性模型联合估计，较好地解决了各维量模型之间的不相容问题，这在生物量研究中尚属首次。

本研究最后确定以方案5为最优估计方案，该方案模型形式简单，参数稳定，全面客观地反映了树木各部分之间生物量的分配关系，因而结果是理想的、可靠的。各维量相容性模型为以下形式：

参考文献(References)

陈传国, 朱俊凤. 1989. 东北主要林木生物量手册. 北京: 中国林业出版社.

唐守正, 李勇. 1996. 一种多元非线性度量误差模型的参数估计及算法. 生物数学学报, 11(1): 23-27.

唐守正. 1984. 多元统计分析方法. 北京: 中国林业出版社.

曾伟生. 1996. 关于加权最小二乘法中权函数的选择问题. 中南林业调查规划, 15(1): 54-55.

张会儒, 唐守正, 王奉瑜. 1999. 与材积兼容的生物量模型的建立及其估计方法研究. 林业科学研究, 12(1): 53-59. DOI:10.3321/j.issn:1001-1498.1999.01.010

张寿, 于清文. 1984. 计量经济学. 上海: 上海交通大学出版社.

Cunia T. 1964. Weighted least aquare method and construction of volume tables. For Sci., 10: 180-191.

Ker MF , Van Raalte G D. 1981. Tree Biomass Equations For Abies Balsamea and Picea Glauca In Northwestern New Brunswick. CAN J FOR RES, 11(1): 13-17. DOI:10.1139/x81-003

Kittredge J. 1944. Estimation of The Amount of Foliage of Trees and Stand. J. For., 42: 905-912.

Ruard G A, martin G L, Bockheim J G. 1987. Comparison of constant and variable allometric ratios for estimating Populus tremuloides biomass. For. Sci., 33(2): 294-300.