度量误差对全林整体模型的影响研究

文章信息

李永慈, 唐守正.

Li Yongci, Tang Shouzheng.

度量误差对全林整体模型的影响研究

A Study on Impact of Measurement Error on Whole Stand Model

林业科学, 2005, 41(6): 166-169.

Scientia Silvae Sinicae, 2005, 41(6): 166-169.

文章历史

收稿日期：2004-06-14

作者相关文章

李永慈

唐守正

引用本文

李永慈, 唐守正. 2005. 度量误差对全林整体模型的影响研究. 林业科学, 41(6): 166-169.

Li Yongci, Tang Shouzheng. 2005. A Study on Impact of Measurement Error on Whole Stand Model. Scientia Silvae Sinicae, 41(6): 166-169.

度量误差对全林整体模型的影响研究

李永慈¹ , 唐守正²

1. 北京林业大学基础学院北京 100083;
2. 中国林业科学研究院资源信息研究所北京 100091

收稿日期：2004-06-14

基金项目：“数字林业”关键技术引进，948项目(2001-13)

关键词：度量误差全林整体模型最小二乘估计

A Study on Impact of Measurement Error on Whole Stand Model

Li Yongci¹, Tang Shouzheng²

1. Base Department, Beijing Forestry University Beijing 100083;
2. Research Institute of Forestry Resource Information Techniques, CAF Beijing 100091

Abstract: Based on the whole stand model of Daqingshan, using simulation method, the impact of measurement error of number of trees per hectare, average diameter, dominant height, average height and form height on the whole stand model were studied. The result indicated that, beting estimated by least square method, basal area model, average diameter model, number of trees per hectare model had obvious biases, but dominant height model, average height model and form height model had no clear biases.

Key words: measurement error whole stand model least square estimation

唐守正(1991)提出的全林整体模型，是一项将生长收获模型作为系统来进行研究的重要成果，在此基础上展开了一系列的应用研究。李希菲(1991)年建立了大青山主要树种的全林整体模型并进行了精度验证，洪玲霞(1993)给出了由全林整体生长模型推导林分密度控制图的方法，唐守正等(1995)对用全林整体模型计算林分纯生长量的方法及精度分析进行了研究。建立全林整体模型时，首先对林分每公顷株数、平均直径、林分优势高、林分平均高和形高5个因子进行观测，然后利用最小二乘法，由自稀疏方程估计出自稀疏指数γ、自稀疏率β、完满立木度林分的密度指数S_f[这3个参数也可以通过其他方法进行估计(唐守正，1991)]，由优势高方程估计出立地指数，最后分别估计全林整体模型的基础模型，根据函数关系，得到派生模型。

然而在生物数学模型中，描述生物体或生物系统的变量之间很少存在严格的数学关系，大多数研究的是“平均关系”。用统计学语言说，研究的是“随机变量数学期望”之间的关系，但是我们观测的量，都是这个随机变量的一次或几次实现，因而与它的期望值有较大的误差。这种误差不仅是观测误差，往往也包含抽样误差，甚至模型误差等，这些统称为度量误差。Gertenr(1990)就度量误差对林分蓄积方程的灵敏性进行了研究，Kangas(1998)研究了度量误差对生长模型系数和生长预测的影响。我们国家在这方面的研究起步较早，唐守正(1991)利用对偶回归和结构关系建立了林分优势高和平均高模型，唐守正等(1996)给出了一种多元非线性度量误差模型的参数估计及算法，Tang(2001)等用非线性度量误差联立方程组进行生态系统的模型整合。

在建立全林整体模型时，林分每公顷株数、平均直径、林分优势高、林分平均高和形高5个观测因子，不可避免地存在度量误差，然而它们的度量误差对全林整体模型产生怎样的影响，至今未见相关报道。本文通过模拟试验，研究这5个林分因子的度量误差对全林整体模型的影响。

1 模拟试验设计和模拟观测数据构造 1.1 全林整体模型简述

基本模型：

1) 断面积模型：G=b₁×L^b₂×{1-exp[-b₄×(S_f/1 000)^b₅×(T-t₀)]}^b₃

2) 林分优势高模型：H_μ=L exp(-B/T+B/t₁)

3) 林分平均高模型：H_a=(H_d-a_a)/b_a

4) 形高H_f模型：H_f=[a_{H_f}+b_{H_f}/(H_a+2)]H_a

5) 自稀疏模型：lnN=lnS_f-(1/γ)ln[(D/D₀)^βγ+(S_f/N₁)^γ-(D₁/D₀)^βγ]

基本函数式：

1) S_f=N(D/D₀)^β

2) G=πND²/40 000

3) M=G×H_f

派生模型：

1) D=c₁×L^c₂×{1-exp[-b₄×(S_f/1 000)^b₅×(T-t₀)]}₃^cS^c₄

2) N=a₁×L^a₂×{1-exp[-b₄×(S_f/1 000)^b₅×(T-t₀)]}₃^aS^a₄

上述方程中，G为公顷断面积，L为立地指数、T为年龄，t₀为平均树高达到胸高时的年龄，H_μ为林分优势高，H_a为林分平均高，H_f为形高，N为每公顷株数，D为平均直径，D₀为基准直径，每公顷初始株数N₁，初始的平均直径D₁，M为公顷蓄积量，其他为参数。

1.2 模拟试验设计

当观测变量有度量误差时，以大青山马尾松(Pinus massoniana)全林整体模型(唐守正，1991)为基础模型，研究用通常采用的方法建立全林整体模型时出现的问题。

大青山马尾松全林整体模型的参数：t₀=2.5，b₁=30.120 4，b₂=0.177 138，b₃=0.199 976，b₄=0.005 249 47，b₅=4.957 445, t₁=20，B=7.715 6，L=16，18，20，a_{H_a}=0.97，b_{H_a}=1.063，a_{H_f}=0.364 45，b_{H_f}=1.942 72，D₀=20，S_f=1 665株·hm^-2，γ=2.5，β=1.73, c₁=[40b₁/(πD₀^β)]^1/(2-β)=17.111 523 865 809 59，c₂=b₂/(2-β)=0.656 066 666 666 67，c₃=b₃/(2-β)=0.740 651 851 851 85，c₄=-1/(2-β)=-3.703 703 703 703 7, a₁=1 000c₁^-βD₀^β=1 309.762 233 061 16，a₂=-βc₂=-1.134 995 333 333 33，a₃=-βc₃=-1.281 327 703 703 7，a₄=1-βc₄=7.407 407 407 407 41。

模拟试验具体设计如下：3个不同的初始密度(S₁=200、S₂=300、S₃=400)和3个不同的立地指数(L₁=16、L₂=18、L₃=20)共9种不同的组合。将年龄T=[5, 10, 15, 20, 25, 30, 35]、初始密度和立地指数代入大青山马尾松全林整体模型，得到断面积、株数、直径、优势高、平均高和形高数据的“真值”。容易看出断面积、株数和直径“真值”都包括63个值。优势高、平均高和形高的“真值”都包括21个值，因为3个初始密度下它们的“真值”数据是相同的。

1.3 模拟试验数据构造

模拟观测数据的构造是通过为“真值”加上一个随机变量来实现。随机变量的不同取值代表了度量误差的随机性，假定随机变量的均值为0，σ²方差为。构造满足这种条件的随机变量方法很多，比如可以取服从N(0, σ²)的随机变量，也可以取上服从均匀分布的随机变量。服从N(0, σ²)的随机变量可能更接近于实际问题中的度量误差，然而模拟试验中如果取这种随机变量模拟度量误差，有可能造成模拟观测数据取负值，而实际问题中不可能出现这种情况。因此我们取服从均匀分布的随机变量来模拟度量误差，随机变量的取值区间参照真值的取值来确定。因为我们要研究的是：当观测变量有度量误差时，用通常采用的方法建立全林整体模型时出现的问题，模拟度量误差究竟是服从N(0, σ²)分布、还是服从上的均匀分布，还是服从其他什么分布，不会对研究结果产生本质的影响。

依据上述原则，为直径“真值”d加上随机变量ξ_D得模拟直径观测数据，D=d+ξ_D(ξ_D是区间[-1，1]上服从均匀分布的随机数)，E(ξ_D)=0，Var(ξ_D)=0.333 3；为株数“真值”n加上随机变量ξ_N得模拟株数观测数据，N=n+ξ_N(ξ_N是区间[-50，50]上服从均匀分布的随机数)，E(ξ_N)=0, Var(ξ_N)=833.333；为优势高数据“真值”加入[-1，1]区间上服从均匀分布的随机变量ξ_{H_d}作为度量误差，H_d=h_d+ξ_{H_d}, E(ξ_{H_d})=0'Var(ξ_{H_d})=0.333 3(h_d是优势高“真值”)；为平均高数据“真值”加入[-1，1]区间的均匀分布的随机变量ξ_{H_a}作为度量误差，H_a=h_a+ξ_{H_a}, E(ξ_{H_a})=0, Var(ξ_{H_a})=0.333 3(h_a是平均高“真值”)；为形高数据“真值”加入[-1，1]区间的均匀分布的随机变量ξ_{H_f}作为度量误差，H_f=h_f+ε_{H_f}，E(ε_{H_f})=0，Var(ξ_{H_f})=0.083 33(h_f是形高“真值”)。

上述构造模拟观测数据的过程重复10次，将10次得到的所有模拟观测数据组合在一起构成一个大样本，这样最终得到的模拟观测数据有630个样本。

2 参数估计值

本节所有计算均在Matlab中进行。用非线性回归函数，对上面构造的模拟观测数据，依次估计全林整体模型的参数。估计自稀疏模型的参数和优势高模型的参数见表 1，估计断面积模型、直径模型和株数模型的参数见表 2，由直径模型参数、株数模型参数与断面积模型参数的关系得表 3，平均高模型和形高模型的参数见表 4。

表 1 自稀疏模型和优势高模型参数估计值 Tab.1 Parameter estimates of self-thing model and dominant height mdel

表 2 断面积模型参数估计值 Tab.2 Parameter estimates of basal area model

表 3 直径模型和株数模型的参数估计值 Tab.3 Parameter estimates of average diameter model and number of trees per hectare model

表 4 平均高模型和形高模型的参数估计值 Tab.4 Parameter estimates of average height model and form height model

3 模型估计值曲线与模型真值曲线的比较

图 1分别列出在立地指数为L₁时，断面积模型、直径模型、株数模型、优势高模型、平均高模型和形高模型在3种不同的密度下真值曲线与估计值曲线。

图 1 模型估计值曲线与真值曲线的对比 Fig. 1 Comparison of the trath value curve with the estimated value curve

4 结论与讨论

以上的研究表明：对于全林整体模型，当株数、直径、优势高、平均高和形高5个观测因子有度量误差时，用通常最小二乘方法估计模型参数时，断面积模型、直径模型和株数模型出现明显的系统偏差，但是优势高模型、平均高模型和形高模型没有明显的系统偏差。因此，有必要探讨其他的参数估计方法，以减少或消除用通常最小二乘方法估计带度量误差的全林整体模型的参数时造成的系统偏差。

Fuller(1987)的Measurement Error Models介绍了线性度量误差模型的理论和应用成果，Carroll等(1995)的Measurement Error in Nonlinear Models介绍了非线性度量误差模型的理论和应用成果，唐守正(2002)的生物数学模型的统计学基础发展了线性和非线性度量误差模型的理论，并将它们引入林业领域，为我们研究和解决度量误差对林分生长收获模型的影响提供了理论依据。

参考文献(References)

洪玲霞. 1993. 由全林整体生长模型推导林分密度控制图的方法. 林业科学研究, 5(6): 510-516.

李希菲. 1991. 大青山实验局主要树种(组)全林整体模型及精度验证. 林业科学研究, 4(增刊): 14-21.

唐守正, 李勇. 1996. 一类多元非线性度量误差模型的参数估计及算法. 生物数学学报, 11: 22-27.

唐守正. 1991. 广西大青山马尾松全林整体生长模型及应用. 林业科学研究, 4(增刊): 8-13.

唐守正, 李希菲. 1995. 用全林整体模型计算林分纯生长量的方法及精度分析. 林业科学研究, 8(5): 471-476.

唐守正, 李勇. 2002. 生物数学模型的统计学基础. 北京: 科学出版社.

Carroll R J, Ruppert D, Stefanski L A. 1995. Measurement error in nonlinear models. New York: Chapman & Hall/CRC.

Fuller W A. 1987. Measurement error models. New York

Gertner G Z. 1990. The sensitivity of measurement error in stand volume estimation. Can J For Res, 20: 800-804. DOI:10.1139/x90-105

Kangas A S. 1998. Effect of errors-in-variables on coefficients of a growth model and on prediction of growth. Forest Ecology and Management, 102: 203-212. DOI:10.1016/S0378-1127(97)00161-8

Tang S Z, Li Y C, Wang Y H. 2001. Simultaneous equations, error-in-variable models, and model integration in systems Ecology. Ecological Modeling, 142(3): 285-294. DOI:10.1016/S0304-3800(01)00326-X