﻿ 测树因子二元概率分布:以毛竹为例
 林业科学  2010, Vol. 46 Issue (10): 29-36 PDF
0

#### 文章信息

Liu Enbin, Zhou Guomo, Shi Yongjun, Ge Hongli

Bivariate Theoretic Probability Distribution of Forest Mensuration:A Case of Moso Bamboo Forest

Scientia Silvae Sinicae, 2010, 46(10): 29-36.

### 作者相关文章

Bivariate Theoretic Probability Distribution of Forest Mensuration:A Case of Moso Bamboo Forest
Liu Enbin, Zhou Guomo, Shi Yongjun, Ge Hongli
School of Environmental Sciences and Technology, Zhejiang Agriculture and Forestry University Lin'an 311300
Abstract: Probability distribution of key factors in forest mensuration was very important in the management practice.It is poor understand that main variables multi-distribution of forest mensuration in the forest ecology, the bivariate distribution model of main variables of forest mensuration was introduced in this paper.We build up a bivariate maximum entropy probability density function used bivariate unite entropy function, and simulating unitary maximum entropy function.This approach demonstrated it was bivariate and exponential distribution for many parameters.It will prompt through to combine with the radix of bivariate consecutive function dimension.We analyzed and contrasted a bivariate maximum entropy function and a bivariate Weibull distribution, and pointed out the former had wider flexibility.The bivariate SBB function and the bivariate Beta function were introduced and the selection of SBB function's initial value had been elaborated and also pointed out that the bivariate SBB function could reflect the two random variables's correlation; bivariate maximum entropy probability density function, bivariate SBB function and the bivariate Beta function respectively were used to measure the two-dimension information of diameter-age.The results indicated that the precision of the former two methods were very high, and the two methods could be suited to describe the joint distribution of the bamboo diameterage, for bivariate maximum entropy:minimum variance was 9.976 77e-05, R2 = 0.996 0, A.H.Колмогоров statistical quantity was 0.999 83, for bivariate SBB function:minimum variance was 0.000 84, R2 = 0.964 00, A.H.Колмогоров statistical quantity was 0.979 98.the precision of the bivariate Beta function was lowest, the selection of its initial value and the variable range transformation were further researched.
Key words: bivariate maximum entropy function    bivariate SBB function    bivariate Beta function    diameter-age    forest mensuration

Hafley等(1976)Schreuder等(1977)应用二元SBB 函数研究了林分胸径、树高分布信息, 结果显示二元SBB 函数非常适合描述胸径、树高联合分布规律; Li等(2002)用二元Beta函数也研究了林分胸径、树高分布规律, 经卡方检验表明二元Beta函数适合于描述胸径、树高分布规律; Wang等(2007)应用二元SBB 、二元Beta等4个函数再次研究了林分胸径、树高分布信息, 结果表明二元SBB 函数拟合精度最高, 要优于二元Beta函数; 葛宏立等(2008)应用二元Weibull分布函数研究了浙江毛竹(Phyllostachys edulis)胸径、年龄分布规律, 表明二元Weibull分布函数具有较高的测量精度; 还有文献介绍的测树因子二元概率密度函数是通过修改一元Weibull概率密度函数3参数得到的, 不满足概率模型的性质(周国模等, 2006)。从以上研究可以看出, 已有测树因子联合分布的研究不是建立在充分利用现有数据提供信息的基础上, 而是事先指定一种概率模型, 然后用它来测量测树因子的概率分布状况, 如果测量精度高, 则说明该分布适合描述测树因子的联合分布规律, 这样做的缺点是事先指定的概率模型不一定是最佳模型, 因为适合描述测树因子联合分布的概率模型可能有很多。因此, 在最大限度地利用现有资料提供信息的基础上, 如何构建适应范围更广、测量精度更高的测树因子概率模型值得研究。熵是信息论中的一个基本概念, 是用以度量信息源不确定性的量, 熵最大就意味着获得的总信息量最少, 即所添加的信息最少, 故本文对测树因子二元最大熵函数做了详细推导, 并用构建的模型与已有二元SBB 函数、二元Beta函数分别测量了浙江毛竹胸径、年龄联合分布信息, 旨在说明二元最大熵函数的优越性。

1 理论与方法 1.1 测树因子二元最大熵函数构建

1.1.1 相关概念与性质
 (1)

(1) 式就是随机变量x1, x2的联合分布混合矩。

 (2)

(2) 式就是随机变量x1, x2的联合分布熵函数。

 (3)

(3) 式就是随机变量x1的连续型熵函数。类似的可定义随机变量x2的连续型熵函数为:

 (4)
 (5)

(5) 式就是在试验x1实现条件下的试验x2的条件熵函数。

 (6)

1.1.2 二元最大熵概率密度模型构建

 (7)

 (8)

 (9)

(9) 式中的S(x1, x2)用(6)式替代, 得:

 (10)

 (11)

(11)式就是本文提出的二元最大熵函数, 该函数的表达式符合指数族分布, 因此可以把它看作是二元多参数指数族分布。从(11)式还可以看出, 二元最大熵函数的指数幂是二维连续函数空间基{1, x1, x12, …, x1m1, …, x2, x22, …, x2n1, …, x11x21, …, x1mx2n, …}(当x1的阶矩取至m1, x2的阶矩取至n1, x1x2的混合矩取至m, n时可达到精度要求)的线性组合, 这与一元最大熵函数类似。以此类推可以得到二元以上最大熵函数, 它可以作为2个以上测树因子的概率密度函数。

1.2 二元SBB 函数

 (12)

 (13)
 (14)

1.3 二元Beta函数

 (15)

3参数二元Beta分布密度函数为:

 (16)

1.4 二元柯尔莫哥洛夫检验

2 模拟案例

2.1 资料来源

2.2 结果与讨论 2.2.1 二元最大熵函数评价检验及其参数

2.2.2 二元最大熵函数测量结果的直观描述

 图 1 省域尺度毛竹胸径、年龄二元最大熵概率密度 Figure 1 Bivariate maximum probability entropy density distribution on moso bamboo's diameter-age for province dimension

 图 2 毛竹胸径在每一度上的二元最大熵函数曲线 Figure 2 Diameter distribution curve of bivariate maximum entropy for each moso bamboo's age

2.2.3 二元SBB 函数评价检验及其参数

2.2.4 二元Beta函数评价检验及其参数

2.2.5 模型分析及对比

1) 二元SBB 函数分析  从回归离差平方和与R2 可以看出:该模型的测量精度很高, 故二元SBB 函数能精确描述浙江毛竹胸径、年龄联合分布规律, 原因在于二元SBB 函数具有严格的概率模型性质, 其边际分布是一元SB分布(Haffley et al., 1977; Schreuder et al., 1977), 而一元SB 分布能非常精确地描述一个测树因子概率分布规律(Haffley et al., 1977)。SBB 函数还具有其他二元函数不具有的优点即可以说明2个随机变量的相关性与独立性, 这一特点可由参数ρ反映。从ρ的值可以看出, 浙江毛竹胸径与年龄的相关性不大, 同时也说明毛竹胸径、年龄分布不属于2个相互独立随机变量的联合分布。故有关2个相互独立随机变量联合分布的性质不适用于研究毛竹胸径、年龄分布。

2) 二元Beta函数分析  从回归离差平方和与R2 可以看出:该模型测量精度最低, 故二元Beta函数很少被用于研究测树因子的联合概率分布规律, 这也可以从二元Beta函数的柯尔莫哥洛夫检验统计量得出。估计精度低的原因是:①二元Beta函数初值选取不像二元SBB 函数一样形成了一套固定的理论; ②目前有关测树因子二元Beta函数初值给定的例子很少见报道, 故本文对二元Beta函数初值的选取完全是盲目的, 因此得出的参数可能不是全局最优解; ③在应用二元Beta函数时, 须先进行变量的区间变换, 但到底哪个变换公式最理论还未见报道, 本文的变换公式只是经多次尝试后确定的, 带有很大的主观随意性。

3) 测树因子二元最大熵函数与二元Weibull分布函数对比分析  二元Weibull函数是分布函数而不是概率密度函数, 因此需要先计算各径阶、各龄阶实测概率的累积值才能用二元Weibull分布模型, 其计算结果也是累积概率, 故要做相应的减法运算才能得到各径阶、各龄阶的概率; 而最大熵模型已经是概率密度函数, 可以直接使用各径阶、各龄阶的实测概率。从二元Weibull分布的表达式可以看出:通过求2阶偏导得到的其概率密度函数相当复杂。从与Weibull分布函数评价检验指标(回归离差平方2.364 2e-004, R2 = 0.990 11, 柯尔莫哥洛夫检验统计量0.996 97)的对比可以看出:2种方法拟合结果都非常好, 二元最大熵函数拟合结果比二元Weibull分布略好, 主要是由于二元最大熵函数有更广的适应性且可以逼近二元Weibull概率密度函数, 这从以下分析可以得出, 现用函数逼近理论对二元最大熵函数的性质做如下推导:

 (17)

3 结论

1) 本文在充分利用现有资料提供信息的基础上构建了测树因子的二元概率密度函数即二元最大熵函数, 它的幂是二维连续函数空间基的线性组合, 是二元多参数指数族分布。

2) 二元最大熵函数的测量精度最高, 适应范围最广, 二元SBB 函数的测量精度次之, 二元Beta函数的测量精度最低, 从本文模型评价检验与分析对比可以得出二元最大熵函数是描述测树因子联合分布信息的最佳模型。

3) 通常确定某种分布函数能不能反映毛竹胸径、年龄联合分布规律的方法是假设检验, 显然符合假设检验的分布函数并不唯一, 二元最大熵函数测量精度优于其他函数的根本原因在于:第一, 二元最大熵函数能最大限度地挖掘测量数据本身所固有的规律; 第二, 表达式所含参数比其他函数多。

4) 二元最大熵函数、二元SBB 函数的测量精度都非常高, 都适合于描述毛竹胸径、年龄联合分布规律:回归离差平方和、R2 与与柯尔莫哥洛夫检验统计量依次为9.976 77e-05, 0.996 0, 0.999 83; 0.000 84, 0.964 00, 0.979 98。

5) 二元Beta函数在林业上的应用还有待于进一步研究。

6) 当考虑2个以上影响毛竹生物量的因素、估算区域尺度毛竹生物量时, 要用到测树因子的2元以上概率密度函数或分布函数, 而二元以上Weibull分布函数与SBB 函数的表达式, 作者查阅了大量有关资料, 还未发现有相关报道; 但从一元与二元最大熵概率密度函数的组成, 结合相关的理论, 可以推出二元以上最大熵概率密度函数的表达式即指数幂是相应空间基的线性组合。

7) 从二元最大熵函数的表达式可以看出:本文构建的二元概率密度函数具有统一的结构形式, 可作为研究测树因子二元概率分布信息的统一模型, 且这种统一形式可以根据数据类型与精度要求, 非常灵活地选用不同的样本阶矩, 从而灵活选择不同阶数的二元最大熵函数。

8) 在用二元SBB 函数测量毛竹胸径、年龄联合分布时, 其参数初值选取方法与胸径、树高参数初值选取(Schreuder et al., 1977)相同, 原因在于这种初值选取方法是根据二元SBB 函数的结构特点与性质提出的, 按照该方法选取的初值在二元SBB 函数的收敛域内, 这从Schreuder等(1977)与本文的研究可以得到验证。

 北京林学院. 1979. 数理统计[M]. 北京: 中国林业出版社: 167-168. 葛宏立, 周国模, 刘恩斌, 等. 2008. 浙江省毛竹直径与年龄的二元Weibull分布模型[J]. 林业科学, 44(12): 15-20. DOI:10.3321/j.issn:1001-7488.2008.12.003 洪利兴, 杜国坚, 张庆荣, 等. 1995. 天然常绿阔叶异龄幼林胸径的Weibull分布及动态预测[J]. 植物生态学报, 19(1): 29-42. 李贤平. 2006. 概率论基础[M]. 2版. 北京: 高等教育出版社: 210-213. 刘君然, 赵东方. 1997. 落叶松人工林威布尔分布参数与林分因子模型的研究[J]. 林业科学, 33(5): 412-417. 吴承祯, 洪伟. 1998. 杉木人工林胸径的Weibull分布及其最优拟合研究[J]. 江西农业大学学报, 20(1): 86-90. 周国模, 姜培坤. 2004. 毛竹林的碳密度和碳贮量及其空间分布[J]. 林业科学, 40(6): 20-24. DOI:10.11707/j.1001-7488.20040604 周国模, 刘恩斌, 刘安兴, 等. 2006. Weibull分布参数辨识改进及对浙江毛竹林胸径年龄分布的测度[J]. 生态学报, 26(9): 2918-2924. 周国模, 王瑞铨, 俞双群, 等. 1996. 庆元县人工杉木林直径分布的研究[J]. 华东森林经理, (1): 18-32. 朱坚民, 郭冰菁, 王中宇, 等. 2005. 基于最大熵方法的测量结果估计及测量不确定度评定[J]. 电测与仪表, 42(8): 5-8. Diane H K, Eddie B, Ralph D, N. 2008. Individual-tree diameter growth model for sugar maple trees in uneven-aged northern hardwood stands under selection system[J]. Forest Ecology and Management, 256: 1579-1586. DOI:10.1016/j.foreco.2008.06.015 Gupta A K, Wong C F. 1985. On three and five parameter bivariate Beta distributions[J]. Metrika, 32(1): 85-91. DOI:10.1007/BF01897803 Haffley W L, Schreuder H T. 1977. Statistical distributions for fitting diameter and height data in even-aged stands[J]. Can J For Res, 7(3): 481-487. DOI:10.1139/x77-062 Hafley W L, Schreuder H T. 1976. Some non-normal bivariate distributions and their potential for forest application[J]. International Union Forest Research Organizations, ⅩⅥ World Congress Proceedings: 104-114. Li F, Zhang L, Davis C J. 2002. Modeling the joint distribution of tree diameters and heights by bivariate generalized beta distribution[J]. Forest Science, 48(1): 47-58. Lindsay S R, Wood G R, Woollons R C. 1996. Modelling the diameter distribution of forest stands using the Burr distribution[J]. Journal of Applied Statistics, 23(6): 609-620. DOI:10.1080/02664769623973 Schreuder H T, Hafley W L. 1977. A useful bivariate distribution for describing stand structure of tree heights and diameters[J]. Biometrics, 33(3): 471-478. DOI:10.2307/2529361 Wang M, Rennolls K. 2007. Bivariate distribution modeling with tree diameter and height data[J]. Forest Science, 53(1): 16-24. Wang M, Rennolls K. 2005. Tree diameter distribution modelling:introducing the logit-logistic distribution[J]. Can J For Res, 35(6): 1305-1313. DOI:10.1139/x05-057