林业科学  2011, Vol. 47 Issue (10): 83-90   PDF    
0

文章信息

李海奎, 法蕾
Li Haikui, Fa Lei
基于分级的全国主要树种树高-胸径曲线模型
Height-Diameter Model for Major Tree Species in China Using the Classified Height Method
林业科学, 2011, 47(10): 83-90.
Scientia Silvae Sinicae, 2011, 47(10): 83-90.

文章历史

收稿日期:2009-12-07
修回日期:2009-12-30

作者相关文章

李海奎
法蕾

基于分级的全国主要树种树高-胸径曲线模型
李海奎1, 法蕾2    
1. 中国林业科学研究院资源信息研究所 北京 100091;
2. 中国林业科学研究院华北林业实验中心 北京 102300
摘要: 采用树高分级方法,通过双重迭代算法,建立栎类、杉木、马尾松、杨树、落叶松和油松6个全国主要树种的树高-胸径曲线模型。数据来自第7次全国森林资源连续清查的树高测定资料,总样本数118 441个,其中建模样本79 095个,验证样本39 346个。与未分级方法相比,分级后模型的决定系数从0.520 3~0.753 2提高到0.943 8~0.966 5;模型参数灵敏度分析和验证模型的应用表明:模型总体稳定,参数可靠,为构建全国所有树种的树高-胸径模型提供可行的方法,有较好的推广价值。进一步考虑林分特点,可以用来进行全国所有现有森林的立地评价。
关键词:树高-胸径模型    树高分级    双重迭代算法    参数灵敏度分析    
Height-Diameter Model for Major Tree Species in China Using the Classified Height Method
Li Haikui1, Fa Lei2    
1. Research Institute of Forest Resources Information Techniques, CAF Beijing 100091;
2. Forestry Experiment Center of North China, CAF Beijing 102300
Abstract: Site plays an important role in fitting height-diameter model in such a large scale as nation, whereas it is not known in most cases. Using the classified height method with double iteration algorithm, height-diameter model of six major tree species in china, including Quercus, Cunninghamia lanceolata, Pinus massoniana, Populus, Larix gmelinii and Pinus tabulaeformis, were constructed. The data came from height-measurement file in 7th national consecutive forest inventory, total observations were 118 441, of which 79 095 observations used for model development and 39 346 observations used for model validation. Contrasting to ordinary method, the coefficients of determination reached 0.942 8-0.966 5 from 0.520 3-0.753 2. Parameter sensitivity analysis and model validation showed that models were robust in general and fitted parameters were statistically reliable. The classified height method is useful to construct height-diameter model for all tree species in china. Considering stand factors, the method is helpful to evaluate national forest site.
Key words: height-diameter model    classified height    double iteration algorithm    parameter sensitivity analysis    

胸径和树高是2个重要的测树因子,是单木材积计算、林分生长和收获预估中不可或缺的数据。胸径测定简单、方便、准确,树高测定则相对复杂、困难且不太精确,同时树高受立地条件等因素的影响很大,同一胸径的树木,在不同的立地条件下,树高差别很大。实践中,不论是临时样地还是固定样地,树高的测定仅在一部分测定胸径的样木中进行,然后用树高-胸径关系模型来估计树高,因此构建简单而准确的树高-胸径模型是十分必要的。由于树种众多,很难找到一个对所有树种都适用的通用模型。多年来,国内外许多研究者用清查和样地数据建立了许多树高-胸径关系模型(Curtis,1967Wykoff et al., 1982Larsen et al., 1987Wang et al., 1988Huang et al., 1992Sharma et al., 2004Zhang,1997Peng,1999Fang et al., 1998Fekedulengn et al., 1999Jayaraman et al., 2001Robinson et al., 2004王明亮等,1998赵俊卉等,2009曾翀等,2009)。这些模型大多为机制性模型,通常是曲线,所以通称树高-胸径曲线模型,主要有Richard,Weibull,Logistic,Korf,Gompertz等模型。近年来,林分密度、胸高断面积、风速、林层等环境和立地因素逐渐被加入到模型设计中,用混合模型的方法来提高模型的精度(Sharma et al., 2007Meng et al., 2008唐守正等,2002)。这用于较小尺度的生态系统无疑是一种理论和方法上的改进,但对于区域乃至全国这样的大范围来说,所有环境因子的总和——立地,则显得更为重要, 例如:Fulton(1999)Huang等(2000)Zhang等(2002)建立了不同地理和生态区域的离散模型,然而,大多数情况下,很难了解某一树种在全国范围的立地,所以基于不同立地条件分别建立树高-胸径曲线模型的设想就不能实现,而建立单一的模型,效果又不好。因此,本文采用树高分级方法,通过迭代算法,建立全国主要树种的树高-胸径曲线模型,并与没有分级的单一模型进行比较,为建立比较适用的全国性树高模型提供可行的方法。该方法已在第7次全国森林资源连续清查过程中对森林生物量进行计算时得到了使用,实际效果很好。

1 数据与方法 1.1 数据

数据来自第7次全国森林资源连续清查的树高测定资料(固定样地所有的样木测定胸径,保留1位小数;树高的测定为固定样地中胸径接近平均胸径的3~5株树,保留1位小数)。选择的主要树种为栎类(Quercus)、杉木(Cunninghamia lanceolata)、马尾松(Pinus massoniana)、杨树(Populus)、落叶松(Larix gmelinii)和油松(Pinus tabulaeformis),这6个树种总面积占全国乔木林总面积的40%以上,蓄积量也占全国总蓄积量的30%以上。总样本数为118 441个单株树高-胸径数据,其中用来建模的样本79 095个,占2/3;用来验证的样本39 346个,占1/3。详细的统计量见表 1

表 1 胸径、树高统计量 Tab.1 Summary statistics for diameter at breast height (DBH) and tree height of tree species
1.2 方法 1.2.1 模型选择

使用Richard, Weibull, Logistic, Korf, Gompertz等5种曲线作为树高-胸径曲线的候选模型。为了保证在胸径为0时树高等于1.3 m,在所有模型中加上常数1.3。具体的模型表达式见表 2

表 2 5种候选的树高-胸径曲线模型 Tab.2 Five kinds of height-diameter curve model for candidate
1.2.2 方法

常用的方法是使用候选的树高-胸径曲线模型分别拟合,然后根据模型决定系数、参数值和参数的渐进标准差,并借助于树高估计值-实测值对比图、树高估计值-残差图最终决定适宜的模型。

对于树高分级方法,首先确定分级数。通常根据树种的分布范围和样本的多少确定,在这里6个树种由于分布范围广,样本数目足够,本文确定的分级数均为9。

为了描述方便,定义:

dij(i=1, 2, …, n; j=1, 2, …, ni)为第i个样地第j株样木的胸径,n为样地数,ni为第i个样地样木数;

hij(i=1, 2, …, n; j=1, 2, …, ni)为第i个样地第j株样木的树高;

hij(l)(i=1, 2, …, n; j=1, 2, …, ni; l=1, 2, …, m)为第i个样地第j株样木的树高属于l级,m为树高分级数;

(i=1, 2, …, n; j=1, 2, …, ni)为第i个样地第j株样木的树高分级设计矩阵,为1行m列,其元素值;

hij(l)(k1)(i=1, 2, …, n; j=1, 2, …, ni; l=1, 2, …, m)为第k1次迭代时第i个样地第j株样木的树高属于l级;

hi(l)(i=1, 2, …, n; l=1, 2, …, m)为第i个样地所有样木的树高属于l级;

(i=1, 2, …, n; j=1, 2, …, ni)为第i个样地样木的树高分级设计矩阵,为nim列,其元素值(j=1, 2, …, ni; k=1, 2, …, m);

hi(l)(k2)(i=1, 2, …, n; l=1, 2, …, m)为第k2次迭代时第i个样地所有样木的树高属于l级。

总是假设同一样地的样木具有相同的树高分级,不失一般性,用Richard模型拟合树高曲线,则方程为:

(1)

式中:=(a1, a2, …, am)′为分级树高上渐进值列向量;eiji个样地第j株样木的树高误差项。

具体算法如下:

1) 对所有dij,用上限排外法,按2 cm进行径阶整化为DD=int(dij/2+0.5)×2,记dijD,即第i个样地第j株样木的胸径整化为D径阶,D的值域为{6, 8, …, Dmax},其中6为起测径阶,Dmax为最大径阶;

2) 对每个径阶D,计算最大树高值HmaxD、最小树高值HminD和级差HclassD:

3) 计算hij(l)(树高初始分组):

4) 构造树高分级设计矩阵,其元素值deshijk:

5) 按式(1)进行模型拟合(唐守正等,2009),获得估计参数=(a1, a2, …, am)′,bc

6) 重新计算hij(l):

7) 如果hij(l)(k1)hij(l)(k1-1): i=1, 2, …, n; j=1, 2, …, ni,返回步骤(4)。

8) 计算hi(l)

9) 如果hi(l)(k2)hi(l)(k2-1): i=1, 2, …, n,返回步骤(4);否则, 结束。

1.2.3 模型评价及验证

除了常用的模型决定系数(R2)外,每次从建模样本中随机抽取50%的样本(刀切法),使用同一模型拟合,重复10次,进行模型参数的灵敏度分析来评价模型;拟合结果使用验证样本,使用模型决定系数(R2)、平均误差(ME)、平均绝对误差(MAE)和均方根误差(RMSE)对模型进行验证。

其中:hij为树高实测值,ĥij为树高预测值,h为树高实测值的平均值,为所有样地样本总数。

2 结果与分析 2.1 2种方法的比较

表 3可以看出,使用分级方法构建的6个主要树种模型的拟合效果要明显地优于不使用分级方法构建的模型:残差平方和明显减小,模型决定系数从0.520 3~0.753 2提高到0.943 8~0.966 5;同时,对于不同的树种,没有分级的方法适宜模型的决定系数变化很大,而使用分级的方法后,适宜模型的决定系数差别较小,模型更为稳定;对于同一树种,是否使用分级方法的适宜模型也不尽相同,未分级的方法模型以Richard和Korf为主,而分级的方法以Richard和Weibull为主。

表 3 未分级和分级的树高-胸径曲线模型拟合结果 Tab.3 Fit statistics of unclassified and classified height-diameter model

图 1, 2分别是6个树种未分级方法中模型决定系数最好的落叶松,在经过未分级、初始分级和最终分级后的树高实测值-预测值图和树高预测值-残差图。从图中可以直观地看到:分级比未分级的拟合结果改进了许多,即使初步的分级也明显优于未分级拟合结果。

图 1 落叶松未分级、初始分级和最终分级树高实测值-预测值 Figure 1 Observed and predicted values of Larix gmelinii for unclassified, initial and classified height
图 2 落叶松未分级、初始分级和最终分级树高预测值-残差 Figure 2 Predicted values and residuals of Larix gmelinii for unclassified, initial and classified height
2.2 模型的评价与验证 2.2.1 参数灵敏度分析

表 4显示: 6个树种适宜模型的拟合结果和刀切法10次拟合的参数平均数非常近似,模型决定系数也几乎相等。例如:栎类的参数和10次重复的平均数的差值,最小的b只有-0.000 014,最大的a9也只有0.022 984。各个树种10次重复所有参数的标准差也很小;反映参数多次拟合值变异程度的变异系数也很少有超过0.05的,说明拟合结果的参数是稳定的。

表 4 分级拟合结果和刀切法10次拟合的参数平均数和标准差 Tab.4 Fit statistics for parameter mean and standard error of classified and ten repeats by jackknife

进一步分析10次重复参数平均数与拟合结果参数是否相等,做平均数的假设检验(t检验)。经过检验,6个树种所有参数和10次重复参数平均数均没有显著性差异,说明模型的参数是稳定的。

2.2.2 模型验证

表 5是拟合参数在验证样本中应用的结果,结合表 3可以发现:分级方法的模型决定系数在建模样本和验证模型中变化不大,和未分级方法一致,但结果明显优于未分级结果。与未分级的方法相比,分级方法的平均绝对误差和均方根误差明显改进,但2种方法的平均误差却差别不大,甚至栎类、杨树、落叶松和油松4个树种未分级方法的结果还优于分级方法的结果。为了进一步分析其中的原因,选择栎类、杨树,分径阶计算2种方法的平均误差、平均绝对误差和均方根误差,结果见表 6。可以看出:只是在个别径阶,未分级方法的平均误差小于分级方法的平均误差,而对于所有的平均绝对误差和均方根误差,分级方法均小于未分级方法,这说明未分级方法总体平均误差较小的原因是正负抵消的结果。图 3更直观地反映了这2种方法的差异,分级的方法明显优于未分级的方法。

表 5 未分级和分级方法的模型验证 Tab.5 Fit statistics for R2, ME, MAE and RMSE of unclassified and classified height by using validation data
表 6 栎类、杨树分径阶模型验证 Tab.6 Fit statistics of unclassified and classified height by using validation data of Quercus and Populus
图 3 栎类分径阶平均误差、平均绝对误差和均方根误差对比 Figure 3 Comparison for ME, MAE and RMSE of unclassified and classified height of Quercus

图 4是6个主要树种的验证样本分级后的树高预测值-残差图,残差表现均呈随机分布,特别是对于较大的树高预测,与未分级方法相比,改进更多。

图 4 6个树种分级方法的预测值-残差 Figure 4 Classified height for predicted value and residuals of six tree species
3 结论

建立同一树种全国性等大尺度的树高-胸径曲线模型时,起关键作用的立地条件在大多情况下难以获得。为解决这一难题,本文采用树高分级方法,通过双重迭代算法,建立栎类、杉木、马尾松、杨树、落叶松和油松等6个全国主要树种的树种树高-胸径曲线模型。与未分级的适宜模型相比,该模型决定系数从0.520 3~0.753 2提高到0.943 8~0.966 5。本文还通过利用刀切法对模型参数的灵敏度进行分析,对验证模型分径阶的平均误差、平均绝对误差、均方根误差进行对比,以及残差图分析都表明:该模型总体稳定,参数可靠,为建立比较适用的全国性树高-胸径模型提供了可行的方法。由于所有样本的胸径均接近所在固定样地的平均胸径,可以利用树高-胸径关系,综合考虑林分特点,来进行全国现有森林的立地评价(固定样地中测定的3~5株树高的本来目的就是为了求算林分的平均高),这是一个有待于进一步研究的问题。

参考文献(References)
唐守正, 郎奎建, 李海奎. 2009. 统计和生物数学模型计算[M]. 北京: 科学出版社.
唐守正, 李勇. 2002. 生物数学模型的统计学基础[M]. 北京: 科学出版社.
王明亮, 唐守正. 1998. 标准树高曲线的研制[J]. 林业科学研究, 10(4): 259-264.
曾翀, 雷相东, 刘宪钊, 等. 2009. 落叶松云冷杉林单木树高曲线的研究[J]. 林业科学研究, 22(2): 182-189.
赵俊卉, 亢新刚, 刘燕. 2009. 长白山主要针叶树种最优树高曲线研究[J]. 北京林业大学学报, 31(4): 13-18.
Curtis R O. 1967. Height-diameter and height-diameter-age equations for second growth Douglas-fir[J]. For Sci, 13(4): 365-375.
Fang Z, Bailey R L. 1998. Height-diameter models for tropical forests on Hainan Island in southern China[J]. For Ecol Manage, 110(1/3): 315-327.
Fekedulengn D, Siurtain M P M, Colbert J J. 1999. Parameter estimation of nonlinear growth models in forestry[J]. Silv Fenn, 33(4): 327-336.
Fulton M R. 1999. Patterns in height-diameter relationship for selected tree species and sites in eastern Texas[J]. Can J For Res, 29(9): 1445-1448. DOI:10.1139/x99-103
Huang S, Price D, Titus S J. 2000. Development of ecoregion-based height-diameter models for white spruce in boreal forests[J]. For Ecol Manage, 129(1/3): 125-141.
Huang S, Titus S J, Wiens D P. 1992. Comparison of nonlinear height-diameter functions for major Alberta tree species[J]. Can J For Res, 22(9): 1297-1304. DOI:10.1139/x92-172
Jayaraman K, Zakrzewski W T. 2001. Practical approaches to calibrating height-diameter relationships for natural sugar maple stands in Ontario[J]. For Ecol Manage, 148(1/3): 169-177.
Larsen D R, Hann D W. 1987. Height-diameter equations for seventeen tree species in southwest Oregon. Oregon State University, Research Paper 49 (Forest Research Laboratory).
Meng S X, Huang S, Lieffers V J, et al. 2008. Wind speed and crown class influence the height-diameter relationship of lodgepole pine: nonlinear mixed effects modeling[J]. For Ecol Manage, 256(4): 570-577. DOI:10.1016/j.foreco.2008.05.002
Peng C H. 1999. Nonlinear height-diameter models for nine tree species in Ontario boreal forests.Ontario Forest Research Institute, Forest Research Report No.155, Ontario, Canada. https://www.researchgate.net/publication/239951319_Nonlinear_height-diameter_models_for_nine_boreal_forest_tree_species_in_Ontario
Robinson A P, Wykoff W R. 2004. Imputing missing height measures using a mixed-effects modeling strategy[J]. Can J For Res, 34(12): 2492-2500. DOI:10.1139/x04-137
Sharma M, Zhang S Y. 2004. Height-diameter models using stand characteristics for Pinus banksiana and Picea mariana[J]. Scand J For Res, 19(5): 442-451. DOI:10.1080/02827580410030163
Sharma M, Parton J. 2007. Height-diameter equations for boreal tree species in Ontario using a mixed-effects modeling approach[J]. For Ecol Manage, 249(3): 187-198. DOI:10.1016/j.foreco.2007.05.006
Wang C H, Hann D W. 1988. Height-diameter equations for sixteen tree species in the central western Willamette Valley of Oregon. Oregon State University, Research Paper 51 (Forest Research Laboratory). http://dspace-ir.library.oregonstate.edu/xmlui/handle/1957/8247
Wykoff W R, Crookston N L, Stage A R. 1982. User's guide to the stand prognosis model. United States Department of Agriculture, Forest Service, Intermountain Forest and Range Experiment Station Ogden UT84401, General Technical Report INT-122. https://www.researchgate.net/publication/265746269_User's_Guide_to_the_Stand_Prognosis_Model
Zhang L, Peng C, Huang S, et al. 2002. Development and evaluation of ecoregion-based jack pine height-diameter models for Ontario[J]. For Chron, 78(4): 530-538. DOI:10.5558/tfc78530-4
Zhang L. 1997. Cross-validation of non-linear growth functions for modeling tree height-diameter relationships[J]. Ann Bot, 79(3): 251-257. DOI:10.1006/anbo.1996.0334