林业科学  2011, Vol. 47 Issue (6): 114-121   PDF    
0

文章信息

金森, 李亮, 赵玉晶
Jin Sen, Li Liang, Zhao Yujing
用直接估计法预测落叶松枯枝含水率的稳定性和外推误差分析
Analysis on Robustness and Extrapolation Errors of Modeling Fuel Moisture Content of Dead Twigs of Larch by Direct Estimation From Observed Data
林业科学, 2011, 47(6): 114-121.
Scientia Silvae Sinicae, 2011, 47(6): 114-121.

文章历史

收稿日期:2010-11-15
修回日期:2010-12-12

作者相关文章

金森
李亮
赵玉晶

用直接估计法预测落叶松枯枝含水率的稳定性和外推误差分析
金森, 李亮, 赵玉晶    
东北林业大学林学院 哈尔滨 150040
摘要: 采用Catchpole等提出的直接估计法分析实验室中3组不同直径(0.5,1.0,1.5 cm)的兴安落叶松枯枝的失水过程,通过交叉验证研究所得模型的稳定性,并对模型的外推误差进行分析。结果表明:枯枝的时滞和平衡含水率参数变化很小,结果具有良好的稳定性。同一直径的不同枝条在时滞、平衡含水率参数等方面存在差异。模型外推没有改变残差的正态分布,但外推后的残差增大。非外推残差集中出现在数值较小的区间上,而外推残差在这些区间上出现的概率下降,在非外推残差没有出现的数值较大的区间上出现的概率增加。研究给出枯枝在不同含水率预测值时不同残差出现的条件概率和均值。随含水率预测值的增加,残差有增加的趋势,不仅是平均值,大的残差出现的概率也在增加。据此可对外推模型所预测的含水率进行评判,确定其误差均值和不同残差出现的可能性,以减少据此进行的火险预报和火行为预报中的不确定性。用至少4个枯枝的混合数据在一定程度上可降低外推误差,减少这种不确定性。由于所有材料和实验条件最大程度上减少了材料和环境的差异,上述结果也可被看作用模型外推预测野外可燃物含水率时可能出现的误差的下限。
关键词:落叶松    可燃物    含水率    稳定性    外推    误差    
Analysis on Robustness and Extrapolation Errors of Modeling Fuel Moisture Content of Dead Twigs of Larch by Direct Estimation From Observed Data
Jin Sen, Li Liang, Zhao Yujing    
College of Forestry, Northeast Forestry University Harbin 150040
Abstract: Absorption processes of dead larch twigs with three different diameters(0.5, 1.0 and 1.5 cm) in laboratory were modeled by a method proposed by Catchpole et al. (2001). Robustness of the model was tested by cross validation. Errors occurred in the model extrapolation were also analyzed. Results showed that moisture-related parameters of timelag and equilibrium moisture content had small variation in the cross validation, which indicated the results were quite robust. Variety existed in timelag and parameters related to equilibrium moisture content among twigs with the same diameter. Although both the errors in applying the models to data on which the models were based and those in applying the models to data on which the models were not based followed normal distribution, the latter was larger than the former. The latter errors occurred with lower probability in sections where the former errors occurred with higher probability and also occurred in sections where the latter errors did not occur. This paper also presented conditional probability and means of errors under different predicted fuel moisture content, which indicated that not only the means but also the probability of larger errors increased with increasing predicted moisture. This probability could allow users of the models to estimate errors on a particular predicted moisture value, which can reduce uncertainty in fire danger rating and fire behavior modeling which uses the predicted moisture. The results also suggested that models established using pooled data from at least 4 twigs could reduce the uncertainty in the model extrapolation in fuel moisture prediction. Since the variation between the twigs and conditions is much less than those occurred in the field, the results can be regarded as lower limits of errors occurred in model extrapolation, which, nevertheless, can provide useful clues to assess model performance when it is extrapolated though full evaluation of the performance is still needed by further research.
Key words: larch    fuel    moisture content    robustness    extrapolation    error    

可燃物含水率决定森林可燃物能否燃烧,也决定了燃烧后的火行为。准确预测可燃物含水率是森林火险天气预报的重要任务之一(Rothermel et al., 1986; 何忠秋等,1996; Nelson,2000; Chuvieco et al., 2004; 胡海清,2005; 金森等,2010)。美、加等国的火险等级系统建设中的基础数据来自木材含水率的研究。选择木材作为研究对象,是因其结构均匀,易于研究且研究得比较多,而野外可燃物床层的结构变化很大,难以得出一般规律。细小枝条属于细小可燃物,是森林火灾的引火物。其结构与木材相似,搞清这些枝条的含水率变化规律对于构建我国的森林火险等级系统具有重要意义。

Catchpole等(2001)提出了一种利用含水率动态数据直接估测可燃物含水率的方法(王会研等,2008) (以下简称“直接估计法”)。该法基于半物理的平衡含水率模型,用初始含水率和环境中温、湿度值对可燃物含水率变化进行预测(详见“1. 1”),无须经过恒温恒湿条件下的可燃物平衡含水率的测定(刘曦,2007; 刘曦等,2007),节省了时间和人力,且精度较高,具有很好的应用价值。

金森等(2010)用此方法,通过对3组不同直径(0.5,1.0,1.5 cm)的各10个兴安落叶松(Larix gmelinii)枯枝的含水率动态变化数据的分析,证明了该方法的有效性。同时也建立了这些枯枝含水率的预测模型,模型预测误差较小。但没有分析所得结果的稳定性,即采用同一总体(指来自同一枯枝的所有可燃物含水率数据)的不同样本进行建模时,所得参数和误差是否稳健,如其变化很大,则该方法的精度会过多依赖所选择的建模样本,对于一部分样本可能效果很好,对另一部分样本则不好,所得参数和模型的适用性就差。

另一个需要考虑的是所得模型的外推误差问题。森林可燃物含水率受多因素影响,具有很强的异质性。在实际工作中,受人力、财力等条件限制,难以对所有可燃物的含水率都进行研究,往往只对一个或少量几个可燃物的含水率进行研究并用这些可燃物含水率的数据建立预测模型,然后将这些模型外推到其他可燃物的含水率预测中。模型外推,特别是统计模型的外推,所产生的误差往往要比每个可燃物一个模型的误差要大。在模型外推不可避免的条件下,如能根据现有模型的误差分布(这在建模后是已知的)获得外推时的误差分布,就可以有根据,至少有一定根据地估计真实的可燃物含水率。这虽不能减少误差,但能给出预测结果的置信区间,对预测结果做出正确的解释,从而有效估计用此数据进行火险预报和火行为预报所带来的误差。

稳定性分析和外推误差分析相互关联。稳定性分析从一个采样总体中随机抽取部分样本建模,然后评价该模型对于其他部分样本的误差。外推误差分析多个彼此间有差异的采样总体,从中随机选择一个总体建模,评价该模型对于其他总体的适用性。本文通过对不同直径落叶松枯枝含水率变化数据的分析,对直接估计法预测细小枯枝含水率的稳定性和外推误差一起进行初步分析研究,并探讨减少外推误差的方法。

1 研究方法 1.1 直接估计法简介

见文献(Catchpole et al., 2001; 王会研等,2008; 金森等,2010)。

1.2 落叶松枯枝含水率动态变化的测定

采用金森等(2010)的数据。以未腐烂的兴安落叶松枯枝为材料,枝条长度5 cm,直径分别为0.5,1.0和1.5 cm,每种尺寸10个重复,共30个样品。在实验室内模拟野外细小枯枝的含水率失水过程。具体方法为:1)按直径由小到大依次为30个样品编号。2)将可燃物放入105 ℃的烘干箱中连续烘干约8 h至恒重,用电子天平分别记录每个样品的绝干质量(g)。3)将试验样品完全浸泡在水中1 h。4)将浸泡后的样品取出,在空气中放置至表面无水。5)每40 min称取试验样品质量,同步测定温度、湿度,每天重复15次。6)每进行完1天试验后,重复步骤3)、4)、5),共进行15天。

1.3 数据分析 1.3.1 模型稳定性分析

建模数据中需要连续2次观测的可燃物含水率,每天连续观测15次,能够形成14个建模数据。由于得到稳定结果的最小数据长度为84个(金森等,2010),本分析中采用8天的数据,共112个含水率数据,以便进行交叉验证。

对每个枯枝的112个数据,随机取84个数据,用直接估计法(Catchpole et al., 2001)估计时滞和平衡含水率参数a,b,然后以余下的28个数据为验证数据,计算模拟含水率,重复前面试验30次(大样本要求),每次选取建模数据不同。然后对所得的30 × 28个含水率数据,计算均方根误差RMSE和变异系数CV, Mi为实测含水率,为预测含水率; CV = σ/mσ为含水率预测误差的标准差,m为误差的平均值。分别对直径为0.5,1.0和1.5 cm的10个样品的参数估计值的平均值、最大值和最小值对建模样本数作图,根据参数估计值和误差的变化幅度来评价模型的稳定性。

1.3.2 模型外推误差分析

根据前面交叉验证中获得的同一直径的10个枝条的可燃物含水率参数和误差进行同直径枝条间的可燃物含水率属性的差异分析。

然后计算模型外推和和非外推时(用针对各个枯枝的模型去预测相应的含水率)的误差概率密度并进行比较,以分析模型外推对误差分布的影响。此时误差由预测残差来表示。对于每个直径,将前面交叉验证产生的300个模型分别用到建模枝条的112个含水率数据和其他9个非建模枝条的含水率数据,形成300×112×10=336 000个含水率预测值和相应的残差,其中300×112=33 600个为非外推残差。由于使用模型时,有时难以判断哪些残差是来自非外推、哪些来自外推模型,因此,在计算外推残差时,使用的是全部336 000个残差。因为本实验的枯枝的最低含水率为0.05,0.30为许多可燃物的灭绝含水率(Rothermel et al., 1986),含水率超过0.30时许多可燃物不燃,超过此范围的可燃物含水率的预测误差对火险预报和火行为模拟的影响不大,故只对0.05~0.30的预测含水率分析模型外推对误差分布的影响。

上述2类误差的范围为[-0.04,0.03 ],由于非外推残差较小,为便于2类残差比较,以0.005为区间宽度,将整个残差范围分为15个区间,分别计算落在第j个区间的2种残差概率Pj; P (r ∈ [0.005j-0.0475,0.005j-0.0425]),j = 1,2,…,15。区间中值为0.005j-0.045。比较2类误差在不同区间上概率数值的变化,以确定外推对模型误差的影响。

最后计算给定含水率预测值时预测残差的条件概率和残差均值,以便用户能够根据含水率预测值确定不同误差出现的概率和误差的均值。为此,对上述336 000个含水率预测值和残差,以0.01为间隔,将预测含水率范围分为区间长度为0.01的26个右开区间[0.01i-0.005,0.01i + 0.005),i = 1,2,…,26,各区间的中值为0.01i。将残差分为长度为0.01的8个右开区间[0.01i-0.075,0.01i-0.065),i = 1,2,…,8,各区间的中值为0.01i-0.07。计算含水率预测值Mp落在第i个含水率区间时残差r落在第j个残差区间的条件概率Pij,即P(r ∈[0.01j-0.07-0.005,0.01j-0.07 + 0.005)/Mp ∈ [0.01i-0.005,0.01i + 0.005]),i = 1,2,…,26; j = 1,2,…,8。计算含水率预测值i时的残差均值采用均方根误差RMSEw,即j为残差区间数,n = 8,Pij为残差落在含水率值为i的区间j的条件概率。

以含水率预测值Mp为x轴,以预测残差r为y轴,以Pij为z轴绘制等值面图,给出不同含水率预测值时残差的条件概率。绘制含水率预测值-残差均值曲线,以判断给定含水率预测值时的平均误差。

1.3.3 混合样本对外推误差的影响

从相同直径的10个枯枝中,随机选出n个枯枝,n = 2,3,…,8。用这些枝条的含水率数据建模,用剩余枝条的数据验证模型。计算每次模拟的均方根误差,以建模枝条数为x轴,绘制均方根误差的均值、最大最小值图,来分析混合样本对模型外推误差的影响。

上述统计利用Matlab6. 0软件完成。

2 结果与分析 2.1 直接估计法的稳定性分析

图 1给出了直径为0.5,1.0,1.5 cm的3组共30个枯枝交叉验证时的时滞、平衡含水率参数a,b的均值和最大最小值。时滞基本随着枯枝直径的增加而增大。图 2给出了相应的误差变化范围。为更好地评价该方法的稳健性,图 3给出了交叉验证时上述参数和误差的变化系数。其中,时滞的变化最小,变化系数多数小于0.05;平衡含水率参数a次之,变异系数一般小于0.10;变化最大的是平衡含水率参数b,但多数也不超过0.15。较之上述3个参数,同一直径的不同枝条间的均方根误差变化较大,但也一般没有超过0.3 (只有1.5 cm直径的一个大于0.3),且图 2所示的均方根误差多数可以接受(在0.005以内),只有1.0 cm直径的4个枝条最大值超过了0.005,但又都小于0.01。以上表明,所得结果比较稳健可靠。

图 1 不同直径的枯枝交叉验证时的估计参数 Figure 1 Parameter of dead twigs with different diameters estimated in cross validation
图 2 不同直径的枯枝交叉验证时的误差均值、最大最小值 Figure 2 Mean, maximum and minimum of RMSE of fuel moisture estimations of dead twig in cross validation
图 3 交叉验证中不同直径枯枝的参数和误差的变异系数 Figure 3 Coefficients of variation of parameters and RMSE of different-diameter dead twigs in cross validation
2.2 直接估计法的外推误差分析

图 1还表明,同一直径的不同枯枝在时滞、平衡含水率参数等方面存在着明显的差异。其中时滞在1.5 cm的各枯枝间变化最大,其次是1.0 cm的枯枝,最小的是0. 5 cm直径的枯枝。平衡含水率参数,无论是a,b,在同直径枯枝间的变化都比时滞大,其中1.0 cm直径枯枝间变化最大。这些含水率参数在枯枝间的变化也反映到含水率预测误差的差异上:1.0 cm直径的枯枝间误差变化最大,0.5 cm直径和1.5 cm直径的枯枝间误差变化较小。

图 4给出了用模型外推时和非外推时的3个直径各10个枯枝的含水率预测残差的概率分布曲线。2类概率曲线的形式没有变化,都服从正态分布(分布的拟合统计见表 1)。表 1表明,外推残差的均值和方差都比非外推残差要大。对于3组直径的枯枝,2类误差曲线基本在残差接近0.005处相交。与非外推残差相比,外推后的残差明显增大,在数值较小(非外推残差出现概率较大)的区间[-0.005,0.005]内的残差出现概率减小,而在残差较大的区间(这里是绝对值大于0.005的残差)的概率增加。对于0.5 cm直径的枯枝,非外推残差基本在[-0.02,0.015]之间,外推后,超过这一范围的概率和为1. 4%;对于1.0 cm直径的枯枝,超过这一范围的概率增加了0.9%;概率和为1.4%;对于1.5 cm直径的枯枝,变化不如其他2组枯枝明显,但非外推残差基本在[-0.02,0.015]之间,外推后,超过这一范围的概率和为2. 4%。

图 4 模型外推和非外推时的残差概率分布 Figure 4 Distribution of residuals of applying models to datasets same for modeling and those differing from the dataset
表 1 模拟外推和非外推时预测残差概率正态分布拟合的χ2统计检验 Tab.1 χ2 test for normal distribution of residuals from moisture models and model extrapolation

图 5给出了在不同含水率预测值时(横轴)的不同残差(纵轴)出现的条件概率。3组不同直径的枯枝都表现出随着预测含水率的增加,预测残差增加,大残差出现概率增加的趋势,这与含水率预测中低含水率误差较小的趋势相符(Matthew et al., 2010)。当含水率预测值在0.10以内时,残差出现在± 0.005以内的概率超过0.75;但当预测的含水率数值超过了0. 20时,± 0.005以内的残差出现的概率降到0. 45以内,而较大残差出现的概率增加。特别是对于0.5 cm直径的枯枝,在这一数值段上,大于± 0.02的残差出现的概率增加,部分含水率预测值时这些大残差出现的概率甚至达到0.65。

图 5 不同含水率预测值时残差出现的条件概率(不同颜色代表不同条件概率) Figure 5 Conditional probability of residual by predicted fuel moisture content(Different colour shows different conditional probability)

图 6给出不同含水率预测值时的平均误差。3组枯枝的平均误差在不同预测含水率时变化较小,除0.5 cm直径的枯枝在含水率0. 24~0. 27段变化较大外,其余都比较平稳,稳定在0.007~0.008之间,呈现出随含水率预测值增加而增加的趋势。结合图 56,用户可以在已知一个给定的含水率预测值时,得出其平均误差值,以及不同误差出现的概率值。

图 6 模型外推时不同可燃物含水率预测值时的平均误差 Figure 6 Mean errors of different predicted fuel moisture contents occurring in model extrapolation
2.3 混合样本对直接估计法外推可靠性的影响

图 7给出了在同直径的10个枯枝中,用2~8个枯枝的含水率数据建模,用剩余的枯枝验证模型或验证含水率估测精度时的均方根误差的分布情况。结果表明,随着建模用的枯枝数量增加,均方根误差的均值和变化幅度总体上有下降的趋势。但个别数据,如0.5 cm直径的枯枝在参与建模枯枝数为7和8时,1.0 cm直径的枯枝在建模枯枝数为6和8时,均方根误差的变化幅度有所增加,而1.5 cm直径的枯枝在建模枯枝数为6和7时,均方根误差的均值略有增加。这是因为,外推误差是由模型数据的代表性和模型自身的精度2个方面决定的。随着建模的枯枝数增加,建模数据代表性增加,外推误差应有所减少; 但由于样本是来自多个方差可能不同的总体所组成,建模样本的内部异质性也在增加,同样形式所建的模型自身的误差就有所增加,这又会增加外推误差。因此,当建模用枯枝数量过多时,由于建模样本的内部异质性而导致的误差增加会超过因建模数据代表性强所带来的外推误差减少。因此,从图 7看,建模用枯枝的数量为4时,所得均方根误差的均值和变动幅度与图 2所示的这些枯枝的均方根误差的均值和变动幅度接近。因此,用一些混合数据建模,能够减少建模误差,增加模型的代表性,避免建立过多的针对具体地区或林分的可燃物含水率模型的数量,从而节约人财物力,但过多的建模数据未必是最佳选择。

图 7 不同混合数据建模时不同直径枯枝含水率模拟的均方根误差 Figure 7 RMSE of fuel moisture modeling by models established from varying pooled dataset
3 结论与讨论

用直接估计法研究了不同直径的落叶松枯枝的失水过程,所估计的时滞的变化系数一般不超过0.05,其他参数变化也较小。模型的均方根误差的变化系数一般不超过0.3,且多数在可接受范围内(0.005以内)。这表明,用直接估计法预测该可燃物的含水率较稳定。

上述研究还表明,同直径的不同枝条在时滞、平衡含水率参数等方面存在着差异。通过对外推模型的误差分析研究,表明模型外推没有改变残差的正态分布,但外推后的残差的均值和方差比非外推时有所增加。研究给出了这些枯枝的不同含水率预测值时不同残差出现的条件概率和均值。随含水率预测值的增加,残差有增加的趋势,不仅是平均值,更多体现在不同大小残差出现的概率不再像含水率预测值较小时(0.10以内)那样集中出现在数值较小的区间上。用户据此可对根据外推模型得到的含水率预测值进行评判,确定其误差均值和不同残差出现的可能性,以减少据此数据进行的火险预报和火行为预报中的不确定性。

对于枯枝而言,用至少4个枯枝的混合数据可以在一定程度上降低外推误差,减少这种不确定性。

目前对于模型外推所产生的误差问题已得到广泛关注,为减少模型外推所带来的误差,对模型的地域、林型的修正工作或建立针对林分(stand specific)模型的工作已开展很多(William et al., 2005; Wotton et al., 2007)。但对于模型外推所产生的误差概率的分析还没有见诸文献。本研究采用的是结构相对简单的枯枝,在实验室内开展,这有很大的局限性。野外可燃物床层结构复杂,受风速、辐射等多因素影响,与实验室条件差异很大,本研究所得结论需要在野外进行验证。

模型外推的误差与研究对象和环境的复杂性和异质性有关。不同林分的可燃物和环境条件差别很大,其误差幅度和出现概率千差万别,难以给出一个普适的估计。可以假设,可燃物自身特征和环境条件变化小的多个可燃物之间的外推误差要低于可燃物自身特征和环境条件变化大的多个可燃物之间的外推误差。如果以可燃物自身特征和环境条件变化小的多个可燃物为研究对象,分析在这些可燃物之间进行外推时的误差变化,就可以为外推分析提供误差下限,即其他对象或环境条件下的外推误差都比此下限大。此信息对于正确分析预测结果也有帮助。本研究所用材料是在同一林分内选择的同直径枯枝,这些枯枝由于结构等方面的细微差异,在含水率变化特性方面有一定差异,但枯枝结构均匀,比野外可燃物床层结构简单均匀,同时实验在实验室内开展,这些在最大程度上减少了材料和环境的差异,因此,本文对于外推分析的结论可以看做是用模型外推预测野外可燃物含水率时可能出现的误差的下限。如果将一个现有的模型用于一个没有开展任何含水率研究的林分或地区,可以根据本文的结论判断其最小的误差或平均误差是多少,但最大的误差仍需要进行实测比对。这虽然不能全部评价该模型的外推误差,但至少为正确解释预测结果提供了一些线索和帮助。

参考文献(References)
何忠秋, 张成钢, 牛永杰. 1996. 森林可燃物湿度研究综述[J]. 世界林业研究, (5): 26-29.
胡海清. 2005. 林火生态与管理[M]. 北京: 中国林业出版社.
金森, 姜文娟, 孙玉英. 1999. 用时滞和平衡含水率准确预测可燃物含水率的理论算法[J]. 森林防火, (4): 12-14.
金森, 李亮. 2010. 时滞和平衡含水率直接估计法的有效性分析[J]. 林业科学, 46(2): 95-102. DOI:10.11707/j.1001-7488.20100216
金森, 李绪尧, 李有祥. 2000. 几种细小可燃物失水过程中含水率的变化规律[J]. 东北林业大学学报, 28(1): 35-38.
刘曦, 金森. 2007. 平衡含水率法预测死可燃物含水率的研究进展[J]. 林业科学, 43(12): 126-127. DOI:10.11707/j.1001-7488.20071222
刘曦. 2007. 温度和湿度对可燃物平衡含水率的影响研究. 东北林业大学林学院硕士学位论文.
王会研, 李亮, 金森, 等. 2008. 一种新的可燃物含水率预测方法介绍[J]. 森林防火, (4): 11-12.
Catchpole E A, Catchpole W R, Viney N R. 2001. Estimating fuel response time and predicting fuel moisture content from field data[J]. International Journal of Wildland Fire, 10(2): 215-222. DOI:10.1071/WF01011
Chuvieco E P, Aguado I P, Dimitrakopoulos A P. 2004. Conversion of fuel moisture content values to ignition potential for integrated fire danger assessment[J]. Canadian Journal of Forest Research, 34(11): 2284-2293. DOI:10.1139/x04-101
Nelson R M A. 1984. Method for describing equilibrium moisture content of forest fuels[J]. Canadian Journal of Forest Research, 14(3): 597-600.
Nelson R M. 2000. Prediction of diurnal change in 10-hour fuel moisture content[J]. Canadian Journal of Forest Research, 30(4): 1071-1087.
Rothermel R C, Wilson R A, Morris G A, et al.1986.Modeling moisture content of fine dead wildland fuels:input to the behave fire prediction system.United States Department of Agriculture, Forest Service, Research Paper INT-359.Intermountain Research Station, Ogden, Utah, 61.
Willam J G, Wardati, Wang Y H. 2005. Calibrating the fine fuel moisture code for grass ignition potential in Sumatra, Indonisia[J]. International Journal of Wildland Fire, 14(1): 161-168.
Wotton B K, Beverly J L. 2007. Stand-specific litter moisture content calibrations for the Canadian Fine Fuel Moisture Code[J]. International Journal of Wildland Fire, 16(2): 463-472.