文章信息
- 朱建刚, 余新晓, 陈丽华
- Zhu Jiangang, Yu Xinxiao, Chen Lihua
- 预测植物瞬态液流的BP神经网络模型
- A BP Neural Network Model for Forecasting Transient Sap Flow
- 林业科学, 2010, 46(1): 152-157.
- Scientia Silvae Sinicae, 2010, 46(1): 152-157.
-
文章历史
- 收稿日期:2008-10-30
-
作者相关文章
对于植物体内水分传输机制正确的数学解释是多年来植物生理学、生态学、森林水文学等领域亟待解决的重大问题。Van den Honert(1948)最先提出了一个简单的用欧姆定律(Ohm’s law)进行植物水分传输机制的模拟模型,建立起水流和电流的相似性,为分析土壤-植物-大气连续统一体(soil-plant-atmosphere continuum,简称SPAC)提供了一个简明思路和有力工具。这个电路模型将植物体视为一个简单的刚性管道,管道内部水流呈稳态(steady state)。尽管如此,后来大量关于叶片蒸腾耗水与根系吸水、茎干液流之间的时滞效应(time lag)的研究表明植物体内的水流过程为瞬态(transient state)(非线性),而非稳态(邵明安等,2000; Steppe et al., 2002; 2004)。时滞效应被解释为由于水容(capacitance of water storage)的存在,这个植物体内的“水库”能够被耗尽并最终在1天内得到补充。
时滞关系是瞬态电路模型引入水容,即用阻-容网络(resistance-capacitance circuits,RC circuits)来模拟植物体内瞬态水流过程的主要动因,其中R为木质部导管的水分传输阻力,C为水容,RC为时间常数。RC电路模型是对稳态电路模型的重要改进,然而其仍然存在一些问题:1)时间常数(水容与水阻的乘积)以对水阻与水容的正确定义为基础,目前尚未明晰其真正含义,常常会有不同的解释(Steppe et al., 2006),分析所谓“时间常数”问题,仍有许多工作可做; 2)RC电路模型不能解释气孔振荡和由此表现出的有规律蒸腾波动现象(王根轩等,1993); 3)RC电路模型为常微分方程模型,难以描述树体水力系统的时空动态特征,因此Chuang等(2006)提出多孔介质模型(porous media,PM),该模型为偏微分方程,能够描述水分传输的时空动态。
实际上,生物系统远不像非生物系统那样符合某一特定的物理规则,植物体内复杂的生理过程及其对环境变化的动态反应(如气孔调节)影响着人们试图从物理的角度进行模拟与描述(刘文兆,2005)。无论是电路模型或多孔介质模型,均试图从机械论的角度来解释生命现象,这本身忽略了生物和非生物的差别,因而会遇到种种困难。为了深入了解植物体内水分传输及其影响因素之间的复杂关系、正确模拟和预测植物体内水分传输过程,有必要借助日趋成熟的非线性方法。
人工神经网络(artificial neural networks,简称ANNs)是20世纪40—50年代产生、80年代发展起来的模拟人脑生物过程的人工智能技术。它是由大量的、简单的神经元广泛互连形成的复杂的非线性系统。它不需要任何先验公式,就能从已有数据中自动地归纳规则,获得这些数据的内在规律,具有自学习性、自组织性、自适应性和很强的非线性映射能力,特别适合于因果关系复杂的非确定性推理、判断、识别和分类等问题(闵惜琳等,2001)。BP网络是一种多层前向型神经网络,其权值的调整采用反向传播(back propagation)学习算法,体现了神经网络理论中最为精华的部分(Anderson,1995)。
本文根据离散动态系统自动器(automaton)网络模型的建模原理(许国志等,2000),建立预测植物瞬态液流的BP神经网络模型,探究液流速率及其影响因素之间的非线性相关关系,并对网络的预测精度和泛化能力进行检验,为森林生态水文领域的水资源高效管理以及植物体内水分传输的进一步深入研究提供参考和依据。
1 材料与方法 1.1 试验地概况试验地位于北京林业大学教学实习林场,地处北京市西郊(39°54′N,116°28′E)。气候属于暖温带半湿润季风型大陆性气候,年均温8.5~9.5 ℃,有效积温3 385~4 210 ℃。无霜期150天,年降水量600 mm左右,其中7,8,9三个月降水量占全年降水量的70%以上。土壤在海拔70~900 m为山地淋溶褐土,900 m以上为山地棕壤。
2007年5月,选择生长良好、树种多样的典型人工林,建立40 m×40 m的永久性固定标准地1块,四周边界以铁丝网隔护。标准地海拔170 m,坡向为东偏南15°,坡度22°,土层瘠薄,A+B层厚度为20 cm左右。林分密度为1 531株·hm-2,平均年龄34年,郁闭度0.7,平均高6.5 m,平均胸径10.3 cm。主要乔木树种包括油松(Pinus tabulaeformis)、侧柏(Platycladus orientalis)、刺槐(Robinnia pseudoacacia)、栓皮栎(Quercus variabilis)、元宝枫(Acer truncatum)等。林下灌木层分盖度40%,主要有构树(Broussonetia papyrifera)、酸枣(Zizyphus jujuba)、小叶鼠李(Rhamnus parvifolia)、荆条(Vitex negundo var.heterophylla)、孩儿拳头(Grewia biloba)、胡枝子(Lespedeza bicolor)等。草本层分盖度20%,主要有鸭跖草(Commelina communis)、羊胡子草(Eriophorum vaginatum)、菅草(Themeda japonica)、中华卷柏(Selaginella sinensis)等。
1.2 研究材料2007年5—11月,在样地内选择生长状况良好、干形通直的油松、侧柏优势木进行树干液流、树干径向变化、土壤水势同步监测,样木特征见表 1。
![]() |
1) 气象因子监测 在样地50 m外的空旷地建立气象观测场,假定气象观测场与样地冠层的气象条件一致。用自动气象站(HOBO,美国,Onset公司)同步测定光强度(W·m-2)、空气温度(℃)、空气相对湿度(%)、风速(km·h-1)和风向等。
2) 树干液流监测 将2组Granier热扩散式探针(SF-L,德国,Ecomatik公司)安装在油松和侧柏样树1.3 m高度处,连续监测树干液流通量。
3) 树干径向变化监测 将2组树干径向记录仪(Dendrometer DC型,德国,Ecomatik公司)安装在油松和侧柏样树1.5 m高度处,连续监测树干径向变化。仪器的工作原理为:树干径向收缩与膨胀变化会对固定在树干上的探头产生瞬间大小不同的压力,而压力变化又与传感器电阻之间存在较好的线性关系,利用这种关系通过探头可实现对树干径向变化的连续监测。
4) 土壤水势监测 将2组土壤水势仪(EQ2,英国,Delta-T公司)安装在油松和侧柏样树基部1 m远处,深度为20 cm,连续监测土壤水势变化。
5) 数据处理与分析 采用智能可编程数据采集器(DT80,DataTaker公司)进行数据采集,采集步长为30 min。定期(每隔7天左右)采用笔记本电脑下载收集原始数据。
2 模型的理论架构植物的生长过程是一个自组织过程,其开放的耗散结构的熵变来自2个方面:自身的熵增加及其与外部环境的熵流。植物体内的水分传输是植物与外部环境熵流交换的一个重要过程,受控于水分代谢的内部机制和外部环境水分状况,后者又包括大气的蒸发能力和土壤的供水能力。
植物体内的水分传输是一个连续动力学系统,按照其所具有的时滞效应特征,将系统的连续时间进行离散化,即把时间当作迭代的步骤(时间间隔相等),得到离散动态系统。根据离散动态系统中的自动器网络模型的建模原理,将系统在t时刻的输入和状态映射为系统在t+1时刻的输出。神经网络是一类特殊的自动器网络模型,它的特点是网络中结点(自动器)之间的连接强度可随时间变化。本文利用多层前向型BP神经网络建立模型,其理论结构为:映射f:I×S→O,即ot+1=f(it,st)。其中,输入变量集I={i},状态变量集S={s},输出变量集O={o}。
将t时刻的输入和状态变量作为BP神经网络模型的输入项。输入变量I包括影响液流速率的天气因素(空气温度、相对湿度、光强度,表征大气的蒸发能力)以及土壤水分因素(土壤水势,表征土壤的供水能力);状态变量S为径向生长微变化,表征树体水容特征。
将t+1时刻的输出变量,即植物瞬态液流速率作为BP神经网络模型的目标输出项。根据时滞效应的研究结果(谢恒星等,2007; 王华等,2008),本文将t与t+1的时间间隔设为1 h。
3 模型构建神经网络模型的建模过程一般分为4步:1)样本数据的收集; 2)建立网络对象; 3)训练网络; 4)模拟输出。本文基于MATLAB7.6平台,利用其自带的神经网络工具箱Neural Network Toolbox,编写MATLAB语言,实现了建模过程。常规的网络对象建立采用newff函数,网络训练采用train函数,网络模拟输出采用sim函数。
在神经网络建模过程中,容易出现样本冗余信息、收敛于局部极小点、网络结构不合理、网络泛化能力差等问题。本文在建模过程中针对这些关键问题进行了改进。
3.1 样本数据预处理根据理论模型的需要,本文利用油松和侧柏各1 985组数据(2007年6月18日10时至2007年9月9日2时)作为模型的初始样本数据集,油松样本数据如表 2所示(侧柏样本数据与油松一致)。
![]() |
样本数据预处理的主要内容包括:1)对t时刻的5个输入项和t+1时刻的1个输出项配对,形成初始样本数据集; 2)因为初始样本数据集内部有个别缺失数据,所以将含有缺失数据的行从初始样本集中删除,形成新的样本集; 3)为提高网络训练的效率,分别提取输入项和输出项,采用mapstd函数进行标准化处理; 4)部分输入项可能会出现信息冗余,因此采用processpca函数对输入项进行主成分分析,去掉冗余信息。
3.2 改善泛化能力在神经网络训练过程中时常发生的一个重要问题是过拟合(overfitting),即网络训练过程中的误差很小,但当有新的数据输入时产生的误差较大,网络泛化能力(generalization)较差。目前主要有2种方法用于改进网络的泛化能力:贝叶斯正则化(Bayesian regularization)和早停止(early stopping)。本文分别利用这2种方法对网络泛化能力进行改善。
1) 贝叶斯正则化模式 常规地,用于前馈神经网络训练的性能函数(目标函数)是均方误差,即:
![]() |
(1) |
式中:t为目标输出,a为模拟输出。
贝叶斯正则化是在网络拟合能力足够强的情况下,给训练目标增加正确的约束条件,即在原目标函数上增加一个合理的惩罚项作为新的目标函数(张胜等,2005):
![]() |
(2) |
式中:msereg表示正则化模式下新的性能函数,γ为性能系数,msw即为惩罚项,并有:
![]() |
(3) |
式中:wj为网络连接权值(weights)和偏置量(biases)。
在MATLAB7.6的神经网络工具箱中,函数trainbr已经将贝叶斯正则化方法实现。本文在贝叶斯正则化模式下,利用dividerand函数将新样本集随机分为训练集(training set)和测试集(test set),再利用trainbr函数进行网络训练。
2) 早停止模式 早停止是在网络训练时从样本集中拿出一部分样本作为验证集(validation set)来控制训练的终止,检验误差(validation error)一般在训练的初期减小,但当网络开始过拟合时,检验误差开始增大。当检验误差增大至指定的迭代次数时,训练随即停止,并返回检验误差最小时刻的网络连接权值和偏置量。
3.3 确定最佳隐含层节点数隐含层节点数的确定决定着网络的结构是否合理。确定隐含层节点数的基本原则是:在满足精度要求的前提下取尽可能少的节点数,建立紧凑的网络结构。虽然现在已有很多确定隐含层节点数的公式,但多数情况下是无效的,仅可作为试凑法(trial and error)的粗略初值,试凑法目前仍然是最有效的方法之一(楼文高,2006),即逐步增加或减少隐含层节点数,直到求得同时具有较小的训练样本、检验样本和测试样本误差的合理值。通过油松和侧柏液流预测模型隐含层节点数的反复试验,本文最终确定最佳隐含层节点数均为11。
3.4 优化网络初始权值在训练过程中网络连接权值和偏置量被不断地重复调整以实现性能函数最小化。网络初始权值直接决定了训练算法是否收敛到全局极小点还是局部极小点,因此本文对同一网络结构进行至少3次训练,当测试样本误差与训练样本和检验样本误差相差不大(一般要求小于1.5倍)并且都足够小的网络连接权值就是全局极小点邻域内具有较好泛化能力的可行解,可行解是一个区域而不是一个解(楼文高,2006)。
4 模型检验与分析模型的预测精度和泛化能力都是模型检验的重要指标。采用网络测试样本的模拟输出与期望(目标)输出之间线性回归的拟合程度来评价BP网络模型的预测精度。网络泛化能力的检验采用训练样本回归检验与上述测试样本回归检验进行比较得出,即当测试样本模拟和期望输出线性回归的拟合程度与训练样本模拟和期望输出线性回归的拟合程度相当或稍大(不超过1.5倍)时,表明模型具有较好的泛化能力(楼文高,2006)。
为了直观表现两树种液流预测模型的预测精度,本文选取典型晴天(2007年7月2日24 h)的液流输入项带入训练好的BP神经网络预测模型(该典型天数据与模型训练样本不重复),得到预测值,并以实测液流值作为对照,见图 1和2。从图 1和2可以看出,油松和侧柏液流预测模型典型天的预测值与实际观测值之间吻合度较高。进一步对网络模型整体性能进行分析,统计结果见表 3。
![]() |
图 1 油松模型典型天液流预测结果对比 Figure 1 Comparison between measured values and predicted values from Pinus tabulaeformis model at the typical day |
![]() |
图 2 侧柏模型典型天液流预测结果对比 Figure 2 Comparison between measured values and predicted values from Platycladus orientalis model at the typical day |
![]() |
由表 3可知,当隐含层节点数为11时,测试样本模拟输出与期望输出之间线性回归拟合较好,相关系数均在0.85以上,表明植物液流预测模型的输入项—空气温度、相对湿度、光强度、土壤水势以及树干径向生长量与模型的输出项—树干液流速率之间的非线性相关程度高,所建立的模型具有较高的预测精度。各类训练样本回归检验的拟合程度与测试样本相当,表明网络泛化能力良好,能够用于实际预测。
从2种模式下的网络训练结果来看,贝叶斯正则化训练模式与早停止训练模式回归检验的拟合度没有明显差别,表明在植物瞬态液流预测问题上,应用贝叶斯正则化模式与早停止模式训练的网络均能取得出较好的预测性能。
从不同树种的网络训练结果来看,侧柏液流预测模型的回归检验在2种训练模式下均较油松液流预测模型表现出更高的拟合度,表明侧柏液流预测模型的输入与输出项之间的非线性相关关系明显,油松液流预测模型的输入与输出项之间的非线性关系更为复杂。
5 结论与讨论选择北京山区优势树种油松和侧柏,以植物液流速率作为目标输出项,以其5个主要影响因子—空气温度、相对湿度、光强度、土壤水势以及树干径向生长量之间作为输入项,建立液流BP神经网络预测模型。通过贝叶斯正则化和早停止2种模式训练网络,结果表明输入项与输出项之间的非线性相关程度高。2种模式下建立的网络模型均能表现出较好的泛化能力,模型的预测精度较高,能够用于实际预测。侧柏的输入与输出项之间的非线性相关关系明显,而油松液流预测模型输入与输出项之间的关系更为复杂。
虽然神经网络非线性映射能力很好,但其固有的缺点需要不断改进,如隐含层节点数需要人为试凑,网络的初始权值需要多次试验等,目前已有一些新的算法用来改进网络的训练过程,如遗传算法(genetic algorithm),其较好的全局寻优能力与神经网络非线性映射能力的结合必将成为神经网络预测性能提升的动力。需要看到,虽然应用BP神经网络建立的植物液流预测模型具有较好的预测性能,但神经网络为黑箱模型,不能解释液流传输的机制。更具解释性的预测模型有赖于液流传输研究工作的不断深入。
刘文兆. 2005. 土壤-植物系统水分运移过程的阻容电模拟[J]. 生态学报, 25(11): 2947-2953. DOI:10.3321/j.issn:1000-0933.2005.11.022 |
楼文高. 2006. 实现BP神经网络从理论到实践的跨越[J]. 哈尔滨工程大学学报, 27(增刊): 59-63. |
闵惜琳, 刘国华. 2001. 用MATLAB神经网络工具箱开发BP网络应用[J]. 计算机应用, 21(8): 163-164. |
邵明安, 黄明斌. 2000. 土-根系统水动力学[M]. 西安: 陕西科学技术出版社.
|
王根轩, 赵松岭. 1993. 在大气干旱条件下胀果甘草气孔振荡的RLC电路模拟[J]. 应用生态学报, 4(2): 131-135. |
王华, 赵平, 蔡锡安, 等. 2008. 马占相思树干液流与光合有效辐射和水汽压亏缺间的时滞效应[J]. 应用生态学报, 19(2): 225-230. |
谢恒星, 张振华, 杨润亚, 等. 2007. 龙爪槐树干液流相对于气象因子的滞后效应分析[J]. 林业科学, 43(5): 106-110. |
许国志, 顾基发, 车宏安. 2000. 系统科学[M]. 上海: 上海科技教育出版社.
|
张胜, 刘红星, 高敦堂, 等. 2005. 神经网络泛化特性改善方法[J]. 计算机应用与软件, 22(12): 12-14. DOI:10.3969/j.issn.1000-386X.2005.12.005 |
Anderson J A. 1995. An introduction to neural networks[M]. London: MIT Press: 5-9.
|
Chuang Y L, Oren R, Bertozzi A L, et al. 2006. The porous media model for the hydraulic system of a conifer tree: linking sap flux data to transpiration rate[J]. Ecological Modeling, 191: 447-468. DOI:10.1016/j.ecolmodel.2005.03.027 |
Steppe K, Lemeur R. 2004. An experimental system for analysis of the dynamic sap-flow characteristics in young trees: results of a beech tree[J]. Functional Plant Biology, 31(1): 83-92. DOI:10.1071/FP03150 |
Steppe K, Lemeur R, Samson R. 2002. Sap flow dynamics of a beech tree during the solar eclipse of 11 August 1999[J]. Agricultural and Forest Meteorology, 112: 139-149. DOI:10.1016/S0168-1923(02)00126-0 |
Steppe K, De Pauw D J W, Lemeur R, et al. 2006. A mathematical model linking tree sap flow dynamics to daily stem diameter fluctuations and radial stem growth[J]. Tree Physiology, 26: 257-273. DOI:10.1093/treephys/26.3.257 |
Van den Honert T H. 1948. Water transport in plants as a catenary process[J]. Discussions of the Faraday Society, 3: 146-153. DOI:10.1039/df9480300146 |