林业科学  2012, Vol. 48 Issue (9): 68-75   PDF    
0

文章信息

谢小华, 唐丽玉, 邹杰, 陈崇成
Xie Xiaohua, Tang Liyu, Zou Jie, Chen Chongcheng
基于本体规则和案例推理相结合的树木生长模拟—以杉木为例
Integrating Rule-Based and Case-Based Reasoning for Simulation of Tree Growth: A Case of Cunninghamia lanceolata
林业科学, 2012, 48(9): 68-75.
Scientia Silvae Sinicae, 2012, 48(9): 68-75.

文章历史

收稿日期:2011-11-07
修回日期:2012-02-10

作者相关文章

谢小华
唐丽玉
邹杰
陈崇成

基于本体规则和案例推理相结合的树木生长模拟—以杉木为例
谢小华, 唐丽玉, 邹杰, 陈崇成    
福州大学福建省空间信息工程研究中心 空间数据挖掘与信息共享教育部重点实验室 福州 350002
摘要: 采用本体规则推理和案例推理相结合的方法表达树木生长与其周围环境之间的复杂关系。通过建立面向森林生态领域的本体知识库来存储相应的本体、规则和案例,基于规则和案例推理开展树木种植适宜性判断以及树木立地质量评价; 根据立地质量估算树木生长参数,以三维可视化的方式对不同环境下树木生长进行模拟。以福建省顺昌县浦上林场杉木为例,对本文提出的方法进行准确度验证,语义推出的立地指数精度达到80%。试验结果表明,该方法为描述树木生长与环境之间的复杂关系提供了一种语义表达和推理途径,为不同环境下树木生长预测研究提供了一个可行的方法。
关键词:领域本体    规则推理    案例推理    生长模拟    可视化    杉木    
Integrating Rule-Based and Case-Based Reasoning for Simulation of Tree Growth: A Case of Cunninghamia lanceolata
Xie Xiaohua, Tang Liyu , Zou Jie, Chen Chongcheng    
Key Laboratory of Data Mining and Information Sharing of Education Ministry Spatial Information Research Center of Fujian, Fuzhou University Fuzhou 350002
Abstract: In this paper, we proposed an integrated approach combining the rule-based and case-based reasoning to express the complex relationship between tree growth and the environment.The determination of the judgment of the tree planting suitability, and the evaluation of the tree site quality are performed on the basis of rules and cases stored in the ontology-based knowledge base.Tree growth under different environment is simulated by means of the three-dimensional visualization technique, in which the parameters of tree growth are estimated by the site quality.Taking Shunchang forest farm in Pushang country of Fujian Cunninghamia lanceolata as an example, the accuracy of site index reaches 80%.The experimental results show that the proposed method can solve the complex relationship problem between tree growth and the environment.In addition, it provides a feasible method to predict the tree growth under different environment.
Key words: domain ontology    rule-based reasoning    case-based reasoning    growth simulation    visualization    Cunninghamia lanceolata    

植物生长受遗传因素和周围环境的影响,整个生长发育过程极其复杂,但随着年龄的增加又呈现一定的规律性。学者们对植物生长进行了大量的研究,构建了各种植物生长模型(雷相东等,2006)。目前虚拟植物的研究已经关注植物生长与环境之间的关系及其可视化研究。Karjalainen等(2002)基于过程模型模拟了气候变化对欧洲树木生长的影响,并对森林碳含量进行了估算。Balandier等(2000)建立了幼龄核桃树的结构-功能模型,该模型根据气候条件(温度、太阳辐射、CO2浓度),模拟了核桃树从几个月到几年的三维动态结构。Měsh等(1996)基于L-系统设计了一个植物结构与环境相互作用的系统,该系统模拟了根对土壤水、树对光的竞争关系,而且能快速地创建和修改树模型。施干卫等(2007)刘东平等(2010)基于L-系统模拟了不同环境下的虚拟树木模型。L-系统能够较好地模拟植物与环境之间的交互作用,但是L-系统需要系统规则来描述植物的生长,比较抽象,不易理解。上述知识表示方法,缺乏重用性和共享性。本体作为共享概念模型的明确的形式化规范说明(Studer et al., 1998),弥补了该缺陷。申忠伟(2010)结合植物学知识和环境对树木生长的影响,构建领域本体知识库,基于Apriori算法提取环境与树木生长之间的规律; 但是该方法的提取效果不够理想,不能验证规律的准确性。

本文引入本体知识库系统,采用规则推理(rulebased reasoning,RBR)和案例推理(case-based reasoning,CBR)相结合的方法来表达树木生长与环境之间的关系,利用树木生长方程估算树木的胸径和树高,与自主开发的参数化单树建模软件OntoPlant-ParaTree(Tang et al., 2011)进行交互,模拟不同环境下树木的生长。并以福建省顺昌县浦上林场杉木(Cunninghamia lanceolata)为例,对本文提出的方法给出应用实例。

1 基于规则与案例推理的树木生长模拟原理

本文采用基于规则推理和案例推理相结合的方法对不同环境下的树木生长进行模拟。但是无论是规则推理还是案例推理,都需要大量相关的领域知识作为推理依据。本体知识库作为知识的存储实体,为规则推理和案例推理提供了知识依据。本节将阐述用于树木生长模拟的本体知识库、规则推理和案例推理相结合的基本原理。

1.1 本体知识库

知识库是存储知识的实体,其以计算机可读的形式表示知识。但是知识表示方法很多,致使不同领域或同一领域的知识库难以实现知识共享和重用。本体是共享概念模型的明确的形式化规范说明(Studer et al., 1998),表示共同认可、可共享的知识。将本体的思想引入到知识库中,可以实现领域知识的共享和重用,有利于知识库的管理和维护。因此,本文采用本体知识库存储领域知识,通过建立本体库、规则库、案例库分别存储领域概念和属性、领域规则、案例数据,从而为规则推理和案例推理提供知识依据。本体知识库的构建流程主要包括知识获取、知识表示和知识存储,具体构建方法见文献(巫建伟等,2010)。

1.2 规则推理

规则推理是以领域专家的经验知识形式化描述为规则,并结合推理机推出相应结果的方法。因此,规则和推理机是实现规则推理的必需条件。规则为规则推理实现提供了知识依据,在本体知识库构建中对其进行描述。推理机是实现规则推理的核心部分,是依据一定的规则从已有的事实中推理出结论的过程。推理机的种类很多,用户可按照需要选择推理机。由于Jena推理机包含一种通用规则推理引擎,能根据用户提供的规则实现推理,所以本文采用它实现规则推理,其推理机制的整体框架见文献(巫建伟等,2010)。

1.3 案例推理

案例推理借鉴了人类解决问题的思维方式,是通过使用或修改以往相似问题的解决方法来解决现有问题的一种方法。其中,以往的问题被称为源案例,存储在案例库中; 现有问题被称为目标案例。本研究中,环境与树木生长之间的关系复杂,难以获取各个环境因子和林分因子对树木生长的影响规律。但是同一区域的植物生长具有相似性,借鉴于自然历史上的植物生长案例来预测当前的植物生长是一条比较可行的途径,因此树木生长和环境之间的关系可以用案例推理的方法进行。

CBR是由案例抽取(retrieve)、案例重用(reuse)、案例修正(revise)和案例存储(retain)组成的一个“4R”循环过程。限于作者经验不足,本文只实现案例抽取这个过程。

案例抽取的关键在于目标案例与源案例的相似度计算。相似度计算方法中,最近邻法(nearest neighbour techniques)由于被多数的CBR工具使用而成为最为广泛使用的方法。源案例与目标案例的相似度计算公式为(Watson,1999) :

(1)

式中: T为目标案例; S为源案例; n为源案例的属性个数; i为1~n的值; f(TiSi)为源案例和目标案例中单个属性i的相似度函数; wi为属性i的权重值; Similarity(TS)为源案例与目标案例的相似度值,取值为0~1。

案例的特征属性取值一般采用数值型和区间型2种方式。对于不同方式的特征属性,采用不同的相似度计算方法。

1) 数值型属性i的相似度函数采用海明(Hamming)距离计算公式:

(2)

式中: SiTi分别为源案例和目标案例的属性i; maxi和mini分别为源案例中属性i的最大值和最小值。

2) 区间型属性采用分级的形式表达。由式(2)可知,如果目标案例与源案例的属性值同属于一个区间,则相似度为1,否则为0。区间型属性i的相似度函数为:

(3)

由式(1)可知,相似度计算还依赖于特征属性的权重。目前权重的确定方法包括德尔菲法(delphi method)、层次分析法(analytic hierarchy process,AHP)等主观赋权法和主成分分析法、离差法、均方差法等客观赋权法。

1.4 基于规则与案例推理的树木生长模拟技术

本文基于RBR和CBR模拟不同环境下树木的生长,具体流程如图 1所示。在本体知识库建立的基础上,根据用户从OntoPlant-ParaTree软件的知识服务界面中传递过来的植物、环境和林分因子,先利用RBR实现树木种植适宜性判断,对树木生长环境做一个初步约束; 利用CBR推理出不同产区树木生长环境的立地质量; 根据产区和立地质量匹配树木生长方程,估算出树木的树高和胸径。把RBR和CBR推理结果传递给OntoPlantParaTree软件,并在OntoPlant-ParaTree软件中对树木进行三维模拟。

图 1 基于RBR和CBR的树木生长流程 Fig.1 Flow chart of tree growth based on RBR and CBR
2 杉木生长模拟实现

根据前面提出的树木生长模拟技术,以福建省顺昌县浦上林场杉木为例给出具体实例应用,模拟不同环境下不同年龄杉木的生长,重点介绍本体知识提取和知识推理过程的具体实现。

2.1 数据源

案例库试验数据来源于福建省南平市顺昌县浦上林场小班调查数据,该数据主要包括树种、年龄、平均树高、平均胸径等林分因子和土壤、地形等环境因子。顺昌县位于福建省中部偏北,26° 38'—27° 121'N,117°29'—118°14'E,属中亚热带海洋性季风气候,年平均气温19 ℃,年平均降雨量2 051 mm,主要以酸性红壤土和山地丘陵地貌为主,是全国杉木中心产区的核心区,杉木用材林面积4.67万hm2,年产杉木30万m3

2.2 领域本体知识库构建

本研究涉及的领域知识包括植物学、生态学、植物形态学、测树学等。从外界环境和植物生长入手,选取领域知识,建立领域本体知识库。

2.2.1 本体库构建

本体描述的是客观世界的概念以及概念之间的关系(属性)。从相关领域中选取领域概念和属性,如图 2表 1所示。使用protégé本体编辑软件对领域概念和属性进行建模,以OWL DL本体描述语言对本体模型进行形式化,建立OWL文件; 并采用Jena2的持久性存储机制将OWL文件存储在关系数据库中,建立本体库。

图 2 领域概念层次结构 Fig.2 Hierarchy structure of domain concept
表 1 部分本体属性 Tab.1 Ontology properties
2.2.2 规则库构建

根据林业学者的经验知识,从书籍(俞新妥,1997)中提取杉木是否适生的环境规则,其中不适生环境规则8条,适生环境规则1条,具体描述如下。

r1:如果树种是杉木,海拔2 000 m以上,那么该区域不适宜种植杉木。

r2:如果树种是杉木,年降水量少于800 mm,那么该区域不适宜种植杉木。

r3:如果树种是杉木,年平均温度小于15 ℃,那么该区域不适宜种植杉木。

r4:如果树种是杉木,年平均温度大于20 ℃,那么该区域不适宜种植杉木。

r5:如果树种是杉木,pH小于4.5,那么该区域不适宜种植杉木。

r6:如果树种是杉木,pH大于6.5,那么该区域不适宜种植杉木。

r7:如果树种是杉木,极端最低温度小于-20℃,那么该区域不适宜种植杉木。

r8:如果树种是杉木,极端最高温度大于42.5℃,那么该区域不适宜种植杉木。

r9:如果树种是杉木,海拔2 000 m以下,年降水量小于800 mm,年平均温度15~20 ℃,pH为4.5~6.5,那么该区域适宜种植杉木。

采用Jena规则语法对以上规则进行形式化表示。例如,规则r1形式化后,可描述为: (? a rdf: type ns: SHM),(? b rdf: type ns: Forest _farm),(? b ns: has_Dominant_species? a),(? b ns: has_ HighAltitude? c),ge(? c,2000),(? d rdf: type ns: Not_Suitable_plant)->(? a ns: has_Suitability? d)。最后将规则存储在关系数据库中,建立规则库。

2.2.3 案例库构建

对浦上林场小班调查数据进行预处理,删除含有异常值、缺失值和数据冗余的小班,获取101个小班数据; 并从中随机选取86个小班作为源案例,其余15个小班作为测试案例。结合书籍(俞新妥,1997),确定案例库字段,包括案例库ID、11个环境因子、2个林分因子、林场、全国产区区划、地位指数和树种ID共18个字段,其中全国产区区划和地位指数是查阅已有研究成果确定的。查找文献(俞新妥等,1980),浦上林场属于闽北杉木中心产区; 由中心产区的杉木立地质量表可知各小班对应的地位指数,以此建立环境及林分因子与地位指数的对应关系。将以上数据存储在关系数据库中,构建案例库。表 2列出了源案例中所有环境和林分因子的取值范围。

表 2 源案例中所有环境和林分因子的取值范围 Tab.2 The value range of environment and stand factors in base case
2.3 杉木生长模拟实现过程

在本体知识库构建基础上,基于Jena2语义网开发包,实现基于规则和案例推理的杉木生长模拟。

2.3.1 基于规则推理的杉木种植适宜性判断

本文采用Jena语义网开发包自带的通用规则推理机(generic rule reasoner)来实现规则推理。实现过程如下: 1)创建含有本体、规则和推理机的推理模型。首先通过模型工厂读取OWL文件,创建一个本体模型; 然后将规则与推理机绑定,形成包含规则的推理机; 最后通过模型工厂将本体模型和含有规则的推理机绑定,创建含有本体、规则和推理机的推理模型。2)推理模型获取含有用户自定义属性的三元组。首先将用户定义的属性has_Suitability存在List中,然后推理模型遍历规则,查找规则条件满足输入的环境信息,规则结论含有has_Suitability属性的规则,最终获取规则结论中含有has _ Suitability属性的三元组。3)获取三元组的客体,得出特定环境下杉木的种植适宜性结果。

2.3.2 基于案例推理的立地质量评价

本文通过案例推理判断杉木生长环境的立地质量,用地位指数表示。由案例推理过程可知,相似环境的小班抽取是首要工作。检索案例库,根据前文案例抽取的最近邻法计算目标案例与源案例环境属性的相似度。在最近邻法中,首先需要确定环境和林分因子的权重。本文开发的软件采用了用户自定义和默认2种方式提供权重值。用户自定义方式即用户根据自身经验自行定义各环境和林分因子的权重。默认方式的权重计算如下:由于专家评分法研究较早,比较成熟,而且是根据专家经验知识来衡量指标权重,具有科学性和可靠性,所以本文采用“专家评分法”来确定环境和林分因子的权重。选择的专家主要集中于农林院校,各位专家主要从事森林培育、林学、生态学等方面的研究。作者通过邮件的方式与各位专家进行交流,对收回的3位专家的评分结果进行属性均值计算,得出各属性的权重值,权重总和为1,见表 3

表 3 各个属性的平均权重值 Tab.3 Mean weight of each attribute

根据式(2)和(3)分别计算数值型和区间型属性的相似度。在13个环境属性中,年平均温度、年降水量、海拔为数值型属性,其余为区间型属性。再根据式(1)对各属性的相似度进行加权求和,计算出目标案例和源案例的相似度,并把与目标案例相似度最大的小班数据抽取出来。

本文直接把抽取出的小班地位指数重用到目标案例中。因为作者的经验知识不足,所以未对源案例进行修改。

2.3.3 杉木生长预测

杉木生长预测体现为树高和胸径的生长预测。根据林场归属的产区和案例推理得出的地位指数,查找相应的杉木树高和胸径生长方程,计算出不同年龄的树高和胸径值。其中,杉木的生长方程采用陈昌雄(2004)陈昌雄等(1999; 2004)模拟的福建杉木不同产区不同地位指数的回归方程。

2.4 结果与讨论

根据上述的杉木生长模拟实现过程,对15个测试案例进行推理,总体预测准确率为86.7%,其中12个测试案例相似度达到80%以上。表 4列出了15个测试案例及其推理结果。由于测试案例和源案例同属于一个林场,二者的年平均温度、年降水量、土壤类型、土壤酸碱度、林分起源相同,所以这些属性不作为案例推理的因子,所选因子如表 4所示。本方法若扩展到大区域间的模拟,其生境差异大,还需要考虑上述因子。

表 4 预测案例及其推理结果 Tab.4 Target cases and reasoning results

以测试案例8和47为例,实现杉木生长模拟。首先通过规则推理对环境进行种植适宜性判断。推理模型查找规则库,匹配规则条件符合测试案例的环境属性,规则结论含有has_Suitability属性的规则。测试案例8和47的环境属性与规则“如果树种是杉木,海拔2 000 m以下,年降水量小于800 mm,年平均温度15~20 ℃,pH为4.5~6.5,那么该区域适宜种植杉木”匹配,从而推理出2个测试案例均适宜种植杉木。然后通过案例推理推出地位指数。检索案例库,根据相似度计算公式,抽取与目标案例相似度最大的源案例,如表 4。从表 4可以看出,测试案例47比测试案例8的相似度高,匹配效果较好; 而且前者比后者的立地质量高,杉木的生长情况相对更好。最后根据推理出的地位指数预测杉木树高和胸径的生长,如表 5所示。

表 5 测试案例8和47的2个不同年龄的树高和胸径 Tab.5 Tree height and DBH of different target cases

为了直观、形象地展示杉木的生长变化,根据文献(卢康宁等,2010; 吴谦等,2010)对杉木的形态描述以及作者野外调查时的形态采集和推理得出的树高、胸径,传输至OntoPlant-ParaTree软件,实现三维可视化模拟,如图 3所示。

图 3 测试案例8和47的2个不同年龄的杉木模型` Fig.3 Cunninghamia lanceolata models of target case 8 and 47 in different ages

本文提出的方法适于表达树木生长的规律性和区域性的特点。通过规则将树木生长的规律性表现出来,并对树木产区进行划分,体现树木生长“同区相似,异区相差”的特点; 再通过案例表达不同产区或相同产区不同立地质量的树木生长。但是,本文提出的方法还存在局限性: 1)在案例推理过程中,目标案例与源案例的相似度取决于案例库的样本。不论是源案例的数量还是质量,都直接影响着相似度; 而且文中没有对检索出来的案例进行修改,而是直接依赖于案例库中的源案例,所以今后的研究中还需进一步丰富和完善案例库,提高案例抽取的准确度。2)本文只用同一林场的案例进行方法验证,而植物生长受地理位置和自然条件等因素影响,适合于该区域,其普适性有待进一步验证。3)在今后的研究工作中,有必要扩大研究区域范围,比如福建省。此时,需要考虑的环境等因素更多,可以从数据资料收集、环境和林分因子确定、区域划分等方面入手,预测杉木的生长。首先设立多个样地,收集资料; 然后,考虑环境对杉木生长的影响。在大区域范围,水热对杉木生长影响很大,所以可以对研究区域进行气候分区,在气候条件相对一致的情况下,采用本文提出的方法对杉木生长进行预测; 同时,需要对不同气候分区的杉木生长进行比较分析。

3 结论

植物与环境的关系十分复杂,如何模拟环境对植物生长的影响、在植物建模过程中增加植物知识,是虚拟植物建模需要考虑的。本文提出基于RBR和CBR相结合的推理方法解决树木生长与环境之间的复杂关系问题。通过RBR初步判断树木生长周期和环境种植适宜性; 通过CBR评价不同产区树木生长环境的立地质量; 应用林业上已建立的树木生长方程,对树木的生长因子进行估计,以预测树木的生长情况; 并在参数化单树建模软件中对树木进行三维模拟。同时以福建省杉木的实际生长情况,给出具体实例应用。从测试案例的预测准确率可知,该方法总体上满足同一林场的应用需求; 但是对于不同地理位置的案例来说,该方法的可靠性还未得到验证。此外,案例推理结果直接依赖于案例库中的源案例。因此,在今后的研究中,除了丰富案例库外,还需对方法的可靠性做进一步验证。该方法引入地位指数和树木生长方程的概念,将林业领域知识很好地应用到树木生长模拟中,为不同环境下树木的生长模拟提供了一个可行的途径。

参考文献(References)
[] 陈昌雄, 许可明, 占贵彪. 1999. 福建杉木中心产区实生林标准收获表的编制研究. 华东森林经理(3): 35–38.
[] 陈昌雄. 2004. 福建杉木一般产区实生林标准收获表的编制研究. 福建林业科技, 31(4): 1–4.
[] 陈昌雄, 陈成和. 2004. 福建杉木边缘产区实生林标准收获表的编制. 福建林学院学报, 24(3): 241–244.
[] 雷相东, 常敏, 陆元昌, 等. 2006. 虚拟树木生长建模及可视化研究综述. 林业科学, 42(11): 123–131. DOI:10.3321/j.issn:1001-7488.2006.11.023
[] 刘东平, 张文俊, 田超, 等. 2010. 一种基于环境变化的树木动态生长仿真模型. 计算机仿真, 27(9): 278–280.
[] 卢康宁, 张怀清, 刘闽. 2010. 杉木形态结构可视化模拟调查方法研究. 中南林业科技大学学报, 30(1): 34–40.
[] 申忠伟. 2010. 应用于植物几何建模的本体知识库系统研究. 福州大学硕士学位论文. http://www.cnki.com.cn/Article/CJFDTOTAL-ZNLB201206031.htm
[] 施干卫, 范菁, 董天阳. 2007. 基于环境敏感的植物动态生长模型研究. 计算机应用研究, 24(3): 223–225.
[] 巫建伟, 陈崇成, 唐丽玉. 2010. 面向土壤适宜性评价的本体知识库系统设计与应用. 地球信息科学学报, 12(5): 602–612.
[] 吴谦, 张怀清, 陈永富, 等. 2010. 杉木形态三维可视化模拟技术研究. 林业科学研究, 23(1): 59–64.
[] 俞新妥. 1997. 杉木栽培学. 福州, 福建科学技术出版社.
[] 俞新妥, 何智英, 房太金, 等. 1980. 福建省杉木产区区划和立地条件类型划分研究报告. 福建林学院学报(1): 14–39.
[] Balandier P, Lacointe A, Roux X L, et al. 2000. SIMWAL: a structuralfunctional model simulating single walnut tree growth in response to climate and pruning. Ann For Sci, 57(5/6): 571–585.
[] Karjalainen T, Pussinen A, Liski J, et al. 2002. An approach towards an estimate of the impact of forest management and cliamte change on the European forest sector carbon budget: Germany as a case study. Forest Ecology and Management, 162(1): 87–103. DOI:10.1016/S0378-1127(02)00052-X
[] Měsh R, Prusinkiewicz P. 1996. Visual models of plants interacting with their environment. SIGGRAPH'96 Proceedings of the 23rd Annual Conference on Computer Graphics and Interactive Techniques: 397–410.
[] Studer R, Benjamins V R, Fensel D. 1998. Knowledge engineering: principles and methods. Data and Knowledge Engineering, 25(1/2): 161–197.
[] Tang L, Chen C, Zou J, et al. 2011. OntoPlant: An integrated virtual plant software package for different scale applications. IEEE: 308–314.
[] Watson I. 1999. Case-based reasoning is a methodology not a technology. Knowledge-Based Systems, 12(5/6): 303–308.