林业科学  2014, Vol. 50 Issue (8): 15-21   PDF    
DOI: 10.11707/j.1001-7488.20140803
0

文章信息

夏凯, 刘仁义, 刘南, 张国江
Xia Kai, Liu Renyi, Liu Nan, Zhang Guojiang
多源小班时空数据更新框架
Updating Framework for Multi-Sources of Subcompartment Spatio-Temporal Data
林业科学, 2014, 50(8): 15-21
Scientia Silvae Sinicae, 2014, 50(8): 15-21.
DOI: 10.11707/j.1001-7488.20140803

文章历史

收稿日期:2013-07-19
修回日期:2013-12-13

作者相关文章

夏凯
刘仁义
刘南
张国江

多源小班时空数据更新框架
夏凯1, 2, 刘仁义1, 刘南1, 张国江3    
1. 浙江大学浙江省资源与环境信息系统重点实验室 杭州 310028;
2. 浙江农林大学信息工程学院 临安 311300;
3. 浙江省森林资源监测中心 杭州 310020
摘要:将时空理论与当前森林资源调查和监测工作紧密衔接,提出由时空数据建模、数据采集、时空数据库和数据更新共同构成的框架。不同方式采集的数据,被组织成3个层次的对象,更新到按时空数据模型定义的时空数据库中,并实现正确的对象关联、空间约束和时间约束。通过原型系统验证了框架的可行性。
关键词时空数据模型    数据更新    森林资源    多源数据    
Updating Framework for Multi-Sources of Subcompartment Spatio-Temporal Data
Xia Kai1, 2, Liu Renyi1, Liu Nan1, Zhang Guojiang3    
1. Zhejiang Provincial Key Lab of GIS, Zhejiang University Hangzhou 310028;
2. School of Information Engineering, Zhejiang Agriculture and Forestry University Lin'an 311300;
3. Monitoring Center for Forest Resources in Zhejiang Province Hangzhou 310020
Abstract: Forestry department has been going to collect data reasonably and termly. But, the development of forest resource data model and data updating mode are slower than the development of the data acquisition. Each set of data exists in isolation and has little relation with each other so that it could not represent the spatio-temporal change of forest resources systematically and thoroughly. Based on combining the spatio-temporal theory with forest resource information management, this article put forward a framework, which consists of spatio-temporal model, data collection, data updating and spatio-temporal database. In the framework, the data collected by different method would be formed as 3 hierarchies of objects, which then would be updated into the spatio-temporal database defined by spatio-temporal data model. The data in the database should keep the validity of object relation, spatial constraint and time constraint. The article verified the feasibility of the framework by a prototype system.
Key words: spatio-temporal data model    data updating    forest resources    multi sources data    

当前,林业部门已经趋向定期、合理地采集各类数据,但森林资源数据管理和更新方式落后于数据采集方式,各期数据孤立存在,关联性差,难以系统、全面地反映森林资源的时空变化。而在森林资源数据管理中引入时空数据库理论是解决这一问题的有效途径。

森林资源时空数据库研究在我国起步较晚。高金萍(2006)高金萍等(2008)将基于事件和特征的时空数据模型引入到森林资源管理中,提出设置基态数据库以存放二类调查数据的思路,并以事件方法记录因突变引起的数据变化。赵春燕等(2010)分析了森林地理实体的演变,认为其中同时存在连续变化和离散变化。Rasinmäki(20032007)讨论了面向对象的森林资源时空数据模型、多尺度时空数据管理和时空数据检索,认为面向对象的时空数据模型可以管理多尺度的时空数据,并探讨了各个尺度的空间对象、属性对象在数据更新中的变化关系。

笔者认为,森林资源时空研究需要考虑2方面的问题: 一是数据表达,即如何用数据表达森林资源的时空过程,为此设计了序列状态的林业资源时空数据模型(夏凯等,2013),结合序列快照方法和事件方法来表达森林资源的渐变突变相交替的时空过程;二是数据更新,即将现实的变化不断更新到数据库,使数据保持现势性。本文设计了针对小班数据的更新框架,该框架通过不同方式采集的数据更新到同一时空数据库中,实现对时空过程的统一表达。其中,本文小班时空演变特征和时空数据模型的对象关联部分夏凯等(2013)

1 从时空过程到时空过程表达

一个相互协调的时空数据更新框架是实现时空数据库和时空数据表达的必要条件。如图 1所示,数据建模是对现实世界的抽象,而时空数据建模是以时空过程为蓝本,定义时空数据库的数据结构、数据操作和数据约束。数据采集和数据更新则不断从时空过程中提取数据,添加到数据存储中,不断增加的数据存储表达了不断延续的时空过程。

图1 从时空过程到时空过程表达 Fig.1 From spatio-temporal course to the expression of spatio-temporal course

时空过程是指地理实体沿时间轴的变化过程。地理实体(geo-entity)是指现实世界中具有共同性质的自然或人工地物(国家测绘地理信息局,2012)。从森林资源管理范畴来看,小班、林班、细班等均为地理实体,森林资源的时空过程即是这些森林地理实体沿时间轴的变化过程。

1.1 小班实体的时空过程

在我国,小班是森林资源调查、统计和管理的基本单位,是最具代表性的森林地理实体。小班实体不仅具有空间部分,即形状(shape),还有属性部分(attributes),如编号、林地所有权、地形地势、覆盖度、森林类别、立地等级、群落结构等。此外,小班内部可以进一步被划分,如细班,细班代表的是单一性质的林地,与细班相关的属性为林地使用权、林木使用权、地类、林种以及林分因子(树种组成、平均胸径、平均高、蓄积量等)1)( 1)参考浙江省林业厅2008年颁布的《浙江省森林资源档案管理实施办法》。) 。

本文认为,小班实体具有空间关系特征、时间特征和时空演变特征。

1)空间关系特征 小班形状之间既不相互叠盖,也没有空隙,每一个小班必在一个村或林场级的权属地理实体的形状之内;同时,权属地理实体的形状也被小班形状所充满。

2)时间特征 小班具有生命周期,即有产生、发展和消亡的过程。

3)时空演变特征(夏凯等,2013)从小班的组成观察,不同属性演变过程和演变频率不同,总体上可以归为4类(图 2): ①编号、林地所有权、森林类型等专题属性,在生命周期内不发生变化,如图 2A,小班林地所有权在生命周期内不会发生改变,在第6年A被划拨,林地所有权的改变引发了A小班的消亡和D小班的产生;②小班形状在生命周期内会因多种原因发生变化,如第5年边界被调整;③依附于形状的一些属性,如植被种类、立地等级、自然度等,在生命周期内可能会发生离散变化;④依附于单一林地(如细班)的一些属性,如蓄积量、平均胸径、平均树高等林分因子具有连续的渐变特性,并且呈现春夏变化快、秋冬变化慢的年度变化特征;林分因子也受突变影响,如图 2中第3年和第4年之间发生灾害事件,使蓄积量因突变而明显减少。此外,也有一些依附于细班的属性会发生离散变化,如灾害发生后,优势树种从杉木(Cunninghamia lanceolata)变为马尾松(Pinus massoniana)。

图2 小班实体的演变过程 Fig.2 The evolution course of subcompartment
1.2 多源小班数据采集

复杂的时空过程促使林业部门采取多样的数据采集方式。早期的数据采集主要依赖一类、二类和三类森林资源调查;但只有二类调查是针对所有小班的,它是森林资源规划设计调查的简称,是以国有林场等森林经营单位或县级森林经营单位为对象,对其范围内所有的森林、林木和林地资源进行全面调查的方法2)( 2)参考浙江省林业厅2004年颁布的《浙江省森林资源规划设计调查技术操作细则》。)。二类调查是全面性的数据调查,其成果是各地区森林资源数据库的主体;同时,二类调查中也要对小班地块进行调整,是小班形状变化的主要原因。

由于二类调查涉及面广、工作量大,一般10年为一个周期,间隔过长。近些年,森林资源动态监测体系逐渐在各个地区建立起来,在实际工作中,动态监测一般是指在新一轮二类调查的基础上,每年(或2~3年为间隔周期)对森林资源进行监测及更新。森林资源动态监测1)( 1)参考浙江省林业厅2008年颁布的《浙江省县级森林资源动态监测技术操作细则》。)增强了森林数据的时效性,是森林资源数据采集工作的发展方向。动态监测主要包括3部分: 1)突变调查(也称为档案更新调查),是指对各种森林经营活动、人为破坏和自然灾害等引起的突变性变化所进行的调查;2)复位调查,是指定期抽取部分村庄,以村为单位,针对小班的属性数据进行调查;3)林分因子调查,针对的是蓄积量、平均树高等林分因子,变化具有一定的规律性,一般采用公式推算而得,属于不确定数据。

在实际工作中,森林资源动态监测尚未完全推开,二类调查也具有其独特的作用,并不能完全被替代,因此本文将2项工作一起讨论,如表 1所示。

表1 森林资源数据采集 Tab. 1 Forest resourse data acquisition
1.3 序列状态的森林资源时空数据模型

虽然林业部门采用了多样的数据采集方式,但数据库建设却相对落后,各期数据没有关联,其原因主要在于缺乏适合的时空数据模型。时空数据模型是着重于地理实体随时间变化的数据模型(Pelekis et al., 2004)。夏凯等(2013)依据小班实体渐变和突变相交替的时空演变特点,设计了序列状态的时空数据模型,模型结合了序列快照方法(Langran et al., 1988)和事件方法(Peuquet et al., 1995),形成了特有的序列状态表达方法,该方法既可以表达形状、林分因子的渐变过程,也可以表达因砍伐、划拨等原因造成的突变。

本文在夏凯等(2013)的基础上进一步发展,与当前小班的实际工作相衔接,并阐述了小班实体在空间和时间上必须遵守的约束。本文从对象关联、时间约束、空间约束3方面来讨论序列状态的森林资源时空数据模型。

对象关联: 如图 3所示为UML简图(图中菱形箭头表示关联关系,即某一对象是菱形箭头所指对象的组成部分)。小班实体由4种相互关联的组件构成: 小班实体(Subcompartment, 公式中简称为Sc)、状态(State)、形状(Shape)和细班状态(Subplot State, 公式中简称为Sps)。各部分的关系可用式(1),(2)表达:

Sc={ ID, ConstantAttributes, ∑State} (1)
State={AlterableAttributes, Shape, ∑Sps} (2)

这样的结构使小班实体各部分具有不同的数据密度,以合理表达实体各组成的演变。ID, ConstantAttributes, 它们直接隶属于Subcompartment(Sc),在生命周期内只有一个值,不能改变。而形状和可变属性在生命周期内是可变的,隶属于State对象,在Subcompartment生命周期内可以拥有多个State, 每一个State代表形状和可变属性在不同阶段的值。进一步,每一个State可拥有多个SubplotState(Sps),不仅仅因为细班之类的次一级实体在空间上隶属于小班,而且因为其拥有蓄积量等变化频率更高的林分因子,在State的生命周期内,每一个细班都可能有多个状态(SubplotState)。通过以上的关联关系将各个部分关联起来,实现对一个小班空间上和历史上的完整表达。

在时间轴上,实体的变化也不恒定。一方面,林分因子有渐变,通过序列数据可表达其演变过程;但另一方面,也会受到突变事件(如权属划拨、火灾等)的影响,突变事件可能只影响一个实体,也可能影响多个实体,可能只导致实体的状态发生变化,也可能导致实体消亡或产生。模型通过Event对象记录事件编码、类型、描述,并关联了事件前后的实体或状态。事件索引表(EventIndexing)对事件进行排序索引,用户可通过其检索事件及相关对象。这样,通过事件机制,还实现了新生小班和消亡小班之间的关联,从而完成对整个区域的时空过程表达。

图3 序列状态的林业资源时空数据模型 Fig.3 Simple graph of sequence states forestry spatio-temporal data model

时间约束: 由于地理实体被分解,地理实体的各部分必须要保证时间上的一致性。Td是指对象的持续时间,是结束时间和开始时间之差:

Td=Tend -Tbegin (3)

1)状态(State)的持续时间等于它所包含的所有细班状态的持续时间的并集:

State.Td= ∪Sps∈StateSps.Td (4)

2)小班实体的持续时间等于它所包含的状态的持续时间之和:

Sc.Td= ΣState∈ScState.Td (5)

3)权属地理实体(村或林场,用Region表示)的持续时间等于它所包含的所有小班实体持续时间的并集:

Region.Td= ∪Sc∈RegionSc.Td (6)

空间约束: 由于时空过程中,权属地理实体(村或林场)是非常稳定的实体;相比而言,小班实体的形状,甚至小班实体本身都可能不断变化,不断产生和消亡,但在演变过程,应始终遵循以下规则。

1)小班实体属于某一权属地理实体(村或林场,用Region表示),则小班实体的形状(Shape)也在这个权属地理实体之内(Region.Shape):

Shape within Region.Shape。 (7)

2)在时空过程中的任一时间ti,权属地理实体的空间被处于生命周期内小班的形状所充满,没有空隙:

Region.shapet=ti= ∪ti∈Shape.TdShape。 (8)

3)在时空过程中的任一时间ti,小班实体的形状相互之间不重叠:

ti∈shape.TdShape=Φ (9)

1.4 森林资源时空数据库更新

时空数据库更新是将现势性强的现状数据或变化数据添加到数据库中,并保持数据结构和数据约束依然符合数据模型定义的数据操作序列。数据更新涉及的问题很多,陈军等(200420072008)从宏观上讨论了时空数据库更新的关键问题,周晓光等(2006)设计了基于事件的时空数据库增量更新系统,张丰等(2010)在此基础上提出了相互约束的多图层数据的关联更新。本文重点讨论将多源数据统一到同一数据序列的数据更新过程。

表 2所示为依据不同方式采集的数据在更新中的特点。序列更新是指定时调查,更新后形成序列数据,二类调查、复位调查、林分因子调查都属于此类;而事件更新是指因突变调查而引发的更新,一般属于局部、实时进行的更新。但无论是序列更新还是事件更新,都需要完成以下3项任务: ①数据对象构造。将采集数据按数据模型组织为3种粒度的对象: 小班对象(Subcompartment)、状态对象(State)、细班状态对象(SubplotState)。②数据对象关联。将新构造的数据对象与数据库已有的数据对象实现正确的关联。③设置和检查空间约束和时间约束。

表2 小班数据更新 Tab. 2 Subcompartment data updating

1)二类调查 二类调查不仅是调查,实际上还承载着规划和调整小班形状并重新制作数据的任务,因此,新数据集必须遵守对象关联(1),(2),空间关联(7),(8),(9)。作为时空数据,新数据集(二类调查之后)和原有数据集(二类调查之前)之间也必须支持小班级的关联。可以根据变化程度将小班分为2类,变化程度在一定范围之内的小班保持原有小班的编号不变,生成新的状态;变化程度大的小班重新编号,作为新小班处理,但应确定一个原有小班作为其父小班,实现对象关联,方法可参考文献(夏凯等,2013)。

2)突变调查 突变调查面向突变事件。突变更新导致小班实体产生、消亡或状态发生更新。在本文的数据模型和数据更新模式下,事件可能会导致以下几种情况: 一个或多个小班消亡,产生一个或多个新的小班;一个或多个小班从一个状态更新到一个新的状态;一个或多个小班消亡,并产生新的小班,另有一个或多个小班从一个状态更新到另一个新的状态。

① 对象关联: 如图 4所示,小班A1和A2,事件前的状态编号分别为A1.State3和A2.State3。发生划拨事件,其中A2整体被划拨,A1也有部分被划拨,事件后,被划拨的部分形成新的小班A3,其当前状态编号为State1;A1形状被改变,但整体没有大的变化,故保留编号,结束原有状态State3,生成新的状态State4。如图 5所示,事件对象记录所有事件的相关信息,并将事件涉及的对象关联在一起。

图4 事件对象记录事件的详细信息 Fig.4 Event object records the details of the event

图5 小班的最新状态由State2更新为State3 Fig.5 The newest state of sub compartment updated from State2 to State3

② 时间约束: 设Objectbefore为事件前的小班实体对象或小班的状态对象,Objectafter为事件后的小班实体对象或小班的状态对象。为保证事件前后小班及其状态的时间不相冲突,则应明确事件时间也同时是Objectbefore的结束时间与Objectafter的开始时间,即时间约束(10):

EventTime=Objectbefore.Tend=Objectafter.Tbegin (10)

③ 空间约束: 为保证小班之间不重叠、不相互叠盖,且充满权属地理实体的要求[满足式(7),(8),(9)的要求],事件前后小班形状的并集必须相等。设Shapebefore为事件前的形状,Shapeafter为事件后的形状,即空间约束(11):

∪Shapebefore=∪Shapeafter (11)

3)复位调查 复位调查一般不涉及空间变化,只调查所有可变属性,但复位调查内容广泛,仍考虑以状态为单位更新数据,新状态中的形状数据(Shape)从原状态中复制。如图 5所示,更新前Subcompartment当前的状态为State2,更新后,新添加的状态State3被标记为当前状态。更新应执行时间约束(12):

Staten.Tend=Staten+1.Tbegin (12)

4)林分因子调查 同样,林分因子调查并不包括细班状态中的所有属性,但仍以细班为单位进行更新。如图 6所示,更新前State1所属的当前细班状态为SubplotState1,更新后,新添加的细班状态SubplotState2被标记为当前细班状态。更新应执行时间约束(13):

Spsn.Tend=Spsn+1.Tbegin (13)

图6 细班的最新状态从SubplotState1更新为SubplotState2 Fig.6 The newest state of subplot updated from SubplotStatel to SubplotState2
2 数据更新实例

本节探讨时空数据库中小班创建、演变过程各阶段数据的存储和关联,并通过森林资源TGIS原型系统的客户端界面展示不同时期的小班数据。原型系统基于c#2005和arcengine9.3组件开发,并以sqlserver2000和arcsde9.3 构建空间数据库系统。

2.1 数据采集和数据更新

试验以浙江省临安市于潜镇小班数据为背景,展示一个小班S005的演变过程。数据通过编码实现对象的关联,编码采用如下格式: S(Y)xxx-xx-xxxx(其中x代表数字,代表如下意义:小班编码-状态编码-细班状态编码)。

小班S005在5年中有如下数据采集和数据更新序列: 1)2005年二类调查,产生新的数据集,原小班S010,在二类调查中边界被重新确定,并在新的数据库中演变为小班S005,当前状态S005-01,当前细班状态S005-01-0101;2)2008年林分因子调查,更新细班状态为S005-01-0102;3)2009年林分因子调查,更新细班状态为S005-01-0103;4)2010年复位调查,数据库中小班状态为更新S005-01;5)2011年发生划拨事件,小班S005被分割,S005状态更新为S005-03;另一部分被划拨,编号为Y701,当前状态编号Y701-01。

2.2 时空数据库

图 7表达的是时空数据库中时空数据的存储。图中只少量列举了对象应包括的一些属性,主要表达的是存储在时空数据库中各对象之间的联系。数据库中,数据集为一个顶级数据单位,每一个数据集分别对应一次二类调查。每一个数据集中包括4种表:小班表、状态表、细班状态表和事件表。图 7展现了小班S005,Y701在数据库中的存储,展示了对象之间的关联;同时,依据数据的更新顺序,它们也隐性地实现了更新中的空间约束和时间约束。如在事件E2011035中,E2011035.time=S005-002.Tend=S005-03.Tbegin=S701-01.Tbegin;另一方面,S005-002.shape=S005-003.shape ∪S701-01.shape。

图7 小班时空数据存储 Fig.7 The storage of subcompartment spatio-temporal data
2.3 小班时空数据显示

图 8所示为客户端显示。客户端分别显示了原型系统在2005和2011年的数据,以左边的树形控件显示小班实体的属性。在对图形的点击查询中,不仅可以查询小班当前的状态,而且所有小班的历史状态均被列出。

图8 小班时空数据显示 Fig.8 The display of subcompartment spatio-temporal data
3 结论

夏凯等(2013)讨论了森林资源时空数据模型,本文则着重探讨数据更新。通过本文设计的框架,可以将多源小班数据有序更新到时空数据库中,并实现数据的完整性。本文的研究与当前的森林资源数据采集工作结合紧密,并以浙江省的森林资源更新调查等资料为基础进行设计。全国各地的小班资源调查与数据更新工作虽与浙江省有不同之处,但总得来说是共同的地方多、差异的地方少,希望本文的研究能为全国森林资源数据库的构建及数据更新做出贡献。

本研究进一步的工作为森林资源时空数据的检索、统计和表达。加入时间维后,历年的森林资源数据都可被存储在一个数据库中,并相互关联,实现对任一时刻、任一位置森林资源数据的检索,不同年份数据间的比较、统计,同时还可实现历史追溯、时间动画等一些特殊的数据表达。

参考文献(References)
[1] 陈军, 李志林, 蒋捷, 等. 2004. 基础地理数据库的持续更新问题. 地理信息世界, 2(5): 1-5.(1)
[2] 陈军, 刘万增, 张剑清, 等. 2008. GIS 数据库更新模型与方法研究进展. 地理信息世界, 6(3): 11-16.(1)
[3] 陈军, 赵仁亮, 王东华. 2007. 基础地理信息动态更新技术体系初探. 地理信息世界, 5(5): 4-9.(1)
[4] 高金萍. 2006. 基于时态 GIS 的森林资源基础空间数据更新管理技术的研究. 北京: 北京林业大学博士学位论文.(1)
[5] 高金萍, 陆守一. 2008. 森林资源小班数据更新管理中时空一体化数据模型研究. 西北林学院学报, 23(5): 188-192.(1)
[6] 国家测绘地理信息局. 2012. ch/z 9010-2011, 地理信息公共服务平台地理实体与地名地址数据规范. 北京: 测绘出版社.(1)
[7] 夏凯, 刘仁义, 刘南, 等. 2013. 序列状态的林业资源时空数据模型研究. 测绘学报, 42(3): 433-439.(7)
[8] 张丰, 刘仁义, 刘南, 等. 2010. 面向对象的地籍时空过程表达与数据更新模型研究. 测绘学报, 39(3): 303-309.(1)
[9] 赵春燕, 李际平, 王国华, 等. 2010. 森林资源空间数据更新的时空数据模型研究. 测绘科学, 35(6): 189-191.(1)
[10] 周晓光, 陈军, 朱建军, 等. 2006. 基于事件的时空数据库增量更新. 中国图象图形学报, 11(10): 1431-1438.(1)
[11] Langran G, Chrisman N R. 1988. A framework for temporal geographic information. Cartographica: The International Journal for Geographic Information and Geovisualization, 25(3): 1-14.(1)
[12] Pelekis N, Theodoulidis B, Kopanakis I, et al. 2004. Literature review of spatio-temporal database models. The Knowledge Engineering Review, 19(3): 235-274.(1)
[13] Peuquet D J, Duan N. 1995. An event-based spatiotemporal data model (ESTDM) for temporal analysis of geographical data. International Journal of Geographical Information Systems, 9(1): 7-24.(1)
[14] Rasinmäki J. 2003. Modelling spatio-temporal environmental data. Environmental Modelling & Software, 18(10): 877-886.(1)
[15] Rasinmäki J. 2007. Management of multi-scale forest resource data over time. Dissertationes Forestales[2013-06-05]. http://www.metla.fi/dissertationes/index-en.htm.(1)