林业科学  2006, Vol. 42 Issue (增刊1): 10-15   PDF    
0

文章信息

冯益明, 李增元, 张旭, 李立伟.
Feng Yiming, Li Zengyuan, Zhang Xu, Li Liwei.
林业空间统计学软件设计
Design of Forestry Spatial Statistics Software
林业科学, 2006, 42(增刊1): 10-15.
Scientia Silvae Sinicae, 2006, 42(增刊1): 10-15.

文章历史

收稿日期:2005-06-24

作者相关文章

冯益明
李增元
张旭
李立伟

林业空间统计学软件设计
冯益明1 , 李增元1 , 张旭1 , 李立伟2     
1. 中国林业科学研究院资源信息研究所 北京 100091;
2. 河南省林业调查规划院 郑州 450045
摘要: 介绍国内外已有空间统计学软件的情况, 提出开发林业行业软件的必要性, 进而提出林业空间统计学软件设计的总体思路, 从软件功能需求角度, 对软件各部分功能进行较为详细的设计与说明, 最后指出实现林业空间统计学软件的方法与策略。
关键词: 林业    空间统计学    软件设计    
Design of Forestry Spatial Statistics Software
Feng Yiming1, Li Zengyuan1, Zhang Xu1, Li Liwei2     
1. Research Institute of Forest Resources Information Techniques, CAF Beijing 100091;
2. Henan Institute of Forest Inventory and Planning Zhengzhou 450045
Abstract: There is a close correlation between the application of spatial statistics and the studied fields, and the calculation of spatial statistics is very complicated, so some relevant computer software supports are necessary so as to apply the spatial statistics in practice. The forestry has itself field characteristics, however, in the forestry field, few involves in the work for the design and development of the computer software supporting the specific application of spatial statistics in China and other countries. In this paper, some situations of domestic and foreign spatial statistics software were introduced, the necessity of developing forestry spatial statistics software was expounded, and the general design ideas of forestry spatial statistics software were put forward. The function of each part of software was designed and described in details from the angle of function requirement of software. Finally, the methods and strategies of realizing the forestry spatial statistics software were pointed out.
Key words: forestry    spatial statistics    software design    

空间统计学是以区域化变量理论为基础, 以变异函数为基本工具来研究那些分布于空间并呈现出一定的随机性和结构性的自然现象的科学。显然, 凡是要研究某些变量(或特征)的空间分布特性并对其进行最优估计, 或要模拟所研究对象的离散性、波动性或其他性质时都可应用空间统计学的理论与方法(侯景儒, 1997)。空间统计学在近50年的研究和实践中, 它的应用已被扩展到分析各种自然现象的空间异质性和空间格局。而森林受物理环境、自然干扰、人为干扰、树种特性、树种对干扰的反应等因素及其相互作用的影响, 具有高度空间异质性和时间异质性(冯益明等, 2004), 因此, 它在林业领域应有着广泛的应用。

空间统计学的应用与行业特点密切相关, 并且计算复杂, 因此具体应用时必须有相应的计算机软件做支撑。由于空间统计起源于地质、矿产部分, 几乎所有成熟的空间统计方面的软件都是出自这些领域, 林业领域有自己行业特色, 如要研究森林类型划分, 就要对分类变量进行分析, 而一般的空间统计学软件只能对连续变量进行分析, 而不具有分析分类变量的能力。目前, 林业系统内很少有人涉足此类软件的研究, 为此, 本文意在依据林业行业特色, 提出适合林业领域特点的空间统计学软件设计与开发的整体思路与实现方式。

1 空间统计学软件研究现状

以往的空间统计学软件, 大多是在以UNIX为操作系统的小型机、工作站和以DOS为操作系统的微机系统上开发的。如美国斯坦福大学开发的GSLib, 法国巴黎高等矿院地质统计学研究中心研制的ISATIS, 法国的BRGM公司、加拿大的GEOSTAT公司、GEOLOG公司与加拿大矿产与能源中心、美国的Mewmont(丹佛)公司等开发的一些软件包, 我国李裕伟教授主持研制的KPX, 北京科技大学侯景儒教授主持编制的地质统计学程序集, 原武警黄金指挥部黄金地质研究所研制的CGES等(侯景儒, 1998; 李裕伟, 1994; Clayton et al., 1992)。

随着计算机水平的不断发展, 先后也出现了一些Windows版本的空间统计学软件。如美国华盛顿大学编制的GS +, 美国斯坦福大学对原GSLib进行移植的WinGSLib等。随着GIS、RS软件以及统计软件的发展与成熟, 空间统计学软件已开始与GIS软件与统计软件逐渐相互融合。如在GIS与RS软件中加入空间统计学功能, 如ArcGIS中Geostatistical Analyst扩展模块提供了空间统计学的部分功能(Heather, 2004), 荷兰ITC开发的综合土地与水信息系统(ILWIS), 此软件中也加入了一些空间统计学功能与算法等。在一些成熟的统计软件中, 也逐渐开始加入空间统计功能, 如国外的SAS已实现了空间统计功能(洪楠等, 2004)。Matlab5.2以上版本, 也提供了空间统计功能(苏金明等, 2004)。所有这些软件都各有优点, 也存在或多或少的不足。如, 当前主流空间统计分析软件ArcGIS中Geostatistical Analyst模块, 其尚未提供条件模型功能, 且只能对连续变量进行处理, 而对分类变量尚未提供有力支撑。再如, 美国斯坦福大学地球科学应用系研制的GSLIB, 可以说此软件是空间统计学研究领域最早、最成熟、功能最全面的软件, 但此软件系统不够集成, 存在界面操作复杂, 图示化功能弱等问题。

当前, 从事空间统计学软件开发的机构, 有地质统计学研究、教学单位, 也有各行业的专业研究单位、专业工程公司和专业软件公司。这些软件系统的基本组成虽大体相似, 但因其适用的计算机和操作系统环境的差异及应用领域的差异而各具特色, 其工作模式和工作流程也各不相同。如地质统计学方法研究类程序系统, 掌握使用难度较大。专业应用类程序系统, 面向各特定专业领域的研究和生产, 这类软件是严格按照本行业或本专业的技术规范或技术标准设计的。在现有软件中, 尚没有考虑林业领域特点而开发的空间统计学软件。

2 林业领域空间统计学软件设计 2.1 总体设计思想 2.1.1 林业领域特点

1) 分析数据的特殊性  林业领域常常需要分析一些分类变量数据的时空格局, 如经常遇到的森林类型划分, 它就需要对分类变量进行研究, 这不同于环境保护、地质、采矿等其他领域, 这些领域所分析的数据通常是连续型变量。因此, 现有的大多数空间统计学软件只能对连续变量进行分析, 而不具有分析分类变量的能力。2)林业领域对GIS与传统统计学软件了解的特殊性  当前, 我国林业系统对GIS的了解和使用已有近20年的历史, 而且目前也有了自己的GIS平台, 大多数林业工作者对GIS软件已有了比较直观的认识与理解。同时, 我国林业领域的统计学软件近20年来也有了长足发展, 如“IBM-PC系列程序集(数理统计、调查规划、经营管理)DOS版”提供了通用和林业常用的90多个程序的源程序, 对推动林业统计学发展以及提高林业工作者统计学水平发挥了一定的作用。

2.1.2 空间统计学软件的发展趋势

1) 空间统计与GIS结合  GIS具有较强的空间数据管理功能, 而空间统计学是对具有空间坐标的变量进行分析, 分析结果往往具有空间分布特征, 这种空间分布特征的图形表述正好是GIS的长处。因此, 空间统计与GIS结合, 可以弥补其空间数据管理功能较弱的特点(柏延臣等, 1999; 王劲峰等, 2001; 王学军, 1997; 孙英君等, 2001)。2)空间统计与经典统计结合  经典统计具有较强的数据处理功能, 空间统计学则具有较强的空间分析功能, 但其数据处理功能较弱, 因此, 在空间统计学软件中, 引入统计学数据处理功能, 可以增强其数据处理能力(洪楠等, 2004)。

2.1.3 总体设计

根据林业行业特色, 考虑当前空间统计学软件发展趋势, 林业空间统计分析总体设计思想是:空间统计与GIS结合, 把空间统计结果通过GIS来展示; 把空间统计与经典统计结合, 以弥补空间统计学数据处理相对较弱的缺点。具体设计如下:1)空间统计与GIS结合方式设计  空间分析模型与GIS的结合是空间统计发展的动向, 二者的结合近期以空间分析模块外挂GIS。在空间统计软件与GIS软件之间增加数据交换接口, 使得空间分析数据及相关的影响因素和空间分析结果能够在GIS中以各种简单的或复合的图形方式显示出来。从事空间统计的林业工作者只要解出方程的分析解, 交由GIS初级操作员, 而不必自己懂得操作, 就可以迅速地得到计算结果, 并通过GIS表达出来。二者结合方式如图 1所示。2)经典统计软件与空间统计软件结合方式设计  在经典统计软件包中把空间统计模块作为一个高级应用模块嵌入, 使得经典统计与空间统计一体化, 空间统计不仅为经典统计软件提供空间统计分析能力, 而且可以将经典统计软件中的数据直接参与空间统计分析计算, 反过来, 空间统计分析借用经典统计软件强大的数据处理功能, 以弥补自身数据处理相对较弱的缺点。二者结合方式如图 2

图 1 空间统计与GIS的松散结合 Fig. 1 Loose link of GIS and spatial statistics
图 2 空间统计模块嵌入经典统计系统 Fig. 2 Spatial statistics integrated into classical statistics system
2.2 软件总体功能设计

空间统计软件应包括以下几个既相对独立又相互依存的部分, 即数据管理、数据基本统计分析、空间统计学结构分析、各种克里格插值算法、各种条件模拟、其他空间分析方法、结果输出、图形展示几个大的部分。软件功能划分及相互关系如图 3所示。由于空间统计分析部分功能是整个林业空间统计分析软件的重点和主要内容, 以下主要针对此部分功能进行设计。其他部分略。空间统计分析是林业空间统计学软件的主体, 它主要包括结构分析与空间估值2大部分。

图 3 软件功能划分 Fig. 3 Function division of spatial statistics software
2.2.1 结构分析

此部分主要包括区域化变量的半变异函数求解, 及半变异函数模型拟合2部分功能。此部分功能结构如图 4

图 4 结构分析功能图 Fig. 4 Function diagram of structure analysis

1) 半变异函数计算  变异函数的计算要考虑数据的结构。空间统计学中数据结构主要有2种:一种是等间距的规则网格数据, 另一种是非等间距的不规则网格数据。针对2种不同的数据结构, 产生了不同的计算变差函数的程序。如GSLIB中, 对2种不同采样方式, 其实现方式也分2种不同情况来实现。

研究考虑到林业行业野外工作条件的复杂性, 实际取样位置有时难以精确。虽然按采样设计要求, 在某一精确点上必须取样, 但由于野外工作条件不允许, 必须偏离采样点一定位置, 再取样。根据这种情况, 研究把规则数据结构与不规则数据结构的变异函数计算形式集成在一起, 采用角度误差限与距离误差限的技术来计算规则采样数据与不规则采样数据的实验半变异函数。对采样位置要求不需要太严格, 用户采样可以偏离采样网格一定角度和距离, 计算中考虑到用户采样可能偏离网格中心一定角度与距离, 这样方便了用户野外工作。

在自然界中许多生物和非生物因子的空间分布与方向有着密切关系。在半变异函数求解过程中, 区域化变量可能存在各向异性情况, 考虑此种情况, 设计分0°、45°、90°、135°方向和任意角度求解半变异函数, 同时提供各向同性的半变异函数求解。半变异函数程序界面如图 5

图 5 半变异函数程序界面 Fig. 5 Programme interface of semivariogram

2) 模型拟合  考虑到区域化随机变量的变化有时非常复杂, 往往包含各种尺度及各种层次的变化, 研究采用加权多项式法、交互法以及直接法3种方法相接合, 以适应变差函数模型拟合中的不同情况。用户可以根据数据特点以及自己对专业背景知识的了解程度选择不同的拟合方法。加权多项式法, 计算机自动拟合出模型参数, 它一般对试验变差函数值规律性较强的较为合适。如果试验变差函数值的规律性不强, 对专业背景知识较强人员, 可以直接采用交互方法(用户根据试验半变异函数图给出模型参数)拟合, 对一般用户, 程序提供了直接法, 可以较粗的模型参数, 然后再用交互方法拟合。模型拟合界面如图 6

图 6 模型拟合程序界面 Fig. 6 Programme interface of model fitting

界面中, 设置好模型拟合方向后, 用户根据数据情况, 设置模型拟合采用的方法, 设置拟合模型类型(包括球状模型、指数模型、高斯模型、幂函数、线性模型)、模型套合层数, 如果采用交互方式拟合, 用户需要根据专业背景知识, 设置相应的拟合模型参数, 经过反复多次拟合, 找出最优拟合模型及相应参数。以文件形式输出模型拟合参数, 为空间估值服务。

2.2.2 空间估值

此部分主要包括克里格插值与随机模拟二部分内容。其中克里格插值部分主要为用户提供不同的克里格插值功能, 如普通克里格、简单克里格、漂移克里格、协同克里格、指示克里格、析取克里格等; 随机模拟部分主要为用户提供不同的模拟功能, 如转向带法、混合模拟(转向带和矩阵分解结合)、LU三角矩阵分解法、布尔条件模拟、高斯截断法、指示条件模拟以及模拟退火等。实际应用中用户根据区域化变量数据情况, 选择最适当的估值方法解决实际问题。此部分功能结构设计如图 7

图 7 克里格插值功能图 Fig. 7 Function graph of Kriging interpolation

1) 克里格方法  空间局部内插假设样本数据是平稳的, 服从正态分布。当样本数据偏离这些假设条件时, 产生一些不同的空间内插法。具体有以下常见估值类型:简单克里格、普通克里格、漂移克里格、指示克里格、协同克里格(Pan, 1997)等。考虑到在实际工作过程中, 区域化变量在研究区域内可能存在着不同情况, 系统设计了多种不同的克里格插值方法, 供用户根据实际进行选择。图 8为普通克里格程序界面。

图 8 普通克里格程序界面 Fig. 8 Ordinary Kriging programme interface

2) 条件模拟  条件模拟是空间统计学里特有的内容, 它建立在克立格估计法基础上, 是根据区域化变量的分布函数、协方差函数和变异函数, 按照一定的算法产生大量不同“实现”的一种随机模拟方法, 可说是一种新的蒙特-卡洛法。条件模拟自提出以来发展很快, 产生了多种方法, 如转向带法、谱方法、指示模拟法、矩阵分解法、序贯方法、布尔条件模拟, 以及模拟退火等算法(Painter, 1998; Goovaerts, 1996)等。由于条件模拟部分内容较多, 这里仅仅列出应用分类变量序列指示条件模拟实现森林分布图自动绘制(图 9)。

图 9 模拟结果 Fig. 9 Simulation result
2.3 其他空间分析

此部分为空间统计分析程序设计的预留功能部分, 设计一定的接口, 具有扩充、修缮功能, 便于空间统计分析功能的扩展、升级。比如程序中可随时加载一些如傅立叶变换、小波变换、谱分析、分形、计算机神经元网络等方面功能, 来逐渐充实扩大空间统计分析程序的功能。

3 林业领域空间统计软件的实现 3.1 开发环境选择

以往的空间统计类软件, 大多是在以UNIX为操作系统的小型机、工作站和以DOS为操作系统的微机系统上开发的。当前Windows是优先选择的开发环境, VB是一种可视化的、事件驱动型的Windows应用程序开发工具, 在GUI设计、绘图、制表、运算、通信和多媒体开发方面都具有简单易行、功能强大等优点, 所以越来越受到开发人员的青睐(孙越, 2002)。为此, 作者采用Visual Basic开发语言, 在Windows环境下进行软件的设计与开发。

3.2 林业领域开发空间统计软件的对策

由于林业领域刚刚开始进行空间统计学方面的研究, 因此, 实现空间统计学软件的功能应当逐步实施。在完成总体设计的基础上, 首先实现空间统计所要求的基本的技术支撑部分, 如数据管理、数据的基本统计分析与计算结果的输出展示等; 其次实现应用较为广泛的空间结构分析部分; 然后完成林业领域急需使用的部分克里格算法与部分随机模拟算法; 最终逐步完善、实现所有空间统计学功能。

结合林业行业当前信息发展的实际状况, 把空间统计学程序作为一个高级模块内嵌于林业统计系统中, 依托其提供数据编辑处理与经典统计运算功能, 实现空间统计学所需要的数据编辑处理与一些基本的统计分析。另外, 通过外挂GIS软件, 来实现空间统计计算结果的图形展示, 这样可以快速开发出适合林业科研和生产使用的空间统计学软件。

参考文献(References)
柏延臣, 李新, 冯学智. 1999. 空间数据分析与空间模型. 地理研究, 18(2): 185-190. DOI:10.3321/j.issn:1000-0585.1999.02.011
冯益明, 唐守正, 李增元. 2004. 空间统计学在林业中应用. 林业科学, 40(3): 76-83.
洪楠, 侯军. 2004. SAS for Windows(V8)统计分析系统教程新编. 北京: 北京交通大学出版社.
侯景儒. 1997. 中国地质统计学(空间信息统计学)发展的回顾与前景. 地质与勘探, 33(1): 53-58.
侯景儒. 1998. 实用地质统计学. 北京: 地质出版社.
李裕伟. 1994. 二维地质统计学. 北京: 地质出版社.
孙英君, 陶华学. 2001. GIS空间分析模型的建立. 测绘通报, (4): 11-12. DOI:10.3969/j.issn.0494-0911.2001.04.005
孙越. 2002. Visual Basic数据库开发自学教程. 北京: 人民邮电出版社.
苏金明, 王永利. 2004. MATLAB 7.0实用指南. 北京: 电子工业出版社.
王劲峰, 柏延臣, 朱彩英. 2001. 地理信息系统空间分析能力探讨. 中国图形图像学报, 6(9): 849-853.
王学军. 1997. 空间分析技术与地理信息系统的结合. 地理研究, 16(3): 70-74.
臧淑英, 高亦珂, 祖元刚. 2000. 基于GIS的优势树种与地形空间关系格局探讨. 东北林业大学学报, 28(5): 120-121. DOI:10.3969/j.issn.1000-5382.2000.05.029
Clayton V, Deutsch C V, André G, et al. 1992. GSLIB geostatistical software library and user' s guide. New York: Oxford University Press.
Goovaerts P. 1996. Stochastic simulation of categorical variables using a classification algorithm and simulated annealing. Mathematical Geology, 28(7): 909-921. DOI:10.1007/BF02066008
Heather K. 2004. Data in three dimensions:a guide to ArcGIS 3D analyst. Clifton Park, NY: Thomson Delmar Learning.
Pan Guocheng.1997.地质统计学中的区域化变量理论.李钟山译.世界地质, 16(2): 85-93
Painter S. 1998. Numerical method for conditional simulation of levy random fields. Math Geol, 30(2): 163-179. DOI:10.1023/A:1021724513646