2. 武汉大学遥感信息工程学院, 湖北 武汉 430079;
3. 香港理工大学土地测量与地理资讯学系, 香港
2. School of Remote Sensing and Information Engineering, Wuhan University, Wuhan 430079, China;
3. Department of Land Surveying and Geo-Informatics, The Hong Kong Polytechnic University, Hong Kong, China
国情是指某一个国家某个时期的基本情况,是制定与实施国家发展战略与规划的重要依据。地理国情以地理信息为载体,从地理的角度对自然环境、人文地理要素和社会经济的基本情况进行综合表达,是基本国情的重要组成部分[1-2]。地理国情监测是利用现代测绘地理信息技术,对自然、人文和社会经济等要素动态变化的监测,是科学、及时掌握地理国情信息,提供权威、准确的地理信息服务的重要手段[3]。为全面掌握地理国情现状,建立常态化地理国情监测的基础,国家测绘地理信息部门已在2016年完成了第一次全国地理国情普查[4]。
地理国情信息是国家职能部门制定战略做出决策的重要依据,可靠的地理国情信息是做出科学决策的保障;相反,不可靠的地理国情信息可能造成决策失误,给国家造成损失[5-6]。为准确地把握地理国情监测结果的可靠程度,迫切需要研究地理国情动态监测的可靠性分析理论方法与实用技术。
可靠性的概念源于对产品可靠性的描述,由美国国防部电子设备可靠性咨询组(AGREE)在1957年首先提出,指的是产品在规定的条件下和规定的时间内完成规定功能的能力[7]。自从可靠性概念提出以来,可靠性理论得到发展,已渗透各学科领域,例如航空航天、电子设备、机械元件、车辆产品、电力系统、软件和网络等[8-9]。
地理空间可靠性理论是对空间不确定性理论[10-11]的拓展。可靠性理论强调在数据、模型及方法层面的可靠性度量与控制,最终提高成果的可靠程度。在测绘地理信息领域,文献[12]拓展了误差理论和测量平差过程理论,提出可靠性的概念。文献[13]开拓了摄影测量学中的可靠性理论。文献[14]探讨了可靠性空间分析理论,提出了空间数据可靠性定量描述指标。针对地表覆盖数据提出了可靠性评估方法,用于大范围地表覆盖数据可靠性验证[15]。文献[15]探讨了可靠性地理国情动态监测相关理论和技术,提出了地理国情动态监测可靠性分析理论,通过动态监测可靠性分析,对监测过程和监测结果的可靠性进行评价,为决策提供可靠的地理国情信息。在影像变化检测领域,文献[16]研究了变化检测的可靠性评价指标,提出一种基于可靠性加权的多方法融合技术。在遥感影像分类领域,文献[17]系统研究了遥感数据分类过程中各个环节的可靠性提升方法,分析了不确定性对分类结果精度的影响,提出了遥感数据的可靠性分类方法。
地表覆盖数据与重要国情要素的可靠性研究是地理国情监测可靠性分析中的重点。目前针对地表覆盖的相关研究主要集中在其精度评价与不确定性分析上。文献[18]总结了针对地表覆盖的精度评价的常用方法和应用背景,指出了基于混淆矩阵的地表覆盖数据分类精度评价的所存在的问题。文献[19]对基于遥感影像的4个全球性地表覆盖制图项目进行了不确定性分析,指出地表覆盖的分类系统和精度验证方法是影响不确定性的最主要因素。文献[20]利用支持向量机的方法对土地利用和地表覆盖(LULC)数据进行分类,并阐述了特征选择对于分类精度的影响。文献[21]利用回归分析和方差分析的手段对LULC变化的全球性预测进行了不确定性分析,指出了LULC变化的不确定性具有区域性,并与特定地物种类有关,同时指出生物活动密集的区域边界是不确定性出现的热点位置。文献[22]对利用OpenStreetMap(OSM)数据进行快速LULC制图的不确定性进行了研究,针对遥感影像中的噪声和OSM数据中属性误差和位置误差提出了相应的解决方案。文献[23]利用影像几何与辐射重建、异质异构服务化集成、对象化分层分类、知识化检核处理等技术方法,将全球30 m分辨率地表覆盖遥感制图的空间分辨率提高了一个数量级。虽然已经出现了较多关于地表覆盖数据的精度评价模型和不确定分析方法,但仍缺少完整的、针对地理国情监测项目的可靠性评估模型。
地理国情监测可靠性分析旨在解决地理国情监测过程与监测成果中的可靠性问题。针对地理国情监测的复杂性、时空动态性等特点,系统研究地理国情监测过程和监测成果的可靠性度量、描述与控制方法,包括地理国情监测过程和监测数据成果可靠性基础理论与方法、地理国情监测成果数据可靠性综合评估方法、地理国情监测过程可靠性建模与控制等。地理国情监测可靠性理论研究将为实现可靠的国情决策提供理论和技术支撑。
1 地理国情监测可靠性分析的研究对象、内容与关键问题 1.1 研究对象 1.1.1 地理国情监测数据成果空间数据可靠性是指在规定的条件下和规定的时间内空间数据表达的内容(包括位置、属性和时间等)与现实世界真实情况的吻合程度。由于对于现实世界认知存在不确定性,实际应用中通常无法获取绝对的现实世界的真值, 通常以参考值取而代之。因此,在实际操作中需根据特定应用,分析应用所限定的范畴,评价描述数据与该应用范畴参考值的吻合程度。根据上述分析,地理国情监测数据的可靠性可以定义为,在规定的条件下和规定的时间内,监测数据与地理国情监测应用范畴真实情况(或参考数据表述情况)的吻合程度。
1.1.2 地理国情监测过程在质量管理中,过程被定义为将输入转换成预期输出的一系列活动[24]。相应的,地理国情监测过程可以定义为将地理国情监测中的观测数据转换为最终成果的一系列数据分析与处理的活动。地理国情监测过程可靠性的研究关注地理国情监测过程中的可靠性因素,通过分析监测过程各环节中存在的不确定性问题以及各环节间的相互关系,找出可靠性相对较低的环节并对其进行可靠性控制,从而实现国情监测成果整体高可靠性。
1.2 研究内容地理国情监测可靠性的研究是对传统空间数据不确定性分析以及可靠性理论的扩展,从分析监测数据以及监测过程中的可靠性影响因子以及可靠性传播过程入手,建立有效的可靠性评估机制和可靠性控制方法。研究成果将为监测项目设计、数据采集和生产实施技术的确定以及基于监测成果的国情决策提供依据。
地理国情监测可靠性分析的研究主要包含4个方面:
(1) 地理国情监测可靠性因素分析。深入研究地理国情监测的业务流程,分析对客观世界表达、认知过程中以及在地理国情监测数据获取、处理过程中影响可靠性的因素,研究可靠性因素的表达方式。
(2) 地理国情监测数据成果可靠性指标与评估模型。结合空间数据可靠性理论,分析可靠性因素之间的关系,构建针对监测数据成果的特点和应用的可靠性指标,建立定量化评估地理国情监测成果可靠性的评估模型和评估方法。
(3) 地理国情监测过程可靠性传播与建模。分析各个可靠性因素对于监测过程以及监测成果可靠性的影响,构建过程可靠性传播模型,为实现监测过程的可靠性评估与控制提供基础理论与方法。
(4) 地理国情监测过程可靠性控制。在监测可靠性传播机制研究的基础上,发现可靠性低的环节,提出改进监测数据处理过程中不确定性的方法,建立地理国情监测过程可靠性控制模型,实现对数据处理过程可靠性的提高。
1.3 关键问题 1.3.1 动态信息的可靠性评估地理国情监测的可靠性研究需要着重关注监测数据的动态性特征。根据现有资料,按照一年更新一次计算,国情监测的变化数据将会以15%的速度增长[25]。为保证对更新后的国情监测数据可靠性进行快速、全面的评估,需针对动态监测中的变化数据建立局部、快速的可靠性评估机制,探索变化数据可靠性信息与原监测数据可靠性信息的综合方法,降低常态化可靠性评估的时间、人工成本,获得与变化数据更新时刻相一致的可靠性评估结果;同时,需要加强研究地理国情监测数据的时间逻辑关系,为变化数据的可靠性控制理论与方法提供基础。
1.3.2 复杂环境下的可靠性度量地理国情监测涉及来自多个部门和行业的多源、多专题数据,不仅包含海量的空间数据,还存在大量的非空间数据,不仅增加了可靠性因素分析的难度,也导致了大量的非结构化、定性、模糊的不确定性问题,使得地理国情监测的可靠性研究具有更大的复杂性。传统的空间数据不确定性分析与可靠性理论已经无法满足地理国情监测中对于复杂、海量、多元空间与非空间数据的可靠性度量。因此,分析复杂生产环境背景下的监测数据可靠性因素,研究空间与非空间、结构化与非结构化数据的相似性和相互关系,解决非空间数据与非结构化数据的可靠性描述与度量方法,是地理国情监测可靠性研究的重要问题之一。
1.3.3 统计分析结果的可靠性地理国情信息的统计分析是地理国情监测的重要成果之一。统计分析成果的可靠性受到了包括分类系统、采集指标、解译方法以及空间统计分析方法(如地统计分析、空间聚类、空间关联分析)等一系列因素的影响。研究数据生产规定、影像解译、统计模型、分析方法中存在的不确定性问题,对统计分析中的可靠性传播过程进行建模,是有效提高统计分析成果可靠性的关键。
1.3.4 可靠性分析尺度可靠性分析尺度是地理国情监测可靠性研究的重点。从空间上看,监测可靠性分析的对象可以是某一特定地理单元(如县、市、省级行政区);从地物分类上看,仅基础性地理国情监测的内容便达到了10个一级类、59个二级类以及143个三级类,可靠性分析的对象既可以是其中某一特定类型或多个类型的综合。随着可靠性分析尺度的变化,可靠性分析的结果会呈现不同的统计特征和分布特征。在具体的可靠性分析应用中,需根据应用的具体要求选择适宜的分析尺度,从而保证可靠性分析结果的准确性和科学性。
1.3.5 综合决策问题提高综合决策的可靠程度是地理国情监测可靠性分析研究的主要目的之一。传统测绘业务的决策问题通常面向单一应用范畴,但由于地理国情监测的复杂性和综合性,其决策问题涉及多个不同应用范畴。开展地理国情监测可靠性分析需要充分考虑具体决策问题当中所涉及的多应用范畴的特点,设计具有综合性、整体性的可靠性分析模型,分析决策过程中决策信息、知识、目标的可靠性问题,为决策者提供宏观的可靠性分析结果、评估参考和数据支持。
2 地理国情监测可靠性分析方法 2.1 数据结果可靠性评估根据地理国情监测数据可靠性的定义,其可靠性指标须针对具体的应用需求进行设计。然而大多数情况下,空间数据可靠性评估时中不会明确限定空间数据的有限应用,这就给地理国情监测数据可靠性指标的设置带来了困难。如何全面描述地理国情监测数据当前面对以及在将来可能的应用过程中可能出现的可靠性问题,是构建合理的空间数据可靠性指标的难点之一。
如图 1所示,地理国情监测可靠性评估流程可以分为3个步骤:数据应用功能分析、可靠性指标构建、整体可靠性评估。
(1) 数据应用功能分析:通过分析地理国情监测的主要目标和其数据本身的结构、内容与类型,推导出其可能的应用场景,从而得出地理国情监测数据的主要应用功能。在常态化地理国情监测的背景下,地理国情监测成果数据的基本功能可以分为两个部分,一是掌握国情要素的分布现状及变化,二是开展地理国情统计分析。此外,根据地理国情监测的设计思路,地理国情监测数据将作为基础数据,并辅以其他综合性统计或其他行业的数据,提供准确的国情要素分布、完整的统计数据以及适用性强的数据底图是地理国情监测数据目前阶段主要的3类功能。
(2) 可靠性指标构建:根据地理国情监测数据的上述3类主要功能,结合可靠性空间分析理论的相关研究[14],构建地理国情监测数据可靠性评估指标体系。具体包括:现势性、鲁棒性、准确性、一致性、完整性、适用性。现势性反映地理国情监测数据与评价时刻指定现实世界状况的吻合程度;鲁棒性指地理国情监测数据在生产过程中,能够持续保持表达指定现实世界状况的能力;准确性指地理国情监测数据的属性记录、几何位置反映的指定现实世界状况的准确程度;一致性指地理国情监测数据的分类与指定现实世界状况的一致程度;完整性指地理国情监测数据在实体位置、实体属性、空间数据关系上与指定现实世界状况相比的符合与缺失的情况;适用性指依据当前设计指标生产的地理国情监测数据描述的空间信息与现实世界状况的符合程度。
(3) 整体可靠性评估:地理国情监测数据可靠性评估的最终结果是一个综合指数。在理论上,地理国情监测数据每个潜在功能的评价指标都是其可靠性综合指数的组成成分之一,但由于各个功能的重要程度不同,在实际的综合计算过程中,需要选择需求较为明显的应用功能,并根据评估目的确定各个应用功能的重要性,对各个指标赋予相应的权重。最终通过加权方式获得待评估数据的可靠性综合指数。
2.2 过程可靠性评估与控制地理国情监测是一个复杂的系统过程,包含大量的不确定性因素,这些因素在生产过程中不断传递与累积,最终影响监测结果的整体可靠性。地理国情监测过程可靠性的影响因素(见图 2)主要包括:① 遥感影像的类型、分辨率、预处理精度等;② 各类基础测绘地理信息成果的准确性与完整性;③ 人工目视解译水平;④ 目标提取、分类、变化检测算法的可靠性;⑤ 外业核查的准确性。
通过分析地理国情监测数据处理过程,以及处理过程中的可靠性影响因素及其相互关系,研究了数据处理过程中的可靠性传播模型,如图 2所示。本文利用改进的故障树分析方法,针对上述过程可靠性指标,建立监测过程可靠性推理模型,描述和分析具有随机性及关联性的事件序列,确定事件之间的逻辑关系。通过对影响可靠性的各种因素进行逐层分析,推导出监测过程的可靠性传播规律。该模型对参考数据的依赖较低,为地理国情监测可靠性评估提出了一种新的解决途径。在此基础之上,可利用模糊数学理论与方法对生产过程中可靠性影响因子的重要度进行度量,建立适用于地理国情监测的过程可靠性控制方法,为改进设计方案与过程控制通过依据,从而降低数据处理过程中不确定性的影响,最终达到提升数据结果可靠性的目的,具体流程如图 3所示。
2.3 地理国情普查数据可靠性评估应用
所提出的地理国情监测数据可靠性评估方法已应用于第一次全国地理国情普查数据成果总体评估中。通过对普查数据生产环境以及数据生产过程相关特征的分析,系统研究造成普查成果数据与真实地表产生差异的各种因素,计算各个因素对数据成果的影响程度,经赋予相应的权重,最终统计获得普查数据相对应所反映真实地表情况的可靠性。所提出可靠性理论在全国地理国情普查成果总体评估中的运用,解决了这一国家工程成果可靠性评估的需求,为国家掌握第一次地理国情普查数据成果的可靠程度提供了依据。通过将普查数据整体质量评估结果与普查数据可靠性评估结果相互比较,更印证了普查成果质量的可靠程度。该应用为下一步常态化地理国情监测中的数据可靠性评估奠定了基础,推动了地理国情监测可靠性理论研究的应用实践。
3 展望根据对地理国情普查与监测可靠性理论研究及应用实践,结合地理空间大数据研究现状,提出以下几个可靠性有关的发展方向供本领域研究人员参考:
3.1 地理国情监测可靠性相关标准的建立地理国情监测可靠性相关技术标准是开展规范、持续国情监测的可靠性评估,实施可靠性控制的重要保障。然而目前尚无正式的国家标准对空间数据及地理国情监测可靠性评估的内容进行规范化约束。开展与地理国情监测基础建设和服务相关的可靠性评估内容、评估指标、量化方式以及抽样方法的研究,提出地理国情监测可靠性评估的相关规定,形成科学、完善的可靠性地理国情监测标准,这对于长期保障地理国情监测成果的权威性具有重要意义。
3.2 可靠性变化检测方法发展可靠的遥感变化检测技术,是提高地理国情监测成果可靠性的重要途径之一。在地理国情监测中,数据源包括成像机理、特性各不相同的卫星遥感光学影像、SAR影像等数据,目前针对此类多源数据的变化检测算法还尚不成熟,远不能满足地理国情监测的实际需求。需深入研究多源数据特征,研究适用于高时空分辨率影像的可靠的变化检测方法,降低不同数据源及大气等环境因素的影响,从而提高变化检测方法的可靠性和实用性。
3.3 大数据的可靠性研究常态化地理国情监测将促进地理国情监测的先进技术与大数据的相互融合,推动相关地理大数据产业的发展。地理大数据所具有的大量、多源、非结构化、多尺度的特点,导致了大量的不确定性问题,是地理大数据进行有效应用的主要瓶颈之一。目前对于地理大数据领域可靠性研究还处于起步阶段。以地理国情监测可靠性理论与方法为基础,开展针对地理大数据数据可靠性研究,加速地理大数据广泛与可靠的应用。
3.4 可靠性全球测图与地理信息服务随着数据采集、管理、访问、分析的技术的不断进步,全球测图及地理信息服务将推动测绘地理信息技术与理论发展。可靠性分析技术已经在局部区域空间数据以及空间数据分析中得到了研究与应用,但针对全球地理信息的可靠性,仍然缺少对应的理论与方法。扩展传统的可靠性理论,实现全球地理信息处理过程中的可靠性控制,有利建立可靠的全球地理信息网络,是提供可靠性全球地理信息服务的关键之一。
[1] | 李维森. 地理国情监测与事业转型升级[J]. 地理信息世界, 2017, 24(2): 1–6. LI Weisen. The Geographic Conditions Monitoring Promoting the Transformation and Upgrading of Surveying, Mapping and Geoinformation Industry[J]. Geomatics World, 2017, 24(2): 1–6. |
[2] | 国务院. 国务院关于开展第一次全国地理国情普查的通知[EB/OL]. [2013-03-05]. http://www.gov.cn/zwgk/2013-03/05/content_2346074.htm. The State Council.The Sate Council, Notice of the State Council on the First National Geographical Survey[EB/OL].[2013-03-05].http://www.gov.cn/zwgk/2013-03/05/content_2346074.htm. http://www.doc88.com/p-1055213241639.html |
[3] | 李德仁, 丁霖, 邵振峰. 关于地理国情监测若干问题的思考[J]. 武汉大学学报(信息科学版), 2016, 41(2): 143–147. LI Deren, DING Lin, SHAO Zhenfeng. Reflections on Issues in National Geographical Conditions Monitoring[J]. Geomatics and Information Science of Wuhan University, 2016, 41(2): 143–147. |
[4] | 张继贤, 翟亮. 关于常态化地理国情监测的思考[J]. 地理空间信息, 2016, 14(4): 1–3, 6. ZHANG Jixian, ZHAI Liang. Thinking about Normalized Geographical Conditions Monitoring[J]. Geospatial Information, 2016, 14(4): 1–3, 6. |
[5] | 史文中, 秦昆, 陈江平, 等. 可靠性地理国情动态监测的理论与关键技术探讨[J]. 科学通报, 2012, 57(24): 2239–2248. SHI Wenzhong, QIN Kun, CHEN Jiangping, et al. Key Theories and Technologies on Reliable Dynamic Monitoring for National Geographical State[J]. Chinese Science Bulletin, 2012, 57(24): 2239–2248. |
[6] | SHI Wenzhong. Principles of Modeling Uncertainties in Spatial Data and Spatial Analyses[M]. New York: CRC Press, 2009. |
[7] | 茆诗松, 汤银才, 王玲玲. 可靠性统计[M]. 北京: 高等教育出版社, 2008. MAO Shisong, TANG Yincai, WANG Lingling. Reliability Statistics[M]. Beijing: Higher Education Press, 2008. |
[8] | ELSAYED E A. Reliability Engineering[M]. London: Springer, 2012. |
[9] | 赵宇. 可靠性数据分析[M]. 北京: 国防工业出版社, 2011. ZHAO Yu. Data Analysis of Reliability[M]. Beijing: National Defense Industry Press, 2011. |
[10] | 史文中. 空间数据误差处理的理论与方法[M]. 北京: 科学出版社, 1998. SHI Wenzhong. Theory and Methods for Handling Errors in Spatial Data[M]. Beijing: Science Press, 1998. |
[11] | FISHER P F.Models of Uncertainty in Spatial Data[C]//LONGLEY P, GOODCHILD M, MAGUIRE D, et al.Geographical Information Systems:Principles, Techniques, Management and Applications.New York:John Wiley & Sons, 1999:191-205. http://www.colorado.edu/geography/class_homepages/geog_4203_s08/class12_SDQUncertaintyA.pdf |
[12] | BAARDA W. Statistical Concepts in Geodesy[J]. Netherlands Geodetic Commission Publications on Geodesy, 1967, 2(4): 61–74. |
[13] | 李德仁, 袁修孝. 误差处理与可靠性理论[M]. 武汉: 武汉大学出版社, 2002. LI Deren, YUAN Xiuxiao. Error Processing and Reliability Theory[M]. Wuhan: Wuhan University Press, 2002. |
[14] | 史文中, 陈江平, 詹庆明, 等. 可靠性空间分析初探[J]. 武汉大学学报(信息科学版), 2012, 37(8): 883–887, 991. SHI Wenzhong, CHEN Jiangping, ZHAN Qingming, et al. Reliable Spatial Analysis[J]. Geomatics and Information Science of Wuhan University, 2012, 37(8): 883–887, 991. |
[15] | SHI Wenzhong, ZHANG Xiaokang, HAO Ming, et al. Validation of Land Cover Products Using Reliability Evaluation Methods[J]. Remote Sensing, 2015, 7(6): 7846–7864. DOI:10.3390/rs70607846 |
[16] | ZHANG Peng, LI Wenyuan, LI Sherwin, et al. Reliability Assessment of Photovoltaic Power Systems:Review of Current Status and Future Perspectives[J]. Applied Energy, 2013, 104: 822–833. DOI:10.1016/j.apenergy.2012.12.010 |
[17] | 张华, 史文中, 汪云甲. 遥感数据可靠性分类方法研究[M]. 北京: 测绘出版社, 2016. ZHANG Hua, SHI Wenzhong, WANG Yunjia. Study on Reliable Classification Methods Based on Remotely Sensed Imagery[M]. Beijing: Surveying and Mapping Press, 2016. |
[18] | FOODY G M. Status of Land Cover Classification Accuracy Assessment[J]. Remote Sensing of Environment, 2002, 80(1): 185–201. DOI:10.1016/S0034-4257(01)00295-4 |
[19] | CONGALTON R G, GU Jianyu, YADAV K, et al. Global Land Cover Mapping:A Review and Uncertainty Analysis[J]. Remote Sensing, 2014, 6(12): 12070–12093. DOI:10.3390/rs61212070 |
[20] | PAL M, FOODY G M. Feature Selection for Classification of Hyperspectral Data by SVM[J]. IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(5): 2297–2307. DOI:10.1109/TGRS.2009.2039484 |
[21] | PRESTELE R, ALEXANDER P, ROUNSEVELL M D A, et al. Hotspots of Uncertainty in Land-use and Land-cover Change Projections:A Global-scale Model Comparison[J]. Global Change Biology, 2016, 22(12): 3967–3983. DOI:10.1111/gcb.13337 |
[22] | JOHNSON B A, ⅡZUKA K. Integrating Open Street Map Crowdsourced Data and Landsat Time-Series Imagery for Rapid Land Use/Land Cover (LULC) Mapping:Case Study of the Laguna De Bay Area of the Philippines[J]. Applied Geography, 2016, 67: 140–149. DOI:10.1016/j.apgeog.2015.12.006 |
[23] | 陈军, 陈晋, 廖安平, 等. 全球30M地表覆盖遥感制图的总体技术[J]. 测绘学报, 2014, 43(6): 551–557. CHEN Jun, CHEN Jin, LIAO Anping, et al. Concepts and Key Techniques for 30 m Global Land Cover Mapping[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(6): 551–557. DOI:10.13485/j.cnki.11-2089.2014.0089 |
[24] | JURAN J M, GODFREY A B. Quality Handbook[M]. New York: McGraw-Hill, 1999. |
[25] | 张继贤, 顾海燕, 鲁学军, 等. 地理国情大数据研究框架[J]. 遥感学报, 2016, 20(5): 1017–1026. ZHANG Jixian, GU Haiyan, LU Xuejun, et al. Research Framework of Geographical Conditions and Big Data[J]. Journal of Remote Sensing, 2016, 20(5): 1017–1026. |