2. 国家基础地理信息中心, 北京 100830;
3. 湖南科技大学地理空间信息技术国家地方联合工程实验室, 湖南 湘潭 411201
2. National Geomatics Center of China, Beijing 100830, China;
3. National-local Joint Engineering Laboratory of Geo-spatial Information Technology, Hunan University of Science and Technology, Xiangtan 411201, China
湿地是由潮湿或浅积水地带发育而成的水生生物群和水成土壤的地理综合体[1]。作为一种特殊的自然资源,它在物种保护、环境改善、气候调节及生态平衡方面发挥着重要作用,其相应研究日益成为国际环保界的热点[2-3]。利用野外调查等传统方式监测湿地,操作范围小、效率低,质量难以保证。遥感技术为湿地研究提供了强有力的技术支撑,在资源清查、分析提取方面优势显著[4-5]。随着湿地遥感应用的深入,各种统计方法、机器学习、计算机视觉等技术与湿地分类领域深度融合[6]。顾及湿地内在特征及计算机分类特点,综合运用自然、生态和人文等多元知识辅助遥感自动分类,从而确保湿地数据质量,是当前亟待解决的难题,同时大尺度的湿地细分通过将计算机自动分类与专家解译相结合来平衡精度与效率[6-8]。
作为研究不可或缺的信息支撑,全球湿地数据主要存在于水系、湖泊及各地表覆盖数据集。全球湖泊和湿地数据库(global lakes and wetlands database,GLWD)是综合性的湿地专题数据,依据已有湿地资料和地图汇编而成,包含河流、湖泊、水库矢量边界信息及不同湿地类型数据,因数据源、分类系统及信息更新等问题其适用性较低[9]。2003年国际湿地局联合欧空局启动GlobWetland项目,旨在论证对地观测技术在湿地管理与监测方面是否可行,尚未完成全球湿地遥感专题制图[10]。20世纪90年代以来,研究者开始逐步采用全球地表覆盖产品提供的湿地信息[11-13]。欧盟和美国利用AVHRR、MODIS、SPOT VGT等粗分辨率影像资料,相继研制出空间分辨率为300 m或1 km的地表覆盖数据(IGBP-DISCover、UMD、BU-MODIS、GLC2000、GlobCover2005、GlobCover2009),学者从面积、类型、空间一致性等方面检核认为湿地的总体分类精度偏低、空间细节不够,难以满足需求[10, 14-15]。
GlobeLand30是我国成功研制的全球首套30 m分辨率地表覆盖数据,涵盖湿地等分布信息[16-19]。其湿地层是指陆地和海洋系统中各种沼生、湿生区域的总称,包括沼泽、红树林、滩涂、盐沼等,不包括水田、裸露砾石河滩地和珊瑚礁(泻湖)。与以往数据相比,其具有更高的空间分辨率、更好的空间一致性和较高的精度;然而尚缺乏亚类信息,在一定程度上制约了其可用性。当前湿地应用研究迫切需要有关全球湿地分布、类型、面积等详尽信息,客观上为GlobeLand30湿地细化研究提供了机遇和动力。本文基于两期GlobeLand30湿地数据,开展了湿地亚类制图总体技术研究与产品研制工作,以期得到类型更加精细、结构更加完备的湿地亚类信息,力图为全球湿地管理保护、生态恢复及价值评估、环境变化和可持续发展研究等提供有力的信息支撑。
1 总体思路受“同物异谱、同谱异物”现象、分类算法、遥感数据源等因素的制约,利用遥感技术完成全球湿地亚类数据制图难度很大。基于GlobeLand30湿地层进行细化分类,不仅能够克服因遥感影像光谱、纹理特征存在的大区域制图难题,而且规避湿地遥感分类方法只适用于特定影像条件或局部区域,针对全球多源影像和湿地复杂特性时,单一方法难以取得较好分类效果的弊端。
1.1 湿地细化类别的定义国内外湿地的定义有很多,如Ramsar分类框架[22]、《湿地分类》(GB/T 24708—2009)等,这些湿地类型往往依据实地调查而制定,很难通过遥感手段获取。基于遥感对湿地进行大尺度细分,宏观提取只能到二级类别。作为全球首套30 m分辨率的地表覆盖数据集GlobeLand30,其湿地亚类的提出必须要兼顾遥感本身的特点。基于以上分析,研究制定了潮间带森林沼泽(含红树林)、潮间沼泽、淤泥质海滩、河口三角洲、河流洪泛湿地、季节性湖泊沼泽、森林沼泽、沼泽湿地8个亚类,图 1为湿地亚类在遥感影像上的表现特征。
GlobeLand30湿地亚类的提出不仅可与国际湿地局建议的分类框架接轨,而且可以与国内外分类体系进行相互关联和转换,为湿地数据的应用与共享奠定了坚实的基础。表 1给出了湿地亚类的详细定义,并与其他分类体系进行了比对。
编码 | GlobeLand30湿地 | 定义 | Ramsar分类 | GB/T 24708—2009 |
51 | 潮间带森林沼泽 (含红树林) | 红树林沼泽和海岸淡水森林沼泽 | 潮间带森林湿地 | 红树林 |
52 | 潮间沼泽 | 潮间地带包括盐沼等在内的非森林沼泽湿地 | 滨海盐沼 盐化草甸 | 潮间盐水沼泽 |
53 | 淤泥质海滩 | 潮间带由淤泥质组成的泥/沙海滩等 | 滩涂 沙滩/砾石/卵石滩 | 砂石海滩 泥质海滩 |
54 | 河口三角洲 | 河口系统周围冲积的泥/沙滩/沙洲等 | 河口三角洲 | 河口三角洲/沙洲/沙岛 |
55 | 河流洪泛湿地 | 围绕河流而形成的湿地系统 | 河流泛滥地 | 泛洪湿地 |
56 | 季节性湖泊沼泽 | 在充满水体的自然洼地周围组成的湿地 | 时令湖泊湿地 | 季节性湖泊湿地 |
57 | 森林沼泽 | 内陆以乔木为优势植被的森林沼泽 | 淡水森林沼泽 泥炭森林沼泽 | 森林沼泽 |
58 | 沼泽湿地 | 以灌丛、草本等为主的非森林沼泽 | 草本泥炭地 高山湿地 苔原湿地 灌丛湿地 绿洲湿地 内陆盐沼 永久性淡水草本沼泽 | 苔藓沼泽 草本沼泽 灌丛沼泽 内陆盐沼 季节性咸水沼泽 沼泽化草甸 绿洲湿地 |
针对GlobeLand30湿地细化问题,研究提出多元知识的分层分类策略,即依据地理区域、地貌类型、植被形态等指标因子,并顾及相互间的内在关联实现GlobeLand30湿地层的细分。首先考虑湿地地域分布格局,从整体上将滨海湿地和内陆湿地进行分离;其次依据典型湿地的地理地貌特点,实现湿地系统的筛选;最后基于植被的形态特征,完成沼泽类湿地的再分类。在保障分层分类策略实现的同时,对各环节进行严密的质量控制(如图 2所示)。
1.3 亚类数据精细化提取计算机分类技术极大地提高了湿地制图的效率,但精度也受地物特征、训练样本选择、分类器配置及阈值设定的影响。湿地复杂的内部特征导致依赖计算机自动分类难以取得较好的效果。因此,从高质量的全球湿地亚类数据产品的要求出发,将计算机分类与专家分析能力有机结合,平衡湿地分类精度与效率。
2 方法 2.1 基于先验知识的对象系统筛选长期以来,为了有效保障地物数据的质量,学者们在改进遥感自动分类方法的同时,结合自然、人文和生态等先验知识辅助分类。针对滨海湿地和内陆湿地的地域分布特征,研究结合先验知识实现初始分类,即利用2000、2010年海岸线数据和DEM(SRTM DEM和ASTER GDEM)高程信息建立空间缓冲区进行区域分离。在此基础上,依据河口三角洲、湖泊、河流湿地的自然地理分布特征及本身结构[23],叠合全球两期GlobeLand30河流与湖泊数据,通过专家解译完成对象系统的筛选(如图 3所示)。
2.2 基于森林数据的同位像元提取森林沼泽分类一直是湿地遥感信息提取研究的难点,涉及地形、土壤、水文等地理生态环境特征及遥感影像本身的特点,仅利用遥感信息获得全球森林沼泽几乎无法完成。本研究充分发挥GlobeLand30的数据优势,依据沼泽类湿地的植被形态特征,通过叠合同尺度、同分辨率、同时相的全球森林信息,实现表征森林沼泽的同位像元获取(如图 4所示)。由于马里兰森林数据在每个像素栅格上以0~100之间的百分数来表示,因此需准确掌握森林分位数的合理值。该比例的确定以各区域为研究单元,通过反复抽样试验的人机交互方式实现,并利用Google Earth高分辨率影像对边界、类型、区域进行目视判断选取最佳经验性数值。
2.3 基于最佳阈值的极大似然掩膜无植被湿地在遥感影像上具有明显的光谱变化差异,为自动阈值分类的实现提供了理论基础。阈值不同对图像进行二值化处理的结果也不同,阈值偏高或偏低均影响目标提取精度及信息的完整程度[24]。由于在灰度图像中有限的辨识度很容易忽略掉关键变化,因此研究选择NDVI作为指标,利用高斯分布模型的EM算法确定阈值范围,以克服人机交互选择的弊端,从而实现目标区域的分类。研究假设灰度图像上目标类wn和背景类wc的概率密度函数服从高斯分布,均值和方差分别用mn、δn2、mc、δc2表示。采用EM算法估计统计分布参数计算公式如下
式中,t和t+1分别代表当前和下次迭代所用的估计值;I、J代表图像的行数和列数;X(i, j)表示图像中第i行j列的灰度值。当邻近两次迭代计算的P(wi)、mi和δi的值小于给定的阈值ε(ε=10-8)时,迭代终止。应用EM算法的关键是如何确定待估计参数的初始值,根据灰度图像的自身特点,选取合理阈值以构造高置信度灰度子集,实现待定参数初始值的估计。基于灰度直方图中目标值集中于中间区域,背景值在左右两边的分布特征,利用如下方法在直方图左右各选取阈值Tn、Tc
式中,α∈(0, 1)为权重调节因子。以子集Sn={X(i, j)|X(i, j)<Tn}和Sc={X(i, j)|X(i, j)>Tc}作为背景灰度的初始典型样本集,其余则归为目标样本Su={X(i, j)|Tn≤X(i, j)≤Tc}。然后以此为基础分别按式(5)计算先验概率、均值和标准差的初始值。得到分布参数初始估计后,代入式(2)、式(4)进行迭代运算,更新参数直至收敛,确定此时估计参数值,并通过式(6)计算图像分类阈值Tn、Tc。当Tn≤X(i, j)≤Tc,则X(i, j)∈wc,归属目标类;否则X(i, j)∈wn,归属背景类。利用最优空间掩膜剔除目标类中包含的非湿地信息,再通过最大似然法将淤泥质海滩准确提取出来(如图 5所示)。获得森林沼泽及淤泥质海滩的同时,对沼泽类湿地进行掩膜处理得到潮间沼泽和沼泽湿地。
3 工程实现 3.1 基础数据研究采用的基础数据为全球两期30 m地表覆盖数据集GlobeLand30、全球Landsat TM影像、全球30 m分辨率森林数据(Global_Forest)、两期全球DEM数据(包括SRTM DEM和ASTER GDEM)、Google Earth高分影像和海岸线数据(见表 2)。
数据源 | 分辨率/m | 来源 | 用途 |
GlobeLand30 | 30 | 国家基础地理信息中心 | 湿地分类 |
Landsat TM遥感影像 | 30 | http://glovis.usgs.gov | 提取湿地信息 |
Global_Forest | 30 | 美国马里兰大学 | 森林湿地提取 |
全球DEM | 30/90 | 美国NASA | 类型筛选 |
Google Earth高分影像 | — | Google网站 | 辅助解译、精度评价 |
海岸线数据 | 250 | 国家地球系统科学网 | 建立空间缓冲区 |
产品研制是将主体分类方法与生产规范、质量控制等成套的技术体系相结合,应用于标准化产品生产的过程。GlobeLand30湿地细化涉及693个图幅,两期共计1386个图幅。工程实现首先完成数据收集与处理,其次按照分层分类流程批量完成区域分离和对象筛选,以及基于植被形态的计算机分类。其中重点解决的难题包括参考资料的收集与筛选、顾及湿地空间结构的完整性、基于植被形态阈值范围的调整、计算机自动分类效率的提高、数据产品的质量控制等。
受作业人员综合素质、资料采集与处理、算法特点等因素影响,在产品的研制过程中质量问题无法避免。为实现更精确的全球湿地分类制图,工程实践中需对数据成果进行优化。一方面,通过对象化过滤、聚类等技术剔除像元级图斑或对其图斑进行重新分类,并利用形态学算子或像元阈值,解决各分类数据内存在的空间连续性问题;另一方面,依据测绘产品规定,并参照测绘产品质量控制体系,由工作人员通过1:1比例逐图幅进行完整全面的整体检查。对于数据分类精度不达标的图幅应查明原因,针对具体问题制定相应的修改方案并严格落实,直至数据精度符合既定要求为止。进而通过分类赋值、顺序叠加与拼接、数据集成等操作形成最终的GlobeLand30湿地亚类数据产品。
3.3 精度评价基于位置信息或非位置信息对分类结果进行评价,是精度分析常用的两种方式[25]。研究基于位置信息评价分类结果,为保证每个类别均能在采样中出现,采用分层采样即对每个类别随机选择样本点。样本个数按8类地物统计面积比进行近似分配,对分类精度进行最优无偏估计。由于样本点的数量直接影响精度评价的合理性,样本数量过多或过少都不科学,本文依据式(7)的计算方法对样本点进行选取[26]
式中,N为样本点个数;B由自由度为1的卡方检验(1-α/K)的临界值确定,α为精度评估要求,K为分类数;C为置信度偏差。
将GlobeLand30湿地细分为8个类别(如图 6所示),假设置信度达95%,允许的误差范围为5%,在没有先验知识的情况下,B=γ2(1,0.993 8)=7.475,由式(7)得出至少需要748个样本点才能保证精度验证的准确性。研究利用ArcGIS软件对分类数据随机生成1000个采样点,结合Google Earth高分辨率影像统计分类正确和错误的样本数量,从而构建精度检验混淆矩阵,并计算分类精度及Kappa系数,已达到对湿地细分结果进行精度评价的目的(见表 3)。
类别 | 潮间带森 林沼泽 | 潮间 沼泽 | 淤泥质 海滩 | 河口 三角洲 | 河流 湿地 | 湖泊 湿地 | 森林 沼泽 | 沼泽 湿地 | 总和 |
潮间带森林沼泽 | 42 | 6 | 0 | 0 | 0 | 0 | 1 | 1 | 50 |
潮间沼泽 | 6 | 40 | 2 | 0 | 0 | 0 | 0 | 2 | 50 |
淤泥质海滩 | 0 | 3 | 82 | 8 | 4 | 0 | 2 | 1 | 100 |
河口三角洲 | 1 | 2 | 9 | 33 | 1 | 0 | 0 | 4 | 50 |
河流湿地 | 0 | 0 | 0 | 0 | 141 | 1 | 3 | 5 | 150 |
湖泊湿地 | 0 | 2 | 0 | 0 | 0 | 41 | 0 | 7 | 50 |
森林沼泽 | 0 | 0 | 0 | 0 | 3 | 6 | 302 | 39 | 350 |
沼泽湿地 | 0 | 0 | 0 | 0 | 13 | 6 | 36 | 145 | 200 |
总和 | 49 | 53 | 97 | 41 | 162 | 53 | 344 | 204 | 1000 |
制图精度/(%) | 85.71 | 75.47 | 84.54 | 80.48 | 87.04 | 77.39 | 87.79 | 71.08 | |
用户精度/(%) | 84 | 80 | 82 | 66 | 94 | 82 | 86.29 | 72.5 | |
总体精度/(%) | 82.6 | Kappa系数:0.781 |
由表 3可知,GlobeLand30湿地细化分类制图总体精度达82.6%,Kappa系数为0.781,具备较好的一致性特点,能够达到基本精度要求。从分类的精度看,基于人工解译的对象筛选能达到较好的分类效果。潮间带森林沼泽和森林沼泽的制图精度、用户精度较高,达85%左右,说明基于植被形态分类其阈值比例设置较为合理。相较之下沼泽湿地和淤泥质海滩精度则略偏低,体现出一定的漏分和错分现象。原因主要有两方面:一是在宏观尺度上无植被类像元数据量较少,部分像元代表了几种混合地物的特征,受混合特征影响后期处理误分为沼泽湿地,导致精度降低;另一方面虽然无植被类湿地典型,灰度图像表现出与植被覆盖类型差异的特征,然而受时相、水文等因素影响无法对稀薄的覆盖类型进行全部剔除。尽管阈值设定合理、科学,但仅利用NDVI指标进行淤泥质海滩的提取还存在一定的局限。
4 结论与展望本研究针对GlobeLand30湿地数据细化问题,创建了层次化的总体技术方法,用于研制出两期全球湿地亚类数据产品,总体精度达80%以上,较好地满足了当前的应用研究需求。在保证精度的同时,克服了常规手段普遍存在的周期长、效率低、受客观条件限制难以完成等弊端,实现了全球尺度上较高分辨率湿地亚类数据的快速精确制图,为全球湿地管理保护、生态恢复及可持续发展研究等提供了重要的信息支撑。鉴于全球范围内湿地类型复杂各异,对沼泽湿地等存在一定的错分和漏分,在今后的实践中应进一步完善,并提高方法的自动化应用水平。下一步工作将对两期湿地亚类数据进行统计分析,完成全球湿地空间分布格局及10年变化(2000—2010年)统计分析报告,为国际、国内的相应机构提供可靠的决策参考。
[1] | 李禄康. 湿地与湿地公约[J]. 世界林业研究, 2001, 14(1): 1–7. |
[2] | 杨永兴. 国际湿地科学研究的主要特点、进展与展望[J]. 地理科学进展, 2002, 21(2): 111–120. DOI:10.11820/dlkxjz.2002.02.003 |
[3] | 吕宪国, 黄锡畴. 我国湿地研究进展——献给中国科学院长春地理研究所成立40周年[J]. 地理科学, 1998, 18(4): 2–9. |
[4] | 李建平, 张柏, 张泠, 等. 湿地遥感监测研究现状与展望[J]. 地理科学进展, 2007, 26(1): 33–43. DOI:10.11820/dlkxjz.2007.01.004 |
[5] | 张树文, 颜凤芹, 于灵雪, 等. 湿地遥感研究进展[J]. 地理科学, 2013, 33(11): 1406–1412. |
[6] | CHEN J, LIAO A, CAO X, et al. Global Land Cover Mapping at 30 m Resolution:A POK-based Operational Approach[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 103: 7–27. DOI:10.1016/j.isprsjprs.2014.09.002 |
[7] | 廖安平, 陈利军, 陈军, 等. 全球陆表水体高分辨率遥感制图[J]. 中国科学(地球科学), 2014, 44(8): 1634–1645. |
[8] | 张委伟, 陈军, 廖安平, 等. 顾及多元知识的GlobeLand30检核优化模型[J]. 中国科学(地球科学), 2016, 46(9): 1149–1161. |
[9] | LEHNER B, DÖLL P. Development and Validation of a Global Database of Lakes, Reservoirs and Wetlands[J]. Journal of Hydrology, 2004, 296(1): 1–22. |
[10] | 牛振国, 单玉秀, 张海英. 全球土地覆盖GlobCover2009数据中的中国区域湿地数据精度评价[J]. 湿地科学, 2012, 10(4): 389–395. |
[11] | TOWNSHEND J, JUSTICE C, LI W, et al. GLC Classifi-cation by Remote Sensing:Present Capabilities and Future Possibilities[J]. Remote Sensing of Environment, 1991, 35(2-3): 243–255. DOI:10.1016/0034-4257(91)90016-Y |
[12] | DEFRIES R S, TOWNSHEND J R G. GLC Characterization from Satellite Data:From Research to Operational Implementation[J]. Global Ecology & Biogeography, 1999, 8(5): 367–379. |
[13] | VERBURG P H, NEUMANN W, LINDA N L. Challenges in Using Land Use and Land Cover Data for Glodal Change Studies[J]. Glodal Change Biology, 2011, 17(2): 974–989. DOI:10.1111/gcb.2010.17.issue-2 |
[14] | HEROLD M, MAYAUX P, WOODCOCK C, et al. Some Challenges in GLC Mapping:An Assessment of Agreement and Accuracy in Existing 1 km Datasets[J]. Remote Sensing of Environment, 2008, 112(5): 2538–2556. DOI:10.1016/j.rse.2007.11.013 |
[15] | 宫鹏. 遥感科学与技术中的一些前沿问题[J]. 遥感学报, 2009, 13(1): 13–22. |
[16] | 廖安平, 彭舒, 吴昊, 等. 30 m全球地表覆盖遥感制图生产体系与实践[J]. 测绘通报, 2015(10): 4–8. |
[17] | 陈利军, 陈军, 廖安平, 等. 30 m全球地表覆盖遥感分类方法初探[J]. 测绘通报, 2012(S0): 350–353. |
[18] | CHEN Jun, BAN Yifang, LI Songnian. China:Open Access to Earth Land-cover Map[J]. Nature, 2014, 514(7523): 434. |
[19] | 陈军, 陈晋, 廖安平, 等. 全球30m地表覆盖遥感制图的总体技术[J]. 测绘学报, 2014, 43(6): 551–557. |
[20] | 唐小平, 黄桂林. 中国湿地分类系统的研究[J]. 林业科学研究, 2003, 16(5): 531–539. |
[21] | 牛振国, 宫鹏, 程晓, 等. 中国湿地初步遥感制图及相关地理特征分析[J]. 中国科学(地球科学), 2009, 39(2): 188–203. |
[22] | 国家林业局《湿地公约》履约办公室. 湿地公约履约指南[M]. 北京: 中国林业出版社, 2001: 16-17. |
[23] | 于兴河, 李胜利, 李顺利. 三角洲沉积的结构——成因分类与编图方法[J]. 沉积学报, 2013, 31(5): 782–797. |
[24] | 李琳琳. 遥感图像分割中阈值的自动选取技术研究[D]. 兰州: 兰州大学, 2012. http://cdmd.cnki.com.cn/Article/CDMD-10730-1012373043.htm |
[25] | 魏飞鸣. 基于对象信息的遥感影像分类研究[D]. 成都: 电子科技大学, 2008. http://cdmd.cnki.com.cn/article/cdmd-10614-2008121564.htm |
[26] | TORTORA R. A Note on Sample Size Estimation for Multinomial Population[J]. The American Statistician, 1978, 32(3): 100–102. |