2. 山东科技大学, 山东 青岛 266590
2. Shandong University of Science and Technology, Qingdao 266590, China
当前,我国地理国情普查工作已取得阶段性成果,获取了大量地表形态数据、地表覆盖分类数据、重要地理国情要素数据[1-3],为开展常态化地理国情监测奠定了基础。水域是地理国情普查中重要的自然地理要素,是地表 12个一级类中之一。通过普查获取的全面、现势性强的水域数据包含了地表水资源的类别、位置、范围、面积等信息[4-6]。然而,内外业一体化采集的水域数据因其采集的复杂性及分层管理的需要,导致部分线状河流数据属性不明确,从而影响了数据在水文水务、河道管理、城市管网、环境保护等领域的进一步深入应用[7]。
目前,解决这种问题的办法多为人工修正[8-10],耗时、耗力且效率低下,因此,本文提出一种面向地理国情普查数据的水系要素属性自动校正算法,在系统分析水域数据特征的基础上,依据位置特征和拓扑关系对属性不明确的水系要素数据进行分类,进而对不同类型的河系数据制定出相应的属性校正规则,并据此设计属性数据自动校正处理方法,通过实际数据测试,验证了这些本文所提方法的合理性和有效性。
1 水域数据特征地理国情要素是地理国情普查的主要内容,根据《地理国情普查内容与指标》要求[11],地理国情要素共涉及5个一级类,16个二级类,47个三级类,其中水域数据是普查的一个主要类别[12-13]。水域数据包括水系要素和水系附属设施,数据内容见表 1。水系要素分为两个图层存储:HYDA和HYDL。其中,HYDA层存储高水位面状的水域数据,包括湖泊、水库、双线河、沼泽、干渠等;HYDL层存放采集的水域中心线和结构线。按照要求,河道实地宽度大于20 m的采集河道范围线构面,需同时采集结构线并赋相关属性;小于20 m的采集中心线,并赋相关属性[14]。城市地区,河道实地宽度大于5 m的采集河道范围线构面赋属性,需同时采集结构线;小于5 m的采集中心线,并赋要素属性[8]。
在地理国情基础地理信息水域数据成果中,水系要素有单线河,表示河流、运河、沟渠、时令河、干涸河等的双线河,以及由单线河或双线河穿越的湖泊、水库、池塘、时令湖、干涸湖等面状河流。河流网络由沿双线或多边形中心采集的水系结构线与单线河流连接构成。然而,成果数据中,单线河流线有明确的GB码属性,而当结构线数据有对应的水域面数据时,该结构线的属性没有明确标识,仅标记为“999999”,同时,汇入双线河的单线支流(中心线)与双线河流结构线之间加河流结构线连接,延伸部分算作单线支流的结构线,GB值也标记为“999999”。
如前所述,当根据GB码进行数据分层时,以常年河为例,只能识别出GB码标识为“230101002”的常年河线,在水系面内的结构线是无法识别出来的。这样的提取结果会造成常年河系的不完整性,对后续的河系结构化、河流选取综合、河流渐变的成图效果等都有影响。因此,需要对编码属性不明确的河流结构线进行属性赋值。目前在实际生产过程中,这部分工作主要还是靠人工识别进行处理的。这样不仅费时费力,而且数据质量无法保证,因此急需一种河流属性自动校正的算法。
2 线状水系要素属性自动校正原则与处理方法 2.1 水系结构线分类根据位置和拓扑关系的不同,将GB属性未定的HYDL水系结构线分为如下几种:
(1) 流入结构线:按照结构线的方向河流是汇入到水域面内的。关联了水域面外的河流中心线,或其他水域面的流出结构线,如图 1中的L2、L6等。
(2) 流出结构线:按照结构线的方向河流是流出水域面内的。关联了水域面外的河流中心线,或其他水域面的流入结构线,如图 1中的L4、L7等。
(3) 中间结构线:结构线完全在水域面内,结构线两端关联的是非面外河流结构线,如图 1中的L3。
(4) 单独结构线:关联一个水域面且这个水域面仅关联一个河流结构线,如图 1中L10、L11、L12三条弧段组成的结构线。
2.2 校正原则当为属性未定的水系结构线进行赋值时,根据水系要素结构线的空间特征和拓扑特征可以发现,属性未定的结构线通常与属性确定的结构线相连接或与属性确定的水域面对应,因此,可以根据空间关联性使用这些确定的属性对结构线进行赋值[15]。然而,简单的空间叠加关联赋值必然会发生同一条主干河流因流过水库、坑塘类水域面而赋予不同的属性值的情况,从而导致河流网络断裂、河流连通性差的问题。因此,属性赋值过程在满足邻近关联赋值的基础上,要同时满足河流的结构健壮性、拓扑延展性等一些基本原则与要求[16-18]:
(1) 结构健壮性原则。在赋值过程中应尽量保持河流网络通畅、完整,保证形成清晰可辨的河网结构,对于河流网络中主要的、明显的、突出的中心线路保证不间断。当人工实施时,经过直观定性分析,选择河流主线进行保留;当计算机自动化处理时,主要依赖河网可定量化的结构特征与拓扑特征。
(2) 拓扑延展性原则。在赋值过程中应尽量保持河流整体的拓扑延展性,可以添加某些长度较小但对于维持河流整体连通性具有重要作用的线路使河流平滑延展,如对汇入双线河的单线支流(中心线)与双线河流结构线之间加河流结构线并连接。当然对于线路之间位置关系的表达要做到清晰、合理。
2.3 校正方法由于结构线的拓扑关联性与水域结构线分布特征有关,因此选择水域面为基本校正处理单位,在一个处理单元中对水域面关联的所有结构线进行处理。此外,国情普查水域要素数据量较大,为提高运算效率,考虑使用结构线中点来代替线判断其与面状水域的空间关系。因此,属性校正过程如图 2所示。
2.3.1 拓扑预处理及拓扑关联关系在构建拓扑关系时,需对基础数据进行拓扑预处理,包括弧段自相交处理、结点拟合处理、去除重复线、去除假节点、删除冗余节点、删除短悬线、构建拓扑多边形等。依据图 1的拓扑特征,建立了结点拓扑关系树(如图 3所示)和点、线、面拓扑信息结构表(见表 2),拓扑关系树及拓扑信息结构表可以清晰地表达各个结点、弧段之间的拓扑关联性及拓扑连通性[19]。
2.3.2 水系要素结构线处理为了保证河网的完整性,根据水系要素中间结构线对应的面状水域是否为河网,可以将水域要素结构线分为两类:一类为河流、水渠类水域面关联的河网结构线;另一类为水库、坑塘类水域面关联的非河网结构线。下面依据邻近关联性原则、结构健壮性原则、拓扑延展性原则,分情况对未定属性的线状水系要素进行处理,处理方法如下:
2.3.2.1 流入结构线河网流入结构线:如果流入结构线关联了水域面外河流中心线,则将面外河流中心线属性赋值给流入结构线;如果关联的是水域面内的河流结构线,则将当前结构线所在的水域面属性赋值给流入结构线。
非河网流入结构线:如果水域面只有一条流入结构线,则将水域面外河流中心线或河流结构线的属性赋值给该结构线,并把该属性值标记为标准校正属性;如果有多条流入结构线,则首先根据流入结构线关联的水域面外河流结构线的等级情况和拓扑延展性确定合理的校正属性值,同时也将该属性值标记为标准校正属性。
2.3.2.2 中间结构线河网中间结构线:将所在水域面的属性赋值给中间结构线即可。
非河网中间结构线:将由流入结构线确定的标准校正属性赋值给中间结构线。
2.3.2.3 流出结构线河网流出结构线:将所在水域面的属性赋值给流出结构线即可。
非河网流出结构线:如果水域面只有一条流出结构线,则将由流入结构线确定的标准校正属性赋值给流出结构线;如果有多条流出结构线,则根据流入结构线关联的水域面外河流结构线的等级情况和拓扑延展性确定主流出结构线,将由流入结构线确定的标准校正属性赋值给它,其余的流出结构线和其关联的面域外河流中心线或结构线属性保持一致。
2.3.2.4 单独结构线河网单独结构线:即为无流入流出的中间结构线,将所在水域面的属性赋值给该单独结构线即可。
非河网单独结构线:将该单独结构线起点关联的河流结构线或中心线赋值给该结构线;如果起点不关联任何河流结构线或中心线,则赋终点关联河流结构线属性。
3 试验分析与评价本文在NewMap WJ-Ⅲ地图工作站开发接口的支撑下,使用C、C++语言进行二次开发,生成了河流属性自动校正程序模块;收集了广东省某市的部分水域数据,包括常年河、干涸河、漫流干河、地面干渠、地面支渠、水库、坑塘7类水系要素;使用不同数量的常年河线数据为例进行了试验,原始HYDL图层包含河流结构线和中心线751条,其中GB码为“210101002”(即常年河线)的有445条,GB码为“999999”(即待进行属性校正)的河流线有227条。原始数据如图 4(a)所示。
计算机自动处理所耗时间信息及处理结果见表 2、表 3及图 4(b)。可以看出,处理后HYDL图层中常年河有637条,相比原始数据增加了112条,对227条需要处理的河流个数均作了处理,仅出现错误1处,正确率达到了99.56%;相比手工选取效率更高,3次试验平均用时只有1.625 s。以往人工进行属性填写时,需经常查看已有属性,效率低,容易疲劳,且易出错。
从图 4的对比中可以看到,未经校正过的HYDL图层提取出的常年河图层数据明显缺失,无法形成完整的河系;而经过自动化属性校正后的HYDL图层提取的结果形成了完整的树状结构,效果明显。
4 结语本文面向国情普查水域数据,针对制图过程遇到的线状水系要素属性不明确的问题,提出了一种属性自动校正算法,经过对数据结构特征和拓扑关系的分析,提出了属性校正的三大基本原则,并依托中国测绘科学研究院研制的WJ-Ⅲ地图工作站实现了校正的自动化。广东省某市的常年河数据处理结果表明:该算法对所有属性未定河段都进行了处理,正确率较高,且处理后的河流数据形成了结构完整、拓扑连通性好的河流网络。下一步的研究是将属性赋值与不同水系要素的等级、名称等属性相似性判断结合起来考虑,使赋值更加合理。
[1] | 李德仁, 邵振峰, 丁霖. 地理国情信息的多级网格化表达[J]. 地理空间信息, 2014(1): 1–5. |
[2] | 陈俊勇. 地理国情监测的学习札记[J]. 测绘学报, 2012, 41(5): 633–635. |
[3] | 何建宁, 王辉, 王莉莉, 等. 地理国情监测图集的设计研究[J]. 测绘技术装备, 2013(4): 35–38. |
[4] | 高晖, 陈通, 施建辉. 高陵县地理县情图的编制[J]. 测绘标准化, 2016(1): 47–48. |
[5] | 陈燕妮, 王宏. 利用地理国情普查信息数据研究和实现地图自动化[J]. 测绘通报, 2015(7): 106–108. |
[6] | 王秀琴, 傅蓉. 浅析地理国情要素数据的质量检查[J]. 地理空间信息, 2015(2): 18–19. |
[7] | 李俊锋, 张养安, 姚丹, 等. 地理国情监测中水系特征提取与变化成因分析——以陕西省红碱淖为例[J]. 水利与建筑工程学报, 2014(2): 188–192. |
[8] | 徐强, 郑勤华. 浅谈地理国情要素信息采集成果的质量控制[J]. 江西煤炭科技, 2015(4): 89–91. |
[9] | 宋燕, 闫会杰, 杨霞. 浅谈地理国情普查数据的应用[J]. 测绘标准化, 2014(2): 5–7. |
[10] | 陈燕妮, 李成名. 基于NewMap DMP的地图自动化成图思考[J]. 测绘科学, 2012, 37(10): 1–4. |
[11] | 刘鹏珍. 基本地理市情监测数据组织管理和应用系统开发[D]. 太原: 太原理工大学, 2013. |
[12] | 程滔, 周旭, 刘若梅. 面向地理国情监测的地表覆盖信息提取方法[J]. 测绘通报, 2013(8): 84–86. |
[13] | 张勤, 樊文锋. 测绘与地理国情监测[J]. 测绘通报, 2012(11): 78–80. |
[14] | 兀伟, 邓国庆, 张静, 等. 地理国情监测内容与分类体系探讨[J]. 测绘标准化, 2012(4): 10–12. |
[15] | 艾廷华, 刘耀林, 黄亚锋. 河网汇水区域的层次化剖分与地图综合[J]. 测绘学报, 2007, 36(2): 231–236. |
[16] | 艾廷华, 刘耀林, 黄亚锋. 河网汇水区域的层次化剖分与地图综合[J]. 测绘学报, 2007, 36(2): 231–236. |
[17] | 李丽, 王结臣, 沈定涛, 等. 一种单线河流渐变符号的绘制方法[J]. 测绘通报, 2008(11): 64–67. |
[18] | 于蕾, 王欢, 岳耀, 等. 数字制图中河流渐变方法的设计与实现[J]. 山东理工大学学报(自然科学版), 2014(5): 76–78. |
[19] | 陈军, 刘万增, 李志林, 等. 线目标间拓扑关系的细化计算方法[J]. 测绘学报, 2006, 35(3): 255–260. |