测绘地理信息   2022, Vol. 47 Issue (6): 81-85
0
基于高分辨率遥感的水源地风险源提取技术研究[PDF全文]
曹琪1,2,3,4, 郑雅兰1,2,3,4, 沈谦1,2,3,4, 汪闽1,2,3,4    
1. 南京师范大学地理科学学院,江苏 南京,210023;
2. 教育部虚拟地理环境重点实验室(南京师范大学),江苏 南京,210023;
3. 江苏省地理信息资源开发与利用协同创新中心,江苏 南京,210023;
4. 地理环境演化国家重点实验室培育基地(江苏省),江苏 南京,210023
摘要: 风险源提取是实现饮用水源地遥感监测的重要技术环节。基于高分遥感的风险源提取的技术方法体系, 研发了结合面向对象和深度学习技术的风险源提取方法并进行了软件实现。以图像分割为基础通过面向对象深度学习分类提取大尺度自然分险源, 再利用语义分割提取各类人工分险源, 实现了不同分险源的分级提取。依托相应软件系统, 以高分二号影像为主要数据源, 以南京市夹江水源地为示范区开展了风险源提取试验。结果表明系统实现了包括水源地水体分布, 以及水体周边建筑物、道路、农、林等多类人工、自然风险源目标的准确提取。
关键词: 饮用水源地    风险源    面向对象图像分析    深度学习    语义分割    
Research on Risk Source Extraction of Water Source Areas Based on High Resolution Remote Sensing
CAO Qi1,2,3,4, ZHENG Yalan1,2,3,4, SHEN Qian1,2,3,4, WANG Min1,2,3,4    
1. School of Geography, Nanjing Normal University, Nanjing 210023, China;
2. Key Laboratory of Virtual Geographic Environment(Nanjing Normal University), Ministry of Education, Nanjing 210023, China;
3. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China;
4. State Key Laboratory Cultivation Base of Geographical Environment Evolution(Jiangsu Province), Nanjing 210023, China
Abstract: Risk source extraction is an important technical step for remote sensing monitoring of drinking water sources.The research group builds up a technical framework for risk source extraction from high-spatial-resolution images by combining object-based image analysis(OBIA)and deep learning techniques. On the basis of image segmentation, the largescale natural risk sources are classified by object-based deep learning classification, and various artificial risk sources are extracted by semantic segmentation, so as to realize the hierarchical extraction of different risk sources. Experiments of risk source extraction at the Jiajiang water source area of Nanjing city were carried out based on GF-2 imagery. The software system accurately extracts the distribution of water bodies, and different kinds of artificial and natural risk sources including buildings, roads, agriculture and forest lands around water bodies.
Key words: drinking water source    risk source    object-oriented image analysis    deep learning    semantic segmentation    

水源地的风险源,主要指的是可能对水环境生态安全,重点对流域内水体水质产生较大影响的,为此对于水污染防治与监控预警具有重要指示价值的人类活动区域、场所或目标,其中包括固定源、移动源等[1]。固定源是指水体周边的居民地、农田、工矿用地、仓储建筑用地、水工建筑(码头堤坝、水面桥梁),以及人工养殖基地等场所或目标;移动源是指运营化学药品的车辆、船舶等,一旦发生事故,如泄露、爆炸等,有可能造成严重水体污染。风险源作为引起水环境问题的根源,对其快速识别和监测对水环境的改善有至关重要的作用。卫星遥感具有观测范围广、信息量大、获取信息快、更新周期短并且可以进行历史对比等特点,是能在瞬时获取地表“面状”分布的技术手段,为此在风险源监测中得到高度重视。利用高分遥感手段,进行水环境(如水源地)风险源遥感自动识别与动态监测是水环境监测的重要需求。在此基础上,可利用已提取的风险源,根据各类风险源与水源地的距离、影响程度等,划分不同风险源的风险等级,建立饮用水源地环境安全评价指数,实现饮用水源地环境安全评价。

面向对象分类方法(object-based image analysis, OBIA)是实现高分遥感信息提取与分析的有效技术。OBIA进行影像分析的最小单元是分割图斑(也称为对象基元),并在其基础上进行特征提取与分析[2, 3]。在OBIA的技术框架下,人工地物识别多采用地物光谱、形状、纹理以及地物空间关系(如建筑物和阴影的关系)进行知识规则的综合建模提取模式,具有特征丰富、与人使用知识规则推理的思维方式一致的优点[4]。目前以OBIA和目视结合的方式开展高分影像上的风险源遥感识别较为常见。姚延娟等[4]基于SPOT5、ZY-02C、ZY-3等多种卫星数据,在构建饮用水源地生态环境监察分类体系的基础上,以OBIA分类结合人工解译方法对我国25个典型湖库型饮用水源地保护区的非点源风险进行提取,得到非点源风险源的空间分布,并对风险进行了定量评估。由于OBIA技术需要用户显式指定特征、制定知识规则,对用户依赖性较高,降低其技术体系对用户依赖和参数依赖,提高分割质量等,是OBIA的现实问题[5]

当前,以卷积神经网络(convolutional neural network, CNN)模型为典型代表的深度学习技术在遥感应用领域取得重要突破。深度学习技术通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示[6]。相较于传统的人工定义指数和浅层机器学习方法,卷积神经网络模型通过对海量图像的深层特征建模实现了图像信息的自动提取,打破人工提取特征的局限性,在提高目标检测和识别、图像分割和图像分类等方面精度上取得了突破[7, 8]。例如,Zhang等[9]提出了一种结合残差学习和U-Net优点的语义分割神经网络,用于道路的提取,在Massachusetts数据集上的提取效果优于现有神经网络模型。崔卫红等[10]提出一种基于多尺度影像的建筑物提取方法,其将原始影像进行不同尺度的下采样,提取不同尺度下的建筑物特征,并将这些多尺度特征相加合并,同时用全卷积上采样代替原始VGG16网络中的全连接层进行建筑物提取,取得较高的提取精度。季顺平等[11]建立了一套范围大、精度较高、航空/航天数据源的建筑物数据库,提出改进的FCN(fully convolutional network)和Mask R-CNN(region-CNN)建筑物提取方法,并推广至目标实例分割,与最先进的方法相比达到了领先水平。与人工设计特征方法相比,深度学习技术往往需要大量训练数据以保证模型质量,虽然可进行迁移学习[12],但模型的迁移能力往往有一定局限性[13]

本文的设计思路和目标是发挥OBIA和深度学习技术各自的技术特色和优势,建立OBIA和深度学习技术有机融合的高分遥感风险源遥感提取识别技术方法体系,实现诸如建筑、道路、农田、养殖基地、工矿等风险源目标的精确识别与提取。在此基础上,建立饮用水源地环境安全评价模型,实现饮用水源地环境安全评价。

1 技术方法体系 1.1 技术流程

本文的风险源提取技术路线如图 1所示,采用由粗到精两级分类模式实现多类风险源目标提取。首先利用基于硬边界约束的遥感图像分割方法进行图像分割,获取对象基元。在基元基础上,通过面向对象方式的样本采集,进行深度学习的模型训练和分类,同时实现了水陆分割、岸边带缓冲区的建立,以及大尺度自然风险源如农田、林地、草地的提取。对于建筑物、道路类型等人工目标,在岸边缓冲区的掩膜限定下,利用基于深度学习的语义分割等技术进行目标提取识别。目标提取后,重建对象基元,并利用面线基元关联模型(region-line primitive association framework, RLPAF)[14],依托对象基元的多类特征建立优化规则,实现风险源目标的形态优化和精确提取。

图 1 风险源提取技术路线 Fig.1 Technical Route of Risk Source Extraction

1.2 关键技术 1.2.1 多精度遥感影像分割

图像分割是实现OBIA的必要步骤。本文自主研发的基于硬边界约束的遥感图像分割方法是一种结合边缘和区域的图像分割方法,该方法利用亚基元分割、多光谱边缘提取、分阶段基元合并等方式,将图像边缘嵌入基元合并过程,可实现高分影像的快速、高精度分割[15]。该方法通过多尺度特征基元的层次融合实现多精度图像分割,并利用尺度参数控制基元大小。此外,构建对象网络,记录同层对象的相邻、包含关系,以及上下相邻图层间父子对象的继承关系,为后续目标判别提供空间结构信息。为兼顾算法效率,采用图像分块、并行计算等方式提高算法效率满足应用需求。

1.2.2 面向对象深度学习分类

面向对象分类能充分表达对象之间的语义信息,深度学习分类能体现不同的效果和精度,两者分类方式的输入接口不同,面向对象分类是通过分割构建多边形处理对象,而深度学习分类是利用矩形分类样本进行分类,为了将面向对象分类和深度学习分类优势结合互补,通过多精度分割获取图斑基元,沿图斑轴线进行多尺度分类样本采集,然后重采样到统一大小输入深度网络进行分类预测。对深度神经网络进行改造,将SENet的Squeeze-and-Excitation(SE)模块嵌入到Google Net的inception模块当中,构建基于多尺度融合的新型深度网络模型,从而实现多尺度样本特征提取与特征加权融合。利用已预学习的深度模型经过增量训练得到修正模型,然后利用修正模型进行图斑类型分类预测,一个图斑有多个分类样本,最后根据分类样本的分类结果进行投票,将最大概率类型作为图斑基元的最终分类结果。

1.2.3 高分遥感影像的语义分割

利用基于深度学习的语义分割技术,实现了风险源目标与背景的二分类。语义分割对于样本标注质量要求较高,设计了基于分割图斑的样本采集、人工标注结合的方式,提供训练样本。为了提高方法适用性,以U-Net语义分割模型为基础,在其基本架构上加入了非对称卷积和空洞卷积结构,使其适用于风险源提取的二分类任务模式。风险源通常不具有规则分布,非对称卷积核取代规则卷积核可以让模型能够针对性学习不同方向上的对象特征;目标风险源大小各不相同的问题普遍存在,于网络中添加空洞卷积可以让模型针对性学习不同尺度上的对象特征,增加网络适应性,提升了模型在遥感图像上的适用性和分类性能。此外,通过语义分割的概率输出,将分类和语义分割技术相融合,限定语义分割范围,提升目标提取精度;分割结束后,对目标物进行斑块重建,形成初始对象基元,并通过OBIA规则进行形态调整,实现风险源目标的精确提取。

1.2.4 风险源的分级提取

针对不同类别风险源的特点采用了不同的提取策略。系统采用特征基元的深度分类直接提取农田、林地、草地等大尺度风险源。针对码头等形态多样的小尺度风险目标,采用一级深度(监督)分类和二级规则分类的两级分类模式进行提取识别,克服样本量不足影响。总体思路是采用分阶段逐步求精的策略,即首先用监督分类模型实现一级水陆划分和主要类别分类,其次利用规则分类的方式,主要依托基元间的拓扑与尺度等空间关系等进行分类粒度的再精化。通过以上一级监督、二级规则分类有机结合的方式,最终实现小尺度风险源目标的准确提取。

2 技术实现与应用示例 2.1 技术实现

本文设计的系统采用VC++开发语言、Python、SQL Server数据库、开源GIS软件QGIS、深度学习框架Tensorflow以及GDAL开源库等主流开发语言、工具与算法库实现。风险源识别子系统作为分系统的重要模块,连同图像预处理、城镇黑臭水体遥感识别、水质参数遥感反演模块构成分系统4大子系统,共同为黑臭水体识别、水质参数反演提供基础数据,实现水环境遥感监测与评价的总体目标。

系统总体设计如图 2所示。水源地风险源动态监测子系统以面向对象图像分析技术、面线基元关联技术框架,以及深度学习等技术,实现风险源提取和变化检测以及环境安全评价等功能,其中,风险源遥感识别子系统的业务逻辑是:对中高分辨率遥感图像,在地面实测、基础地理数据的支撑下,通过多精度遥感图像分割和特征提取,输出面线基元,计算基元特征库。利用深度学习监督分类与规则分类、语义分割,实现专题目标识别和输出风险源目标,将以上信息输入环境安全评估模块,输出城镇饮用水源地环境安全评估结果。此外,风险源动态监测子系统功能模块包括图像批分割、OBIA深度学习分类等,共同实现多级、多类风险源提取。系统由主体界面和批分割模块、样本采集模块、语义分割模块等子模块组成。

图 2 城镇水体水质高分遥感监测分系统 Fig.2 High Resolution Remote Sensing Monitoring Sub-system of Urban Water Quality

2.2 实验设计 2.2.1 实验数据说明

研究采用的数据源是南京市饮用水取水地夹江区域的高分二号融合后影像,成像时间为2018年12月12日,分辨率为1 m。根据江苏省政府关于县级以上集中式饮用水水源地保护区划分方案和《饮用水水源保护区划分技术规范》(HJ/T338—2007),将注入南京夹江内的秦淮新河作为水域影响区域,将保护区水域向两岸外延1 000 m范围作为陆域影响区域[16-18],最终确定南京夹江饮用水源地各级保护区范围如图 3所示。

图 3 南京市夹江饮用水源地各级保护区划分 Fig.3 Jiajiang Drinking Water Source Protection Area of Nanjing City

2.2.2 实验参数设置

深度学习模型的训练精度依赖于大量带有标签的样本,因此,在进行深度学习分类和语义分割训练前均采用数据增广技术如旋转、平移和翻转等对样本进行扩充,以避免模型训练出现过拟合现象。

在使用面向对象深度学习分类方法提取农田、林地、草地大尺度地物时,基于面向对象采样方式采集样本,并将样本数量扩充到9 000个,其中训练样本6 000个,测试样本3 000个,设置模型训练批次为25,批次大小为8,学习率为0.000 1。对已经预学习过的Google Net模型进行增量训练,然后利用增量后的模型对图斑轴线采样的分类样本进行分类预测,最后以投票次数最多的类型作为图斑分类类型。

在训练语义分割模型时,通过面向对象采样和人工标注相结合的方式采集样本,并将样本数量扩充到10 000个,其中训练样本5 000个、验证样本2 500个、测试样本2 500个。随后,设置模型训练批次为30,批次大小为8,采用RMSProp优化器并设置学习率为0.000 1,对改进的U-NET模型进行训练并提取道路、建筑物等人工地物。

2.3 评价指标

本文中自然风险源提取结果使用总体精度和Kappa系数进行评价。总体精度为分类正确的样本个数占所有样本个数的比例,Kappa系数是一种评估一致性的方法,可用它来进行多分类模型准确度的评估,其取值范围是[-1, 1]。总体精度和Kappa系数的值越高,则代表分类准确度越高。

语义分割结果利用平均交并比(mean intersection over union, m Io U)来进行精度评价,它是语义分割的标准度量。m Io U计算两个集合的交集和并集之比,在语义分割的问题中,这两个集合分别表示真实值和预测值。这个比例可以变形为正真数(交集)比上真正、假负、假正(并集)之和。在每个类上计算Io U,之后取平均,其值越大表明正确分割的精度越高。

2.4 结果分析

部分风险源提取结果如图 4所示,通过统计总的样本数和各类别正确预测样本个数,计算得到农田、林地、草地分险源提取的总体精度为0.863, Kappa系数为0.812,语义分割方法提取建筑物和道路的m Io U值分别为86%和80%。实验表明,采用深度学习与OBIA技术结合的方式能够有效提取各类风险源并具有较高的提取精度。在足量样本支撑条件下,具有较高的提取精度。

图 4 研究区域部分风险源提取效果图 Fig.4 Risk Source Extraction Results

3 结束语

本文将深度学习技术和OBIA技术进行有机结合和技术集成,建立了基于高分遥感的风险源目标识别与提取的技术方法体系,研发了结合面向对象深度学习分类和语义分割的风险源遥感识别软件系统。在以南京市夹江水源地区域为示范区进行的实验结果表明,该系统可以实现对多类自然和人工风险源目标的准确提取。进一步的研究将通过开发、集成水源地安全评估模型,开展系统在夹江、太湖等水源地安全评价方面的应用。

参考文献
[1]
城市水源地突发污染事故风险源项辨识与分析[J]. 人民长江, 2008, 39(23): 19-20. DOI:10.3969/j.issn.1001-4179.2008.23.006
[2]
Baatz M, Schape A. Multiresolution Segmentation: An Optimization Approach for High Quality MultiScale Image Segmentation[J]. Angewandte Geographische Informations Verarbeitung, 2000(12): 12-23.
[3]
基于分水岭变换与空间聚类的高分辨率遥感影像面向对象分类[J]. 遥感技术与应用, 2010, 25(5): 597-603.
[4]
饮用水源地非点源风险遥感提取及定量评估[J]. 环境科学研究, 2013, 26(12): 1349-1355. DOI:10.13198/j.issn.1001-6929.2013.12.013
[5]
Jyothi N B, Babu G R, Krishna V M I. Object Oriented and Multi-scale Image Analysis: Strengths, Weaknesses, Opportunities and Threats—A Review[J]. Journal of Computer Science, 2008, 4(9): 706-712. DOI:10.3844/jcssp.2008.706.712
[6]
Ball J E, Anderson D T, Chan C S. A Comprehensive Survey of Deep Learning in Remote Sensing: Theories, Tools and Challenges for the Community[J]. Journal of Applied Remote Sensing, 2017, 11(4): 2609-2663.
[7]
Girshick R, Donahue J, Darrell T, et al. RegionBased Convolutional Networks for Accurate Object Detection and Segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2016, 38(1): 142-158. DOI:10.1109/TPAMI.2015.2437384
[8]
Kussul N, Lavreniuk M, Skakun S, et al. Deep Learning Classification of Land Cover and Crop Types Using Remote Sensing Data[J]. IEEE Geoscience and Remote Sensing Letters, 2017, 14(5): 778-782. DOI:10.1109/LGRS.2017.2681128
[9]
Zhang Z, Liu Q, Wang Y. Road Extraction by Deep Residual U-Net[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(5): 749-753. DOI:10.1109/LGRS.2018.2802944
[10]
多尺度全卷积神经网络建筑物提取[J]. 测绘学报, 2019, 48(5): 597-608.
[11]
遥感影像建筑物提取的卷积神经元网络与开源数据集方法[J]. 测绘学报, 2019, 48(4): 448-459.
[12]
Hu F, Xia G S, Hu J, et al. Transferring Deep Convolutional Neural Networks for the Scene Classification of High-Resolution Remote Sensing Imagery[J]. Remote Sensing, 2015, 7(11): 14680-14707. DOI:10.3390/rs71114680
[13]
Pan S J, Yang Q. A Survey on Transfer Learning[J]. IEEE Transactions on Knowledge and Data Engineering, 2010, 22(10): 1345-1359. DOI:10.1109/TKDE.2009.191
[14]
Wang M, Wang J. A Region-Line Primitive Association Framework for Object-Based Remote Sensing Image Analysis[J]. Photogrammetric Engineering & Remote Sensing, 2016, 82(2): 149-159.
[15]
Wang M, Li R. Segmentation of High Spatial Resolution Remote Sensing Imagery Based on Hard-Boundary Constraint and Two-Stage Merging[J]. IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(9): 5712-5725.
[16]
王永波. 基于GF-1数据的南京夹江饮用水源地安全评价研究[D]. 南京: 南京师范大学, 2015.
[17]
秦淮河入江段污染状况及其对长江污染的影响[J]. 水利经济, 2012, 30(6): 51-54.
[18]
长江南京段夹江水质保护的对策[J]. 污染防治技术, 2005(3): 26-28.