测绘地理信息   2019, Vol. 44 Issue (2): 97-100
0
基于Landsat 8影像的赣抚尾闾区水体提取研究[PDF全文]
赵哲1, 况润元1, 廖启卿1    
1. 江西理工大学建筑与测绘工程学院,江西 赣州,341000
摘要: 水体是人类赖以生存的重要资源。随着遥感技术的不断发展,利用遥感对水体各方面的研究也越来越多。赣抚尾闾区作为鄱阳湖入湖区的重要组成区域,包含了许多对鄱阳湖主湖区影响很大的农田和城镇,因此,选择该区域作为研究区域具有重要意义。选取Landsat 8遥感影像作为数据源,结合归一化植被指数、归一化水体指数、近红外波段反射率、自动水提取指数等方法,选择合适的阈值,构建适用于赣抚尾闾区水体提取的决策树模型,实现对赣抚尾闾区水体的提取,其精度达到94.86%。通过对结果分析,发现该方法对植被的浅水区水体的提取存在一定的局限性。
关键词: 水体提取     遥感     归一化差分植被指数     归一化差分水指数     自动水提取指数    
Study on the Water Extraction Based on Landsat 8 Imagery in the Area of Tail-Streams of Gan River and Fu River
ZHAO Zhe1, KUANG Runyuan1, LIAO Qiqing1    
1. School of Architecture and Surveying Engineering, Jiangxi University of Science and Technology, Ganzhou 341000, China
Abstract: Water is an important resource for human survival. With the continuous development of remote sensing technology, the use of remote sensing in all aspects of water research is increasing. As an important component area of Poyang Lake inlet, there is a lot of farmland and towns which have great influence on the main lake area of Poyang Lake. Therefore, it is of great significance to select the region as the research area. In this paper, Landsat8 remote sensing image is selected as the data source, and the appropriate threshold is selected according to the normalized vegetation index (NDVI), normalized water index (NDWI), near infrared band reflectance and new water index (AWEI) to construct the decision tree model of the water body extraction in the tail area of Gan River and Fu River and to extract the water body in the tail area of Gan River and Fu River area, the accuracy of which is 94.86%. The study also shows that this method has some limitations on the extraction of shallow water in the presence of vegetation.
Key words: water body extraction     remote sensing     normalized difference vegetation index (NDVI)     normalized diffe-rence water index (NDWI)     automated water extraction index (AWEI)    

鄱阳湖是中国最大的吞吐型、季节性和通江性淡水湖泊,其面积、容积及水位无论季节还是年际变幅都较大,主湖南部、东部区域地势平缓,是洪涝多发区。赣抚尾闾区位于鄱阳湖南部,是鄱阳湖生态经济区的主要组成部分之一,其中包含的许多城镇中的工农业生产是影响主湖区水质变化的重要原因。赣抚尾闾区水体监测研究有助于了解河湖水情相互作用机制,也有助于研究鄱阳湖水质变化机制。

遥感卫星影像具有成像快、范围广等优点,可以迅速、长期、客观地获取水资源的各种信息。近年来,许多专家学者在利用遥感影像提取水体方面进行了一系列研究,取得了许多成果。陈华芳等[1]利用专题绘图仪(thematic mapper, TM)影像的红外波段,选择合适的阈值将香格里拉县部分区域的水体进行提取,水体面积精度达到了90%以上;周成虎等[2]提出基于阈值的多波段谱间关系法,利用TM影像的(波段2灰度值+波段3灰度值)>(波段4灰度值+波段5灰度值)的谱间特征,为水体提取提供了一种新的方法;水体指数法是水体提取中研究最多的方法,在多光谱波段内,通过增强指数影像上水体的亮度,抑制其他背景地物,进而突出水体,此类方法具体有比值植被指数、归一化差分植被指数(normalized difference vegetation index, NDVI)、归一化差分水指数(normalized difference water index,NDWI)[3]、改进型归一化差分水指数[4]、归一化差分积雪指数[5]、水体比值指数、归一化差异综合水体指数[6]等;何志勇等[7]运用改进的小波阈值法在去噪前对水体信息进行膨胀和去噪处理,结合多窗口线性保持技术对容易损失的线状水体进行有效保持,同时使用联合特征去噪技术,在去噪的同时结合了水体地学特征,减少了水体目标信息损失,使水体的自动识别判对率达到了94.92%;刘建波等[8]通过计算机密度分割确定出水面的分布范围,进行统计分析,计算出水面的像元数后,将像元数乘以每个像元所覆盖的面积,得到水体的精确范围。此外,在水体提取方面还有比率测算法[9]、基于分类器集成的水体提取法[10]、AdaBoost算法[11]等。

由于遥感影像的类别不同,不同地区的地物特征差别很大,因此,单一的方法并不能适用所有的情况,也不能完全去除背景的影响[12]。目前,关于水体的提取研究的很多方法,对较为单一的水体提取效果较好,赣抚尾闾区内水体情况复杂,因此,本文综合考虑该地区的水域情况,结合Landsat 8遥感影像的特征,提出了采用NDVI、NDWI、红外波段阈值法、多波段谱间关系等多种方法来构建决策树的算法模型,去除了云、居民地、阴影等的影响,对赣抚尾闾区内的水体进行提取,取得了较好效果。

1 研究区域及数据预处理

赣抚尾闾区主要是指赣江和抚河流入鄱阳湖的入湖口广大区域,主要包括南昌市的大部分区域。本研究区域北部以鄱阳湖大堤为界,南部是以锦江入赣江汇合处和抚河李家渡水文监测站为控制点,结合ASTER 30 m地形提取的分水岭作为基准,按照尽量保持集水区域和流域的完整性的原则划分边界。

本文选择的是由NASA于2013年2月发射的Landsat 8卫星遥感影像,携带有两个主要荷载:陆地成像(operational land imager, OLI)和热红外传感器(thermal infrared sensor, TIRS),本文选取的是OLI影像。

对所选取的Landsat 8卫星上OLI影像进行几何校正、辐射定标、大气校正等预处理,得到预处理后的影像。其中,大气校正选用Flaash模型,该模型的基础是Modtran模型。

2 水体提取方法

水体在遥感影像的所有波段都具有强吸收、弱反射的特性,反射率随着波长的增加而不断降低[13]。对于清澈水体的反射率来说,从蓝绿光波段到红光波段,再到近红外波段逐步减小,并且在近红外波段几乎为零。许多关于水体的提取方法研究都基于这个特征,但是对于阴影、云、土壤和居民地等的区分,要根据不同地区、不同类型的影像、不同的时间采用的方法并不相同,单一的方法不能很好地将水体与其他地物进行区分,需要综合考虑多种方法。本文采用NDVI、NDWI、红外波段阈值法、多波段谱间关系等多种方法构建决策树算法,对赣抚尾闾区的水体进行了提取。

对原始影像中的云选取一系列的采样点,进行统计分析,其结果如表 1所示。

表 1 各波段云采样点反射率统计表 Tab.1 Statistic of Cloud Sampling Points in Each Band

同样地,对植被、水体、建筑和土壤等主要地物选取一系列的采样点,对每类地物光谱值取平均后得到它们的光谱曲线,结果如图 1所示。

图 1 主要地物光谱曲线 Fig.1 Spectral Curve of Main Features

图 1可以看出,云的光谱平均值明显高于其他地物,并且从表 1可以看出,各个波段云的均值都比较高,尤其第5波段,即近红外波段的均值最大。因此,本文选择近红外波段对云进行去除,对其反射率采用0.55这个阈值。

水体与植被的反射光谱特性具有明显的差异,尤其在近红外波段后者反射率较高,而前者几乎吸收了其全部能量造成反射率低。在通常情况下,水体在红光波段的反射率高于植被的反射率,植被在近红外波段的反射率明显高于水体的反射率,利用这种差异性,本文选择应用较为广泛的NDVI模型算法,其计算公式为:

$ {\rm{NDVI}} = ({F_2} - {F_1})/({F_2} + {F_1}) $ (1)

式中,NDVI为归一化植被指数;F1F2分别为Landsat 8影像红光波段和近红外波段的地表反射率。

通常在NDVI图像中,植被覆盖区域的NDVI值呈现正值,且NDVI值与植被覆盖度的大小有关,一般来说,植被的生长状况好,相应区域的覆盖度也比较大,从而NDVI值就越高;岩石或裸土的NDVI趋近于0,水体的NDVI为负值;因此,可根据NDVI阈值来区别水体与植被、裸地(城镇居住区)等其他地物[12]。谭衢霖等[13]认为鄱阳湖水域覆盖区域的NDVI阈值应根据季节变化在-0.1~0.3选取。综合考察鄱阳湖水文变化规律与植被物候规律的相互影响,本文经过反复实验,将NDVI的阈值取为0。

由于研究区内水体情况比较复杂,其中,部分水体中存在一些植被,因此,NDVI值为正数的区域同样有部分水体,对于这部分水体,本文采用NDWI进行提取。其计算公式为:

$ {\rm{NDWI}} = ({F_5} - {F_3})/({F_5} + {F_3}) $ (2)

式中,F3为Landsat 8影像的绿光波段(第3波段)的地表反射率; F5为影像的近红外波段(第5波段)的地表反射率。

2013年10月24日Landsat 8卫星影像通过不同的NDWI阈值进行水域提取,提取结果的比较如图 2所示,其中,图 2(a)偏黑色表示水域,图 2(b)图 2(c)图 2(d)中灰白色部分(偏白色)分别表示NDWI阈值大于-0.05、0和0.05时提取的水域范围,十字线交点代表的像元表示同一时间同一地点。

图 2 NDWI提取水体对比图 Fig.2 Comparison of NDWI Extraction Water

经过分析实验,选取-0.05作为使用NDWI提取研究区域内水体的阈值。NDWI值小于-0.05的是除水体之外的其他地物,NDWI≥-0.05的部分中含有水体(主要)、土壤及建筑物和阴影的,只有将阴影和土壤及建筑物去除,才能得到水体,鉴于此,本文通过近红外波段设阈值的方法去除土壤及建筑物的影响[14],通过自动水提取指数(automated water extraction index, AWEI)算法去除阴影,结合NDVI、NDWI、近红外反射率等规则,构建基于赣抚尾闾区的决策树水体提取模型。

NDVI和NDWI如上述所示,AWEI通过差分和应用不同的系数来最大限度地提高水体和非水体像素的差异性,有效地抑制非水体像素从而提高水体提取的精度,本文使用的是解决阴影问题的AWEIsh算法,具体公式如下:

$ \begin{array}{l} {\rm{AWE}}{{\rm{I}}_{{\rm{sh}}}} = {\rho _{{b_1}}} + 2.5 \times {\rho _{{b_2}}} - 1.5 \times \\ \;\;\;\;\;\;\;({\rho _{{b_3}}} + {\rho _{{b_4}}}) - 0.25 \times {\rho _{{b_5}}} \end{array} $ (3)

式中,ρ为Landsat 8影像的反射率值;b1为蓝光波段;b2为绿光波段;b3为近红外波段;b4为SWIR1波段;b5为SWIR2波段。

通过多次实验分析,选用近红外波段影像去除建筑物及土壤时反射率阈值为0.1,小于0.1的为建筑物和土壤;使用AWEI去除阴影是选用0作为阈值,大于0的为阴影,反之为水体。

通过上述的分析实验,建立了适合赣抚尾闾区的水体提取决策树模型,实现了对赣抚尾闾区水体的提取。其具体模型如图 3所示。

图 3 决策树水体提取模型 (F5为Landsat影像的近红外波段) Fig.3 Water Extraction Model Base of the Decision Tree (F5 Is Near Infrared Band of Landsat Image)

3 结果及分析 3.1 结果

经过构建的决策树处理后,虽然将水体比较准确地提取了出来,但是其结果中水体存在一些碎斑,以及一些过小水体的误提取现象,对其结果进行聚类、过滤等处理后,去除其他地物,得到水体的结果如图 4所示。

图 4 水体提取结果 Fig.4 Results of Water Body Extraction

通过上述结果可以看出, 赣抚尾闾区内主要的水体集中在赣江和抚河这两条河流以及青山湖、艾溪湖、瑶湖、青岚湖等几个主要的湖泊,此外还存在许多大大小小的湖泊、水塘等水体,这些水体星罗分布于整个赣抚尾闾区。

3.2 精度分析

图 5为水体提取的结果与原始影像的叠加显示。通过对比分析可知,水体提取的结果较为准确,精度较高。

图 5 结果与原始影像叠加 Fig.5 Results and Original Image Overlay

经过对结果进行混淆矩阵计算,分类后的总体精度达到了92.57%,Kappa系数为0.87。水体的分类精度达到了94.86%,说明了本文对水体的提取达到了较高的精度。具体的混淆矩阵如表 2所示。

表 2 混淆矩阵结果/% Tab.2 Result of Confusion Matrix/%

表 2可知, 结果存在漏提取、错提取的情况。分析其主要原因,可能是浅水区有部分植物,这部分水体并没有全部被提取;虽然影像中云被提取出来,但是云下的少量水库存在没有被提取的现象。另外,对于建筑物与裸地和细小水体的区分比较困难,存在着部分被误提取的情况。

4 结束语

本文构建了适用于赣抚尾闾区的决策树水体提取算法模型,有效去除了云、阴影、土壤及建筑物等因素干扰,对水体的提取精度达到了94.86%。通过对水体的分类结果分析来看,本文仍然存在着一些不足。浅水区水体以及富营养化水体的提取一直是进行水体提取的难点,不同的地区、不同类型的影像采用的方法不同,效果也存在着一定的差异,本文研究的决策树模型,虽然可以很大程度地提取这类水体,但是仍然存在着一些漏提取现象,今后该模型还需进一步改进。同时,还可以研究南部环鄱阳湖流域水体的变化对鄱阳湖水位的影响。

参考文献
[1]
陈华芳, 王金亮, 陈忠, 等. 山地高原地区TM影像水体信息提取方法比较:以香格里拉县部分地区为例[J]. 遥感技术与应用, 2004, 14(6): 479-484. DOI:10.3969/j.issn.1004-0323.2004.06.009
[2]
周成虎, 骆剑承. 遥感影像地学理解与分析[M]. 北京: 科学出版社, 2003.
[3]
McFeeters S K. The Use of Normalized Difference Water Index(NDWI) in the Delineation of Open Water Features[J]. International Journal of Remote Sensing, 1996, 17(7): 1 425-1 432. DOI:10.1080/01431169608948714
[4]
徐涵秋. 利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J]. 遥感学报, 2005, 9(5): 589-595.
[5]
刘玉洁, 杨忠东. MODIS遥感信息处理原理与算法[M]. 北京: 科学出版社, 2001.
[6]
莫伟华, 孙涵, 钟仕全, 等. MODIS水体指数模型(CIWI)研究及其应用[J]. 遥感信息, 2007, 9(5): 16-21. DOI:10.3969/j.issn.1000-3177.2007.05.004
[7]
何智勇, 章孝灿, 黄智才, 等. 一种高分辨率遥感影像水体提取技术[J]. 浙江大学学报(理学版), 2004, 31(6): 701-707. DOI:10.3321/j.issn:1008-9497.2004.06.024
[8]
刘建波, 戴昌达. TM图像在大型水库库情监测管理中的应用[J]. 环境遥感, 1996, 11(1): 54-58.
[9]
陆家驹, 李士鸿. TM资料水体识别技术的改进[J]. 环境遥感, 1992, 7(1): 17-23.
[10]
吴春花, 杜培军, 夏俊士. 一种基于投票法融合的ASTER遥感影像水体提取方法[J]. 遥感信息, 2012, 14(2): 51-56. DOI:10.3969/j.issn.1000-3177.2012.02.010
[11]
李长春, 张光胜, 慎利. 基于AdaBoost算法的遥感影像水体信息提取[J]. 测绘科学, 2013, 38(2): 104-105.
[12]
赵英时. 遥感应用分析原理与方法[M]. 北京: 科学出版社, 2003.
[13]
谭衢霖, 刘正军, 胡吉平, 等. 应用多源遥感影像提取鄱阳湖形态参数[J]. 北京交通大学学报, 2006, 30(4): 26-30. DOI:10.3969/j.issn.1673-0291.2006.04.007
[14]
董婷, 焦利民, 许刚. 基于分层分类法提取城市裸地信息[J]. 测绘地理信息, 2016, 41(4): 56-61.