基于Landsat-8卫星OLI遥感影像和AdaBoost算法的水体信息提取 | ![]() |
2. 西北大学信息科学与技术学院,陕西 西安,710127
2. School of Information and Technology, Northwest University, Xi'an 710127, China
水体的快速精确提取对水域的水质监测、突发污染调查和生态保护等具有重大意义。对于不同水域信息的获取,遥感影像作为主要数据源具有获取信息速度快、多时相、不受时空限制等优势,利用遥感影像快速精确提取水体信息一直是水域界限识别、水质连续监测、水体悬浮物监测等领域的研究重点。文献[1-4]提出的各种水体提取算法均是对单一特征方法的改进,对某一特定区域具有较好的提取效果。但利用单一方法提取水体没有充分体现水体像元特征的选择过程,使整体提取精度难以有效提高。若能将几种不同的水体提取算法相结合,构造出多种特征的强分类器,多种算法取长补短,无疑能实现水体信息更加快速精确的提取。本文引入AdaBoost算法,以Landsat-8卫星OLI传感器的L1T影像作为实验数据,通过将不同特征的简单分类器进行组合,构造强分类器,能较好地提高水体提取的精度。
1 AdaBoost算法原理AdaBoost算法是Freund等人在1995年提出的投票式分类算法,通过对样本训练将不同弱分类器组合为强分类器,以提高分类精度[5-9]。该算法成功应用于人脸识别、医学诊断、文本挖掘等领域。在遥感影像水体提取过程中,使用单一特征提取,如NDVI (normalized difference vegetation index)、NDWI (normalized difference water index)、MNDWI (modified normalized difference water index) 等方法,对于提取某些细小水域的分辨能力欠佳,容易对需要提取的大面积水域造成干扰信息。鉴于单一分类器存在的局限性,本文采用AdaBoost M1算法能很好地将每个分类器最大化的水体特征赋予不同权重集中学习,使弱分类器被迫集中在分类的难点上,最终将学习结果与其他分类器的结果以加权最大投票方式融合输出,全面提高水体提取的精度。
AdaBoost M1算法的实现步骤如下:
1) 初始化输入。构造训练样本集S{(x1,y1),(x2,y2),…,(xm,ym)},其中xi为不同特征参数值,yi为识别类型,一般默认为两个类别。初始化设置样本权值:
$ D\left( {{x_i}, {y_i}} \right) = \omega _{_i}^{^1}, i = 1, 2, \cdots, m $ | (1) |
2) 训练过程。经过迭代t=1,2,…,T, 得到弱分类器ht:x→{0,1},1表示有变化,0表示没有发生变化,进而计算ht的权训练误差εt,即
$ {\varepsilon _t} = \sum\limits_{i = 1}^m {D\left( {{x_i}, {y_i}} \right)} \left[{{y_i} \ne {h_t}\left( {{x_i}} \right)} \right] $ | (2) |
计算αt=εt/(1-εt),更新:
$ \omega _{_i}^{^{t + 1}} = \omega _{_i}^{^t} \times \alpha _{_t}^{^{1-|{h_t}\left( {{x_i}} \right)-{y_i}|}} $ | (3) |
结束上述训练过程。
3) 输出强分类器:
$ H\left( x \right) = {\rm{sign}}\left[{\sum\limits_{t = 1}^T {{\alpha _t}{h_t}(x)} } \right] $ | (4) |
$ H\left( x \right) = \left\{ \begin{array}{l} 1, 水体信息\\ 0, 非水体信息 \end{array} \right. $ | (5) |
红碱淖湖位于陕西省北部毛乌素沙漠内,面积约为32.16 km2,是中国最大的沙漠淡水湖,也是国家一级重点保护野生动物遗鸥的主要栖息地。由于旅游活动开发和气候变干导致水域面积呈逐年缩小的趋势,若能实时、快速、精确地提取该区域的水体信息,对监测水域萎缩程度、合理开发旅游资源、遏制周边地区荒漠化进程和生态环境保护等意义重大。本文采用红碱淖地区2013年9月13日的Landsat-8卫星OLI遥感影像作为实验研究数据。
2.1 Landsat-8影像数据介绍Landsat-8卫星OLI传感器提供的L1T数据较好地延续了Landsat系列遥感影像的长时期对地观测能力,性能更加优化。初庆伟等[10]将Landsat-8卫星的OLI成像仪和Landsat-7卫星ETM+成像仪的影像进行比较,结果显示,在不同辐射亮度值下,OLI成像仪产生的影像信噪比更高,成像精度更好;李旭文等[11]利用OLI影像对研究区的大气能见度、湖泊蓝藻水华等一系列生态环境问题进行了分析和反演,结果表明,OLI影像光谱辐射亮度的采样量化能力达到12 bit,较以往TM的8 bit量化水平有很大提高;徐涵秋等[12]通过对OLI影像与ETM+影像水体信息的对比,发现分辨率为12 bit的OLI影像能更好地显示水体的细节信息,而8 bit的ETM+影像出现了灰度过饱和现象,边缘细节表现不及OLI影像丰富。因此,采用Landsat-8遥感影像作为实验数据,能更好地保证影像水体信息,满足对一般水域的水体信息提取的研究。
Landsat-8影像数据需采用ENVI5.0SP3版本进行处理,其数据和以往TM数据类似,依然使用Landsat系列的UTM/WGS84投影坐标系,已做过初步的几何校正[11-13],在此基础上,首先对数据进行辐射定标,然后采用ENVI5.1提供的Landsat-8波谱响应函数进行大气校正,再将校正后的影像裁剪得到实验所需的研究区域。
2.2 构造弱分类器本文根据多次不同方法提取效果的初步对比,最终选择谱间关系、NDVI、NDWI和K-T变换的wetness分量等指数作为特征值构造弱分类器,再经AdaBoost M1算法组合成强分类器。上述指数的计算方法描述如下。
1) NDVI。NDVI即归一化插值植被指数[14, 15],根据可见光红波段和近红外波段确定植被冠层的发射率,是应用较为广泛的植被提取方法。本文研究区周边荒漠化较为严重,选取的遥感影像时段处于秋季,能有效地减弱植被信息,突出水体NDVI的分布特征。
NDVI=(Band5-Band4)/(Band5+Band4)
其中,Band5为Landsat-8遥感影像的第5波段,即近红外波段;Band4为第4波段,即可见光红色波段。OLI影像和ETM+影像波段参数对比见表 1[11, 12]。
表 1 Landsat-8与Landsat-7波段参数对比 Table 1 Comparison of Band Parametrics Between Landsat-8 and Landsat-7 |
![]() |
从表 1可以看出,OLI传感器对ETM+传感器原有的6个多光谱波段的波谱范围进行了调整,并且新增加了两个波段:第1波段 (深蓝波段,主要用途是对海岸带、陆地大型水面的水色以及气溶胶进行监测) 和第9波段 (主要用于卷云监测)。OLI传感器提高了光谱辐射亮度的采样量化能力 (由8 bit提高到12 bit),增强了区域能见度和观测能力。OLI传感器还取消了ETM+中的热红外波段,利用专门的热红外传感器 (TIRS) 进行检测。
2) 谱间关系。谱间关系法[16]是在利用TM影像提取水体时,发现水体与其他地物的光谱特性差异,水体的波段2灰度值与波段3灰度值之和大于波段4与波段5的灰度值之和。而OLI影像的波段顺序较TM影像发生了变化,所以OLI影像对应的谱间关系算法模型为:
(Band3+Band4)>(Band5+Band6)
其中,Band3为Landsat-8遥感影像第3波段,即绿光波段;Band6为第6波段,即短红外波段。
3) NDWI。归一化差分水体指数NDWI[17, 18]是在进行水体提取时,由于水体边缘的湿地部分绿光波段与近红外波段的光谱特征有着明显差异,加上水体的反射作用,使得近红外波的吸收性较强,利用绿光波段与近红外波段的反差得到其NDWI,从而突出水体特征。其算法模型为:
NDWI=(Band3-Band5)/(Band3+Band5)
4) K-T变换。缨帽变换[19, 20]又称K-T变换,是Kauth和Thomas通过分析大量的Landsat和MSS影像后,用于反映农作物和植被生长过程的数据结构,进而提出了一种经验性的多波段影像的正交线性变换方法。缨帽变换作为一种特殊的主成分分析,具有固定的转换系数。采用缨帽变换可以将TM影像除热红外波段外的6个波段压缩成3个分量,第一分量为亮度指数,反映了地物总体反射率的综合效果;第二分量为绿度指数,与地面植被覆盖、叶面积指数及生物量有很大关系;第三分量为湿度指数,利用可见光和近红外与较长红外波段的差值,反映地面水分条件。本文选取第三分量即wetness作为后续组合分类器的特征值。
3 提取结果及精度分析将人工选取的谱间关系、NDVI、NDWI和K-T变换wetness分量等300个像元值作为AdaBoost组合分类器的训练样本输入;然后将剩余各指数像元值作为验证数据进行检验,得到组合分类器训练数值。利用基于AdaBoost算法训练后的数值进行水体信息提取 (提取结果见图 1),图中白色区域表示提取后的水体信息分布区域。
![]() |
图 1 实验提取结果 Figure 1 Extraction Results of Different Methods |
本文将单个指数提取结果和AdaBoost组合分类器的提取结果进行对比,利用错误率分别进行评价。经AdaBoost组合分类器提取结果的精度较NDVI、K-T变换、谱间关系、NDWI单一分类器的精度分别提高了7.04%、5.78%、4.57%、3.21%(见表 2),提取结果的平均错误率降低了5.15%。
表 2 不同分类器提取结果精度对比 Table 2 Precision Comparison of Different Classifiers Extraction Result |
![]() |
由表 2错误率对比可以看出,AdaBoost方法提取水体信息的错误率较低,体现在以下几方面:
1) 虽然选取的遥感影像时间为秋季,而且研究区周边区域荒漠化较为严重,在一定程度上减弱了植被NDVI的影响,突出了水体NDVI特征值。但由于荒漠中一些小的植被的影响,导致红碱淖周边出现较多混淆信息,这些噪声体现在红碱淖周边众多细小“伪水体”的白色点,干扰主要水体的提取,造成错误率增加。同样,谱间关系法和K-T变换方法也存在此类混淆现象,不能充分突出主要的水体信息。而NDWI的提取结果跟以上3种方法的结果相反,NDWI有效地去除了红碱淖周围的干扰信息,突出了主要水体信息,但在水体边缘、水陆交界处出现混淆,使得主水体周围信息判断错误,这是由于NDWI对于水体边缘的阴影提取存在一定的局限性。本文也尝试利用改进的水体指数MNDWI进行提取,但效果依然不好,水体边缘阴影不能较好地区分。
2) 针对上述几种方法的优劣,本文引入的AdaBoost算法较好地解决了这一问题。由图 1可以看出,AdaBoost算法组合后的强分类器结合了几种提取方法的优势,又弥补了各个方法本身的局限,不仅有效地去除了主水体周围众多细小“伪水体”的噪声信息,而且解决了普通水体提取方法难以消除的水体边界阴影问题,使得整体的错误率降低。作为一种新型的水体提取方法,对提高遥感影像的解译效率[21],对于单一较大面积水域的提取具有快速准确的特性。
3) AdaBoost算法结合了单一分类方法的最大特征值,例如在利用K-T变换的wetness分量突出水体最大边界的同时,也利用NDWI消除了周围的噪声信息。这种将每个特征值最大化的方法对于提取一般地形下的水体具有较好的效果,对于荒漠化、半荒漠化区域水体的快速准确监测具有重大意义。
4 结束语遥感水体提取的方法已趋于成熟,每种方法通过对水体特征最大化进行表征,但往往特征较为单一,不能很好地表达水体提取的综合整体情况。本文尝试运用不同特征组合提取的方法,将单一特征结合,经过每种特征值的“带权投票”,实现对水体信息多种特征的提取,组合多种分类器训练,提取结果具有较好的互补性。Landsat-8卫星OLI遥感影像较好地延续并提升了原TM影像的成像质量和效果,原有的适用于TM影像的水体处理方法也可以在改进后用于Landsat-8遥感影像的处理。该组合方法对Landsat-8卫星OLI遥感影像的水体信息提取具有较强的可行性,对提取遥感影像的水体信息提供了一种新思路。本文的研究区地势平缓,地貌类型复杂度不高,因此对于较为复杂地形下的水体提取效果还需要做进一步的研究。
[1] | 张洁, 王心源, 高超, 等. 基于Landsat TM数据的东平湖水体提取方法研究[J]. 测绘与空间地理信息, 2012, 35(4): 23–28 |
[2] | 郭振亚, 王心源, 王传辉, 等. 巢湖流域水体信息提取方法研究[J]. 遥感技术与应用, 2012, 27(3): 443–448 DOI: 10.11873/j.issn.1004-0323.2012.3.443 |
[3] | 丁凤. 一种基于遥感数据快速提取水体信息的新方法[J]. 遥感技术与应用, 2009, 24(2): 167–171 DOI: 10.11873/j.issn.1004-0323.2009.2.167 |
[4] | 徐涵秋. 利用改进的归一化差异水体指数 (MNDWI) 提取水体信息的研究[J]. 遥感学报, 2005, 9(5): 589–595 |
[5] | 周红英, 蔺启忠, 吴昀昭, 等. 基于AdaBoost的组合分类器在遥感影像分类中的应用[J]. 计算机应用研究, 2007, 24(10): 181–184 DOI: 10.3969/j.issn.1001-3695.2007.10.056 |
[6] | 李长春, 张光胜, 慎利. 基于AdaBoost算法的遥感影像水体信息提取[J]. 测绘科学, 2013, 38(2): 104–105 |
[7] | 许凯, 秦昆, 杜鹢. 基于AdaBoost的高分辨率遥感影像城市绿地提取算法[J]. 计算机工程与应用, 2008, 44(20): 23–25 DOI: 10.3778/j.issn.1002-8331.2008.20.008 |
[8] | 王奎, 张荣, 尹东, 等. 基于边缘特征和AdaBoost分类的遥感图像云检测[J]. 遥感技术与应用, 2013, 28(2): 263–268 DOI: 10.11873/j.issn.1004-0323.2013.2.263 |
[9] | 李锐, 王卷乐, 任正超. 基于AdaBoost算法的城镇建设用地遥感动态提取研究[J]. 国土资源遥感, 2010, (2): 86–96 DOI: 10.6046/gtzyyg.2010.02.19 |
[10] | 初庆伟, 张洪群, 吴业炜, 等. Landsat-8卫星数据应用探讨[J]. 遥感信息, 2013, 28(4): 110–114 |
[11] | 李旭文, 牛志春, 姜晟, 等. Landsat8卫星OLI遥感影像在生态环境监测中的应用研究[J]. 环境监控与预警, 2013, 5(6): 1–5 |
[12] | 徐涵秋, 唐菲. 新一代Landsat系列卫星: Landsat8遥感影像新增特征及其生态环境意义[J]. 生态学报, 2013, 33(11): 3249–3257 |
[13] | 焦志敏, 张晓丽, 李法玲, 等. Landsat_8多光谱波段纹理对叶面积指数的影响分析[J]. 地理与地理信息科学, 2014, 30(3): 42–45 |
[14] | 马丽, 徐新刚, 贾建华, 等. 利用多时相TM影像进行作物分类方法[J]. 农业工程学报, 2008, 24(2): 191–195 |
[15] | 张洪亮, 倪绍祥, 蒋建军, 等. 环青海湖地区天然草地TM影像植被指数分析[J]. 中国草地, 2002, 24(2): 6–11 |
[16] | 周成虎, 骆剑承, 刘庆生, 等. 遥感影像地学理解与分析[M]. 北京: 科学出版社, 1999 |
[17] | Mcfeeters S K. The Use of the Normalized Difference Water Index (NDWI) in the Delineation of Open Water Features[J]. International Journal of Remote Sensing, 1996, 17(7): 1425–1432 DOI: 10.1080/01431169608948714 |
[18] | 李辉霞, 李森, 周红艺, 等. 基于NDWI的海南岛西部沙漠化信息自动提取方法研究[J]. 中国沙漠, 2006, 26(2): 215–219 |
[19] | 陈超, 江涛, 刘祥磊. 基于缨帽变换的遥感图像融合方法研究[J]. 测绘科学, 2009, 34(3): 105–106 |
[20] | 张景奇, 关威, 孙萍, 等. 基于K-T变换的地表水体信息遥感自动提取模型[J]. 中国水土保持科学, 2011, 9(3): 88–92 |
[21] | 刘金榜, 李建松, 柯晓龙, 等. ArcGIS支持下高分辨率遥感影像解译效率提高方法[J]. 测绘地理信息, 2014, 39(6): 54–58 |