利用多光谱卫星遥感和深度学习方法进行青藏高原积雪判识

Download PDF 打印本文

文章快速检索

高级检索

引用本文

阚希，张永宏，曹庭，等。利用多光谱卫星遥感和深度学习方法进行青藏高原积雪判识[J]. 测绘学报，2016，45(10)：1210-1221. DOI: 10.11947/j.AGCS.2016.20160183 复制到剪切板

KAN Xi, ZHANG Yonghong, CAO Ting, et al. Snow Cover Recognition for Qinghai-Tibetan Plateau Using Deep Learning and Multispectral Remote Sensing[J]. Acta Geodaetica et Cartographica Sinica, 2016, 45(10): 1210-1221. DOI: 10.11947/j.AGCS.2016.20160183 复制到剪切板

利用多光谱卫星遥感和深度学习方法进行青藏高原积雪判识

阚希¹, 张永宏^2,3, 曹庭², 王剑庚⁴, 田伟⁵

1. 南京信息工程大学大气科学学院, 江苏南京 210044 ;
2. 南京信息工程大学信息与控制学院, 江苏南京 210044 ;
3. 江苏省大气环境与装备技术协同创新中心, 江苏南京 210044 ;
4. 南京信息工程大学大气遥感学院, 江苏南京 210044 ;
5. 南京信息工程大学计算机与软件学院, 江苏南京 210044

收稿日期：2016-04-22；修回日期：2016-08-31

基金项目：国家自然科学基金（91337102；41401481）；江苏省自然科学基金（BK20140997；14KJB170017）

第一作者简介：阚希(1987-),男,博士生,研究方向为深度学习与卫星遥感图像识别。E-mail:kanxi@nuist.edu.cn

通信作者： ZHANG Yonghong. E-mail:zyh@nuist.edu.cn.

摘要：青藏高原积雪对全球气候变化十分重要，针对已有积雪遥感判识方法中普遍采用的可见光与红外光谱数据易受复杂地形与高海拔影响，导致青藏高原地区积雪判识精度较低的问题，提出了一种基于多光谱遥感与地理信息数据特征级融合的积雪遥感判识方法：以风云三号卫星可见光与红外多光谱遥感资料与多要素地理信息作为数据源，由地面实测雪深数据与现有积雪产品交叉筛选出样本标签，构建并训练基于层叠去噪自编码器（SDAE）的特征融合与分类网络，从而有效辨识青藏高原遥感图像中的云、积雪以及无雪地表。经地面实测雪深数据验证，该方法分类精度显著高于使用相同数据源的FY-3A/MULSS积雪产品，略高于国际主流积雪产品MOD10A1与MYD10A1，并且年均云覆盖率最低。试验结果表明该方法可有效地减少云层对积雪判识的干扰，提升分类精度。

关键词：卫星遥感深度学习风云三号多光谱融合青藏高原积雪

Snow Cover Recognition for Qinghai-Tibetan Plateau Using Deep Learning and Multispectral Remote Sensing

KAN Xi¹, ZHANG Yonghong^2,3, CAO Ting², WANG Jiangeng⁴, TIAN Wei⁵

1. School of Atmospheric Science, Nanjing University of Information Science & Technology, Nanjing 210044, China ;
2. School of Information & Control, Nanjing University of Information Science & Technology, Nanjing 210044, China ;
3. ${affiliationVo.addressStrEn} ;
4. Jiangsu Collaborative Innovation Center on Atmospheric Environment and Equipment Technology, Nanjing 210044, China ;
5. School of Atmospheric Physics, Nanjing University of Information Science & Technology, Nanjing 210044, China

Foundation support: The National Natural Science Foundation of China(Nos.91337102;41401481); Natural Science Foundation of Jiangsu Province (Nos.BK20140997;14KJB170017)

First author: KAN Xi(1987—), male, PhD candidate, majors in deep learning and satellite remote sensing image recognition.E-mail： kanxi@nuist.edu.cn

Corresponding author: ZHANG Yonghong, E-mail: zyh@nuist.edu.cn

Abstract: Snow cover in Qinghai-Tibetan plateau (QT plateau) is very important to global climate change. Because of the complex topography and high altitude, the recognition accuracies of existing snow cover products in QT plateau are significantly lower than flat areas. This paper proposed a new method of snow cover recognition for QT plateau based on deep learning. The multispectral remote sensing data from Chinese meteorological satellite FY-3A and the multiple geographic elements information are put together as the data sources, the insitu snow depth measurements and existing snow cover products are used for selecting the labeled samples. A stacked denoising auto-encoders (SDAE) network was built and trained for feature extraction and classification, this network can be used as a classifier for distinguishing the snow cover from cloud and other snow-free surface features. The recognition results are verified by snow depth data of meteorological station observations, verification results show that the recognition accuracy of this method is significantly higher than the snow product FY-3A/MULSS, which is using the same remote sensing data source FY-3A, and slightly higher than the widely used snow products MOD10A1 and MYD10A1,and the cloud coverage rate of this method is the lowest. According to the validation results, this method can effectively improve the accuracy of snow cover recognition, and reduce the interference of clouds.

Key words: satellite remote sensing deep learning FengYun-3 multispectral data fusion Qinghai-Tibetan plateau snow cover

积雪是多个地球科学领域的关键影响因素。在气象与气候学领域，积雪是响应全球气候变化的敏感指标，此外，由于积雪对太阳辐射具有极高的反射率，雪盖显著影响了地表辐射的收支平衡，进而通过一系列反馈机制深刻影响全球气候变化与局地天气过程^[1]。在水文学领域，积雪形成的融雪径流对于区域水文过程具有重要影响，季节性积雪也是中纬度地区主要淡水来源之一^[2-4]。青藏高原拥有北半球中纬度地区海拔最高、范围最广的稳定积雪区域，青藏高原的积雪是亚欧大陆上多条重要河流的源头，因此对青藏高原积雪分布的准确监测，是研究全球气候变化、局地天气过程、水文循环、水资源管理、雪灾预警等重大课题的必要前提^[5-7]。

基于卫星遥感技术的积雪监测方法因其时空分辨率高、监测范围广等优势，成为当代积雪监测的主流方法^[8-9]。已有的积雪遥感监测方法普遍以归一化差分积雪指数(NDSI)^[10]作为积雪判识的主要依据。NDSI依赖于雪盖与无雪地表在可见光与近红外波段的反射率差异，然而部分种类的云与积雪在可见光与近红外波段上的光谱特征非常相似，因此仅凭NDSI无法有效区分云与雪盖，解决这一问题通常需要根据积雪表面与云顶的温度差异，通过红外波段的光谱信息进一步区分云雪^[11]。然而在实际应用过程中发现，云顶与积雪表面的温度都易受海拔、地形、气温等因素影响，难以通过人工统计与分析的方式确定温度阈值来区分云雪。这一现象在地形复杂多变、地势起伏剧烈、海拔极高的青藏高原地区尤其明显^[12]。青藏高原平均海拔在4km以上，且有大量海拔超过6km的高寒山区，山区地表温度随海拔攀升而快速下降。此外，即使在相同海拔带，不同坡向区域的地表温度也差异巨大。这使得青藏高原的云雪判识问题成为一个与海拔、地形、地表覆盖类型等信息耦合的复杂非线性问题。已有研究表明，目前国际主流的卫星遥感积雪产品在青藏高原地区的积雪误判、漏判率都显著高于其他地区^[13]。

深度学习是机器学习领域一个新兴的研究热点，近年来在计算机视觉、语音识别等领域取得了良好成绩。同时，随着卫星遥感数据的多元化和海量化，遥感大数据时代已经到来^[14]，而深度学习的一大优势在于它能有效应对高维、海量数据进行模式识别与分类，因此深度学习方法可作为处理遥感大数据分析与挖掘问题的有效手段，也正适用于高原山区多光谱遥感积雪判识问题。

文献[15]提出的深度置信网络(deep belief network,DBN)被认为是第一种深度学习架构，随后又出现了多种经典的深度学习架构，这些架构按训练方式的不同大致可分为两类^[16]：①有监督深度学习架构，如深度卷积神经网络(convolutional neural networks,CNN)^[17]，循环神经网络(recurrent neural networks,RNN)^[18]等；②无监督或半监督深度学习架构，如前文所述的深度置信网络DBN，基于受限玻尔兹曼机的深度玻尔兹曼机(deep boltzmann machines,DBM)^[19]，以及层叠去噪自编码器(stacked denoising auto-encoders,SDAE)^[20-21]等。有监督深度学习模型通常适用于能提供大量有标签训练样本用于训练的任务，如面向目标检测任务的CNN类网络Fast R-CNN^[22]，以及面向自然语义理解的RNN类网络LSTM^[23]等。而有监督深度学习并不适用于青藏高原地区的遥感积雪判识任务，这是由于该任务所需的样本标签通常来源于地面气象站的每日积雪观测数据，但在地广人稀、地形复杂的青藏高原地区，地面气象站数量稀少、分布稀疏，因此无法供足够多的真实客观且具有空间代表性的标签样本用于有监督训练。而如果使用无监督或半监督深度学习架构，大量遥感数据则可提供足够的无标签训练样本用于无监督预训练，只需要在最后的全局微调阶段使用少量带标签样本进行有监督学习。因此，本文选择无监督或半监督类型的深度学习架构用于青藏高原的遥感积雪判识。进一步而言，受当地基础设施条件的限制，地面气象站提供的样本标签无法保证100%的客观准确，并且卫星遥感数据中也偶尔出现缺测或异常值，因此与DBN和DBM比较，对输入数据中的噪声干扰更具稳健性的SDAE更适合本文任务。

因此，本文选择基于SDAE的深度学习方法对包含多光谱卫星遥感与地理信息的遥感大数据进行特征提取与分类识别，从而达到准确判识青藏高原积雪的目的，主要流程为：构建与训练基于SDAE的深度学习模型，将多光谱卫星遥感与地理信息数据作为输入，通过大量无标签样本对网络进行逐层贪婪预训练，再通过有监督训练对网络进行全局微调，训练完成后的网络即可有效辨识青藏高原遥感图像中的云、积雪以及无雪地表，从而绘制出青藏高原积雪分布图。本文方法的技术流程图如图 1所示。

图 1 技术流程 Fig. 1 Flow chart of method

图选项

1 研究区域与数据来源 1.1 研究区域概况

青藏高原是全球平均海拔最高的高原，有“世界屋脊”和“世界第三极”之称，平均海拔在4km以上，中南部的喜马拉雅山脉有多个山峰超过8km。青藏高原西起帕米尔高原，东至横断山脉，南至喜马拉雅山脉南缘，北起昆仑山至祁连山北侧，总面积近300万km²。受地形、地貌和大气环流的影响，该区域气候复杂多样，主要为高寒气候：冬季严寒，夏季温暖，全年温差小，日温差大。青藏高原区域降水量变化较大且分布不均，总体上，降水量与气温大致都是自东南向西北递减^[24]。

1.2 数据来源

1.2.1 多光谱卫星遥感数据

本文采用国家卫星气象中心提供的风云三号A星(FY-3A)所搭载的可见光红外扫描辐射计(VIRR)的多光谱遥感资料FY-3A/VIRR作为主要数据来源。FY-3A/VIRR拥有10个光谱通道，其中第1、7、8、9通道为可见光波段，第2、6、10通道为近红外波段，第3、4、5通道为热红外波段，星下点空间分辨率为1.1km，FY-3A/VIRR各通道光谱信息参考文献[25]。

1.2.2 地理信息数据

地理信息数据包括数字高程数据、坡度与坡向数据、地表覆盖类型数据。本文采用GTOPO30(Global 30 Arc-Second Elevation)作为高程数据，青藏高原区域数字高程及地面气象观测站分布如图 2所示。坡度与坡向数据由高程数据计算得到，通过高程、坡向以及坡度数据可以反映该区域的地势特征。地表覆盖类型数据源自国家基础地理信息中心发布的全球30m分辨率地表覆盖遥感制图(GlobalLand30)，包括耕地、森林、草地、灌木地、湿地、水体、苔原、人造地表、裸地、冰川和永久积雪共10种地表覆盖类型。

图 2 青藏高原区域数字高程及地面气象观测站分布 Fig. 2 QT Plateau digital elevation and meteorological stations

图选项

1.2.3 现有遥感积雪产品

本文选择美国国家雪冰数据中心(NSIDC)提供的MODIS逐日积雪产品MOD10A1和MYD10A1数据，以及中国气象局卫星气象中心提供的基于FY-3A卫星多传感器融合的FY-3A/MULSS每日雪盖产品，用于深度学习模型无标签样本的交叉筛选，以及与本文方法结果的对比和验证。所选数据时间范围为2011年1月1日至2013年12月31日。

1.2.4 地面实测雪深数据

地面气象站实测雪深数据来源于中国气象数据网(data.cma.cn)提供的每日雪深资料集。本文选取使用了青藏高原范围内106个站点，时段为2011年至2013年。每日雪深大于2cm则认为当天该气象站所在位置有积雪，否则为无雪，以此作为本文的标签样本与对比验证的客观参考标准。

2 研究方法 2.1 多光谱遥感数据预处理

FY-3A/VIRR数据预处理主要分为可见光与近红外通道数据定标、热红外通道数据定标、太阳天顶角订正、几何校正、图像拼接和裁剪。预处理流程如图 3所示。

图 3 遥感数据预处理流程 Fig. 3 Multispectral remote sensing data pre-processing

图选项

可见光与近红外通道数据定标是指将原始光谱数据转化为反射率数据。热红外通道数据定标包括星上线性定标、辐亮度非线性订正、等效黑体亮温计算，用于将原始光谱数据转化为亮度温度值。对于极轨卫星而言，其拍摄的卫星图像中各像元不同的空间位置导致各像元所处位置的太阳高度角也各不相同，因此需要通过太阳高度角订正，将不同空间位置的反射率修正为在统一太阳直射角度下的反射率值。几何校正采用地理位置查找表法(geographic lookup table，GLT)进行投影变换，利用FY-3A/VIRR数据自带的经纬度数据生成地理位置查找表，然后根据该表将原图像数据投影转换为0.01°等经纬度图像。最终通过图像拼接与裁剪，得到青藏高原区域的多光谱遥感数据。

2.2 多光谱遥感与地理信息融合的积雪判识方法

多光谱卫星遥感资料的数据规模巨大，不同波段的光谱信息与多种地理信息要素之间有着复杂的非线性关系，因此本文构建与训练一个基于SDAE的深度学习网络模型对多光谱遥感数据与地理信息数据进行特征表达与分类。

2.2.1 层叠去噪自动编码网络原理

层叠自动编码器是当今主流深度学习架构之一。自动编码器(auto-encoder,AE)是该架构的基本组成单元。本质上，AE是一种单隐层神经网络，但是AE的输出层并不用于输出分类或拟合结果，而是要求输出尽可能与输入相同。AE网络的迭代训练过程如图 4所示，输入信号由编码器转化为特征编码，再通过解码器转化为重构信号，然后计算重构信号与输入信号的误差，并将误差逆传播，通过调节AE网络各神经元间连接的权值使误差下降。通过控制隐藏层神经元数量，或对隐藏层的编码加入限制条件，可以使AE学习到对输入数据的特殊表达方式：如果隐藏层的单元数量小于输入层，则AE能实现对输入数据的降维表达；如果隐藏层单元数量大于输入层，并加入稀疏性限制，那么AE能实现对输入数据的稀疏表达。值得一提的是，这一训练过程是无监督的，并不需要预先知道训练样本的分类标签，而这对于缺乏足够多的地面观测记录来制作含标签训练样本的青藏高原区域，无监督训练的优势显得尤为重要。

图 4 自动编码器学习过程 Fig. 4 Training process of AE

图选项

设AE网络用于训练的样本数据集为{x⁽¹⁾,x⁽²⁾,…,x^(K)}，该样本集由K个n维向量x∈[0,1]^n×1构成，输入向量x由输入层传播至隐藏层，转化为m维特征向量h∈R^m×1，该过程被称为编码，如下所示

(1)

积雪产品	年均精度评价			年均覆盖率
积雪产品	分类正确率	漏测误差	多测误差	云	积雪	无雪地物
MYD10A1	93.83	5.59	0.58	51.98	3.84	44.17
MOD10A1	93.55	5.93	0.52	43.16	5.05	51.79
FY3A/MULSS	90.51	6.48	3.01	38.27	7.74	53.99
本文方法	93.96	5.06	0.98	35.01	8.47	56.51

[1]	YANG Kun, WU Hui, QIN Jun, et al. Recent Climate Changes over the Tibetan Plateau and Their Impacts on Energy and Water Cycle:A Review[J]. Global and Planetary Change , 2014, 112 : 79 –91. DOI:10.1016/j.gloplacha.2013.12.001
[2]	DIETZ A J, KUENZER C, GESSNER U, et al. Remote Sensing of Snow-A Review of Available Methods[J]. International Journal of Remote Sensing , 2012, 33 (13) : 4094 –4134. DOI:10.1080/01431161.2011.640964
[3]	KLEIN A G, HALL D K, NOLIN A W. Development of A Prototype Snow Albedo Algorithm for the NASA MODIS Instrument[C]//Proceedings of the 57th Eastern Snow Conference. Syracuse, New York:[s.n.], 2000:15-17.
[4]	JAIN S K, GOSWAMI A, SARAF A K. Accuracy Assessment of MODIS, NOAA and IRS Data in Snow Cover Mapping under Himalayan Conditions[J]. International Journal of Remote Sensing , 2008, 29 (20) : 5863 –5878. DOI:10.1080/01431160801908129
[5]	ZHOU Xiuji, ZHAO Ping, CHEN Junming, et al. Impacts of Thermodynamic Processes over the Tibetan Plateau on the Northern Hemispheric Climate[J]. Science in China Series D:Earth Sciences , 2009, 52 (11) : 1679 –1693. DOI:10.1007/s11430-009-0194-9
[6]	HUANG Jie, KANGS Shichang, ZHANG Qiangong, et al. Spatial Distribution and Magnification Processes of Mercury in Snow from High-Elevation Glaciers in the Tibetan Plateau[J]. Atmospheric Environment , 2012, 46 : 140 –146. DOI:10.1016/j.atmosenv.2011.10.008
[7]	王叶堂, 何勇, 侯书贵. 2000-2005年青藏高原积雪时空变化分析[J]. 冰川冻土 , 2007, 29 (6) : 855–861. WANG Yetang, HE Yong, HOU Shugui. Analysis of the Temporal and Spatial Variations of Snow Cover over the Tibetan Plateau Based on MODIS[J]. Journal of Glaciology and Geocryology , 2007, 29 (6) : 855 –861.
[8]	都伟冰, 李均力, 包安明, 等. 高山冰川多时相多角度遥感信息提取方法[J]. 测绘学报 , 2015, 44 (1) : 59–66. DU Weibing, LI Junli, BAO Anming, et al. Information Extraction Method of Alpine Glaciers with Multitemporal and Multiangle Remote Sensing[J]. Acta Geodaetica et Cartographica Sinica , 2015, 44 (1) : 59 –66. DOI:10.11947/j.AGCS.2015.20130514
[9]	李震, 施建成. 高光谱遥感积雪制图算法及验证[J]. 测绘学报 , 2001, 30 (1) : 67–73. LI Zhen, SHI Jiancheng. Snow Mapping Algorithm Development and Validation Using Hyperspectral Data[J]. Acta Geodaetica et Cartographica Sinica , 2001, 30 (1) : 67 –73. DOI:10.3321/j.issn:1001-1595.2001.01.013
[10]	HALL D K, RIGGS G A, SALOMONSON V V, et al. MODIS Snow-Cover Products[J]. Remote Sensing of Environment , 2002, 83 (1-2) : 181 –194. DOI:10.1016/S0034-4257(02)00095-0
[11]	RIGGS G A, HALL D K. Reduction of Cloud Obscuration in the MODIS Snow Data Product[C]//Proceedings of the 60th Eastern Snow Conference. Sherbrooke, Québec:[s.n.], 2003:205-212.
[12]	YANG Juntao, JIANG Lingmei, MÉNARD C B, et al. Evaluation of Snow Products over the Tibetan Plateau[J]. Hydrological Processes , 2015, 29 (15) : 3247 –3260. DOI:10.1002/hyp.v29.15
[13]	刘洵, 金鑫, 柯长青. 中国稳定积雪区IMS雪冰产品精度评价[J]. 冰川冻土 , 2014, 36 (3) : 500–507. LIU Xun, JIN Xin, KE Changqing. Accuracy Evaluation of the IMS Snow and Ice Products in Stable Snow Covers Regions in China[J]. Journal of Glaciology and Geocryology , 2014, 36 (3) : 500 –507.
[14]	李德仁, 张良培, 夏桂松. 遥感大数据自动分析与数据挖掘[J]. 测绘学报 , 2014, 43 (12) : 1211–1216. LI Deren, ZHANG Liangpei, XIA Guisong. Automatic Analysis and Mining of Remote Sensing Big Data[J]. Acta Geodaetica et Cartographica Sinica , 2014, 43 (12) : 1211 –1216. DOI:10.13485/j.cnki.11-2089.2014.0187
[15]	HINTON G, OSINDERO S, TEH Y W. A Fast Learning Algorithm for Deep Belief Nets[J]. Neural Computation , 2006, 18 (7) : 1527 –1554. DOI:10.1162/neco.2006.18.7.1527
[16]	郭丽丽, 丁世飞. 深度学习研究进展[J]. 计算机科学 , 2015, 42 (5) : 28–33. GUO Lili, DING Shifei. Research Progress on Deep Learning[J]. Computer Science , 2015, 42 (5) : 28 –33.
[17]	KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet Classification with Deep Convolutional Neural Networks[C]//Advances in Neural Information Processing Systems. Red Hook, NY:Curran Associates, 2012:1097-1105.
[18]	MIKOLOV T, KARAFIÁT M, BURGET L, et al. Recurrent Neural Network Based Language Model[C]//Proceedings of INTERSPEECH. Lyon, France:ISCA, 2010:1045-1048.
[19]	SALAKHUTDINOV R, HINTON G E. Deep Boltzmann Machines[J]. Journal of Machine Learning Research , 2009, 5 (2) : 448 –455.
[20]	VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and Composing Robust Features with Denoising Autoencoders[C]//Proceedings of the 25th International Conference on Machine Learning. New York:ACM Press, 2008:1096-1103.
[21]	VINCENT P, LAROCHELLE H, LAJOIE I, et al. Stacked Denoising Autoencoders:Learning Useful Representations in a Deep Network with a Local Denoising Criterion[J]. Journal of Machine Learning Research , 2010, 11 : 3371 –3408.
[22]	GIRSHICK R. Fast R-CNN[C]//Proceedings of the IEEE International Conference on Computer Vision. Santiago, Chile:IEEE, 2015:1440-1448.
[23]	SUTSKEVER I, VINYALS O, LE Q V. Sequence to Sequence Learning with Neural Networks[C]//Advances in Neural Information Processing Systems. 2014, 4:3104-3112.
[24]	秦小静, 孙建, 陈涛. 青藏高原温度与降水的时空变化研究[J]. 成都大学学报(自然科学版) , 2015, 34 (2) : 191–195. QIN Xiaojing, SUN Jian, CHEN Tao. Study on Spatiotemporal Variation of Temperature and Precipitation in Qinghai-Tibetan Plateau from 1974 to 2013[J]. Journal of Chengdu University (Natural Science Edition) , 2015, 34 (2) : 191 –195.
[25]	杨军, 董超华, 卢乃锰, 等. 中国新一代极轨气象卫星——风云三号[J]. 气象学报 , 2009, 67 (4) : 501–509. YANG Jun, DONG Chaohua, LU Neimeng, et al. FY-3A:the New Generation Polar-Orbiting Meteorological Satellite of China[J]. Acta Meteorologica Sinica , 2009, 67 (4) : 501 –509.

文章信息

文章历史

相关文章

工作空间