2. 南京大学江苏省地理信息技术重点实验室, 江苏 南京 210023
2. Jiangsu Provincial Key Laboratory of Geographic Information Science and Technology, Nanjing University, Nanjing 210023, China
土地利用/覆盖变化对陆地生态系统的生物多样性, 水、碳和养分循环, 能量平衡, 以及温室气体释放增加等其他环境问题具有重要的影响[1]。近年来, 随着遥感技术的发展, 基于遥感数据的解译方法成为获取土地利用/覆盖信息的主要方式之一。遥感影像分类一直是遥感影像处理的重要环节[2]。随着计算机技术的不断发展, 神经网络分类、专家系统分类、支持向量机分类等机器学习方法在土地覆盖遥感分类中取得了广泛的应用[3]。分类方法的发展极大地满足了日益庞大的遥感信息提取所需要的数量与速度, 但是样本的选取成为制约遥感图像自动解译发展的一个重要因素。由于受大气吸收与散射、物候、传感器定标等因素的影响, 同一地物的光谱在两期影像上不能服从同样的概率统计分布[4]。而针对大范围的分类制图任务, 重新标注样本需要耗费大量的时间与人力, 制约了遥感数据的自动化处理及长时间序列土地利用/覆盖变化的研究。
近年来, 迁移学习已经引起了广泛关注和研究。迁移学习是运用已有知识对不同但相关领域问题进行求解的一种机器学习方法, 它放宽了传统机器学习中的两个基本假设:①用于学习的训练样本与新的测试样本满足独立同分布的条件; ②必须用足够的训练样本才能学习得到一个好的分类模型[5-6]。迁移学习是为了解决已有信息、知识的再利用问题而提出的一种机器学习新理论, 这一理论为解决上述遥感分类中的样本选取问题提供了新思路。迁移学习在遥感图像的目标识别[7-8]及土地覆盖分类[4, 9-13]中已经有了一些研究, 但研究多针对高分数据或高光谱数据, 而对于在土地利用/覆盖研究与应用中最常用的中等分辨率数据如Landsat卫星数据的研究较匮乏。本文基于Landsat数据, 从像元级分类发出, 充分挖掘其丰富的光谱信息, 并从知识迁移的角度, 一定程度上解决了训练样本在目标影像中的优化问题, 从而构建一种基于样本标签迁移的遥感数据自动分类方法。
1 研究区与数据巫山县位于重庆市东部, 处三峡库区腹心, 素有“渝东北门户”之称。巫山县位于北纬30°45'—31°29', 东经109°33'—110°12'之间, 辖区面积2958 km2, 地处四川盆地东端, 属四川盆地东部山地地貌, 相对高差悬殊。研究区属中亚热带湿润季风气候区, 四季分明, 无霜期长, 雨量充沛, 日照时间长[14]。本文选取研究区位置如图 1所示, 位于巫山县内, 主要包括县政府所在的巫峡镇, 以及龙乡镇、两坪乡、建平乡大部分地区和其他乡镇的部分地区, 面积约为441 km2。
研究用到的数据主要包括全球30 m地表覆盖数据(GlobeLand30)、研究区1:5万DEM及Landsat TM影像。GlobeLand30数据集[15-16]是在863计划支持下, 由国家基础地理信息中心牵头完成的30 m分辨率的全球地表覆盖遥感制图数据产品。该数据覆盖全球南北纬80°内的陆地范围, 包括10种地表覆盖类型, 其中研究区范围内共有耕地、森林、草地、水体、人造地表 5类覆盖类型。如图 2、图 3所示。
研究所使用的TM数据共两期(见表 1), 作为参考土地覆盖分类专题图的GlobeLand30数据虽然以2010年为基准年, 但实际用于解译的影像大多获取时间为2009—2011年, 因此为了充分检测变化信息, 提高最终结果的精度, 选取2011年而非2010年的数据作为源领域影像。
迁移学习是基于给定的源领域数据集Ds与学习任务Ts, 充分挖掘其中的知识以帮助完成或完善Dt中的学习任务Tt的机器学习方法[5]。近年来, 随着时间序列遥感研究的发展, 迁移学习逐渐被引入遥感自动分类方法中, 如面向对象分类中的对象级样本迁移[4]与场景分类中的特征迁移[12]。以Landsat数据为代表的中等分辨率的遥感数据, 可以对全球大多数区域长时间连续观测, 并且有可以提供样本标签的相关土地利用/覆盖产品, 其样本迁移的问题有更大的应用研究价值。本文运用变化检测技术与光谱形状编码的方法, 构建了地物类别标签(关联知识)迁移的自动分类框架, 如图 4所示。
2.1 迁移学习卫星对同一地区的重复观测可以获得时间序列遥感数据, 假设X={X1, X2, …, XM}为M期同一地区但获取时间不同的多光谱影像, 其中第m期为有K个波段的多光谱数据Xm={xm, 1, xm, 2, …, xm, N}(其中N为研究区影像的像元总数), 其中含有大量训练样本, 而其他的影像仅有少量不足以分类甚至没有任何样本。通过迁移学习的方法可以获得时间序列内其他任意影像的土地覆盖分类图。当目标影像中有少量标注样本时, 这种迁移的方法被称为归纳迁移学习(inductive transfer learning), 当目标影像中没有任何标签样本时, 则为直推式迁移学习(transductive transfer learning)。
在本文的研究中只涉及两期影像之间的样本迁移, 因此上述可以简化为:X1={x1, 1, x1, 2, …, x1, N}与X2={x2, 1, x2, 2, …, x2, N}分别为t1与t2两个时期获得的研究区的遥感影像, 其中(x1, i, x2, i)是第i对两期影像中同一空间位置的像元。假设两期影像中的土地覆盖类别一致, 且类别为Ω={ω1, ω2, …, ωB}。假设影像X1有对应的土地覆盖分类产品C1={x1, j, y1, j}i=1L, 其中x1, j∈X1表示对应分类图上相应空间位置的像元, 而y1, j∈Ω表示对应的类别标签。同时认为在X2时期没有对应土地覆盖分类产品且标注训练样本非常困难。那么X1则为源领域影像, X2为目标领域影像。迁移学习可以充分利用X1影像及对应土地覆盖分类产品C1中的有用知识, 并迁移至目标影像中完成目标影像的分类。在本文研究中, 主要在于地类标签的迁移, 将源领域中地类标签通过一定的方法筛选并标记为目标领域可靠的训练样本, 以达到目标领域影像自动分类的目的。
2.2 变化检测变化检测是上述算法流程中的一个关键技术, 其主要作用是确定X1和X2两个时相影像之间的不变信息。相对辐射定标可以提升变化检测效果, 在变化检测之前可以考虑采用暗像元法或者直方图匹配法来完成相对辐射定标。采用变化矢量分析法(CVA), 变化矢量是描述从时相1到时相2某像元光谱变化大小和方向的矢量[17]。变化矢量分析法首先需要对两个不同时相的影像作差值运算, 生成多光谱的差值图像。差值图像中的第i个像元的变化矢量可以表示为[16]
式中, x1, ik与x2, ik分别为影像X1、X2中第i像元k波段的像元灰度值。根据变化矢量分析的原理, 变化矢量ΔXi的方向代表地物的变化类型, 模则代表了地物变化的大小程度, 即变化矢量可以通过角度α与长度ρ来表示[19], 其中
如上文所述, ρ表示第i个像元的变化强度, 在本文的变化检测中, 仅考虑运用CVA来确定像元的变化强度从而选择不变区域, 不考虑变化类型的问题。
对于CVA计算得到的变化检测结果, 采用大津法(Otsu’s)对结果进行阈值分割。Otsu’s是一种图像灰度自适应的阈值分割算法, 该方法按照图像上的灰度值分布, 将图像分为背景和前景两部分, 遍历不同的阈值, 计算不同阈值下对应的背景与前景之间的类内方差取得最大值时, 对应的阈值即为所求的阈值。
通过上述过程, 确定不变地物像元对应的空间位置, 并将相应的地类标签标注到目标影像上。
2.3 光谱形状计算对于上文得到的结果, 可以采用随机选取的方法抽取样本对目标影像进行分类, 但是考虑到土地覆盖分类产品C1本身的精度及分类产品, 在直接分类的结果上进行了一系列后处理, 且分类产品使用影像与源影像存在一些差异, 导致实际上迁移至目标影像中的地类标签可能不完全准确。为了选择可靠的样本进行训练, 采用光谱形状计算的方法构建一种较优样本的选择策略。
对于中等分辨率的多光谱数据, 很难获取到较好的形状或纹理特征, 尤其是像研究区这样地形起伏较大、景观格局破碎度较高的区域。同时Landsat数据有较丰富的光谱信息, 重复挖掘其光谱信息有助于优化分类结果。通过对影像的观察统计发现, 同类地物如林地由于太阳高度角或生长程度的不同, 表现在影像上的各个波段的反射率可能有差异。但是光谱曲线的形状总是一致或相似, 可以通过一种光谱曲线形状计算的方法获得[20]。
假设x2, iK∈X2是目标影像的标记样本, z2, i=
一般认为, 训练样本与分类结果在特征空间上分布越趋于一致, 取得的分类效果就越理想, 因此直方图统计常用样本的选取。利用不变地物的土地覆盖分类结果将地类标记在目标影像上。对于其中的每一类样本, 采用上述公式可以获得其相应的光谱形状编码结果。将计算得到相同的光谱形状的样本进行聚类, 并统计聚类后的直方图, 去掉直方图内值较小的类, 并按直方图内的比例选取训练样本。
3 试验与结果分析研究区影像尺寸为700×700像素, 以2011年获取的Landsat影像为源领域影像, 对应的土地覆盖分类产品为GlobeLand30, 待分类的目标领域影像为2007年获取的Landsat影像, 采用本文提出的样本迁移方法, 对目标数据进行分类。为了更好地说明光谱曲线形状在样本选择中的作用, 测试了不使用光谱曲线形状下的分类效果; 同时考虑研究区地形起伏较大的特点, 加入数字高程模型与坡度作为特征, 发现对分类结果有积极的影响。选取支持向量机(SVM)作为目标影像分类的分类器。
分类结果如图 5所示, 其中图 5(a)为未经过光谱形状计算直接分类结果(SVM), 图 5(b)为光谱形状计算后的分类结果(SVM_scs), 图 5(c)(SVM(T))与图 5(d)(SVM(T)_scs)为图 5(a)与图 5(b)基础上加上地形特征后的分类结果。结合2006年的研究区二调数据及Google Earth高清影像, 随机选取了2109个有效的验证样本点, 对分类结果进行精度验证, 同时计算了4次分类结果的各类地物的生产者精度、总体精度与Kappa系数, 见表 2。
类别 | 测试样本 | 测试精度/(%) | |||
SVM | SVM_scs | SVM(T) | SVM(T)_scs | ||
人工地表 | 64 | 100 | 89.06 | 100 | 98.44 |
水体 | 366 | 100 | 100 | 100 | 100 |
林地 | 901 | 100 | 100 | 100 | 100 |
耕地 | 391 | 73.45 | 75.71 | 79.10 | 84.18 |
草地 | 387 | 76.17 | 81.82 | 85.75 | 87.96 |
Kappa | 0.846 8 | 0.865 1 | 0.891 5 | 0.914 1 | |
OA | 88.72 | 90.04 | 91.99 | 93.65 |
从精度验证的结果来看, 加入地形特征对研究区的分类结果的精度有显著提高, 主要表现在对人工地表、耕地、草地的分类精度有明显提升。对比SVM_scs与SVM分类结果、SVM(T)_scs与SVM(T)分类结果, 以及SVM(T)_scs与SVM(T)分类结果发现, 光谱形状计算对总体精度和Kappa系数有明显的提高, 其中主要表现在对耕地和草地两类的精度有明显的提高。考虑到耕地和草地因为植被的稀疏程度或同一地区不同作物物候特征存在差异因素, 这两类地类类内的光谱可能就存在较大差异。光谱形状方法对样本的选取进行了一定的优化, 使得不同光谱曲线形状的耕地或草地按照各自的比例选取样本, 这样的训练样本更能代表地物的真实分布, 从而对分类的结果有一定的提高。
SVM(T)_scs的分类总体精度达到了93.65%, 对应的Kappa系数为0.914 1。由此可见, 本文提出的自动分类方法可以得到较好的分类结果。尤其对人工地表、水体、林地和草地的提取精度较高, 均在85%以上。耕地的提取精度相对较低, 为84.18%, 考虑到研究区内的耕地类型较多样, 且部分区域分布十分破碎。因此耕地的最终提取结果还算较为理想, 可以在一定程度上满足应用需求。
4 结语本文结合土地覆盖遥感分类产品提出了一种基于迁移学习的样本自动选取的方法, 并构建了面向Landsat的像元级自动分类的算法框架。基于GlobeLand30产品, 运用基于变化矢量分析的变化检测与光谱形状编码的方法, 充分挖掘Landsat数据丰富的多光谱信息, 通过知识迁移的方法将源领域内的地类标签迁移至目标影像中, 并通过支持向量机算法完成分类, 最终分类精度达到93.65%。综上所述, 本文所提出的样本迁移方法大大降低了目视采集的烦琐性, 可以自动选取可靠的样本, 并且能够得到较好的分类结果, 从而提高了遥感影像分类的自动化程度, 在一定程度上满足了时间序列遥感数据的智能解译需求, 具有实际应用价值。
[1] | 陈广生, 田汉勤. 土地利用/覆盖变化对陆地生态系统碳循环的影响[J]. 植物生态学报, 2007, 31(2): 189–204. DOI:10.17521/cjpe.2007.0024 |
[2] | 沈泉飞, 曹敏, 史照良, 等. 基于布谷鸟算法的遥感影像智能分类[J]. 测绘通报, 2017(1): 65–68. |
[3] | 张增详, 汪潇, 温庆可, 等. 土地资源遥感应用研究进展[J]. 遥感学报, 2016, 20(5): 1243–1258. |
[4] | 吴田军, 骆剑承, 夏列钢, 等. 迁移学习支持下的遥感影像对象级分类样本自动选择方法[J]. 测绘学报, 2014, 43(9): 908–916. |
[5] | PAN J S, YANG Q. A Survey on Transfer Learning[J]. IEEE Transactions on Knowledge & Data Engineering, 2010, 22(10): 1345–1359. |
[6] | 庄福振, 罗平, 何清, 等. 迁移学习研究进展[J]. 软件学报, 2015, 26(1): 26–39. |
[7] | DAN Z, SANG N, CHEN Y, et al. Remote Sensing Object Recognition Based on Transfer Learning[C]//International Conference on Fuzzy Systems and Knowledge Discovery (FSKD). Shenyang: IEEE, 2013: 930-934. http://ieeexplore.ieee.org/iel7/6811385/6816154/06816328.pdf?arnumber=6816328 |
[8] | 鲁恒, 付萧, 贺一楠, 等. 基于迁移学习的无人机影像耕地信息提取方法[J]. 农业机械学报, 2015, 46(12): 274–284. DOI:10.6041/j.issn.1000-1298.2015.12.037 |
[9] | RAJAN S, GHOSH J, CRAWFORD M M. Exploiting Class Hierarchies for Knowledge Transfer in Hyperspectral Data[J]. IEEE Transactions on Geoscience & Remote Sensing, 2006, 44(11): 3408–3417. |
[10] | PERSELLO C, BRUZZONEL. Active Learning for Domain Adaptation in the Supervised Classification of Remote Sensing Images[J]. IEEE Transactions on Geoscience & Remote Sensing, 2012, 50(11): 4468–4483. |
[11] | DEMIR B, BOVOLO F, BRUZZONE L. Updating Land-Cover Maps by Classification of Image Time Series:A Novel Change-Detection-Driven Transfer Learning Approach[J]. IEEE Transactions on Geoscience & Remote Sensing, 2013, 51(1): 300–312. |
[12] | SUN H, LIU S, ZHOU H, et al. Unsupervised Cross-View Semantic Transfer for Remote Sensing Image Classification[J]. Geoscience & Remote Sensing Letters, 2016, 13(1): 13–17. |
[13] | ZHOU Y, LIAN J, HAN M. Remote Sensing Image Transfer Classification Based on Weighted Extreme Learning Machine[J]. Geoscience & Remote Sensing Letters, 2016, 13(10): 1405–1409. |
[14] | 罗洁琼. 基于GIS的三峡库区山地人居环境自然适宜性动态评价——以奉节县和巫山县为例[D]. 重庆: 西南大学, 2013. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y2309813&f=datatang |
[15] | 廖安平, 彭舒, 武昊, 等. 30 m全球地表覆盖遥感制图生产体系与实践[J]. 测绘通报, 2015(10): 4–8. |
[16] | 陈军, 陈晋, 廖安平, 等. 全球30m地表覆盖遥感制图的总体技术[J]. 测绘学报, 2014, 43(6): 551–557. |
[17] | 陈晋, 何春阳, 卓莉. 基于变化向量分析(CVA)的土地利用/覆盖变化动态监测(Ⅱ)——变化类型的确定方法[J]. 遥感学报, 2001, 5(5): 346–353. DOI:10.11834/jrs.20010505 |
[18] | 常方正, 赵银娣, 刘善磊. 遥感影像CVA变化检测的CUDA并行算法设计[J]. 遥感学报, 2016, 20(1): 114–128. |
[19] | LIU S, BRUZZONE L, BOVOLO F, et al. Sequential Spectral Change Vector Analysis for Iteratively Discovering and Detecting Multiple Changes in Hyperspectral Images[J]. IEEE Transactions on Geoscience Remote Sensing, 2015, 53(8): 4363–4378. DOI:10.1109/TGRS.2015.2396686 |
[20] | LI E, DU P, SAMAT A, et al. An Automatic Approach for Urban Land-cover Classification from Landsat-8 OLI Data[J]. International Journal of Remote Sensing, 2015, 36(24): 5983–6007. DOI:10.1080/01431161.2015.1109726 |