基于联合字典稀疏表示的遥感图像超分辨率制图

引用本文

赵春晖, 杨怀娟, 刘务, 等. 基于联合字典稀疏表示的遥感图像超分辨率制图[J]. 哈尔滨工程大学学报, 2018, 39(8): 1400-1408. DOI: 10.11990/jheu.201706002.

ZHAO Chunhui, YANG Huaijuan, LIU Wu, et al. Super-resolution mapping of remote sensing image based on joint dictionary sparse representation[J]. Journal of Harbin Engineering University, 2018, 39(8): 1400-1408. DOI: 10.11990/jheu.201706002.

基金项目

国家自然科学基金项目（61405041，61571145）

通信作者

赵春晖, E-mail:zhaochunhui@hrbeu.edu.cn

作者简介

赵春晖(1965-), 男, 教授, 博士生导师

文章历史

收稿日期：2017-06-01
网络出版日期：2018-04-27

Contents Abstract Full text Figures/Tables PDF

基于联合字典稀疏表示的遥感图像超分辨率制图

赵春晖, 杨怀娟, 刘务, 朱海峰, 万晓青

哈尔滨工程大学信息与通信工程学院, 黑龙江哈尔滨 150001

收稿日期：2017-06-01；网络出版日期：2018-04-27

基金项目：国家自然科学基金项目（61405041，61571145）

作者简介：赵春晖(1965-), 男, 教授, 博士生导师.

通信作者：赵春晖, E-mail:zhaochunhui@hrbeu.edu.cn.

摘要：超分辨率制图是一种由低分辨率遥感图像获得高分辨率土地覆盖图的技术，针对空间相关性原则不足以描述复杂地物模式的问题，本文提出了一种基于联合字典稀疏表示的超分辨率制图方法。利用迁移学习机制，使用自然图像训练高、低分辨率图块联合字典，并根据高、低分辨率图像块对与其对应字典的稀疏表示间的一致性，将低分辨率丰度图像的稀疏表示与高分辨率字典结合生成高分辨率软分类图像，最后进行类分配从而获得高分辨率土地覆盖图。利用合成Landsat多光谱图像和NLCD 2001子图像对所提方法进行测试，并与几种现有的典型超分辨率制图方法进行比较，实验结果显示本文所提算法的超分辨率制图精度优于对比算法。

关键词：遥感图像超分辨率制图稀疏表示迁移学习联合字典

Super-resolution mapping of remote sensing image based on joint dictionary sparse representation

ZHAO Chunhui, YANG Huaijuan, LIU Wu, ZHU Haifeng, WAN Xiaoqing

College of Information and Communication Engineering, Harbin Engineering University, Harbin 150001, China

Abstract: Super-resolution mapping (SRM) is a technique for generating fine-spatial-resolution land cover maps from coarse-spatial-resolution fraction images. In this paper, we propose a new SRM method that uses a joint dictionary-based sparse representation to overcome one problem:in practice, the spatial dependence principle is not sufficient for describing complex patterns. We use a transfer learning mechanism and natural images to jointly train a high-and low-resolution image patch dictionary, and according to the similarity of the sparse representations of the low-and high-resolution image patch pairs with their corresponding dictionaries, high-resolution soft-classified images are generated by combining the sparse representation of low-resolution abundance images with the high-resolution image patch dictionary. Finally, we perform class allocation to obtain a high-resolution land cover map. Using a synthetic Landsat multispectral image and a subset image of the National Land Cover Database 2001, we tested and compared the performance of the proposed method against those of several existing typical SRM methods. The results show that the proposed method has the highest SRM accuracy of the SRM algorithms tested.

Keywords: remote-sensing images super-resolution mapping sparse representation transfer learning joint dictionary

混合像元广泛存在于遥感影像，特别是低空间分辨率遥感图像中，给土地覆盖制图技术带来了巨大的挑战。混合像元分解技术通过估计每个混合像元中不同类别地物所占的比例，实现对遥感图像中混合像元的定量分析。然而，混合像元分解不能确定各地物类别在亚像元级别的空间分布情况^[1]。为了进一步解决这个问题，超分辨率制图(super-resolution mapping, SRM)，也被称为亚像元定位，自提出以来得到了快速发展。到目前为止，超分辨率制图技术已经成功应用于海岸线和湖泊边界测绘^[2]、城市土地覆盖测绘^[3]、土地覆盖监测^[4]以及地面控制点改进^[5]等领域。

超分辨率制图受到越来越多的关注，近年来大量算法也相继发展起来。目前超分辨率制图技术常用空间相关性理论作为先验模型来描述地物空间格局，如基于插值的方法^[6]、亚像元/像元间空间引力模型(sub-pixel/pixel spatial attraction model，SPSAM)^[7]、像元交换算法^[8]、Hopfield神经网络^[9]、遗传算法^[10]、马尔可夫随机场模型^[11]和粒子群优化算法^[12]等。基于空间相关性理论的SRM算法具有简便和高效的特性，但是在制图缩放尺度较大和处理的图像存在复杂地物分布模式时，仅最大化空间相关性不足以描述地物特征。在这种情况下，为了提高超分辨率制图精度和更好地保留地物特征，来自全色图像^[13]、多偏移图像^[14]和其他高分辨率土地覆盖图^[15]的辅助信息被结合到SRM算法中。除此之外，地物分布空间特征或辅助先验信息也可以从训练图像中学习获得，例如基于反向传播(BP)神经网络^[16]、两点直方图^[17]、指示协同克里格^[18]、支持向量回归^[19]等方法，这些算法被称为基于学习的SRM算法。尽管上述基于学习的SRM算法能够在一定条件下提高超分辨率制图精度，然而它们各自也存在一定的局限性。例如作为辅助数据或训练数据的高分辨率图像应当与输入图像覆盖相同的区域或者具有相似的地物分布模式，然而在实际中这些数据通常不易获得。

针对上述问题，本文提出了基于联合字典稀疏表示的超分辨率制图算法(joint dictionary sparse representation super-resolution mapping, JDSR_SRM)，利用稀疏表示从自然图像中学习得到高、低分辨率图块联合字典，根据迁移学习机制，将学习得到的联合字典迁移到遥感图像超分辨率制图中。利用高、低分辨率图块联合字典与高、低分辨率图块之间稀疏表示的一致性特点，将联合字典用于恢复高空间分辨率软分类图像，优化亚像元锐化过程，实现提高超分辨率制图精度的目的。

1 超分辨率制图

作为混合像元分解的后处理步骤，超分辨率制图旨在根据软分类结果预测每个混合像元内每类地物的空间位置，其输出结果本质上是一个比输入图像具有更高空间分辨率的土地覆盖图^[20]。为了构建超分辨率制图观察模型，假定输入的低分辨率丰度图像Y包含M×N像元，地物类别数为L。SRM将原始丰度图像Y转换为包含(s×M)×(s×N)亚像元的高分辨率图像X，即Y中的每一个粗像元被分成s×s个亚像元，其中s为降尺度因子。这一过程可以表示为^[21]

$ {y_c} = S{x_c} + n $

(1)

式中：y_c为某像元中c类地物的输入丰度值；S是一个降采样向量；x_c代表一个s²大小的向量，其中x_ci=1表示高分辨率图像块中第i个亚像元属于c类地物，否则，第i个亚像元不属于c类地物；n则表示图像中的噪声或者由混合像元分解带来的误差。超分辨率制图就是利用观测图像Y反向求解X的过程，由此可以看出，超分辨率制图是一个欠定问题，即对于一幅低分辨率图像可能有多幅高分辨率图像与其对应。

图 1以两类地物为例给出了上述超分辨率制图过程的简单示意图，其中灰色块代表地物0，白色块代表地物1。图 1(a)表示包含3×3粗像元的输入丰度图像，其中每个像元上所标数字为地物0在混合像元中所占比例，相应的地物1所占比例可由1减去地物0的比例得到。在类别比例约束下，以降尺度因子s=2对丰度图像进行超分辨率制图，得到图 1(b)和图 1(c)所示的不同结果，由空间相关性原理可知图 1(c)的空间分布比图 1(b)更为合理。

	Download: JPG larger image
图 1 超分辨率制图原理示意图 Fig. 1 Schematic of super-resoluton mapping

在图 1所示的简单地物分布模型中，利用空间相关性原理可以确定最优地物分布模式。然而在实际情况中，土地覆盖图的地物种类繁多且分布模式更加复杂，空间相关性原理不能准确地描述地物空间信息。因此借助于其他辅助信息和先验模型对丰度图像进行降尺度分析，是目前超分辨率制图方法的研究热点。

2 信号稀疏表示

稀疏性是信号中普遍存在的一种属性，即通常的信号可以用极少的数据很好地表示^[22]。信号稀疏表示理论：信号可以在一组超完备基张成的空间里得到分解，且线性表示系数只有极少数为非零值。这组超完备基称为超完备字典，求解稀疏系数的过程叫做信号的稀疏分解。

基于过完备字典的稀疏表示模型自提出以来便收到各研究领域的高度关注，近年来更成为图像信号表示领域的研究热点，被广泛应用于图像去噪、图像压缩、图像超分辨率等方面。对稀疏表示模型的描述如下：给定一个信号x∈Rⁿ和过完备字典D =[d₁ d₂ … d_k]∈R^n×k，(n＜k)，则x可以近似表示为D中原子的线性组合，即

$ \mathit{\boldsymbol{x}} \approx \sum\limits_{i = 1}^k {{\alpha _i}{\mathit{\boldsymbol{d}}_i}} $

(2)

其中α=[α₁ α₂ …α_k]∈R^k为字典中各原子的加权系数。根据稀疏表示理论，α中的非零元素个数远小于k，即‖α‖₀≪k，此α被称为稀疏系数，如图 2所示(图中灰色部分表示非零元素)。式(2)的近似是由于信号噪声和表示误差的存在导致信号不能被稀疏系数完全精确重构，将其写成不等式形式为

$ \mathop {\min }\limits_\alpha {\left\| \mathit{\boldsymbol{\alpha }} \right\|_0}\;\;\;{\rm{s}}.\;{\rm{t}}.\;\;\left\| {\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{D\alpha }}} \right\|_2^2 \le \delta $

(3)

	Download: JPG larger image
图 2 稀疏表示模型示意图 Fig. 2 Schematic of sparse representation model

式中：δ表示一个预设的误差约束阈值。由于L₀范数的存在，式(3)通常是一个非凸的、不确定问题。研究结果表明，在α足够稀疏的条件下，L₀范数可以用L₁范数来替代^[23]：

$ \mathop {\min }\limits_\alpha {\left\| \mathit{\boldsymbol{\alpha }} \right\|_1}\;\;\;{\rm{s}}.\;{\rm{t}}.\;\;\left\| {\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{D\alpha }}} \right\|_2^2 \le \delta $

(4)

式(4)也可以用正则化的形式等效地表示：

$ \mathop {\min }\limits_\alpha \left\| {\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{D\alpha }}} \right\|_2^2 + \lambda {\left\| \mathit{\boldsymbol{\alpha }} \right\|_1} $

(5)

式中λ代表的是平衡稀疏度和表示误差的正则化参数。

2006年D.L.Donoho^[22]提出的压缩感知理论证明了在信号满足一定的稀疏性条件下，降采样信号能够以极高的概率被精确恢复。将这一理论引申到图像信号领域，可以发现信号的稀疏性与图像分辨率增强之间的关系。由于低分辨率图像可以看作高分辨率图像的降采样信号，则在稀疏先验约束下，高分辨率图像能够通过稀疏表示从低分辨率图像中精确恢复。对基于软硬属性转换的超分辨率制图(soft-then-hard super-resolution mapping, STHSPM)^[20]方法来说，其亚像元锐化步骤的输入输出都是0~1的连续值(这一过程也被称为软属性值估计)，则高分辨率软分类图像可以通过稀疏表示由低分辨率丰度图像恢复。因此本文将利用稀疏表示方法解决超分辨率制图的亚像元锐化问题。

3 迁移学习

传统的机器学习就是从给定的训练数据中学习一个模型，然后利用该模型对来自同一个任务的测试数据进行预测。这个过程通常建立在两个假设条件上：1)所用的训练数据必须与测试数据具有相同或类似的分布；2)必须具有足够多的训练数据以保证学习到好的模型。然而在很多领域，尤其是新兴领域中，大量符合同分布假设的训练数据非常难以获取，而将可获得的大量不同分布下的训练数据丢弃也十分浪费。在这种背景下，迁移学习方法在各领域得到了广泛关注。

迁移学习的目标在于运用已有的知识对不同但相关领域的问题进行求解^[24]。不同于传统的机器学习，迁移学习放宽了对训练数据的假设要求，利用其他领域学习的知识或模型来解决目标领域缺乏训练样本的问题。然而，若迁移领域间的任务差异性较大，加入迁移学习后可能会产生学习效果变差的情况，即“负迁移”^[25]现象。因此找到并合理利用一个合适的源域、避免负迁移，是迁移学习研究中的一个重要挑战。

针对应用的不同环境，迁移学习可以分为不同类别，如样本迁移、特征迁移、参数迁移和关联知识迁移等。其中样本迁移具有更强、更直接的知识迁移能力，适用于目标域训练数据难以获取，而源域训练数据充足且与目标域数据相似性较高的情况。目前迁移学习已用于文本分类、图像分类、情感分类和人工智能规划等领域，并取得了显著的研究成果。

4 联合字典稀疏表示的超分辨率制图方法

本文运用迁移学习中的样本迁移方法，将从自然图像中学习到的知识迁移到遥感图像超分辨率制图中，使用自然图像的高、低分辨率图像块训练得到的联合字典，对超分辨率制图的输入丰度图像进行稀疏分解，并用求解得的稀疏系数恢复高分辨率软分类图，由此提出一种新的基于联合字典稀疏表示的超分辨率制图方法。

4.1 离线联合训练字典对

选取一组高分辨率自然图像作为训练图像，经采样处理和特征提取得到训练样本集T={X^h, Y^l}，其中X^h={x₁, x₂, …, x_n}为高分辨率图像块样本集，Y^l={y₁, y₂, …, y_n}为与X^h相对应的低分辨率图像块样本集。应用稀疏编码算法，对每个字典进行单独训练的公式为

$ {\mathit{\boldsymbol{D}}_h} = \arg \mathop {\min }\limits_{\left\{ {{D_h},\beta } \right\}} \left\| {{\mathit{\boldsymbol{X}}^h} - {\mathit{\boldsymbol{D}}_h}\mathit{\boldsymbol{\beta }}} \right\|_2^2 + \lambda {\left\| \mathit{\boldsymbol{\beta }} \right\|_1} $

(6)

$ {\mathit{\boldsymbol{D}}_l} = \arg \mathop {\min }\limits_{\left\{ {{D_l},\beta } \right\}} \left\| {{\mathit{\boldsymbol{Y}}^l} - {\mathit{\boldsymbol{D}}_l}\mathit{\boldsymbol{\beta }}} \right\|_2^2 + \lambda {\left\| \mathit{\boldsymbol{\beta }} \right\|_1} $

(7)

式(6)和式(7)中第一项为重构误差，第二项为稀疏惩罚项，β表示稀疏系数。

为保证学习得到的高、低分辨率字典对输入输出图像中每一对高、低分辨率图像块的稀疏表示具有一致性，需要对字典对进行联合训练，使其共享稀疏编码^[26]，将式(6)、(7)的目标函数结合起来表示为

$ \begin{array}{*{20}{c}} {\mathop {\min }\limits_{\left\{ {{D_h},{D_l},\beta } \right\}} \frac{1}{M}\left\| {{\mathit{\boldsymbol{X}}^h} - {\mathit{\boldsymbol{D}}_h}\mathit{\boldsymbol{\beta }}} \right\|_2^2 + \frac{1}{N}\left\| {{\mathit{\boldsymbol{Y}}^l} - {\mathit{\boldsymbol{D}}_l}\mathit{\boldsymbol{\beta }}} \right\|_2^2 + }\\ {\lambda \left( {\frac{1}{M} + \frac{1}{N}} \right){{\left\| \mathit{\boldsymbol{\beta }} \right\|}_1}} \end{array} $

(8)

式中：M和N分别代表向量形式下高、低分辨率图像块的维数。将式(8)进一步简化可得：

$ \begin{array}{*{20}{c}} {\left\{ {{\mathit{\boldsymbol{D}}_h},{\mathit{\boldsymbol{D}}_l}} \right\} = \mathop {{\text{arg}}\min }\limits_{\left\{ {{D_h},{D_l},\beta } \right\}} \left\| {{\mathit{\boldsymbol{X}}_c} - {\mathit{\boldsymbol{D}}_c}\mathit{\boldsymbol{\beta }}} \right\|_2^2 + \hat \lambda {{\left\| \mathit{\boldsymbol{\beta }} \right\|}_1}}\\ {{\rm{s}}.\;{\rm{t}}.\;\;\;\;\left\| {{\mathit{\boldsymbol{d}}_i}} \right\|_2^2 \le 1,i = 1,2, \cdots ,k} \end{array} $

(9)

其中

$ {\mathit{\boldsymbol{X}}_c} = {\left[ {\begin{array}{*{20}{c}} {{\mathit{\boldsymbol{X}}^h}/\sqrt M }&{{\mathit{\boldsymbol{Y}}^l}/\sqrt N } \end{array}} \right]^{\rm{T}}} $

$ {\mathit{\boldsymbol{D}}_c} = \left[ {\begin{array}{*{20}{c}} {{\mathit{\boldsymbol{D}}_h}/\sqrt M ,}&{{\mathit{\boldsymbol{D}}_l}/\sqrt N } \end{array}} \right]。$

式(9)对于参数D_c和β是非凸的，但是当其中一个参数固定时，对另一个参数来说式(9)成为一个凸优化问题，因此本文采取交替优化的方法解决上述问题，即先固定D_c优化β，然后再固定β更新D_c，依次循环，直至D_c和β的迭代收敛。最终训练得到的高、低分辨率图像块联合字典{D_h, D_l}被用于超分辨率制图技术的亚像元锐化步骤。

4.2 基于联合字典稀疏表示的超分辨率制图

超分辨率制图是一个欠定问题，因此为了解决该问题，本文将稀疏先验加入高分辨率软属性值的估计过程，对其不确定性进行约束。稀疏先验假设高分辨率图像块x可以由一个过完备字典稀疏表示，而其稀疏系数可以由其低分辨率观察恢复^[26]。具体来说，对应的高、低分辨率图像块在其各自字典下的稀疏表示具有一致性。根据这一先验信息，给定分别由高、低分辨率图像采样块学习得到的联合字典对D_h和D_l，则高分辨率软分类图像中任一图块可以表示为D_h的一个稀疏线性组合形式：

$ \mathit{\boldsymbol{x}} \approx {\mathit{\boldsymbol{D}}_h}\mathit{\boldsymbol{\alpha }} $

(10)

其中稀疏系数α可由低分辨率丰度图像块y与D_l的稀疏表示得到。

根据第2节介绍的稀疏表示模型，可由式(4)推导出低分辨率丰度图像块y在过完备字典D_l下的稀疏表示求解式：

$ \mathop {\min }\limits_\alpha {\left\| \mathit{\boldsymbol{\alpha }} \right\|_1}\;\;\;\;{\rm{s}}.\;{\rm{t}}.\;\;\;\left\| {\mathit{\boldsymbol{y}} - {\mathit{\boldsymbol{D}}_l}\mathit{\boldsymbol{\alpha }}} \right\|_2^2 \le \delta $

(11)

为了提高高分辨率软属性值的估计精度和联合字典对的适用性，需要引入一个算子F对低分辨率输入图像和训练图像进行特征提取：

$ \mathop {\min }\limits_\alpha {\left\| \mathit{\boldsymbol{\alpha }} \right\|_1}\;\;\;\;{\rm{s}}.\;{\rm{t}}.\;\;\;\left\| {Fy - F{\mathit{\boldsymbol{D}}_l}\mathit{\boldsymbol{\alpha }}} \right\|_2^2 \le \delta $

(12)

此处算子F通常是一种高通滤波器，因为图像的有效信息多存于高频处。目前存在多种特征提取方法，考虑特征提取的有效性和运算的简便性，本文采用了梯度算子和Laplace算子来提取低分辨率图像的一、二阶特征，其表达式为

$ \begin{array}{l} {\mathit{\boldsymbol{f}}_1} = \left[ {\begin{array}{*{20}{c}} { - 1}&0&1 \end{array}} \right],{\mathit{\boldsymbol{f}}_2} = \mathit{\boldsymbol{f}}_1^{\rm{T}}\\ {\mathit{\boldsymbol{f}}_3} = \left[ {\begin{array}{*{20}{c}} 1&0&{ - 2}&0&1 \end{array}} \right],{\mathit{\boldsymbol{f}}_4} = \mathit{\boldsymbol{f}}_3^{\rm{T}} \end{array} $

(13)

用这4个滤波器对低分辨率图像进行滤波，则每个图块得到4个描述特征向量，将其连接为一个向量作为低分辨率图像块的最终表示。

若对每一个图像块单独求解式(12)，会存在没有充分考虑相邻图块间兼容性的问题。因此需要加入限制项，保证当前高分辨率软分类图块的恢复结果与先前恢复的相邻图块一致，将式(12)修改为

$ \mathop {\min }\limits_\alpha {\left\| \mathit{\boldsymbol{\alpha }} \right\|_1}\;\;\;\;{\rm{s}}.\;{\rm{t}}.\;\;\;\begin{array}{*{20}{c}} {\left\| {Fy - F{\mathit{\boldsymbol{D}}_l}\mathit{\boldsymbol{\alpha }}} \right\|_2^2 \le {\delta _1}}\\ {\left\| {\mathit{\boldsymbol{z}} - \mathit{\boldsymbol{P}}{\mathit{\boldsymbol{D}}_h}\mathit{\boldsymbol{\alpha }}} \right\| \le {\delta _2}} \end{array} $

(14)

式中:P用于提取当前图像块与先前恢复的图像块之间的重叠部分，z则代表先前恢复的图像块在重叠区域中的值。将式(14)简化为正则化形式：

$ \mathop {\min }\limits_\alpha \left\| {\mathit{\boldsymbol{\tilde y}} - \mathit{\boldsymbol{\tilde D\alpha }}} \right\|_2^2 + \lambda {\left\| \mathit{\boldsymbol{\alpha }} \right\|_1} $

(15)

式中：$\mathit{\boldsymbol{\tilde{D}=}}{{\left[F{{\mathit{\boldsymbol{D}}}_{l}}\ \ P{{\mathit{\boldsymbol{D}}}_{h}} \right]}^{\text{T}}}$，$\mathit{\boldsymbol{\tilde{y}=}}{{\left[F\mathit{\boldsymbol{y}}\ \ \mathit{\boldsymbol{z}} \right]}^{\text{T}}}$。求出式(15)的最优解α^*，并将其代入式(10)恢复每一个高分辨率软分类图像块，最后对整幅高分辨率软分类图像进行类分配，得到最终的超分辨率制图结果。本文算法(JDSR_SRM)的整体框架如图 3所示。

	Download: JPG larger image
图 3 SR_SRM算法的整体框架 Fig. 3 The framework of SR_SRM algorithm

5 实验及结果分析

本文利用两组实验来验证所提JDSR_SRM算法的有效性，并与几种常用的SRM算法进行比较，包括基于双线性插值的SRM算法(BI_SRM)、基于亚像元/像元空间引力模型的SRM算法(SPSAM_SRM)、基于Hopfield神经网络的SRM算法(HNN_SRM)以及基于径向基插值的SRM算法(RBF_SRM)。两组实验数据分别是Landsat TM多光谱图像和2001年美国国土资源数据库(NLCD 2001)。

为避免图像配准和混合像元分解为SRM引入误差，实验中的低分辨率图像和丰度图像都通过一个均值滤波器对高分辨率参考图像进行退化得到，其中滤波的窗口大小对应于SRM的缩放因子。实验中基于软硬属性转换的SRM算法，包括BI_SRM、SPSAM_SRM、RBF_SRM和JDSR_SRM，其所用类分配方法同为UOC^[20]，这样能够更科学的比较本文提出的算法和对比算法在亚像元锐化步骤的表现。

传统基于学习的超分辨率制图算法大多要求训练图像与测试图像有类似的分布且数量充足，但使用遥感图像作为训练图像存在获取成本高、方式复杂及难以达到所需高分辨率等问题。但随着互联网的广泛普及，自然图像的获取变得十分容易，利用遥感图像和自然图像构成元素的相似性，本文利用迁移学习将自然图像学习到的知识迁移到遥感图像超分辨率制图中，能够有效地解决传统基于学习的超分辨率制图方法由缺失数据导致的精度和泛化性下降问题。本文实验采用从互联网下载的自然图像来训练高、低分辨率图块联合字典{D_h, D_l}，部分自然图像如图 4(a)所示。字典大小经验设定为1 024，训练图块对采样数为1×10⁵。图 4(b)显示了训练所得高分辨率图像块字典中的部分原子，可以看到字典中包含了构成图像块的基本模式，如方向性边界，使得在不同的图像处理领域之间进行知识迁移存在可能。

	Download: JPG larger image
图 4 训练图像与高分辨率图像块字典原子示例 Fig. 4 Examples of training images and high-resolution image patch dictionary atoms

SRM亚像元锐化步骤中高分辨率软分类图的恢复过程使用5×5大小的图像块，相邻图块间重叠4像元；λ的选择取决于输入图像的噪声水平，在本文实验中经验设定λ=0.2。本文采用Kappa系数, 正确分类率PCC和生产者精度PA来对SRM算法的制图精度进行评价。为了排除纯像元对精度评价的影响，调整型正确分类率PCC(PCC′)和调整型Kappa系数(Kappa′)也被用来作为本文评价制图精度的指标。本文所有算法均使用MATLAB 8.0软件，在配置为2.2 GHz CPU，4G内存，i3 Intel处理器的Window 7系统环境下实现。

5.1 Landsat TM图像

第一组实验使用合成的Landsat TM多光谱图像来验证本文所提出的JDSR_SRM算法。Landsat TM图像拍摄于2006年6月19日，覆盖范围为巴西亚马逊河流域，总共包含7个波段，波长范围为0.45~2.35 μm，用于分析的波段包括1~5和7，图 5(a)为原始图像的合成假彩色图像(波段4-3-2)。对其进行手动数字化得到合成的高分辨率土地覆盖图，用作本实验的参考图像，如图 5(b)所示。参考图像包含200×200像素，由四种地物构成：裸地、草地、耕地以及森林。分别设定缩放因子s等于4和8，将参考图像按照缩放因子退化得到模拟低分辨率图像和类别丰度图像，作为SRM的输入。图 5(c)和(d)分别为在s=5和s=8下退化得到的模拟低分辨率图像。

	Download: JPG larger image
图 5 Landsat TM图像数据集 Fig. 5 Landsat TM data set

5种SRM算法处理得到的超分辨率制图结果如图 6所示，其中图 6(a)~(e)和图 6(f)~(j)分别为缩放因子s=4和s=8时的SRM结果。由图 6(a)~(e)可以看到，在s=4时，5种算法的制图效果都比较好，但是明显JDSR_SRM产生的地物连接性更好，边界更为平滑；在s=8时，5种SRM算法的结果图对比更为明显，将图 6(f)~(j)与参考图像图 5(b)比较可以看出，JDSR_SRM的制图结果与之最为相似。为了更加明显的视觉对比，将五幅结果图中对应的部分区域用不同颜色的方框标注出。从图中可以看到，BI_SRM和SPSAM_SRM算法的结果具有许多不规则的边界形状，难以保持一些微小的结构(如下部红框区域所示)；而HNN_SRM算法的结果过于平滑，导致丢失了许多地物空间分布的细节信息；RBF_SRM消除了BI_SRM和SPSAM_SRM结果中的部分斑点状错误，但是地物边界仍比较粗糙，且不能很好的恢复呈细条状的地物分布模式(如蓝框区域所示)。相比之下，JDSR_SRM结果图具有更加平滑的边界和更少的斑点状错误，并较好地保持了条状地物的连续性以及地物覆盖的细节信息。

	Download: JPG larger image
图 6 尺度因子s=4和s=8时的SRM结果图 Fig. 6 The SRM results with s=4 and s=8

除了直观比较外，本文还对5种算法的制图精度进行定量评价。各算法在不同缩放因子下的制图精度统计数据如表 1所示，可以看到表中4种系数JDSR_SRM均为最高。在s=4时，与BI_SRM、SPSAM_SRM、HNN_SRM和RBF_SRM相比，JDSR_SRM的Kappa′分别提高2.59%、1.78%、3.08%和1.31%，PCC′分别提高1.82%、1.25%、2.15%和0.92%；在s=8时JDSR_SRM相比于其他算法的Kappa′分别提高2.35%、3.25%、4.54%和1.45%，PCC′分别提高1.63%、2.26%、3.13%以及1.01%。由此可看出在5种算法中JDSR_SRM算法具有最高的精度，且在缩放尺度变大的情况下仍能保持较好的制图精度和视觉结果，证明了本文所提算法的有效性。

表 1 尺度因子为4和8时5种SRM方法产生模拟Landsat土地覆盖图的Kappa, PCC, Kappa’, PCC’精度评价 Tab.1 Kappa, PCC, Kappa' and PCC' of land cover maps generated by different SRM methods for the simulated Landsat TM image with scale factors of 4 and 8

5.2 NLCD 2001子图像

第二组实验采用美国国家土地覆盖数据库(NLCD 2001)的模拟图像被用于测试本文提出的算法。NLCD 2001是一个基于栅格的16类土地覆盖图，其空间分辨率为30 m×30 m，覆盖了美国50个州和波多黎各自治区，主要由Landsat ETM+图像的非监督分类生成。从NLCD 2001图像中选择包含了120×120像素的子图像作为本实验的测试图像，如图 7(a)所示。为了简化实验，原始的16类NLCD 2001图像被转换成一个简单的类方案，只包括四个土地覆盖类：水域、城镇、森林和农业，参考图像如图 7(b)所示。

	Download: JPG larger image
图 7 NLCD 2001子图像和参考图像 Fig. 7 The selected subset of NLCD 2001 land cover maps and reference image

与第一组实验相似，缩放因子s设定为4和8，将参考图像退化得到的各类地物丰度图像作为5种SRM算法的输入，在相同的类分配框架下进行测试。5种SRM算法的结果如图 8所示，图 8(a)~(e)和图 8(f)~(j)分别为s=4和s=8的高分辨率土地覆盖结果图。为了更加清晰地比较不同算法的超分辨率制图效果，参考图像中的局部区域用不同颜色的方框分别标注出(如图 7(b)所示)，并在SRM结果图中将对应区域进行细节放大显示。

	Download: JPG larger image
图 8 两种尺度下五种算法产生的土地覆盖图 Fig. 8 Resultant land cover maps generated by five methods with two different scale factors top

由图 8(a)~(e)可以看出，在缩放尺度较小时，所测试的全部SRM算法均能产生比较满意的制图结果，但是BI_SRM和SPSAM_SRM方法产生的地物边界比较粗糙，在靠近边界处存在许多孤立像素和线型斑块；由于HNN_SRM不能保持类别比例，尽管其产生的结果地物有效减少了孤立像素，然而边界过于平滑，大量细节信息被丢失; RBF_SRM和JDSR_SRM方法产生的土地覆盖图具有较为光滑的地物边界，且保持了较多的空间细节信息。为了使比较更加清晰，我们将包含小尺度地物的红色方框细节图放大，可以清晰地看到在小尺度地物的制图效果上JDSR_SRM要优于其他4种方法，对于细长的城镇类地物也能保持较好的空间连续性，在视觉效果上更加接近参考图像。图 8(f)~(j)能够更加明显地展示出JDSR_SRM算法的优势，在缩放尺度变大的情况下，BI_SRM和SPSAM_SRM的结果图存在更加严重的锯齿形边界和线型斑块，甚至不能保持地物的几何完整性；HNN_SRM和RBF_SRM产生的土地覆盖图也难以保持线型地物的连续性。相比之下JDSR_SRM产生的土地覆盖图依然能保持大部分地物的基本特征，特别是线性水域和城镇覆盖类的连通性。

5种SRM算法的制图精度评价如表 2所示。在s=4时，JDSR_SRM与BI_SRM、SPSAM_SRM、HNN_SRM及RBF_SRM相比，Kappa′分别提高2.68%、1.2%、3.01%和0.7%，PCC′分别提高1.86%、0.84%、1.98%和0.49%；在s=8时，相比于BI_SRM、SPSAM_SRM和RBF_SRM、JDSR_SRM的Kappa′分别提高2.32%、2.58%和1.95%；PCC′分别提高1.59%、1.76%和1.33%。尽管在s=8时HNN_SRM的Kappa′和PCC′高于JDSR_SRM，但由于HNN不考虑类别比例限制，其制图结果的丰度均方值误差不为零，且其恢复的地物分布形状过于圆滑，在直观上与参考图像差异大。比较5种SRM算法的PA，可看出对于分布模式复杂的水域和城镇类地物，JDSR_SRM相对于其他算法的精度提高更为明显。以上直观比较和定量分析共同说明本文提出的JDSR_SRM算法优于对比算法。

表 2 尺度因子为4和8时五种SRM算法产生NLCD 2001土地覆盖图的Kappa’, PCC’, PA精度评价 Tab.2 Kappa', PCC' and PA of resultant land cover maps by different SRM methods for NLCD 2001 data with scale factors of 4 and 8

与第一组实验类似的是，在缩放尺度s增大时，JDSR_SRM制图精度的退化程度相于其他基于空间相关性的算法更小。这是由于在实际中，仅仅利用空间相关性假设来描述地物分布模式往往太过简单，无法在缩放尺度较大和地物分布模式较为复杂的情况下，为SRM提供足够的信息。与之相比，相关过完备字典的稀疏性是一个在尺度和模式变化下性能更为稳定的先验条件，将其用于SRM的亚像元锐化过程可以实现良好的高分辨率软分类图像重建，使得JDSR_SRM在较大缩放尺度和复杂地物覆盖模式下都能保持较好的表现。

在过完备字典的构造问题上，利用迁移学习机制，从自然图像中学习的知识可用于遥感图像的超分辨率制图过程，且由于其应用对象是类别概率图像，所得到的软属性值要经过混合像元类别比例限制和类分配步骤来确定地物类标签，不需要考虑迁移学习会带来人工痕迹明显等负迁移影响。

6 结论

1) 实验结果证明，与简单的空间相关性先验模型相比，本文JDSR_SRM算法依据的稀疏先验能够有效地描述空间地物覆盖模式，其制图结果能够更好保持地物分布的细节信息和空间连续性，使获得的高分辨率土地覆盖图更为准确。

2) 此外，在缺乏辅助图像或训练图像的情况下，本文算法使用易于获取的自然图像来训练离线联合字典，可用于遥感图像的超分辨率制图，并能保持相对良好的精度。

参考文献

[1]	ATKINSON P M. Mapping sub-pixel boundaries from remotely sensed images[M]//Kemp Z. Innovations in GIS Ⅳ. London: Taylor and Francis, 1997, 4: 166-180. (0)
[2]	LING F, XIAO F, DU Y, et al. Waterline mapping at the subpixel scale from remote sensing imagery with high-resolution digital elevation models[J]. International journal of remote sensing, 2008, 29(6): 1809-1815. DOI:10.1080/01431160701802489 (0)
[3]	THORNTON M W, ATKINSON P M, HOLLAND D A. Sub-pixel mapping of rural land cover objects from fine spatial resolution satellite sensor imagery using super-resolution pixel-swapping[J]. International journal of remote sensing, 2006, 27(3): 473-491. DOI:10.1080/01431160500207088 (0)
[4]	LING Feng, LI Wenbo, DU Yun, et al. Land cover change mapping at the subpixel scale with different spatial-resolution remotely sensed imagery[J]. IEEE geoscience and remote sensing letters, 2011, 8(1): 182-186. DOI:10.1109/LGRS.2010.2055034 (0)
[5]	FOODY G M. The role of soft classification techniques in the refinement of estimates of ground control point location[J]. Photogrammetric engineering and remote sensing, 2002, 68(9): 897-903. (0)
[6]	LING Feng, DU Yun, LI Xiaodong, et al. Interpolation-based super-resolution land cover mapping[J]. Remote sensing letters, 2013, 4(7): 629-638. DOI:10.1080/2150704X.2013.781284 (0)
[7]	WANG Qunming, WANG Liguo, LIU Danfeng. Integration of spatial attractions between and within pixels for Sub-pixel mapping[J]. Journal of systems engineering and electronics, 2012, 23(2): 293-303. DOI:10.1109/JSEE.2012.00037 (0)
[8]	SU Y F, FOODY G M, MUAD A M, et al. Combining pixel swapping and contouring methods to enhance super-resolution mapping[J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2012, 5(5): 1428-1437. DOI:10.1109/JSTARS.2012.2216514 (0)
[9]	MUAD A M, FOODY G M. Impact of land cover patch size on the accuracy of patch area representation in HNN-based super resolution mapping[J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2012, 5(5): 1418-1427. DOI:10.1109/JSTARS.2012.2191145 (0)
[10]	MERTENS K C, VERBEKE L P C, DUCHEYNE E I, et al. Using genetic algorithms in sub-pixel mapping[J]. International journal of remote sensing, 2003, 24(21): 4241-4247. DOI:10.1080/01431160310001595073 (0)
[11]	KASETKASEM T, ARORA M K, VARSHNEY P K. Super-resolution land cover mapping using a Markov random field based approach[J]. Remote sensing of environment, 2005, 96(3/4): 302-314. (0)
[12]	WANG Qunming, WANG Liguo, LIU Danfang. Particle swarm optimization-based sub-pixel mapping for remote-sensing imagery[J]. International journal of remote sensing, 2012, 33(20): 6480-6496. DOI:10.1080/01431161.2012.690541 (0)
[13]	LI Xiaodong, LING Feng, DU Yun, et al. Spatially adaptive superresolution land cover mapping with multispectral and panchromatic images[J]. IEEE transactions on geoscience and remote sensing, 2014, 52(5): 2810-2823. DOI:10.1109/TGRS.2013.2266345 (0)
[14]	LING Feng, DU Yun, XIAO Fei, et al. Super-resolution land-cover mapping using multiple sub-pixel shifted remotely sensed images[J]. International journal of remote sensing, 2010, 31(19): 5023-5040. DOI:10.1080/01431160903252350 (0)
[15]	XU Yong, HUANG Bo. A spatio-temporal pixel-swapping algorithm for subpixel land cover mapping[J]. IEEE geoscience and remote sensing letters, 2014, 11(2): 474-478. DOI:10.1109/LGRS.2013.2268153 (0)
[16]	WU Ke, NIU Ruiqing, WANG Yi, et al. Super-resolution land-cover mapping based on the selective endmember spectral mixture model in hyperspectral imagery[J]. Optical engineering, 2011, 50(12): 126201. DOI:10.1117/1.3660527 (0)
[17]	ATKINSON P M. Super-resolution land cover classification using the two-point histogram[M]//SANCHEZ-VILA X, CARRERA J, JAIME J, et al. geoENV Ⅳ-Geostatistics for Environmental Applications. Dordrecht: Springer, 2004, 13: 15-28. (0)
[18]	WANG Qunming, SHI Wenzhong, WANG Liguo. Indicator cokriging-based subpixel land cover mapping with shifted images[J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2014, 7(1): 327-339. DOI:10.1109/JSTARS.2013.2262927 (0)
[19]	ZHANG Yihang, DU Yun, LING Feng, et al. Example-based super-resolution land cover mapping using support vector regression[J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2014, 7(4): 1271-1283. DOI:10.1109/JSTARS.4609443 (0)
[20]	WANG Qunming, SHI Wenzhong, WANG Liguo. Allocating classes for soft-then-hard subpixel mapping algorithms in units of class[J]. IEEE transactions on geoscience and remote sensing, 2014, 52(5): 2940-2959. DOI:10.1109/TGRS.2013.2267802 (0)
[21]	FENG Ruyi, ZHONG Yanfei, XU Xiong, et al. Adaptive sparse subpixel mapping with a total variation model for remote sensing imagery[J]. IEEE transactions on geoscience and remote sensing, 2016, 54(5): 2855-2872. DOI:10.1109/TGRS.2015.2506612 (0)
[22]	DONOHO D L. Compressed sensing[J]. IEEE transactions on information theory, 2006, 52(4): 1289-1306. DOI:10.1109/TIT.2006.871582 (0)
[23]	CANDES E J, TAO T. Near-optimal signal recovery from random projections:Universal encoding strategies?[J]. IEEE transactions on information theory, 2006, 52(12): 5406-5425. DOI:10.1109/TIT.2006.885507 (0)
[24]	庄福振, 罗平, 何清, 等. 迁移学习研究进展[J]. 软件学报, 2015, 26(1): 26-39. ZHUANG Fuzhen, LUO Ping, HE Qing, et al. Survey on transfer learning research[J]. Journal of software, 2015, 26(1): 26-39. (0)
[25]	ROSENSTEIN M T, MARX Z, KAELBLING L P, et al. To transfer or not to transfer[C]//Proceedings of the Neural Information Processing Systems 2005 Workshop on Inductive Transfer: 10 Years Later. Cambridge: MIT Press, 2005. https://www.mendeley.com/research-papers/transfer-not-transfer/ (0)
[26]	YANG Jianchao, WRIGHT J, HUANG T S. Image super-resolution via sparse representation[J]. IEEE transactions on image processing, 2010, 19(11): 2861-2873. DOI:10.1109/TIP.2010.2050625 (0)