中国科学院大学学报  2020, Vol. 37 Issue (4): 547-552   PDF    
基于丰度分布约束的NMF端元生成方法
石悦1,2,3, 王宏琦1,2, 郭新毅4     
1. 中国科学院电子学研究所, 北京 100190;
2. 中国科学院网络信息体系技术科技创新重点实验室, 北京 100190;
3. 中国科学院大学, 北京 100049;
4. 国电联合动力技术有限公司, 北京 100039
摘要: 非负矩阵分解(non-negative matrix factorization,NMF)端元生成方法可以同时获得端元和丰度,且支持乘式迭代实现目标函数优化,处理效率高,因此受到越来越多的关注。由于目标函数非凸,基于NMF的端元提取方法容易陷入局部极值。尽管采用增加约束的方式可以缓解局部极值问题,但往往会破坏NMF乘式迭代规则,从而降低NMF方法的处理效率。提出一种基于丰度分布约束的方法,利用矩阵迹运算实现目标函数乘式迭代优化。实验结果表明,该方法既能估计出准确的端元,又能提高端元生成的效率。
关键词: 高光谱    端元生成    非负矩阵分解(NMF)    丰度分布约束    
NMF endmember generation method based on abundance distribution constraint
SHI Yue1,2,3, WANG Hongqi1,2, GUO Xinyi4     
1. Institute of Electronics, Chinese Academy of Sciences, Beijing 100190, China;
2. Key Laboratory of Network Information System Technology(NIST) and Application System of Chinese Academy of Sciences, Beijing 100190, China;
3. University of Chinese Academy of Sciences, Beijing 100049, China;
4. Guodian United Power Technology Company LTD, Beijing 100039, China
Abstract: In recent years, the endmember generation method based on non-negative matrix factorization (NMF) attracted much attention. The NMF endmember generation method can be used to obtain endmembers and the abundance matrix simultaneously, and the multiplicative update rule works. Because of the non-convexity of the objective function, NMF endmember extraction easily goes into local extrema. Several constraints were imposed on NMF to alleviate the local extremum problem, but they often broke the multiplicative update rules and increased the processing time. In this work, we propose a new method based on abundance distribution constraint, and the multiplicative iterations can be used. The experimental results show that the method improves the efficiency and accuracy of endmember generation.
Keywords: hyperspectral    endmember generation    non-negative matrix factorization (NMF)    abundance distribution constraint    

由于高光谱传感器空间分辨率的限制以及地物的复杂多样性,混合像元普遍存在于高光谱遥感图像中,因此混合像元分析受到越来越广泛的关注。线性混合模型(the linear mixture model,LMM)是国内外混合像元分解方法中应用最广泛且最简单的光谱混合模型。该模型把遥感影像的像元光谱看作是各种不同类型的纯像元(称为端元)光谱的线性组合。基于LMM的端元提取方法主要分为端元识别类方法和端元生成类方法。端元识别类方法包括纯像元指数法(pixel purity index, PPI)[1]、正交子空间投影法(orthogonal subspace projection, OSP)[2]、顶点成分分析法(vertex component analysis, VCA)[3]、高斯消元法(Gaussian elimination method, GEM)[4]、N-FINDR[5]、基于Gram行列式的快速端元提取算法(FGDA)[6]、单纯形生长算法(simplex generation algorithm, SGA)[7]和基于单形体的端元提取方法(simplex volume algorithm, SVA)[8]等。此种方法需要纯像元假设,即假设一个场景中每个端元至少有一个纯像元。端元生成类方法不需要纯像元假设,主要包括最小体积变换[9]、迭代约束端元法(iterated constrained endmember, ICE)[10]、稀疏优化ICE(sparse ICE, SPICE)[11]和几何优化模型(geometry optimization model, GOM)[12]等。

近年来,非负矩阵分解NMF(non-negative matrix factorization)的端元生成方法受到越来越多的关注。NMF端元生成方法可以同时估计出端元矩阵和丰度矩阵。Lee和Seung[13]证明NMF端元生成方法可利用乘式迭代高效快速地实现NMF目标函数的优化迭代。由于NMF目标函数是非凸的,NMF方法容易陷入局部极值[14]。为了缓解NMF方法固有的局部极值问题,通常采用增加约束来优化NMF端元生成方法。常用的优化约束包括最小体积约束(minimum volume constraint, MVC)[15]、丰度分段平滑约束[16]、端元不相似性约束[17]、丰度稀疏约束[18-19]等。基于以上约束的NMF方法在一定程度上缓解了NMF方法的局部极值问题,但由于约束的引入,如经典MVC-NMF方法,乘式迭代规则被破坏,算法计算复杂度大幅增加。我们提出一种基于丰度分布约束的NMF方法,通过矩阵迹运算表达丰度分布离散度约束优化端元提取精度。同时可利用乘式迭代实现目标函数的迭代优化,算法计算复杂度小。

1 基于丰度分布约束的NMF端元生成方法 1.1 线性混合模型

假设线性混合模型成立,图像中每个像元向量可以表示为几个端元(纯像元)向量的线性组合,而混合系数为各个端元的丰度。线性混合模型表示如下:

$ {{\mathit{\boldsymbol{r}}_i} = \sum\limits_{j = 1}^p {{c_{ij}}} {\mathit{\boldsymbol{e}}_j} + {\mathit{\boldsymbol{n}}_i} = {\mathit{\boldsymbol{E}}_{\mathit{\boldsymbol{c}}i}} + {\mathit{\boldsymbol{n}}_i},} $ (1)
$ {\sum\limits_{j = 1}^p {{c_{ij}}} = 1,} $ (2)
$ {0 \le {c_{ij}} \le 1.} $ (3)

式中:N为像素数,p为端元数,R=[r1, r2, …, rN]是大小为L×N的高光谱图像(L为波段数)。ci=[ci1, ci2, …, cip]Tcij分别为像元ri的丰度向量以及端元ej在像元ri处的丰度值。E=[e1, e2, …, ep]是L×p的端元矩阵,C=[c1, c2, …, cN]是p×N的丰度矩阵,N=[n1, n2, …, nN]是噪声矩阵。由于像元的物理意义约束,丰度满足2个约束条件:丰度和为一约束(abundance sum-to-one constraint,ASC)、丰度非负约束(abundance non-negative constraint,ANC)。

1.2 丰度分布约束

由于观测像元的物理意义约束,任意一个像元ri的丰度值ci=[ci1, ci2, …, cip]T非负,且满足sum(ci1, ci2, …, cip)=1。实际应用中,并非所有的端元都对某个混合像元有贡献,且每个端元的贡献系数也分主次,换句话说,混合像元往往是由某个端元子集混合而成,其他端元的丰度值基本接近于0。Cichocki等[20]提出的HALS盲信号分离方法也进一步印证,在丰度矩阵C分布离散程度高的情况下,可以获取较好的盲信号分离结果。

假设所有像元由3个端元构成,如图 1所示。端元构成的单形体顶点可以是{A, B, C},也可以是{A′, B′, C′}。在端元单形体ABC中,像元P的丰度向量cABC=[0.8, 0.1, 0.1]T,丰度向量cABC的距离为0.66;相应地,P在端元单形体ABC中,对应的丰度向量cA′B′C′=[0.3, 0.3, 0.4]T,丰度向量的距离cA′B′C′等于0.34。因此,丰度向量分布约束可由丰度向量的分布离散程度,即丰度向量的距离表示。很明显,丰度向量cABC的分布离散程度优于丰度向量cA′B′C′。因此丰度向量的分布离散程度越高,即丰度向量的距离越大,解混效果越好。

Download:
图 1 丰度分布示意图 Fig. 1 Sketch map of abundance distribution

丰度分布离散度可以由丰度矩阵C的迹运算表示,即

$ {J_{\rm{C}}}(\mathit{\boldsymbol{C}}) = {\rm{trace}} ({\mathit{\boldsymbol{C}}^{\rm{T}}}\mathit{\boldsymbol{C}}). $ (4)

因此,我们将丰度分布离散度作为一项约束应用于NMF端元生成方法。

1.3 基于丰度分布约束的NMF端元生成方法

在NMF标准方法的基础上,增加丰度分布约束,本方法形成新的目标函数:

$ \begin{array}{*{20}{c}} {{\rm{min}}f(\mathit{\boldsymbol{E}},\mathit{\boldsymbol{C}}) = \frac{1}{2}\left\| {\mathit{\boldsymbol{R}} - \mathit{\boldsymbol{EC}}} \right\|{\kern 1pt} _{\rm{F}}^2 - \frac{\alpha }{2} \cdot {{\rm{J}}_{\rm{C}}}(\mathit{\boldsymbol{C}}),}\\ {\mathit{\boldsymbol{E}} \ge 0,\mathit{\boldsymbol{C}} \ge 0.} \end{array} $ (5)

式中:JC(C)为新增的惩罚函数,E为端元矩阵,C为丰度矩阵,$\frac{1}{2}\|\boldsymbol{R}-\boldsymbol{E} \boldsymbol{C}\|_{\mathrm{F}}^{2}$为误差值,α为用于平衡误差值和丰度分布约束的正则化参数。

由于惩罚因子JC(C)与端元矩阵E不相关,因此,偏微分$\frac{\partial f(\boldsymbol{E}, \boldsymbol{C})}{\partial \boldsymbol{E}}$可以表示为

$ \frac{{\partial f(\mathit{\boldsymbol{E}},\mathit{\boldsymbol{C}})}}{{\partial \mathit{\boldsymbol{E}}}} = (\mathit{\boldsymbol{EC}} - \mathit{\boldsymbol{R}}){\mathit{\boldsymbol{C}}^{\rm{T}}}. $ (6)

$\frac{\partial f(\boldsymbol{E}, \boldsymbol{C})}{\partial \boldsymbol{C}}$由两部分组成,

$ \frac{{\partial f(\mathit{\boldsymbol{E}},\mathit{\boldsymbol{C}})}}{{\partial \mathit{\boldsymbol{C}}}} = {\mathit{\boldsymbol{E}}^{\rm{T}}}(\mathit{\boldsymbol{EC}} - \mathit{\boldsymbol{R}}) - \frac{\alpha }{2} \cdot \frac{{\partial ({{\rm{J}}_{\rm{C}}}(\mathit{\boldsymbol{C}}))}}{{\partial \mathit{\boldsymbol{C}}}}. $ (7)

通过计算,可知

$ \frac{{\partial ({J_{\rm{C}}}(\mathit{\boldsymbol{C}}))}}{{\partial \mathit{\boldsymbol{C}}}} = 2\mathit{\boldsymbol{C}}. $ (8)

因此,

$ \frac{{\partial f(\mathit{\boldsymbol{E}},\mathit{\boldsymbol{C}})}}{{\partial \mathit{\boldsymbol{C}}}} = {\mathit{\boldsymbol{E}}^{\rm{T}}}(\mathit{\boldsymbol{EC}} - \mathit{\boldsymbol{R}}) - \alpha \cdot \mathit{\boldsymbol{C}}\mathit{\boldsymbol{.}} $ (9)

因此,目标函数的迭代优化可通过乘式迭代实现,迭代规则可以表示为:

$ \left\{ {\begin{array}{*{20}{l}} {\mathit{\boldsymbol{E}} = \mathit{\boldsymbol{E}}. * (\mathit{\boldsymbol{R}}{\mathit{\boldsymbol{C}}^{\rm{T}}})/(\mathit{\boldsymbol{EC}}{\mathit{\boldsymbol{C}}^{\rm{T}}})}\\ {\mathit{\boldsymbol{C}} = \mathit{\boldsymbol{C}}. * ({\mathit{\boldsymbol{E}}^{\rm{T}}}\mathit{\boldsymbol{R}} + \alpha \mathit{\boldsymbol{C}})/({\mathit{\boldsymbol{E}}^{\rm{T}}}\mathit{\boldsymbol{EC}})} \end{array}} \right.. $ (10)

考虑丰度矩阵ASC约束,只需要将观测像元矩阵R和端元矩阵E分别替换为$\overline{\boldsymbol{R}}=\left[\begin{array}{c}\boldsymbol{R} \\ \boldsymbol{\sigma} \boldsymbol{1}_{N}^{\mathrm{T}}\end{array}\right]$$\overline{\boldsymbol{E}}=\left[\begin{array}{c}\boldsymbol{E} \\ \boldsymbol{\sigma} \boldsymbol{1}_{p}^{\mathrm{T}}\end{array}\right]$,其中σ是正数,用来控制ASC效果,文中依据文献[15]选取σ=20。

本方法可利用乘式迭代规则实现端元目标函数迭代,处理效率较高,且得到的单形体满足以下两个特点:第一是基于线性混合模型下估计和真实数据间的误差最小,类似于外力,使得端元单形体包含尽量多像元;第二是丰度矩阵离散度最高,类似于内力,使得端元单形体尽可能紧地包裹像元。

2 实验与分析

利用仿真数据和真实数据开展了一系列的实验。为验证本方法的有效性,与3种比较有代表性的方法(NFINDR-FCLS[5]、MVC-NMF[15]和NMF-ICE[21])进行比较。本方法采用NFINDR的端元提取结果作为初始值。

2.1 仿真数据

利用美国地质调查(USGS)数字光谱库中4种矿物的光谱作为端元。光谱数据共包含224个光谱波段,覆盖波长范围为0.38~2.5 μm,光谱分辨率为10 nm。仿真图像数据大小为58×58,利用Dirichlet分布生成丰度系数。为进一步去除纯像元,丰度系数均小于0.9。此外,仿真数据还添加了均值为零的白高斯噪声,以模拟可能存在的误差和传感器噪声。为了公正地评价所提出方法的有效性,在SNR=20的情况下开展对比实验。其中NFINDR-FCLS、MVC-NMF、NMF-ICE分别依据参考文献[5, 15, 21]进行参数选取,本方法选择迭代次数为150次,α=0.01,σ=20。

本方法利用文献[14]中的rmsSAD(光谱角度散度)、rmsAAD(丰度角度散度)、rmsSID(频谱信息散度)、rmsAID(丰度信息散度)评估方法的性能。从图 2图 3可以看出,在NFINDR端元提取结果作为初始值的条件下,本文方法具有明显优势。

Download:
图 2 误差值对比结果 Fig. 2 Comparison among different methods

Download:
图 3 本方法端元生成结果与真实端元比较 Fig. 3 Comparison of the extracted endmembers with real endmembers

此外, 还通过丰度RMSE分析噪声对本文方法的影响,在模拟数据中添加不同的高斯噪声(SNR=10、15、20、25、30 dB)。从图 4可以看出,本文方法生成的丰度RMSE值较小,且在SNR=20 dB以后,基本不受噪声影响。

Download:
图 4 不同噪声条件下丰度RMSE结果 Fig. 4 RMSE results of abundances at different SNR values

我们提出的端元生成方法支持利用乘式迭代进行端元优化迭代。由表 1可知,在4核处理器主频2.3 GHz的条件下,本方法在图 1所示的端元提取精度条件下,与其他方法相比处理时间大幅减少。

表 1 模拟数据算法处理时间 Table 1 Processing time for different methods with the synthetic image

同时我们也分析了本方法在不同初始值条件下的端元提取效果。从表 2可以看出,由于本文方法未考虑现有方法提出的约束,需要较好的初始值才能达到较好的端元生成结果。

表 2 本方法在不同初始值条件下的性能评估 Table 2 Performance under different initializations
2.2 真实数据

这里使用的高光谱图像数据,为ENVI软件提供的机载可见光红外成像光谱仪(AVIRIS)赤铜矿数据集。该数据集是一个400×350图像,由1.990 8~2.479 0 μm的短波红外线(SWIR)50波段组成。该场景已被广泛用于验证端元提取算法的性能。这个图像数据在第44个波段存在一个异常像素,反射率值为0.8左右,是由于噪声破坏而造成,如图 5所示。

Download:
图 5 真实实验数据 Fig. 5 Real image data

将提取的端元与美国地质勘察(USGS)数字光谱库的对应真实光谱进行比较,提取8个端元,并利用端元rmsSAD[14]平均值和处理时间评价本文方法的处理精度和处理效率。

设定提取的端元数为8,4类方法提取出的8个端元分别与光谱库中的真实数据进行比较。从表 3可以看出,与其他方法相比,本文方法rmsSAD值优于或接近其他方法。

表 3 不同算法处理精度 Table 3 Performance evaluation for different methods

在4核处理器主频2.3 GHz的条件下,本次实验对各方法在以上处理精度下的处理时间进行了统计分析。从表 4可以看出,本文方法既能有效提取端元,且处理效率优于其他方法。

表 4 真实数据算法处理时间 Table 4 Processing time for different methods with the real image
3 结束语

基于约束的NMF方法缓解了NMF目标函数非凸带来的局部极值问题,往往也造成乘式迭代规则被破坏,端元生成效率降低等问题。本文提出一种基于丰度分布约束的NMF方法,首次利用矩阵迹运算表征丰度分布离散度,可利用乘式迭代实现目标函数的迭代优化,处理效率较高。通过模拟数据和真实数据从处理精度、处理时效性和噪声鲁棒性等方面进行实验分析,本文方法可提高端元估计结果的精度和算法处理效率。由于未考虑现有方法在端元方面的约束,本方法对初始值依赖较高,希望在以后的研究中进一步改进。

参考文献
[1]
Boardman J W, Kruse F A, Green R O. Mapping target signatures via partial unmixing of AVIRIS data[J]. Fifth JPL Airborne Earth Science Workshop, 1995, 1(1): 23-26.
[2]
Harsanyi J C, Chang C I. Hyperspectral image classification and dimensionality reduction:an orthogonal subspace projection approach[J]. IEEE Transactions on Geoscience and Remote Sensing, 1994, 32(4): 779-785. Doi:10.1109/36.298007
[3]
Nascimento J M, Dias J M. Vertex component analysis:a fast algorithm to unmix hyperspectral data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(4): 898-910. Doi:10.1109/TGRS.2005.844293
[4]
Geng X, Xiao Z, Ji L, et al. A Gaussian elimination based fast endmember extraction algorithm for hyperspectral imagery[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 79: 211-218. Doi:10.1016/j.isprsjprs.2013.02.020
[5]
Winter M E. N-FINDR: an algorithm for fast autonomous spectral end-member determination in hyperspectral data[C]//Michael R. Imaging Spectrometry V: Brisbane: International Society for Optics and Photonics, 1999: 266-276.
[6]
Sun K, Geng X, Wang P, et al. A fast endmember extraction algorithm based on Gram determinant[J]. IEEE Geoscience and Remote Sensing Letters, 2014, 11(6): 1124-1128. Doi:10.1109/LGRS.2013.2288093
[7]
Chang C I, Wu C C, Liu W, et al. A new growing method for simplex-based endmember extraction algorithm[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(10): 2804-2819. Doi:10.1109/TGRS.2006.881803
[8]
Geng X, Ji L, Wang F, et al. Statistical Volume Analysis:a new endmember extraction method for multi/hyperspectral imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(10): 6100-6109. Doi:10.1109/TGRS.2016.2581180
[9]
Craig M D. Minimum-volume transforms for remotely sensed data[J]. IEEE Transactions on Geoscience and Remote Sensing, 1994, 32(3): 542-552. Doi:10.1109/36.297973
[10]
Berman M, Kiiveri H, Lagerstrom R, et al. ICE:a statistical approach to identifying endmembers in hyperspectral images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2004, 42(10): 2085-2095. Doi:10.1109/TGRS.2004.835299
[11]
Zare A, Gader P. Sparsity promoting iterated constrained endmember detection in hyperspectral imagery[J]. IEEE Geoscience and Remote Sensing Letters, 2007, 4(3): 446-450. Doi:10.1109/LGRS.2007.895727
[12]
Geng X, Ji L, Zhao Y, et al. A new endmember generation algorithm based on a geometric optimization model for hyperspectral images[J]. IEEE Geoscience and Remote Sensing Letters, 2013, 10(4): 811-815. Doi:10.1109/LGRS.2012.2224635
[13]
Lee D D, Seung H S. Learning the parts of objects by non-negative matrix factorization[J]. Nature, 1999, 401(6755): 788. Doi:10.1038/44565
[14]
Cai D, He X, Han J, et al. Graph regularized nonnegative matrix factorization for data representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(8): 1548-1560. Doi:10.1109/TPAMI.2010.231
[15]
Miao L, Qi H. Endmember extraction from highly mixed data using minimum volume constrained nonnegative matrix factorization[J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(3): 765-777. Doi:10.1109/TGRS.2006.888466
[16]
Jia S, Qian Y. Constrained nonnegative matrix factorization for hyperspectral unmixing[J]. IEEE Transactions on Geoscience and Remote Sensing, 2009, 47(1): 161-173. Doi:10.1109/TGRS.2008.2002882
[17]
Wang N, Du B, Zhang L. An endmember dissimilarity constrained non-negative matrix factorization method for hyperspectral unmixing[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2013, 6(2): 554-569. Doi:10.1109/JSTARS.2013.2242255
[18]
Qian Y, Jia S, Zhou J, et al. Hyperspectral unmixing via L1/2 sparsity-constrained nonnegative matrix factorization[J]. IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(11): 4282-4297. Doi:10.1109/TGRS.2011.2144605
[19]
Wang W, Qian Y. Adaptive L1/2 sparsity-constrained NMF with half-thresholding algorithm for hyperspectral unmixing[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(6): 2618-2631. Doi:10.1109/JSTARS.2015.2401603
[20]
Cichocki A, Zdunek R, Amari S-i. Hierarchical ALS algorithms for nonnegative matrix and 3D tensor factorization[C]//International Conference on Independent Component Analysis and Signal Separation. Springe, 2007: 169-176.
[21]
Geng X, Ji L, Yang W, et al. The multiplicative update rule for an extension of the iterative constrained endmembers algorithm[J]. International Journal of Remote Sensing, 2017, 38(23): 7457-7467. Doi:10.1080/01431161.2017.1375571