﻿ 基于改进SPA算法的高效降维方法
«上一篇
 文章快速检索 高级检索

 应用科技  2018, Vol. 45 Issue (5): 51-55  DOI: 10.11991/yykj.201712002 0

### 引用本文

CUI Ying, WANG Xueting, LIU Shubin, et al. An efficient reduction method based on the improved successive projection algorithm[J]. Applied Science and Technology, 2018, 45(5), 51-55. DOI: 10.11991/yykj.201712002.

### 文章历史

1. 哈尔滨工程大学 信息与通信工程学院，黑龙江 哈尔滨 150001;
2. 黑龙江省农业科学院 遥感技术中心，黑龙江 哈尔滨 150086

An efficient reduction method based on the improved successive projection algorithm
CUI Ying1,2, WANG Xueting1, LIU Shubin2, LU Zhongjun2
1. College of Information and Communication Engineering, Harbin Engineering University, Harbin 150001, China;
2. Remote Sensing Technology Center, Heilongjiang Academy of Agricultural Sciences, Harbin 150086, China
Abstract: The hyperspectral image data has high dimensionality and much redundant information, which would cause Hughes phenomenon easily. In order to solve this problem, the improved Successive Projection Algorithm (SPA) is applied to the dimension reduction processing of the hyperspectral image data. Based on the initial algorithm, the improved SPA limits the choice of the initial band with the kurtosis and the skewness respectively, and obtains a small number of high-efficiency characteristic bands in a short time, which improves the classification performance and processing speed. Using the AVIRIS data, the algorithm proposed in this paper is simulated by the relevance vector machine (RVM) and support vector machine (SVM) classifier respectively. The experimental results show that SPA performs the Monte Carlo algorithm in improving the dimension reduction performance.
Keywords: hyperspectral image    band selection    dimensionality reduction    successive projection algorithm    kurtosis    skewness    support vector machine    relevance vector machine

1 连续投影算法原理

SPA算法属于前向选择算法，首先选出一个初始波段，然后在每一次迭代时加入新的波段，直到达到指定的波段数，这样是为了选出那些具有最小冗余信息的波段，解决共线性问题[13]。SPA作为一种波段选择方法，以其简便、快速的特点得到越来越多的应用，在多种样本波段的提取方面取得了很好的效果。

SPA算法步骤如下[14]

1）设随机选取的初始迭代向量为Xk(0)，并设定需要提取向量的个数为N，即降维后波段数；

2）在第一次迭代(n=1)之前，随机选取光谱矩阵的任意一列j，把校正集光谱矩阵X中的第j列赋值给Xk(0)，其中j=1,2,···，(J−1),JJ为所有的波段数。

3）令S是没有被选中的波段集合，那么S可以表示为

 $S = \left\{ {j,1 \leqslant j \leqslant J,j \notin \left\{ {k\left( 0 \right), k(1), \cdots,k\left( {n - 1} \right)} \right\}} \right\}$

4）对Xj在子空间中正交于Xk(n-1)的投影进行计算：

 $P{{X}_j} = {{X}_j} - \left( {{X}_j^{\rm{T}} {{X}_{k\left( {n - 1} \right)}}} \right){{X}_{k\left( {n - 1} \right)}}{\left( {{X}_{k\left( {n - 1} \right)}^{\rm{T}} {{X}_{k\left( {n - 1} \right)}}} \right)^{ - 1}}$ (1)

5）式（1）中的k(n)可表示为

 $k\left( n \right) = \arg \left( {\max \left( {\left\| {P{{X}_j}} \right\|,j \in S} \right)} \right)$

6）将最大投影值作为下次迭代的初始值：

 ${{X}_j} = P{{X}_j},j \in S$

7）令n=n+1，如果n<N，则返回到步骤3）循环计算；

8）将降维后得到的所有的波段组合表示为集合W

 $W = \left\{ {{x_{k\left( n \right)}};n = 0,1, \cdots ,N - 1} \right\}$

2 峰度值与偏度值

 ${\beta _2}{\rm{ = }}{\varphi _4}\left( X \right){\rm{ = }}\frac{{{\rm E}\left[ {{{\left( {X - \mu } \right)}^4}} \right]}}{{{{\left\{ {\rm E\left[ {{{\left( {X - \mu } \right)}^2}} \right]} \right\}}^2}}}$

 ${\rm E}\left[ {{{\left( {X - \mu } \right)}^4}} \right] = \int_{ - \infty }^{ + \infty } {{{\left( {x - \mu } \right)}^4}} p\left( x \right){\rm d}x$

 $\sqrt {{\beta _1}} {\rm{ = }}{\varphi _3}\left( X \right){\rm{ = }}\frac{{{\rm E}\left[ {{{\left( {X - \mu } \right)}^3}} \right]}}{{{{\left\{ {{\rm E}\left[ {{{\left( {X - \mu } \right)}^2}} \right]} \right\}}^{\frac{3}{2}}}}}$

3 基于峰度值与偏度值的连续投影算法

4 实验结果与分析 4.1 实验数据及仿真环境

4.2 实验结果与分析 4.2.1 实验1

4.2.2 实验2

5 结论

1)针对SPA算法中随机选取初始波段的缺点，分别以峰度值和偏度值的大小作为选择初始波段的标准，提出了P-SPA与S-SPA两种降维方法。

2)在AVIRIS数据集上将SPA、P-SPA与S-SPA算法分别应用于相似地物数据降维，将降维后的数据分别采用RVM和SVM分类器进行分类。对比实验结果表明本文提出的算法较原始的连续投影算法性能具有一定的提高。

3)为了进一步验证改进算法的有效性，将P-SPA、S-SPA与MC算法进行对比，通过RVM的分类结果表明本文提出的S-SPA、P-SPA算法在保证分类精度的前提下，具有更快的速度，达到了高效的目的。

4)对于S-SPA算法在训练样本为40时，使用RVM分类精度较低的问题，说明S-SPA算法还具有一定的局限性，在今后的工作中还会对此进行进一步的研究。

 [1] LICCIARDI G, MARPU P R, CHANUSSOT J, et al. Linear versus nonlinear PCA for the classification of hyperspectral data based on the extended morphological profiles[J]. IEEE geoscience and remote sensing letters, 2012, 9(3): 447-451. DOI:10.1109/LGRS.2011.2172185 (0) [2] 王秀朋. 基于投影寻踪的高光谱图像降维算法研究[D]. 西安: 西北工业大学, 2006: 38-43. (0) [3] 刘春红, 赵春晖, 张凌雁. 一种新的高光谱遥感图像降维方法[J]. 中国图像图形学报, 2005, 10(2): 218-222. (0) [4] 秦方普, 张爱武, 王书民, 等. 基于谱聚类与类间可分性因子的高光谱波段选择[J]. 光谱学与光谱分析, 2015, 35(5): 1357-1364. DOI:10.3964/j.issn.1000-0593(2015)05-1357-08 (0) [5] MARTÍNEZ-USÓMARTINEZ-USO A, PLA F, SOTOCA J M, et al. Clustering-based hyperspectral band selection using information measures[J]. IEEE transactions on geoscience and remote sensing, 2007, 45(12): 4158-4171. DOI:10.1109/TGRS.2007.904951 (0) [6] SU Hongjun, DU Qian, CHEN Genshe, et al. Optimized hyperspectral band selection using particle swarm optimization[J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2014, 7(6): 2659-2670. DOI:10.1109/JSTARS.2014.2312539 (0) [7] TIWARI R, HUSAIN M, GUPTA S, et al. Improving ant colony optimization algorithm for data clustering[C]//Proceedings of the International Conference and Workshop on Emerging Trends in Technology. New York, USA, 2010: 529-534. (0) [8] 王立国, 赵亮, 刘丹凤. 基于人工蜂群算法高光谱图像波段选择[J]. 哈尔滨工业大学学报, 2015, 47(11): 82-88. DOI:10.11918/j.issn.0367-6234.2015.11.014 (0) [9] CUI Ying, WANG Jiaqi, LIU Shubin, et al. Hyperspectral image feature reduction based on tabu search algorithm[J]. Journal of information hiding and multimedia signal processing, 2015, 6(1): 154-162. (0) [10] 崔颖, 宋国娇, 陈立伟, 等. 基于烟花算法降维的高光谱图像分类[J]. 华南理工大学学报: 自然科学版, 2017, 45(3): 20-28. (0) [11] ARAÚJO M C U, SALDANHA T C B, GALVAO R K H, et al. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis[J]. Chemometrics and intelligent laboratory systems, 2001, 57(2): 65-73. DOI:10.1016/S0169-7439(01)00119-8 (0) [12] FILHO H A D, GALVÃO R K H, ARAÚJO M C U, et al. A strategy for selecting calibration samples for multivariate modelling[J]. Chemometrics and intelligent laboratory systems, 2004, 72(1): 83-91. DOI:10.1016/j.chemolab.2004.02.008 (0) [13] 郝勇, 孙旭东, 王豪. 基于改进连续投影算法的光谱定量模型优化[J]. 江苏大学学报: 自然科学版, 2013, 34(1): 49-53. (0) [14] 陈斌, 孟祥龙, 王豪. 连续投影算法在近红外光谱校正模型优化中的应用[J]. 分析测试学报, 2007, 26(1): 66-69. DOI:10.3969/j.issn.1004-4957.2007.01.016 (0) [15] 寻丽娜, 方勇华. 基于投影寻踪的高光谱图像目标检测算法[J]. 光子学报, 2006, 35(10): 1584-1588. (0) [16] 田禹. 基于偏度和峰度的正态性检验[D]. 上海: 上海交通大学, 2012. (0)