高光谱影像信息向量机分类

Download PDF 打印本文

文章快速检索

高级检索

引用本文

谭熊，余旭初，秦志远，等。高光谱影像信息向量机分类[J]. 测绘学报，2015，44(11)：1227-1234. DOI:10.11947/j.AGCS.2015.20140600 复制到剪切板

TAN Xiong, YU Xuchu, QIN Zhiyuan, et al. Informative Vector Machine Classification for Hyperspectral Imagery[J]. Acta Geodaeticaet Cartographica Sinica, 2015, 44(11): 1227-1234. DOI:10.11947/j.AGCS.2015.20140600 复制到剪切板

高光谱影像信息向量机分类

谭熊, 余旭初, 秦志远, 张鹏强, 魏祥坡

信息工程大学地理空间信息学院，河南郑州 450001

收稿日期：2014-11-18；修回日期：2015-03-10

基金项目：国家自然科学基金(41201477,41401534);地理信息工程国家重点实验室开放基金(SKLGIE2013-M-3-1);测绘地理信息公益性行业科研专项(201412007).

第一作者简介：谭熊(1986-),男，讲师，研究方向为高光谱影像处理与分析、摄影测量与遥感。E-mail:kjadetx@163.com

摘要：信息向量机是一种基于贝叶斯理论的稀疏高斯过程方法，其模型训练速度快、内存耗费小、稀疏性强，具有良好的预测性能。本文从高斯过程回归模型出发，提出了一种基于信息向量机的高光谱影像分类方法，针对高斯过程分类中的非高斯噪声模型，采用假定概率滤波算法将分类问题转化为回归问题，通过最大化边缘似然函数进行模型训练，选择活动子集中的信息向量数量达到了稀疏的目的。通过ROSIS影像试验，表明了基于信息向量机的高光谱影像分类方法的优势。

关键词：高光谱影像信息向量机分类

Informative Vector Machine Classification for Hyperspectral Imagery

TAN Xiong, YU Xuchu, QIN Zhiyuan, ZHANG Pengqiang, WEI Xiangpo

Institute of Surveying and Mapping, Information Engineering University, Zhengzhou 450001, ChinaAbstract

First author: TAN Xiong(1986—), male, lecturer, majors in hyperspectral imagery processing and analysis, photogrammetry and remote sensing. E-mail： kjadetx@163.com

Abstract: Informative vector machine is a method of sparse Gaussian process based on Bayesian theory, which has high speed in model training, small consuming in memory, strong effective in sparseness and good forecasting performance. In this paper, the Gaussian process regression model is introduced firstly, and then a hyperspectral imagery classification method based on informative vector machine is brought forward. Secondly, to solve the problem of non-Gaussian noise model in the Gaussian process classification, the classification problem is transformed into a regression problem by using the assume density filtering algorithm, after which model is trained by maximizing the marginal likelihood function. Finally, the number of informative vector is chosen in active subset to achieve the purpose of sparse. According to the experimental results of ROSIS images, the advantages of hyperspectral imagery classification method based on informative vector machine are validated.

Key words: hyperspectral imagery informative vector machine classification

1 引言

20世纪80年代出现的高光谱遥感技术，将图像和光谱相结合，克服了传统光学遥感在地物属性信息精细探测方面的不足^[1]。高光谱遥感的优势主要表现为对地观测时能够获取众多连续波段的光谱影像，从而实现对地面目标的精细描述，达到识别地物的目的^[2]。

高光谱影像分类是高光谱影像处理与分析以及广泛应用的关键问题和核心技术。然而，高光谱影像数据的高维小样本、波段间的高相关性以及非“线性可分”等特点制约着高光谱影像分类技术的发展与应用。训练样本的不足使得传统统计模式分类中参数估计的可靠性成为一个挑战，容易出现“维数灾难”现象^[4]。

为了提高数据处理效率，确保分类精度，通常可采用两种有效策略：一是在分类处理前，对原始高光谱影像数据进行特征降维处理即光谱特征选择与提取^[5]；二是采用以支持向量机(support vector machine,SVM)为主的核方法^[7]。总体上讲，这两种不同的分类策略在不同的应用场合均取得了较好的成果，其中以SVM为主的核方法越来越成为高光谱影像分类的重点。尽管如此，SVM仍存在一定的不足之处，如核函数必须满足Mercer定理、模型训练时间较长、参数选择较困难、结果不具有概率统计意义以及稀疏性有限等。

针对这些问题，文献^[9]在稀疏贝叶斯分类模型的基础上，提出利用相关向量机(relevance vector machine,RVM)进行高光谱影像分类，得到了相对稀疏的、具有概率统计意义的分类结果，但其分类精度仍低于SVM分类器。另外，高斯过程(Gaussian process,GP)^[10]是一种几乎与支持向量机(SVM)同时出现的基于核函数的机器学习算法。相较于SVM，高斯过程是在贝叶斯框架下的非参数概率模型，核函数参数可自适应获得，且其输出结果具有一定的概率意义，主要用于数据降维、回归与分类等方面。但其在处理大样本数据时仍存在计算效率低、内存耗费大和稀疏性弱的问题。文献^[11]通过最小化KL散度来达到稀疏数据子集选择的目的；文献[12—14]利用信息原理中的贪婪准则来选择训练样本，提出了信息向量机(informative vector machine，IVM)。目前，IVM在手写数字识别^[12]、人脸识别^[15]和神经活动分类^[16]等方面得到一定的应用。

本文在高斯过程回归模型的基础上，利用假定密度滤波算法(assume density filtering,ADF)将分类中的概率噪声模型逼近高斯噪声模型，采用最大化边缘似然函数自适应获得模型参数，通过选择活动子集(active subset)中信息向量的数量来进行模型的训练，达到稀疏的目的，采用一系列的两类IVM分类器组合解决多类分类问题，并将其应用于高光谱影像分类。通过ROSIS高光谱影像分类试验，验证了基于IVM的高光谱影像分类方法的优势。

2 高斯过程回归模型 2.1 高斯过程

高斯过程是指一系列随机变量的集合，集合中任意有限数量的随机变量均服从联合高斯分布。简而言之，高斯过程是把多元高斯分布推广到无限多个随机变量的形式，即多元高斯分布由均值向量和协方差矩阵确定，而高斯过程由均值函数和协方差函数确定。

如果一个随机变量的集合x=(x₁,x₂,…,x_N)的联合分布服从均值为μ，协方差矩阵为Σ的高斯分布即x=(x₁,x₂,…，x_N)~N(μ,Σ)，那么将随机变量以函数的形式表示为一个随机过程f(x)，则可以通过随机过程f(x)的均值函数m(x)和协方差函数或核函数k(x,x′)来完全确定高斯过程

类别	1	2	3	4	5	6	7	8	9
名称	水体	树木	草地	砖块	裸土	柏油路面	沥青屋顶	瓦片屋顶	阴影
数量	456	488	335	366	581	465	457	404	295

核函数	linear	MLP	RBF
训练时间/s	15.84	53.82	25.24
测试时间/s	1.22	1.12	1.02
错误率/(%)	5.65	1.93	2.16

类别	SVM	RVM	IVM
参数σ	0.72(1.6)	0.72	0.72
基向量数量	361	85	50
训练时间/s	93.46(241.26)	65.60	18.59
测试时间/s	0.18	0.09	0.98
错误率/(%)	4.13	3.79	1.71

[1]	YANG Guopeng, YU Xuchu, FENG Wufa, et al. The Development and Application of Hyperspectral RS Technology[J]. Bulletin of Surveying and Mapping, 2008(10):1-4.(杨国鹏，余旭初，冯伍法，等. 高光谱遥感技术的发展与应用现状[J]. 测绘通报, 2008(10):1-4.)

[2]	TAN Xiong, YU Xuchu, ZHANG Pengqiang, et al. A Classification Algorithm for Hyperspectral Images Based on Fuzzy Mixed Pixel Decomposition[J]. Journal of Geomatics Science and Technology, 2013, 30(3):279-283.(谭熊，余旭初，张鹏强，等. 一种基于模糊混合像元分解的高光谱影像分类方法[J]. 测绘科学技术学报, 2013, 30(3):279-283.)

[3]	YU Xuchu, FENG Wufa, YANG Guopeng, et al. Analysis and Application for Hyerspectral Imagery[M]. Beijing:Science Press, 2013.(余旭初，冯伍法，杨国鹏，等. 高光谱影像分析与应用[M]. 北京:科学出版社, 2013.)

[4]	TAN Xiong. Research on Classification Techniques for Hyperspectral Imagery Based on Combined Spectral and Spatial Features[D]. Zhengzhou:Information Engineering University, 2014.(谭熊. 联合光谱和空间特征的高光谱影像分类技术研究[D]. 郑州:信息工程大学, 2014.)

[5]	SUN Weiwei. Theory and Methods of Dimensionality Reduction Using Manifold Learning for Hyperspectral Imagery[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(4):439.(孙伟伟. 基于流形学习的高光谱影像降维理论与方法研究[J]. 测绘学报, 2014, 43(4):439.)

[6]	SHI Qian, DU Bo, ZHANG Liangpei. A Dimensionality Reduction Method for Hyperspectral Imagery Based on Local Discriminative Tangent Space Alignment[J]. Acta Geodaetica et Cartographica Sinica, 2012, 41(3):417-420.(石茜，杜博，张良培. 一种基于局部判别正切空间排列的高光谱遥感影像降维方法[J]. 测绘学报, 2012, 41(3):417-420.)

[7]	TAN Kun, DU Peijun. Wavelet Support Vector Machines Based on Reproducing Kernel Hilbert Space for Hyperspectral Remote Sensing Image Classification[J]. Acta Geodaetica et Cartographica Sinica, 2011, 40(2):142-147.(谭琨，杜培军. 基于再生核Hilbert空间的小波核函数支持向量机的高光谱遥感影像分类[J]. 测绘学报, 2011, 40(2):142-147.)

[8]	ZHANG Lei, SHAO Zhenfeng, ZHOU Xiran, et al. Semi-supervised Collaborative Classification for Hyperspectral Remote Sensing Image with Combination of Cluster Feature and SVM[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(8):855-861.(张磊，邵振峰，周熙然，等. 聚类特征和SVM组合的高光谱影像半监督协同分类[J]. 测绘学报, 2014, 43(8):855-861.)

[9]	YANG Guopeng, YU Xuchu, ZHOU Xin, et al. Research on Relevance Vector Machine for Hyperspectral Imagery Classification[J]. Acta Geodaetica et Cartographica Sinica, 2010, 39(6):572-577.(杨国鹏，余旭初，周欣，等. 基于相关向量机的高光谱影像分类研究[J]. 测绘学报, 2010, 39(6):572-577.)

[10]	YAO Futian, QIAN Yuntao. Gaussian Process and Its Applications in Hyperspectral Image Classification[J]. CAAI Transactions on Intelligent Systems, 2011, 6(5):396-404.(姚伏天，钱沄涛. 高斯过程及其在高光谱图像分类中的应用[J]. 智能系统学报, 2011, 6(5):396-404.)

[11]	CSATÓ L. Gaussian Processes-iterative Sparse Approximations[D]. Aston:Aston University, 2002.

[12]	LAWRENCE N D, SEEGER M, HERBRICH R. The Informative Vector Machine:A Practical Probabilistic Alternative to the Support Vector Machine[R]. Sheffield, UK:Technical Report, Department of Computer Science, 2005.

[13]	LAWRENCE N D, SEEGER M, HERBRICH R. Fast Sparse Gaussian Process Methods:The Informative Vector Machine[M]//Advances in Neural Information Processing Systems.[S.l.]:MIT Press, 2003:625-632.

[14]	LAWRENCE N D, PLATT J C. Learning to Learn with the Informative Vector Machine[C]//Proceedings of the 21st International Conference in Machine Learning. San Francisco:[s.n.], 2004:512-519.

[15]	LIU Jianwei, XU Xiang, LUO Xionglin. Face Recognition Based on Orthogonal Locality Preserving Projection and Informative Vector Machine[J]. Computer Engineering, 2010, 36(7):200-202.(刘建伟，徐翔，罗雄麟. 基于OLPP和信息向量机的人脸识别[J]. 计算机工程, 2010, 36(7):200-202.)

[16]	XU Xiang, LIU Jianwei, LUO Xionglin. Research on Nerval Activity Classification and Decoding Based on Informative Vector Machine[J]. Computer Engineering, 2010, 36(7):198-199, 202.(徐翔，刘建伟，罗雄麟. 基于信息向量机的神经活动分类和译码研究[J]. 计算机工程, 2010, 36(7):198-199, 202.)

[17]	GIBBS M N, MACKAY D J C. Variational Gaussian Process Classifiers[J]. IEEE Transactions on Neural Networks, 2002, 11(6):1458-1464.

[18]	NEAL R M. Regression and Classification Using Gaussian Process Priors[J]. Bayesian Statistics, 1998, 6(10):475-501.

[19]	WILUAMS C K I, BARBER D. Bayesian Classification with Gaussian Processes[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(12):1342-1351.

[20]	MINKA T P. A Family of Algorithms for Approximate Bayesian Inference[D]. Cambridge:Massachusetts Institute of Technology, 2001:36-48.

[21]	MØLLER M F. A Scaled Conjugate Gradient Algorithm for Fast Supervised Learning[J]. Neural Networks, 1993, 6(4):525-533.

[22]	LI Hang. Statistical Learning Method[M]. Beijing:Tsinghua University Press, 2012.(李航. 统计学习方法[M]. 北京:清华大学出版社, 2012.)

文章信息

文章历史

相关文章

工作空间