1 引 言
在遥感影像分类中,传统方法将影像中的所有地物类型进行标记。而在有些应用中,只要求提取其中的某个特定类别,不考虑其他的地物类型,例如湿地提取、植被提取、水体提取等[1, 2, 3, 4, 5],这就是单类分类问题。单类分类问题中,待提取的类别称为兴趣类别。兴趣类别的样本也称正样本,其他的类别统称为非兴趣类别,非兴趣类别的样本称为负样本。
单类分类已逐渐成为遥感信息提取研究的热点,提取兴趣类别所采用的方法具有针对性,如文献[6]提出了一种自适应的水体信息提取方法,结合图的聚合、相邻等空间特征和高维波段映射的谱分析,通过自适应信息计算方法自动地调整提取参数,实现水体信息提取的自动化,取得了较好的效果。单类分类与传统的遥感影像分类不同的是,前者感兴趣的是一个类别的提取精度,而后者关心的是影像中所有地物类型的准确划分。单类分类问题可以通过两种方法解决,一是多类分类器,另一个是单类分类器。采用多类分类方法提取单类信息,将影像数据划分为多个地物类别,同时获取兴趣类别信息。例如为了能准确地提取水田信息,需要将原影像分成水田与林地、旱地、水体和城镇用地等不同的类别[7]。近年来,遥感影像多类分类算法层出不穷,例如支持向量机,其优点是能在样本较小的情况下获得较好的分类结果,而且具有高维数据处理能力[8, 9]。纹理分类也是近年来研究的一个热门课题[10],人们越来越注重图像的空间特征如纹理、形状和地学数据等在信息提取中的作用。此外,研究者们还提出了采用多源遥感数据进行信息提取的方法[11];基于图像对象进行影像分类和变化检测、信息提取的方法[12, 13, 14, 15, 16]等。这些方法都是多类分类方法,确定多类中的兴趣类别后,也可以用于单类信息提 取。采用多类分类方法提取遥感影像单类信息,当前的主要研究兴趣是特征的选择,例如利用比值运算创建的各种指数,这类指数最广为使用的就是归一化差异植被指数NDVI,文献[4]则提出了改进的归一化差异水体指数(MNDWI)提取水体信息。
近年来,多类分类方法层出不穷,而利用单类分类器提取遥感影像中的兴趣类别,相关的研究还较少。一个常用的单类分类器是单类支持向量 机(one-class support-vector machine,OCSVM)[17]。 OCSVM方法在高维空间中寻找一个能将兴趣类别分开的具有最大间隔的超平面,它的缺点是自由参数的选择困难。在构造分类器过程中,除了兴趣类别样本外,未标记样本也提供了有用的信息,例如 Transductive SVM(TSVM)方法[18],通过利用未标记样本可以得到较好的分类性能。 TSVM方法需要设定迭代次数,而且需要已标记 样本中的正样本和负样本两个方面。还有基于支持域描述的方法(support vector data description,SVDD)[19, 20],利用一个包含目标数据的尽可能小的球体进行判别,由小样本训练就能得到较好的分类效果。SVDD方法的主要缺点也是参数设置比较复杂。文献[21]提出了PUL(positive and unlabeled learning)算法进行单类分类,在高分辨率遥感影像中进行了试验,分别提取了影像中的各个单类,包括市区、树木、草地、水体、裸地。文献[22]提出的遥感影像单类分类的MAXENT方法,在训练过程中只要求正样本,试验结果表明其单类分类效果优于OCSVM方法。MAXENT方法选择具有最大熵的分布形式作为兴趣类别的数据分布,是一种参数化的方法,对于不规则的兴趣类别分布形式,效果受到影响。
传统多类分类器应用于单类分类问题,需要对所有类别提取训练样本,得到所有类别的分类图像,增加了分类难度和时间代价,也增大了训练样本采集的工作量。而采用单类分类器提取单个兴趣类别,只需要兴趣类别的训练样本,或者少量的、不完善的非兴趣类别样本。在遥感影像单类信息提取中,一般对兴趣类别了解的比较充分,而对于其他类别的了解有限。例如,在遥感影像小目标信息的提取中,不能保证背景的光谱是已知的。又如,在全国范围的湿地提取与制图工作中,对湿地类别了解比较充分,但是在大范围区域的影像中,湿地以外的非兴趣类别可能多种多样,而且各个地区有所区别,不易掌握。单类分类器不需要所有类别的训练样本,是一种特殊的分类方法,旨在训练和提取单一兴趣类别,可以用于特定类别提取(如海洋溢油面积提取)、遥感影像目标识别、变化检测(未变化作为背景)等,具有广泛的应用前景和重要的研究价值。本文提出一种基于白化变换的遥感影像单类分类方法,并通过试验验证了该方法的有效性。
2 基于兴趣类别的图像白化变换将遥感影像映射到n维特征空间,设n维随机向量X表示待提取的兴趣类别,并由包含N个训练样本的样本集 S={S1,S2,…,SN}来估计。又设 Σ 为样本的协方差矩阵,Φ和Δ分别为Σ所对应的特征向量矩阵和特征值矩阵,则
式中,为白化变换,变换后的数据为白化数据。
由于
欧几里得距离不是保持不变,因此,白化变换不是正交归一变换。
白化变换是将一个分布的协方差矩阵变换为单位阵 I。白化变换后,该分布所有特征的方差相同,且为1,消除了各个特征尺度不同的影响。在遥感影像中,白化处理可以将兴趣类别映射到其协方差矩阵的主分量上,特征空间的坐标中心位于兴趣类别中心,各个方向是兴趣类别协方差矩阵中的主要特征值对应的特征向量,而且互不相关。作白化处理后,兴趣类别的数据点在特征空间呈超球形对称聚集,由于许多单类分类算法都是依赖于样本到数据中心点之间的距离的,白化变换使单类提取变得容易。
白化变换是在不同的方向上作了相应的尺度缩放,使得兴趣类别的分布呈超球形状,其他各类别分布的形状也相应发生改变,但是所有类别之间的总体结构并未改变。因此,对于依赖正态分布的基于高斯模型的单类分类方法来说,分类结果并不会得到改善。对于基于支持向量描述的SVDD方法,如果兴趣类别分布较为规范,不具有多模式特征,白化变换后满足超球形状的分布,对于单类提取是有利的。而如果兴趣类别分布较为 分散,白化后仍然可能和非兴趣类别混合一起,影响兴趣类别的提取,因此,白化变换更适合具有结构简单、分布集中的类别。白化变换通过不同方向上的缩放,优化兴趣类别的分布形状,数据点聚集在它们的几何中心周围,不同方向上具有相同的距离尺度,有利于依靠距离的分类方法设定阈值。
以TM遥感影像单类提取为例,说明白化变换前后的类别分布变化情况。图 1所示为一幅TM遥感影像,是德国Definients公司推出的eCognition软件手册中的实例图像[23],地点为德国萨克森州一城镇区域,图像大小为499像素×498像素,由7个波段合成的影像,包含4个类别:不透水表面、林地、草地和水体。
以不透水表面为兴趣类别,其他为非兴趣类别,各选择1000样本点,并根据前两个波段作二维散点图,如图 2所示。图 2中圆圈代表兴趣类别,圆点代表其他类别。由图 2(a)可见,在白化变换前兴趣类别样本分布形状不规范,而白化变换后的图 2(b)显示,兴趣类别样本能够较好地呈圆形分布,容易实现单类提取。
3 基于白化变换的单类分类基于白化变换的遥感影像单类分类流程如图 3所示。白化变换后,以原点为中心,确定一个超球体进行单类分类,距离原点小于超球半径的样本为正类。在单类分类中,只有兴趣类别的训练样本,由于没有其他类别作为比较,需要设定一个距离阈值,根据阈值判断样本是否属于兴趣类别。
该算法的时间复杂度主要体现在白化过程和单类分类两个方面。在白化变换中估计一个n阶的N个样本的协方差矩阵,时间复杂度为O(n2N),求协方差矩阵的特征值和特征向量的时间复杂度是O(n3),对M个像素的整个影像作白化的复杂度是O(n2M)。对整个影像进行单类分类的时间复杂度是O(nM)。因为,n是数据的维数,N是样本的数量,都远远小于数据的规模M,所以,本文方法总的时间复杂度为O(n2N)+ O(n3)+ O(n2M)+ O(nM)= O(n2M)。在空间复杂度方面,主要体现在初始影像数据和兴趣类别样本所占的空间O(nM)+ O(nN),以及白化后影像占的空间O(nM),所以总的空间复杂度为O(nM)。
3.1 阈值选择在单类分类方法中,只对兴趣类别进行训练,由训练样本计算出兴趣类别的均值向量和标准差等分布特征。没有其他类别的分布知识,从而无法和其他类别之间的距离进行比较,因此在单类分类中关键是要选择一个合适的距离阈值。根据切比雪夫不等式,对于任意分布形式的数据,在平均数K倍标准差范围之内的数据比例至少占(1-1/K2)。例如,在3倍标准差区间内的数据比例至少为89%,在4倍标准差区间内的数据比例至少为94%。根据该定理,如果兴趣类别的判别阈值为均值的3倍标准差,就能保证兴趣类别中90%左右的数据被正确分类,区间越大比例越大,但随着区间的扩大,错分比例也会增加。这是因为在遥感影像中,兴趣类别往往与其他类别在特征空间邻近分布或相互交叠,其他类别的数据被更大的区间包括进来的比例增加。基于兴趣类别的白化变换为阈值选择提供了有利条件,因为在白化变换后,兴趣类别的分布中心在特征空间坐标中心,而且各个方向上的方差相同,使得在各个方向上的阈值可以是一个统一的数值。在白化变换后的空间,兴趣类别均值向量为0,而且呈超球形分布,阈值选择就是确定一个距离值T,使0到T之间的超球体能够最大限度地包含兴趣类别样本同时减少错分数据。
3.2 阈值选择试验为了选择最佳的距离阈值,分别在两幅TM遥感影像上,针对不同的兴趣类别进行试验。首先,在如图 1所示的遥感影像中,选择2000个正样本和1000个负样本,其中1000个正样本训练分类器,另1000个正样本和1000个负样本作精度评价。由训练样本计算兴趣类别的均值向量和 协方差矩阵,并求出协方差矩阵的特征向量矩阵和特征值矩阵,将原遥感影像进行白化变换。在变换后的空间中,将距离阈值从小到大依次变化,进行单类分类,并对每次得到的结果作精度评价。 精度评价指标包括生产精度、用户精度、总体精度和Kappa系数。由于生产精度和用户精度反映的是片面的分类效果,而且往往是前者高时后者低,后者高时前者低,因此将二者的乘积作为一个评价指标。
为了方便,在计算欧氏距离时不开方,并以方差的倍数作为距离阈值的度量,阈值越大,区间内包含的兴趣类别数据越多,但其中包含的非兴趣类别数据也会增加。为了在一个较大的范围内进行试验,方差倍数阈值从2到50变化(近似于1.4倍到7倍标准差),如图 4所示。图 4中,横坐标表示兴趣类别白化后选择的不同方差区间,纵坐标表示对应的提取精度。
如图 5所示为eCognition软件用户手册中另一幅TM实例图像[23],地点为美国加利福尼亚地区,图像大小为600像素×600像素,由蓝、绿、红3个波段合成影像,其中包含4个类别:不透水表面、水体、耕地和村庄,各个类别的提取精度与阈值的关系如图 6所示。
从单类提取精度与距离阈值的关系图表中可以看出,分类精度随阈值逐渐增大呈现一个由升到降的曲线,而且大都是在3~4倍标准差的区间内精度最高,对应图中的阈值范围为9~16的方差。从图 4和图 6的两组曲线图来看,试验图像中的各个地物类别在横坐标阈值取9~16的范围内达到最大值,这一特点具有很强的规律性。整个阈值范围内,3种精度度量基本保持一致的曲线形状,随着区间的扩大,错分像素增多,分类精度逐渐降低。在两幅影像中的水体类别,提取精度的曲线比较平缓,因为水体类别分布集中,而且距离其他类别较远,阈值达到5~6倍的标准差仍能保证较高的分类精度。总体来看,采用基于白化变换的单类分类方法提取TM影像中的单类信息,最佳阈值为3~4倍标准差,这大大简化了阈值选择过程,而且保证了分类的精度。
4 试验结果分析比较将基于白化变换的方法应用于TM遥感影像单类信息提取,阈值统一选择为3倍标准差。试验数据为图 1和图 5所示TM影像。将本文方法与OCSVM方法进行比较,OCSVM方法中选择RBF核函数,并通过10折交叉验证获得各种 参数。在每个试验中选择2000个正样本和1000个负样本,其中1000个正样本用来训练分类器,另1000个正样本和1000个负样本作精度评价。试验数据1和数据2中各地物类别提取的试验结果如图 7和图 8所示,对应的分类精度估计见表 1和表 2。
类别 | 本文方法 | OCSVM | ||||
OA/(%) | Kappa | Ua×Pa | OA/(%) | Kappa | Ua×Pa | |
不透水表面 | 91.5 | 0.79 | 0.55 | 90.2 | 0.66 | 0.52 |
草地 | 85.9 | 0.69 | 0.68 | 83.4 | 0.65 | 0.63 |
林地 | 85.9 | 0.67 | 0.62 | 87.7 | 0.73 | 0.68 |
水体 | 99.2 | 0.84 | 0.73 | 99.2 | 0.83 | 0.72 |
类别 | 本文方法 | OCSVM | ||||
OA/(%) | Kappa | Ua×Pa | OA/(%) | Kappa | Ua×Pa | |
不透水表面 | 93.8 | 0.83 | 0.78 | 94.5 | 0.85 | 0.79 |
耕地 | 87.7 | 0.76 | 0.78 | 91.1 | 0.82 | 0.84 |
村庄 | 85.3 | 0.64 | 0.50 | 91.0 | 0.63 | 0.46 |
水体 | 98.7 | 0.94 | 0.90 | 98.8 | 0.97 | 0.97 |
从试验结果来看,本文方法虽然选择固定为3倍标准差的距离阈值,但提取单类信息的分类精度与OCSVM方法非常相近。在本文提出的单类分类方法中,由于遥感影像进行了基于兴趣类别的白化变换,对兴趣类别分布的各个方向进行缩放,使固定的阈值能够应用于各个类别,增加了单类提取的鲁棒性。而OCSVM方法在应用中参数选择难度较大,且参数对分类结果有很大的影响。通过试验测试,本文提出的单类分类算法及参数设置简单,对于不同分布结构的类别同样有效。
为了进一步估计单类分类器的性能,采用多类分类器提取单类信息进行比较。以最近邻(nearest neighbor,NN)分类器为例,为每个类别选择1000个样本进行训练,并采用与单类分类器相同的测试方法。每个单类的分类结果如图 9所示,分类精度评价如表 3所示。由于提供了非兴趣类别样本参考,多类分类器的分类精度一般要优于单类分类器。
另一试验数据为澳大利亚首都堪培拉部分市区2.5m分辨率SPOT 5影像,大小为512像素× 512像素的JPEG图像,时间为2003年2月,如图 10所示。通过目视解译其中包括不透水面、植被、裸地和水体4个类别,分别对各个单类进行提取。训练样本和测试样本的选择都采用目视解译进行,每次分类选择1000个正样本作训练,1000个正样本和1000个负样本作测试,并对分类结果进行评价。本文方法和OCSVM方法对SPOT 5影像中的各地物类别提取的试验结果如图 11所示,对应的分类精度估计见表 4。由表 4可见,本文方法与OCSVM方法的总体分类精度非常接近,虽然只需要设置3倍的标准差阈值参数,而分类精度并不低于经过复杂参数设置的OCSVM方法。
类别 | 本文方法 | OCSVM | ||||
OA /(%) | Kappa | Ua×Pa | OA /(%) | Kappa | Ua×Pa | |
不透水表面 | 85.4 | 0.50 | 0.35 | 88.1 | 0.53 | 0.36 |
植被 | 82.2 | 0.62 | 0.58 | 83.4 | 0.65 | 0.61 |
裸地 | 81.5 | 0.55 | 0.45 | 80.7 | 0.47 | 0.35 |
水体 | 97.4 | 0.92 | 0.88 | 95.3 | 0.86 | 0.79 |
遥感影像单类信息提取方法有两种:一是多类分类器,二是单类分类器,其中单类分类器的研究还不够充分。单类分类器只需要兴趣类别的训练样本,没有其他类别作比较判断,因此一般都需要确定若干个阈值参数。阈值的选择对单类分类器至关重要,直接影响单类分类的精度,本文提出的基于白化变换的单类分类器,阈值选择简单,只要3倍标准差的距离阈值就能对TM影像中的各个地物类别进行有效提取。试验结果与OCSVM方法作了比较。两种方法对各个地物类别的分类精度都非常接近,本文提出的单类分类方法不需要复杂的参数设置,具有较强的适应性。
[1] | GONG Peng, NIU Zhenguo, CHENG Xiao, et al. China's wetland change (1990—2000) determined by remote sensing [J]. Scientia Sinica: Terrae, 2010, 40(6), 768-775.(宫鹏, 牛振国, 程晓, 等.中国1990和2000基准年湿地变化遥感[J]. 中国科学: 地球科学, 2010, 40(6): 768-775.) |
[2] | TOOKE T R, COOPS N C, GOODWIN N R et al. Extracting Urban Vegetation Characteristics Using Spectral Mixture Analysis and Decision Tree Classifications[J]. Remote Sensing of Environment, 2009, 113(2): 398-407. |
[3] | SHEN Li, TANG Hong, WANG Shidong, et al. River Extraction from the High Resolution Remote Sensing Image Based on Spatially Correlated Pixels Template and Adboost Algorithm[J]. Acta Geodaetica et Cartographica Sinica, 2013, 42(3): 344-350. (慎利, 唐宏, 王世东, 等. 结合空间像素模板和Adaboost算法的高分辨率遥感影像河流提取[J]. 测绘学报, 2013, 42(3): 344-350.) |
[4] | XU Hanqiu. A Study on Information Extraction of Water Body with the Modified Normalized Difference Water Index(MNDWI)[J]. Journal of Remote Sensing, 2005, 9(5): 589-595. (徐涵秋. 利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J]. 遥感学报, 2005,9(5):589-595.) |
[5] | YAN Baikun, WANG Runsheng, GAN Fuping, et al. Progresses in Minerals Information Extraction Using Thermal Remote Sensing[J]. Advances in Earth Science, 2005, 20(10): 1116-1126. (闫柏琨, 王润生, 甘甫平, 等. 热红外遥感岩矿信息提取研究进展[J]. 地球科学进展, 2005, 20(10): 1116-1126.) |
[6] | HU Xiaodong, LUO Jiancheng, XIA Liegang, et al. Adaptive Water Body Information Extraction Using RS TUPU Computing Model[J]. Acta Geodaetica et Cartographica Sinica[J]. 2011, 40(5): 544-550. (胡晓东, 骆剑承, 夏列钢, 等. 图谱迭代反馈的自适应水体信息提取方法[J]. 测绘学报, 2011, 40(5): 544-550.) |
[7] | ZHANG Youshui, YUAN Lifeng, YAO Yonghui. Study on Extraction of Paddy Rice Fields from Multitemporal MODIS Images[J]. Journal of Remote Sensing, 2007, 11(2): 282-288. (张友水, 原立峰, 姚永慧. 多时相MOD IS影像水田信息提取研究[J]. 遥感学报, 2007, 11(2): 282-288.) |
[8] | INGLADA J. Automatic Recognition of Man-made Objects in High Resolution Optical Remote Sensing Images by SVM Classification of Geometric Image Features[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2007, 62(3): 236-248. |
[9] | MELGANI F, BRUZZONE L. Classification of Hyperspectral Remote Sensing Images with Support Vector Machines[J]. IEEE Transactions on Geoscience and Remote Sensing, 2004, 42(6): 1778-1790. |
[10] | AVCI E, SENGUR A, HANBAY D. An Optimum Feature Extraction Method for Texture Classification[J]. Expert Systems with Applications, 2009, 36(3): 6036-6043. |
[11] | SOHN G, DOWMAN I. Data Fusion of High-resolution Satellite Imagery and LiDAR Data for Automatic Building Extraction[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2007, 62(1): 43-63. |
[12] | BENZ U C, HOFMANN P, GREGOR W. Multi-resolution, Object-oriented Fuzzy Analysis of Remote Sensing Data for GIS-ready Information[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2004, (58): 239-258. |
[13] | MING Dongping, LUO Jiancheng, SHEN Zhanfeng, et al. Research on Information Extraction and Target Recognition from High Resolution Remote Sensing image [J]. Science of Surveying and Mapping, 2005,30(3):18-20.(明冬萍, 骆剑承, 沈占锋, 等. 高分辨率遥感影像信息提取与目标识别技术研究[J]. 测绘科学, 2005, 30(3): 18-20.) |
[14] | CHEN Yunhao, FENG Tong, SHI Peijun, et al. Classification of Remote Sensing Image Based on Object Oriented and Class Rules[J]. Geomatics and Information Science of Wuhan University, 2006, 31(4): 316-320. (陈云浩, 冯通, 史培军, 等. 基于面向对象和规则的遥感影像分类研究[J]. 武汉大学学报: 信息科学版, 2006, 31(4): 316-320.) |
[15] | CHEN Jie, DENG Min, XIAO Pengfeng, et al. Object-oriented Classification of High Resolution Imagery Combining Support Vector Machine with Granular Computing[J]. Acta Geodaetica et Cartographica Sinica, 2011, 40(2): 135-141. (陈杰, 邓敏, 肖鹏峰, 等. 结合支持向量机与粒度计算的高分辨率遥感影像面向对象分类[J]. 测绘学报, 2011, 40(2): 135-141.) |
[16] | GENELETTI D, GORTE B G H. A Method for Object-oriented Land Cover Classification Combining Landsat TM Data and Aerial Photographs[J]. International Journal of Remote Sensing, 2003, 24(6): 1273-1286. |
[17] | SCHÖLKOPF B, PLATT J C, SHAWE-TAYLOR J, et al. Estimating the Support of a High-dimensional Distribution[J]. Neural Computation, 2001, 13(7):1443-1471. |
[18] | BRUZZONE L, CHI M, MARCONCINI M. A Novel Transductive SVM for Semisupervised Classification of Remote-sensing Images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(11): 3363-3373. |
[19] | SANCHEZ-HERNANDEZ C, BOYD D S, FOODY G M. One-class Classification for Mapping a Specific Land-cover Class: SVDD Classification of Fenland [J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(4): 1061-1073. |
[20] | MUÑOZ-MARí J, BRUZZONE L, CAMPS-VAILS G. A Support Vector Domain Description Approach to Supervised Classification of Remote Sensing Images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(8): 2683-2692. |
[21] | LI W K, GUO Q H, ELKAN C. A Positive and Unlabeled Learning Algorithm for One-class Classification of Remote-sensing Data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(2): 717-725. |
[22] | LI W K, GUO Q H. A Maximum Entropy Approach to One-class Classification of Remote Sensing Imagery[J]. International Journal of Remote Sensing, 2010, 31(8): 2227-2235. |
[23] | BAATZ M, BENZ U, DEHGHANI S, et al. eCognition User Guide[EB/OL]. Berlin: Definients, (2004-06-20)[2013-02-10]. http://www.definiens- imageing.com. |