1 前 言
遥感影像分类技术是实现遥感专题信息自动提取与表达的一个基本方法[1]。目前对遥感影像的分类处理,主要有两类方法:如果是多光谱影像,则采用传统的基于像素的分类方法;如果是高分辨率影像,则采用面向对象的分类方法。因此,遥感影像分类研究也主要体现在两个方面:针对多光谱影像,充分挖掘传统的像素级方法的潜力、提出一些改进算法[2, 3, 4, 5]或应用新数学理论发展新方法[6, 7, 8];针对高分辨率影像,则开展面向对象的影像分割、分类规则的研究[9, 10, 11]。
无论是像素级方法还是对象级方法,都面临着两个问题:① 两类方法都存在一些自身难以克服的困难。像素级方法对多光谱影像分类时,因光谱特征丰富、同物异谱现象更为突出,容易产生过分类现象。对象级方法对高分辨率影像分类时,因光谱特征有限、异物同谱现象可能很明显,容易将空间相邻、形状类似的不同类地物误分为同一个类别而产生欠分类现象。② 两类方法都局限在一个单一层次对影像进行分类。由于遥感影像的复杂性,单一层次的分类结果往往存在着一定程度的错误,而且这种错误在单一层次分类中是很难纠正的。
国内外的分类研究,将像素级分类和对象级分类分别作为两个独立的方向开展,很少注意到二者的结合与优势互补。考虑到遥感数据获取能力的发展已能同时获得空间分辨率高的全色影像和光谱分辨率高的多光谱影像,以及单一像素级分类或对象级分类都面临着自身难以克服的困难而存在一定的分类错误,本文作出新的探索与尝试,将像素级分类方法和对象级分类方法结合,提出一种新的影像分类方法,即基于像素级和对象级的遥感影像合成分类方法。将像素级分类视为一个层次、对象级分类视为另一个层次,在不同的两个层次上求解同一个分类问题,通过像素层分类与对象层分类的合成运算纠正两个层次分类结果的不一致、通过对象层的分解运算纠正对象层分类结果的欠分类问题,将其优化合成为最终的分类结果。
2 基于改进RBF神经网络的像素级分类RBF神经网络分类法主要用于像素级分类,其性能的关键在于确定合适的隐含层神经元数量和神经元核函数[12],目前多采用K 均值法、ISODATA 法等确定,难以得到最优的隐含层状态。本文提出了一个改进的RBF神经网络分类算法,通过两个方案来改进隐含层神经元的设计。
2.1 隐含层神经元的初始化设类别集合为C={C1,C2,…,Cm},类别Ci的样本集为{xki}(1≤i≤m,1≤k≤ni),ni是类别Ci的样本数,类别Ci的样本中心为
对类别Ci的每一个样本xki,按式(2)计算与样本中心的相似性ski,得到一组相似性集合
式中,·表示内积;相似性ski越大,属于同一类别的可能性越大。对于相似性集合{ski},使用Otsu算法得到最优分割阈值ti,从而将样本集{xki}分为两组。对每一组样本集迭代上面的过程,最终将类别Ci的样本集分为若干个聚类集合{Cim′}。这里实际的聚类数可以通过类内方差之间的关系调整。每一个聚类Cim′计算其样本中心
核聚类算法能较好地表达各模式在类域中的分布情况,与k均值、ISODATA等以均值向量点方式相比,能更好地表示一个聚类。因此,通过核聚类能更准确地调整隐含层神经元状态。由于正态分布具有普适性,本文利用正态核函数进行核聚类
式中,mi、Σi为聚类的均值向量和协方差矩阵,核聚类过程见文献[13]。经过核聚类后,每个聚类对应一个神经元,计算其相应的径向基函数的中心和方差,完成隐含层神经元的调整。 3 基于改进模糊支持向量机和决策树的对象级分类当影像空间分辨率比较高时,面向对象的技术被认为是更接近目视解译的分类方法,其关键在于影像分割和对象分类。影像分割是一个经典难题,而对象分类目前多采用模糊分类技术,在很大程度上依赖于隶属度函数和模糊规则的人为设置。对于影像分割,这里采用一种基于有序抖动半调和互信息的分水岭分割方法。对于对象分类,则采用基于改进模糊支持向量机和决策树的层次分类技术。
3.1 基于有序抖动半调和互信息的分水岭分割该方法首先使用Bayer有序抖动算法,获得抖动影像。抖动影像以一个简化的方式包含了原始影像的结构信息,可以从中几乎不受噪声干扰地提取与真实目标相关的点作为标记点。然后设计了一个称为相对互信息熵的指标,以从多尺度分割结果中确定最佳的分割尺度。该方法已在文献[14]中详细论述。
3.2 改进模糊支持向量机和决策树结合的层次分类针对影像分割后生成的区域具有数量相对较少、特征维数相对较高的特点,文献[15]提出了一种改进的模糊支持向量机和决策树相结合的分层分类技术,通过二叉决策树建立对象分类的分层递阶模型,通过改进的模糊支持向量机实现每个结点的两类分类判别。在决策树的分层递阶模型中,其关键在于每个层次如何确定决策特征,文献[15]并未对这一问题展开讨论,本文采取的方法是在每个中间结点计算对应样本各特征的方差,选择方差最大的特征作为FSVM分类的特征。具体描述如下:
设节点对应的训练样本集合可分为s类c1,c2,…,cs,其中类ci(1≤i≤s)含有ni个训练样本,计算全部训练样本的各类特征fj的均值mj、方差σj(1≤j≤m,m为特征数),则节点的决策特征fk满足σk=max{σ1,σ2,…,σm}。应用Otsu算法计算全部训练样本所含像素的决策特征fk的最佳分割阈值Tk,将s类训练样本分为两大类:
若≥Tk,则将ci类的训练样本集合{x|x∈ci}作为正类的训练样本;
若,则将ci类的训练样本集合{x|x∈ci}作为负类的训练样本。
其中,表示ci类的训练样本决策特征fk的均值。
针对像素级方法容易产生过分类、对象级方法容易产生欠分类等缺点,通过像素层、对象层合成运算纠正两个层次分类结果的不一致,通过分解运算纠正对象层分类结果的欠分类问题,从而提高影像分类的精度。对于每个区域,比较像素层和对象层分类结果中每个像素的类别值,如果每个像素在两个层次的分类结果一致,则有理由认为该区域像素分类正确。如果某个像素在两个层次分类结果不一致,则该像素分类存在争议,可能是描述该区域的尺度较大、存在欠分类,需粒度分解、细分纠正为多个类;或者是存在分类错误,则需对其分类重新判断。算法描述如下:
(1) 运用基于改进RBF神经网络的像素级分类方法获得像素层分类结果,表示为(X1,f1),其中X1表示像素集合、f1表示像素属性。
(2) 运用基于改进模糊支持向量机和决策树的对象级分类方法获得对象层分类结果,表示为(X2,f2),其中X2表示对象集合、f2表示对象属性。
(3) 像素层分类结果(X1,f1)和对象层分类结果(X2,f2)进行层次合成,合成分类结果可表示为(X3,f3)。
对于每个区域,如果每个像素在两个层次中的分类结果一致,则该区域存储到集合X3中,否则存储该区域到集合Y中。
(4) 对于集合Y中的每个区域R,统计R中像素在像素层分类中的分类情况,假设有C1,C2,…,Cm个类别,对类别Ci计算指标gi
式中,ni表示类别Ci的像素数;d(pik,

(5) 对m个指标值g1,g2,…gm,计算其最大值gj,若gj对应的类别Cj就是区域类别,则将gj置0,并将像素集合{pjk}存储到论域X3,执行步骤(10);否则执行步骤(6)。
(6) 对类别Cj的每个连通像素集合{pjk}在区域R约束下,进行区域增长得到像素集合{p′jk},其中区域增长的阈值为像素集合{pjk}的光谱均方差与区域R的光谱均方差的最大值。
(7) 若区域增长后的像素集合{p′jk}满足
式中,fj、fR表示像素集合{p′jk}、区域R的光谱均值,阈值T为区域R类别的平均光谱值与其他类别的平均光谱值的最小差异,则将像素集合{p′jk}类别值赋区域R类别、存储到论域X3中,继续执行步骤(6);否则执行步骤(8)。(8) 计算集合X3中各个类别Ci的光谱特征均值fCi、纹理特征均值tC i ,以及像素集合{p′jk}光谱特征均值fPj、纹理特征均值tPj。以光谱特征均值、纹理特征均值组成特征向量,其中每个特征分量都已量化调整到0~255,{p′jk}与Ci的特征差异di按式(6)计算
式中,wfPj、wtPj分别是{p′jk}光谱特征的权值、纹理特征的权值;wfCi、wtCi分别是Ci光谱特征的权值、纹理特征的权值。权值可以通过特征属性自适应调整 式中,σfPj、σtPj表示{p′jk}光谱特征方差、纹理特征方差;σfCi、σtCi表示Ci光谱特征方差、纹理特征方差。(9) 将像素集合{p′jk}与每一个类别Ci的特征向量进行比较,若存在特征差异小于差异阈值且最小的类别,则将其作为{p′jk}的类别,并存储到集合X3中。
Ci的特征差异阈值Ti为Ci样本中心到样本点的最大距离。否则,将{p′jk}存储到集合Z中。
(10) 指标值gj置0,重新计算区域R中待定像素类别的指标值,并继续执行步骤(5)直到指标值全为0。
(11) 对集合Y中的全部区域执行步骤(4)~(10)后,重新计算集合X3中各个类别Ci的特征向量。对于集合Z中的每个像素集合{p′jk},按式(6)、(7)重新计算{p′jk}与Ci的特征差异di。若存在满足式(8)的类别Cn,则将类别值Cn赋给{p′jk}。若仍然不存在满足式(8)的类别,则搜索其相邻接区域o1,o2,…,os(s为邻接区域数),像素集合{p′jk}与邻接区域oi同类的边缘损失代价Costi定义为
式中,pj、pi、pc分别为{p′jk}、oi的周长以及它们的公共边界长度。边缘损失代价越小,则{p′jk}与邻接区域同类所引起的影像结构信息的改变越小。因此,若邻接区域on满足则{p′jk}的类别值赋为邻接区域on的类别值,并存储到集合X3中。
5 试验和分析 5.1 试验A 5.1.1 试验数据为验证基于像素级和对象级合成分类方法的有效性,试验数据为美国QuickBird卫星于2007年9月拍摄的武汉地区影像中截取的大小为735像素×529像素的试验区,如图 1(a)、(b)所示,为典型的城区影像图。将3个可见光波段和1个近红外波段(图 1(b))与全色波段(图 1(a))进行Pansharp融合,形成一幅融合影像。经过目视判读,影像上的地物大致可分为8类:浅色屋顶(class1)、深色屋顶(class2)、黄色建筑物(class3)、树林(class4)、空地(class5)、道路(class6)、阴影(class7)、湖泊(class8)。
![]() |
图 1 Fig. 1 |
对融合影像进行像素级分类。在影像上为每一类地物选择一定数量的训练样本,运用2.1节的隐含层神经元初始化方法,确定了68个神经元及其初始参数。通过2.2节的核聚类算法,将68个神经元的径向基函数调整为最优。至此,可以确定神经网络拓扑结构是一个输入层节点数为4、隐含层神经元数为68、输出层节点数为8的3层前馈网络。采用最小二乘法和梯度下降法联合求解隐含层到输出层的连接权值,使训练样本分类误差最小。对融合影像运用训练好的RBF神经网络分类器,得到像素级分类结果如图 1(c)所示。
从图 1(c)的分类结果来看,像素级方法对多光谱影像分类时容易产生过分类现象,如图 1(c),A处的浅色屋顶与黄色建筑物之间、B处的浅色屋顶与道路之间、C处的深色屋顶与道路之间、D处的深色屋顶与阴影之间、E处的空地与黄色建筑物之间均存在一定程度的误分和混分,其原因在于影像上光谱特征丰富,同一区域内部不同部分之间的光谱差异可能很明显却被误分为不同的类别。
5.1.3 对象级分类对高分辨率的全色波段进行对象级分类。首先运用3.1节的方法对影像进行最优尺度的分水岭分割。然后对分割得到的每个区域进行特征提取,计算其光谱特征(均值、方差)、纹理特征(同质度、对比度、熵、能量)和形状特征(面积、长宽比、紧致度、光滑度)作为对象级分类时的特征。最后运用3.2节的分层分类方法进行对象级分类,获得全色波段的分类结果如图 1(d)所示。
从图 1(d)可以看出,对象级方法对全色波段分类时容易导致欠分类现象,如图 1(d)中,A、B处存在浅色屋顶与阴影之间分成同一类的情况,C、D处的浅色屋顶被错分成道路,E处的屋顶和阴影被错分成一类,其原因在于全色波段上光谱特征有限,相邻地物之间光谱可分性降低、光谱干扰性增强,对象级方法在分类时更侧重于同质像素集合所表现出来的整体特性(如纹理、形状、大小),容易将空间相邻、形状类似的不同类地物误分为同一个类别。
5.1.4 像素级和对象级合成分类合成分类是在不同的两个层次上求解同一个分类问题,既充分利用多波段影像光谱特征丰富以及像素级方法侧重光谱特征,又利用全色波段空间分辨率高以及对象级方法侧重空间特征、形状特征的优点,优化合成为最终的分类结果。运用第4节提出的合成分类算法,得到像素级分类与对象级分类的合成分类结果如图 1(e)所示。
合成分类对像素级和对象级分类结果进行对比分析,通过分解与合成运算,纠正了单一层次分类中的错误,使分类结果更为可靠,如:图 1(c)中A处的浅色屋顶与黄色建筑物之间的混分,在图 1(e)中被纠正;图 1(c)中B处的屋顶被过分类为屋顶和道路两类,对应图 1(d)中的C处且被误分为道路,在图 1(e)中被纠正为屋顶;图 1(c)中C处的屋顶被误分为道路,在图 1(d)中对应E处且被误分为阴影,在图 1(e)中被纠正为屋顶。
对每一类地物选择一定数量的测试样本,进行分类精度评定。表 1是试验A的分类精度表,列出了像素级、对象级和合成分类方法对各类地物的分类精度。像素级方法的分类总精度为0.776,分析各类地物的分类精度可以发现,像素级方法对屋顶、道路等人工地物分类精度较低。这是因为这些人工地类光谱特征比较接近,仅根据光谱特征难以有效地区分,并且对能区分这些地物的形状特征、上下文特征等,像素级方法难以直接考虑。对象级方法的分类总精度为0.804,其中,屋顶类、道路类分类精度相比像素级方法均有所提高,而对于阴影类、空地类这些不规则地物分类精度有所降低。这是因为对象级分类方法依赖于同质对象及其呈现出的多维特征来区分目标,对于形状规则或者纹理特征明显的地物,可以获得较好的效果,但对于形状不规则、纹理特征不明显的地物,加上光谱特征的不稳定,分类效果则会较差。合成法的分类精度为0.853,无论是从分类结果的目视效果还是从分类精度表均可以看出,本文所提出的像素级和对象级合成分类方法对高分辨率、多光谱影像有着更高的分类精度和可靠性,优于单独的像素级和对象级分类方法。
分类方法 | 分类精度 | 类1 | 类2 | 类3 | 类4 | 类5 | 类6 | 类7 | 类8 | 总精度 |
改进的RBF | 生产者精度 | 0.631 | 0.688 | 0.872 | 0.803 | 0.726 | 0.685 | 0.638 | 0.932 | 0.776 |
神经网络分类 | 用户精度 | 0.698 | 0.797 | 0.718 | 0.952 | 0.845 | 0.511 | 0.698 | 0.926 | |
对象层分类 | 生产者精度 | 0.670 | 0.816 | 0.875 | 0.835 | 0.713 | 0.752 | 0.608 | 0.972 | 0.804 |
用户精度 | 0.678 | 0.904 | 0.810 | 0.867 | 0.792 | 0.664 | 0.572 | 0.967 | ||
合成分类 | 生产者精度 | 0.742 | 0.865 | 0.929 | 0.856 | 0.854 | 0.829 | 0.675 | 0.972 | 0.853 |
用户精度 | 0.800 | 0.953 | 0.832 | 0.778 | 0.903 | 0.886 | 0.657 | 0.971 |
图 2是从QuickBird影像上截取的大小为1997像素×1213像素的另一个试验区域。影像分类体系为:浅色屋顶(class1)、深色屋顶(class2)、黄色屋顶(class3)、林地(class4)、白色空地 (class5)、深色公路(class6)、暗色阴影 (class7)、浅色小路 (class8)。将3个可见光波段和1个近红外波段(图 2(b))与全色波段(图 2(a))Pansharp融合后的影像进行像素级分类,得到的分类结果如图 2(c)所示。对全色波段进行对象级分类,得到的分类结果如图 2(d)所示。利用像素级和对象级合成分类方法,获得最终的分类结果如图 2(e)所示。对试验结果进行定性比较可以看出,像素层分类结果存在较多的过分类等分类错误,如图 2(c)中的A处存在浅色屋顶的部分过分类为小路类;B处深色屋顶中存在深色公路类的类别噪声;C处白色空地类中存在浅色小路类的类别噪声;D处存在深色公路的部分过分类为屋顶类;E处存在屋顶的部分过分类为公路类。而对象层分类结果存在一定的欠分类等分类错误,如图 2(d)中的A处存在植被类、屋顶类分成同一类的欠分类错误;B处存在屋顶类分成公路类的错分类;C处存在浅色屋顶类与小路类分成同一类的欠分类错误;D、 E处植被类存在欠分类错误。合成分类综合两个层次的分类结果进行修正,纠正了单一层次分类的错误,使分类结果更为可靠,如像素层分类结果(图 2(c))中A~E处存在的过分类等错误被纠正,对象层分类结果(图 2(d))中A~E处存在的欠分类等错误被纠正。但对于像素层与对象层分类结果中错分一致的目标,合成法不能将其纠正,如屋顶(黄色)中夹杂错分的公路(棕色),这可以通过设置面积、宽度等条件修正。表 2是对试验结果进行定量评定的精度表,像素层分类的总精度为0.723;对象层分类的总精度为0.813;合成分类的总精度为0.881;相比单一的像素层和对象层分类精度分别提高了15.8%和6.8%。
![]() |
图 2 Fig. 2 |
类 | 像素层分类精度 | 对象层分类精度 | 合成分类精度 | 合成分类较像素 层分类精度提高 |
合成分类较对象 层分类精度提高 |
class1 | 0.610 | 0.754 | 0.800 | 0.190 | 0.046 |
class2 | 0.688 | 0.667 | 0.888 | 0.200 | 0.221 |
class3 | 0.897 | 0.900 | 0.952 | 0.055 | 0.052 |
class4 | 0.952 | 0.840 | 0.920 | -0.032 | 0.08 |
class5 | 0.599 | 0.834 | 0.769 | 0.170 | -0.065 |
class6 | 0.654 | 0.712 | 0.925 | 0.271 | 0.213 |
class7 | 0.813 | 0.830 | 0.875 | 0.062 | 0.045 |
class8 | 0.601 | 0.889 | 0.941 | 0.340 | 0.052 |
总精度 | 0.723 | 0.813 | 0.881 | 0.158 | 0.068 |
本文对遥感影像分类提出基于改进的像素级和对象级的遥感影像合成分类方法。该方法的特点是对不同的数据(多光谱波段、全色波段),利用不同层次的分类方法(像素级方法、对象级方法)以获得不同层次、具有互补性的分类结果,通过提出具体的像素级与对象级合成分类算法,根据不同层次分类结果的差异用像素层分类结果修正对象层分类结果,准确性高于单独的某一个层次分类。由于像素级和对象级分类分别都有成熟的方法可以运用,理论上合成分类方法是可行的。在QuickBird影像上的分类试验表明,本文的像素级和对象级合成分类方法对高分辨率、多光谱影像有着更高的分类精度和可靠性,优于单独的像素级和对象级分类方法。由于二维影像上的信息缺失,难以完全模拟三维地物原型,进一步的研究重点是,建立像素级、对象级以及融入地面高程数据的合成分类方法。
[1] | GONG Peng.Some Essential Questions in Remote Sensing Science and Technology[J]. Journal of Remote Sensing, 2009, 13(1):16-24.(宫鹏.遥感科学与技术中的一些前沿问题[J].遥感学报,2009,13(1):16-24.) |
[2] | RICHARDS J A, XIU Pingjia. Using Suitable Neighbors to Augment the Training Set in Hyperspectral Maximum Likelihood Classification[J]. IEEE Geoscience and Remote Sensing Letters, 2008,5 (4): 774-777. |
[3] | PARRINELLO T, VAUGHAN R A. On Comparing Multifractal and Classical Features in Minimum Distance Classification of AVHRR Imagery [J]. International Journal of Remote Sensing, 2006, 27(18):3943-3959. |
[4] | VENKATALAKSHMI K, SHALINIE S M. Multispectral Image Classification Using Modified K-Means Algorithm [J]. Neural Network World, 2007, 17(2):113-120. |
[5] | MELESSE A M, JORDAN J D. A Comparison of Fuzzy vs. Augmented-ISODATA Classification Algorithms for Cloud-shadow Discrimination from Landsat Images [J]. Photogrammetric Engineering and Remote Sensing, 2002, 68(9):905-911. |
[6] | RATLE F, CAMPS-VALLS G, WESTON J. Semisupervised Neural Networks for Efficient Hyperspectral Image Classification [J]. IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(5): 2271-2282. |
[7] | MAULIK U, SAHA I. Automatic Fuzzy Clustering Using Modified Differential Evolution for Image Classification [J]. IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(9):3503-3510. |
[8] | YANG Guopeng, YU Xuchu, ZHOU Xin, et al. Research on Relevance Vector Machine for Hyperspectral Imagery Classification[J]. Acta Geodaetica et Cartographica Sinica, 2010, 39(6):572-578.(杨国鹏,余旭初,周欣,等.基于相关向量机的高光谱影像分类研究[J].测绘学报, 2010, 39(6):572-578.). |
[9] | CORCORAN P, WINSTANLEY A, MOONEY P. Segmentation Performance Evaluation for Object-based Remotely Sensed Image Analysis[J]. International Journal of Remote Sensing, 2010, 31(3): 617-645. |
[10] | CHEN Y, SHI P, FUNG T, et al. Object-oriented Classification for Urban Land Cover Mapping with ASTER Imagery[J]. International Journal of Remote Sensing, 2007, 28(20): 4645-4651. |
[11] | BENZ U, HOFMANN P, WILLHAUCK G, et al. Multi-resolution, Object-oriented Fuzzy Analysis of Remote Sensing Data for GIS-ready Information [J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2004, 58(3): 239-258. |
[12] | MAO K Z, HUANG G B. Neuron Selection for RBF Neural Network Classifier based on Data Structure Preserving Criterion[J]. IEEE Transactions on Neural Networks, 2005, 16(6): 1531-1540. |
[13] | SUN Jixiang. Modern Pattern Recognition[M]. Changsha: National Defense University Press,2002.(孙即祥.现代模式识别[M].长沙:国防科技大学出版社, 2002.) |
[14] | LI Gang, WAN Youchuan. Improved Watershed Segmentation with Optimal Scale Based on Ordered Dither Halftone and Mutual Information[C]//IEEE International Conference on Computer Science and Information Technology. Chengdu: [s.n.], 2010 : 296-300. |
[15] | LI Gang, WAN Youchuan. Object-oriented Classification Method Based on Quotient Space Theory[J]. Opto-Electronic Engineering,2011, 38(2): 108-115. (李刚,万幼川.商空间理论下面向对象的遥感影像分类[J].光电工程, 2011, 38(2): 108-115.) |