舰船科学技术  2017, Vol. 39 Issue (7): 149-152   PDF    
基于KPCA与KFDA的SAR图像舰船目标识别
刘磊, 孟祥伟, 于柯远     
海军航空工程学院 电子与信息工程系,山东 烟台 264001
摘要: 针对SAR图像中舰船目标识别的问题,提出了基于核主成分分析(Kernel Principal Component Analysis,KPCA)和核Fisher判别分析(Kernel Fisher Discriminate Analysis,KFDA)相结合的舰船目标识别算法。用核主成分分析的方法对实测的SAR舰船目标数据进行特征降维,再结合核Fisher判别分析法对降维后的样本数据进行多类别分类。将该方法用于对实测的四类舰船目标进行识别,平均识别率可达91.25%。实验结果表明,核主成分分析与核Fisher判别分析相结合的方法可提取目标的有效特征,在较低特征维数情况下获得较高的目标正确识别率。
关键词: SAR图像     目标识别     特征提取     核主成分分析     核Fisher判别分析    
Ship targets recognition in SAR images based on KPCA and KFDA
LIU Lei, MENG Xiang-wei, YU Ke-yuan     
Department of Electronic and Information Engineering, Naval Aeronautical and Astronautical University, Yantai 264001, China
Abstract: Ship targets recognition algorithm combining Kernel Principal Component Analysis (KPCA) and Kernel Fisher Discriminate Analysis (KFDA) was proposed to deal with the problem of ship targets recognition in SAR images. Firstly, KPCA algorithm was used to transform the sample data of high dimension space to low dimension space to reduce the dimension. Then, the processed samples were recognized according to KFDA algorithm. The method is applied for recognizing fourth-class ship targets and the average recognition arrives at 91.25%. The result showed that the combination of KPCA and KFDA can effectively eliminate the interaction between sample variable indicators. It is an effective method for SAR images feature extraction and target recognition.
Key words: SAR images     ship targets recognition     features extraction     kernel principal component analysis(KPCA)     kernel fisher discriminate analysis(KFDA)    
0 引 言

随着SAR在海洋上的应用越来越广泛,SAR图像自动目标识别(Automatic Target Recognition,ATR)技术成为目前的热门研究方向。国内外对SAR ATR展开了广泛深入的研究。比较著名的如林肯实验室开发的基于模板的ATR系统[1],以及DARPA和AFRL共同资助的基于模型的MSTAR ATR系统等,它们通常将目标识别系统分为检测、鉴别和分类3个阶段[23]。SAR图像特征提取是识别中的关键环节[4]。如何有效地提取出目标特征就显得尤为重要。

本文采用核主成分分析(KPCA)[56]与核Fisher判别分析(KFDA)[78]相结合的方法,利用KPCA准则进行非线性特征提取,降低样本数据的维数,提取有利于分类的特征,然后将结合核Fisher判别分析法对降维后的样本数据进行分类,并通过实验证明本文方法的有效性。

1 理论与算法 1.1 核主成分分析

经典的主成分分析[910]是一种线性算法,因此不能提取数据中的非线性结构特征,而在实际问题中非线性特征却广泛存在着。核主成分分析通过非线性变换将输入数据映射到高维特征空间,在高维空间中应用PCA方法进行分析。

设样本集 $X = \{ {x_1},{x_2}, \cdots ,{x_M}\} $ ,其中 ${x_k} \in {{{R}}^N}$ M为样本总数。设Φ是一个非线性映射,对应的高维空间映射形式为 ${x_k} \to \varPhi ({x_k})$ ,且满足 $\sum\limits_{k = 1}^M {\varPhi ({x_k})} = 0$ ,则该空间中的协方差矩阵为:

${{C}} = \frac{1}{M}\sum\limits_{j = 1}^M {\varPhi ({x_j})\varPhi {{({x_j})}^{\rm T}}}, $ (1)

对应的特征方程为:

$\lambda \nu = {{C}}\nu, $ (2)

其中v是高维空间中λ对应的特征向量。式(2)两边同时乘上 $\varPhi ({x_k})$

$\lambda (\varPhi ({x_k})\nu ) = (\varPhi ({x_k})C\nu ),$ (3)

并且存在系数 ${{{\alpha }}_i}$ ,使

$\nu = \sum\limits_{i = 1}^M {{{{\alpha }}_i}\varPhi ({x_i})}, $ (4)

定义核矩阵

${{\mathop{ K}\nolimits} _{ij}} = k({x_i},{x_j}) = (\varPhi ({x_i}) \cdot \varPhi ({x_j})),$ (5)

式中: $i,j = 1,2,\; \cdots ,M$ k为核函数。

综合以上各式得

$M\lambda {{\alpha }} = {\mathop{ K}\nolimits} {{\alpha }},$ (6)

式中: $M\lambda $ K的特征值, ${{\alpha }} = {[{\alpha _1},{\alpha _2}, \cdots {\alpha _M}]^{\rm T}}$ 为相应的特征向量。对于样本在特征空间 ${V^r}$ 的投影为

$({\nu ^r}\varPhi (x)) = \sum\limits_{i = 1}^M {{{({{{\alpha }}_i})}^r}(\varPhi ({x_i}) \cdot \varPhi (x))}, $ (7)

用核函数代替内积

$({\nu ^r} \cdot \varPhi (x)) = \sum\limits_{i = 1}^M {{{({{{\alpha }}_i})}^r}{\mathop{\rm K}\nolimits} ({x_i},x)}{\text{。}} $ (8)

求解核矩阵K的特征值和特征向量。对求得的特征值进行降序排序,并对特征向量进行相应调整,对特征向量进行归一化得到 ${\alpha _1},{\alpha _2}, \cdots {\alpha _n}$ 。计算特征值累计贡献率 ${B_1},{B_2}, \cdots {B_n}$ ,设定提取效率p,如果 ${B_T} \geqslant p$ ,则提取t个主成分 ${\alpha _1},{\alpha _2}, \cdots {\alpha _t}$ 。计算样本X在提取的特征向量上的投影 ${\mathop{ Y}\nolimits} = { K} \cdot {{\alpha }}$ ,其中 ${{\alpha }} = ({\alpha _1},{\alpha _2}, \cdots {\alpha _t})$ 。投影Y即为原始数据经过KPCA降维后的数据。

1.2 核Fisher判别分析

类似于KPCA思想,核Fisher判别分析把数据非线性映射到高维特征空间,然后在特征空间中进行Fisher判别。

Φ是一个非线性映射,对应特征空间为F,样本集合 $\{ {x_1},{x_2}, \cdots {x_N}\} $ 映射到空间F中的集合为 $\{ \varPhi ({x_1}), $ $\varPhi ({x_2}), \cdots \varPhi ({x_N})\} $ 。则F空间中第i类样本的均值为

${{m}}_i^\varPhi = \frac{1}{{{l_i}}}\sum\limits_{j = 1}^{{l_i}} {\varPhi (x_j^i)}, $ (9)

   F空间上类间离散度矩阵为

${{S}}_B^\varPhi = \frac{1}{{C(C - 1)}}\sum\limits_{i = 1}^C {\sum\limits_{j = 1}^C {({{m}}_i^\varPhi - {{m}}_j^\varPhi ){{({{m}}_i^\varPhi - {{m}}_j^\varPhi )}^{\rm T}}} }, $ (10)

   F空间上类内离散度矩阵为

${{S}}_W^\Phi = \frac{1}{C}\sum\limits_{i = 1}^C {\frac{1}{{{l_i}}}\sum\limits_{j = 1}^{{l_i}} {(\Phi ({x_j}) - {{m}}_i^\varPhi ){{(\Phi ({x_j}) - {{m}}_i^\varPhi )}^{\rm T}}} }, $ (11)

寻求一个最佳投影矢量w,使得 ${{S}}_B^\varPhi $ ${{S}}_W^\varPhi $ 的比值最大,得到核Fisher准则函数

${{J}}(w) = \frac{{{{{w}}^{\rm T}}{{S}}_B^\varPhi {{w}}}}{{{{{w}}^{\rm T}}{{S}}_w^\varPhi {{w}}}},$ (12)

式中:C为类别数;li为第i类样本的总数 $l = \sum\limits_{i = 1}^C {{l_i}} $ 为样本总数。w可用F空间中的所有样本张成,即

${{w}} = \sum\limits_{i = 1}^l {{\alpha _i}\varPhi ({x_i})}, $ (13)

其中 ${\alpha _i}$ 为权系数。定义

$\begin{array}{c}{{{w}}^{\rm T}}{{m}}_i^\varPhi = \frac{1}{{{l_i}}}\sum\limits_{j = 1}^l {\sum\limits_{k = 1}^{{l_i}} {{\alpha _j}k({x_j},x_k^i)} }= \\ {\alpha ^{\rm T}}\left[ {\begin{array}{*{20}{c}}{\frac{1}{{{l_i}}}\sum\limits_{k = 1}^{{l_i}} {k({x_1},x_k^i)} }\\{\frac{1}{{{l_i}}}\sum\limits_{k = 1}^{{l_i}} {k({x_2},x_k^i)} }\\ \vdots \\{\frac{1}{{{l_i}}}\sum\limits_{k = 1}^{{l_i}} {k({x_l},x_k^i)} }\end{array}} \right] = {\alpha ^{\rm T}}{{{M}}_i},\end{array}$ (14)

式中 $k({x_j},x_k^i)$ 为核函数。则式(12)中

${{{w}}^{\rm T}}{{S}}_B^\varPhi {{w}} = {\alpha ^{\rm T}}{{M}}\alpha, $ (15)
${{{w}}^{\rm T}}{{S}}_W^\varPhi {{w}} = {\alpha ^{\rm T}}{{N}}\alpha, $ (16)

其中:

${{M}} = \frac{1}{{C(C - 1)}}\sum\limits_{i = 1}^C {\sum\limits_{j = 1}^C {({{{M}}_i} - {{{M}}_j}){{({{{M}}_i} - {{{M}}_j})}^{\rm T}}} }{\text{。}} $ (17)
${{N}} = \frac{1}{C}\sum\limits_{i = 1}^C {\frac{1}{{{l_i}}}\sum\limits_{j = 1}^{{l_i}} {({{{K}}_j} - {{{M}}_i}){{({{{K}}_j} - {{{M}}_i})}^{\rm T}}}, } $ (18)
${{{K}}_j} = (k({x_1},{x_j}),k({x_2},{x_j}), \cdots ,k({x_i},{x_j})),$ (19)

则在F空间中应用Fisher线性判别就是最大化:

$J(\alpha ) = \frac{{{\alpha ^{\rm T}}{{M}}\alpha }}{{{\alpha ^{\rm T}}{{N}}\alpha }},$ (20)

该式的解为 ${{{N}}^{ - 1}}{{M}}$ 最大特征值对应的特征向量。

2 算法思路及流程

将KPCA与KFDA两种方法结合可以充分利用2种方法各自的优点,消除了变量之间的信息叠加,提高了提取特征的稳定性。首先读入SAR舰船目标图像,将每幅图像数据展成一个列向量,然后对数据进行归一化处理,然后利用KPCA算法进行降维处理,最后采用KFDA方法对降维后的样本进行分类识别。本文采用的识别流程如图1所示。

图 1 本文算法流程图 Fig. 1 The flow chart of this algorithm
3 实验结果及分析

实验中所用的SAR图像取自C波段RADARSAT-2卫星获取的实测SAR数据。图像方位向和距离向的分辨率都为3 m。所选用的舰船包括集装箱船、油船、军舰与散装货船各80幅,共320幅构成舰船库。图2展现了各类型舰船的光学图像及在RADARSAT-2数据中部分舰船类型的SAR图像。所有SAR图像目标切片大小均为100×100,在舰船库中选出每类舰船的前40幅图像共160幅作为训练图像,构成训练集,剩下的160幅图像作为测试样本。

图 2 SAR图像舰船切片数据示例 Fig. 2 Ship samples of SAR image

在生成的舰船样本中,每幅图像按列相连构成10 000维列向量,通过主成分分析的方法可以将这些10 000维的样本特征向量降至k维。这样数据库中每一艘舰船样本都可以由一个k维的特征向量来表示,以作为后续分类所采用的特征。这些特征向量对应的图像很像舰船,在这里称之为“主成分船”。图3中比较了KPCA+KFDA和PCA+KFDA两种算法的特征维数变化对识别率的影响,随着特征子空间维数的升高,舰船图像的识别率也随之逐渐提高。在特征维数小于10的时候,识别率的变化率比较大,而在特征维数大于20以后趋于稳定。这里选定特征向量的维数为20维,20个主成分船如图4所示。

图 3 特征子空间维数与识别率的关系 Fig. 3 Relationship between the dimension of feature subspace and identification rate

图 4 20个主成分船 Fig. 4 20 principal components ship

本文采用KPCA与KFDA相结合的方法,并与单独采用KFDA方法以及KFDA与PCA结合的方法做出比较,为体现识别效果,将识别率采用百分比的形式展现,即每类舰船能够正确分类识别出的数量/每类总的测试数量。识别率的比较如表1所示。

表 1 不同方法的识别率对比 Tab.1 Comparison of identification rate

表1可看出,将样本数据用PCA方法进行特征降维后再用KFDA方法判别得到的识别率比直接用KFDA方法判别的识别率提高了5%。本文采用KPCA与KFDA相结合的方法可以进一步提高了识别率,达到91.25%,是一种有效的SAR图像目标特征提取和目标识别的方法。

4 结 语

本文提出了一种基于KPCA+KFDA特征提取的SAR图像目标识别方法,有效结合了2种方法的优越性,用KPCA方法对样本数据进行特征降维,再用KFDA方法进行判别。通过实验仿真对本文方法进行了验证,结果表明KPCA+KFDA方法得到的舰船目标识别率比没有经过特征降维的KFDA方法提高将近9%,比PCA+KFDA方法提高了近4%,提高了舰船目标识别的精度。

参考文献
[1] DUDGEON D E, LACOSS R T. An overview of automatic target recognition[J]. The Lincoln Laboratory Journal, 1993, 6 (1): 3–10.
[2] OUEHI K, TAMAKI S. Ship detection based on coherence images derived from cross correlation of multilook SAR images[J]. IEEE Transactions on Geoscience and Remote Sensing letters, 2004, 1 (3): 184–187. DOI: 10.1109/LGRS.2004.827462
[3] ROSS T. SAR ATR: so what’s the problem An MSTAR perspective[J]. Proc. SPIE Conf. on SAR, 1999, 3721 : 662–672. DOI: 10.1117/12.357681
[4] 张晰, 张杰, 纪永刚. 基于结构特征的SAR船只类型识别能力分析[J]. 海洋学报, 2010, 32 (1): 146–152.
ZHANG X, ZHANG J, JI Y G. The capability analysis of ship classification by structure feature using SAR images[J]. Acta Oceanologica Sinica, 2010, 32 (1): 146–152.
[5] SCHOLKOPF B, SMOLA A, MULLER K. Nonlinear component analysis as a kernel eigenvalue problem[J]. Neural Computation, 1998, 10: 1299–1319.
[6] 韩萍, 吴仁彪, 王兆华, 等. 基于KPCA准则的SAR目标特征提取与识别[J]. 电子与信息学报, 2003, 25 (10): 1297–1301.
HAN P, WU R B, WANG Z H. SAR automatic target recognition based on KPCA criterion[J]. Journal of Electronics & Information Technology, 2003, 25 (10): 1297–1301.
[7] MULLER K, MIKA S, RATSCH G. An introduction to kernel based learning algorithms[C]// IEEE Tran. on Neural Networks, 2001(12): 181–201.
[8] 徐正光, 王淑盛, 刘冀伟, 等. 基于主成分分析的核Fisher判别方法在油水识别中的应用[J]. 北京科技大学学报, 2005, 27 (1): 126–128.
XU Z G, WANG S S, LIU J W, et al. Application of kernel Fisher method based on primary factor analysis to recognition problem between oil layer and water layer[J]. Journal of University of Science and Technology Beijing, 2005, 27 (1): 126–128.
[9] HUANG S J, YE J Y, Wang T Q. Extracting Refined Low-Rank Features of Robust PCA for Human Action Recognition[J]. Arabian Journal for Science and Engineering, 2015, 40 (5): 1427–1441. DOI: 10.1007/s13369-015-1635-8
[10] TAE H O, J C BAZIN. Partial Sum Minimization of Singular Values in Robust PCA: Algorithm and Applications[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2016, 38 (4).