舰船科学技术  2020, Vol. 42 Issue (4): 159-163    DOI: 10.3404/j.issn.1672-7649.2020.04.031   PDF    
基于粒子群优化的SAR图像舰船目标特征选择
邱洪彬1, 王雪梅1, 许哲1, 张钧2, 宿常鹏1     
1. 火箭军工程大学,陕西 西安 710025;
2. 北京遥感设备研究所,北京 100854
摘要: SAR图像特征提取和分类器设计是进行目标识别的关键,通常情况下分类器性能与特征数量之间并不存在线性关系,相反过度冗余的特征甚至会导致分类器性能严重下降,因此特征选择成为必要。提出一种粒子群优化与Wrapper策略相结合的特征选择方法,针对包含待识别舰船目标的SAR图像,提取其3类共16个典型特征,利用本文所提算法筛选出最佳的特征组合。实验结果表明,将本文所提取的特征组合用于目标识别,分类精度提高了22%,分类时间缩短了2.16 s。
关键词: SAR图像     分类器     粒子群优化     Wrapper策略     特征选择    
The feature selection of SAR image ship target based on PSO
QIU Hong-bin1, WANG Xue-mei1, XU Zhe1, ZHANG Jun2, SU Chang-peng1     
1. Rocket Force University of Engineering, Xi’an 710025, China;
2. Beijing Institute of Remote Sensing Equipment, Beijing 100854, China
Abstract: SAR image feature extraction and classifier design are the key to target recognition. Generally, there is no linear relationship between classifier performance and feature quantity. On the contrary, over-redundant features may even lead to serious degradation of classifier performance. Feature choice becomes necessary. A feature selection method combining particle swarm optimization and Wrapper strategy is proposed. For the SAR image containing the ship target to be identified, 16 typical features of 3 categories are extracted, and the best combination of features is chosen out using the proposed algorithm. The experimental results show that the feature combination extracted in this paper is used for target recognition, the classification accuracy is improved by 22%, and the classification time reduced by 2.16 seconds.
Key words: SAR image     classifier     particle swarm optimization     wrapper strategy     feature selection    
0 引 言

合成孔径雷达(Synthetic Aperture Rad,SAR)作为一种主动式微波成像传感器,具有全天时、全天候和多极化的观测能力,在农、林、地质、环境、水文、海洋、灾害、测绘、军事等众多领域具有独到的应用优势。近年来,随着SAR图像分辨率的提高,舰船目标体现出更加丰富的特征,使得精确制导武器利用合成孔径雷达获取末段制导参数并锁定攻击目标成为可能,舰船目标识别作为这一过程中的关键问题,已被相关研究人员重点关注。

目前,国内外对SAR图像舰船目标识别的研究还处于起步阶段,现有文献中的研究成果较少,且尚未形成系统。种劲松[1]从图像理解的角度分析了SAR图像舰船目标的研究层次,为目标检测与识别的开展提供了理论支撑;文献[2]提出了将视觉注意机制应用于图像检测与识别的频谱残差法(Spectral Residual,SR),具有简单快速的优点;匡纲要等[3]基于固体热扩散模型与图像尺度空间的等价性提出一种非监督的SAR图像快速分割算法,有效抑制了斑点噪声对分割的影响;陈文婷等[4]深入分析了典型舰船目标的几何结构和电磁散射机理。

SAR图像舰船目标的特征提取是进行目标识别的前提和关键。本文综合考虑了SAR图像舰船目标的几何结构、灰度统计以及仿射不变矩三大类特征,并利用粒子群优化算法进行特征选择,筛选出了最优的特征组合。实验结果表明,本文提取的特征组合用于SAR图像舰船目标识别,兼顾了准确率和实时性,对工程应用具有很强的现实指导意义。

1 基本概念

1)目标识别

SAR图像舰船目标的识别,是在检测所得的目标切片上,利用数字图像处理技术和模式识别的方法,确定相应舰船的所属类别。根据通用的分类标准,舰船目标识别共有3个等级,分别为舰船军民级、舰船类型级和舰船型号级[5],3个识别等级对于SAR图像分辨率的要求是逐级提高的,目前的分辨率可以满足舰船类型级的要求。本文便是利用美国“布什”号航母、伯克级驱逐舰和日本“金刚”级驱逐舰的仿真数据进行实验,以分类准确率最大化为指标得到最佳的特征组合。

2)粒子群优化算法

粒子群优化[6](particle swarm optimization,PSO)算法是计算智能领域,除了蚁群算法、鱼群算法之外的一种群体智能的优化算法,该算法由Kennedy和Eberhart于1995年提出。与其他群优化算法类似,PSO也是利用群体中不同个体的不断运动寻找最优解。粒子在解空间中运动,通过跟踪个体极值Pbest和群体极值Gbest更新个体位置。每次迭代的速度和位置更新公式如下:

$ v_{id}^{k + 1} = \omega v_{id}^k + {c_1}{r_1}\left( {y_{id}^k - x_{id}^k} \right) + {c_2}{r_2}\left( {y_{gd}^k - x_{id}^k} \right) \text{,} $ (1)
$ x_{id}^{k + 1} = x_{id}^k + v_{id}^{k + 1} \text{。} $ (2)

其中: $y_{id}^k$ $y_{gd}^k$ 分别为第k次迭代时的个体极值和群体极值; $\omega $ 为惯性权重,反映了粒子继承先前速度的能力;系数 ${c_1}$ ${c_2}$ 分别反映了粒子跟踪个体极值和群体极值的能力。本文将其用于优化组合的问题, $x_{id}^k$ 的取值为二进制的0和1,相应的粒子位置更新公式变为:

$ x_{id}^k{\rm{ = }}\left\{ \begin{gathered} \begin{array}{*{20}{c}} {1,}&{S(v_{id}^k) \geqslant rand} \end{array} \text{,}\\ \begin{array}{*{20}{c}} {0,}&{S(v_{id}^k) < rand} \end{array} \text{。} \end{gathered} \right. $ (3)

式中:rand产生0~1之间的随机数;S通常取sigmoid函数。

3)分类器

进行SAR图像舰船目标识别,分类器的设计和选择是关键,对分类性能的影响也最为直接。目前发展比较成熟,应用较为广泛的分类器主要有:基于欧氏距离的k-近邻分类器、基于概率论与数理统计的贝叶斯分类器、基于人工智能的神经网络分类器以及基于核函数的支持向量机分类器等[4]。考虑到本文所用数据及分类目标的特点,选用基于线性核的支持向量机分类器[7],既能保证分类精度,同时又能兼顾算法的快速性。

2 特征提取

SAR图像由于其成像方式的不同,相对于光学图像而言,并不能完整地描述目标的外形特征,而是呈一系列稀疏的散射中心。受成像机制的影响,目标方位角的变化可以显著地改变SAR图像的表象,有时甚至产生明显的旁瓣和“十”字叉[8]。因此,为了从SAR图像中获取对于感兴趣目标的稳健、紧凑的描述,以期提高分类识别的速度和性能,目标特征的提取与选择显得尤为重要。目前,研究者广泛应用的特征主要包括几何结构特征、灰度统计特征、电磁散射特征以及变换特征等,如表1所示。

表 1 SAR图像舰船目标识别的典型特征 Tab.1 The typical characteristics of ship target recognition in SAR images

对一幅SAR图像切片Imn),考虑只包含目标区域的二值图Bmn)(背景像素为0,目标像素为1),则只包含目标的图像Tmn)= Imn).*Bmn),其中.*表示对应像素相乘[5]。考虑到实验数据的限制,某些特征不便提取,本文提取了以下三类特征:

1)几何结构特征

几何结构特征是描述目标形状、大小的最基本特征,应用也最为广泛。为避免目标方位角变化对特征提取的影响,提取了周长、面积、形状复杂度和转动惯量4个特征。

周长L定义为目标边缘像素的数目[5]

$ L = \sum\limits_m {\sum\limits_n {edge\left( {B(m,n)} \right)} } \text{,} $ (4)

面积S定义为目标区域像素数目的总和[5]

$ S = \sum\limits_m {\sum\limits_n {B(m,n)} } \text{,} $ (5)

形状复杂度可简单定义为周长的平方与面积的比值,是目标边缘复杂程度的度量[5]

$ R = \frac{{{L^2}}}{S} \text{,} $ (6)

转动惯量G是对散射截面在目标区域中分布的描述,定义为[9]

$ G = \sum\limits_m {\sum\limits_n {T(m,n)} } \cdot {r^2} \text{,} $ (7)

式中r2=(m-m02+(n-n02表示像素点到图像质心距离的平方,质心(m0n0)定义为:

${m_0} = \frac{{\displaystyle\sum\limits_m {\displaystyle\sum\limits_n {T(m,n) \cdot m} } }}{{\displaystyle\sum\limits_m {\displaystyle\sum\limits_n {T(m,n)} } }},{n_0} = \frac{{\displaystyle\sum\limits_m {\sum\limits_n {T(m,n) \cdot n} } }}{{\displaystyle\sum\limits_m {\displaystyle\sum\limits_n {T(m,n)} } }} \text{。} $

2)灰度统计特征

灰度统计特征描述了图像灰度分布的统计规律,大量的实验表明,灰度统计特征用于SAR图像的识别可以取得良好的效果。本文主要提取了均值、方差、方差系数、灰度最大离差和加权填充比5个特征。

均值定义为目标区域所有像素灰度的平均:

$ \mu {\rm{ = }}\frac{1}{{MN}}\sum\limits_{m = 1}^M {\sum\limits_{n = 1}^N {T\left( {m,n} \right)} } \text{,} $ (8)

方差是目标区域内像素灰度与均值偏离程度的度量,定以为:

$ {\sigma ^2}{\rm{ = }}\frac{1}{{MN}}\sum\limits_{m = 1}^M {\sum\limits_{n = 1}^N {{{\left[ {T\left( {m,n} \right) - \mu } \right]}^2}} } \text{,} $ (9)

方差系数反映了灰度值的变化范围,定义为标准差与均值之比[9]

$ \delta {\rm{ = }}\sqrt {\frac{1}{{MN}}\sum\limits_{m = 1}^M {\sum\limits_{n = 1}^N {{{\left[ {T\left( {m,n} \right) - \mu } \right]}^2}} } } {\rm{/}}\mu\text{,} $ (10)

灰度最大离差[10]

$ \Delta {\rm{ = }}\max (T\left( {m,n} \right)) - \mu \text{,} $ (11)

加权填充比反映了目标强亮散射块的能量对目标区域总能量的占比[11]

$ \eta {\rm{ = }}\frac{{\displaystyle\sum\limits_m {\displaystyle\sum\limits_n {I\left( {m,n} \right) \cdot {B_2}\left( {m,n} \right)} } }}{{\displaystyle\sum\limits_m {\displaystyle\sum\limits_n {T\left( {m,n} \right)} } }}\text{。} $ (12)

式中: ${B_2}\left( {m,n} \right)$ 为目标区域中只含K(通常取K=50)个最亮像素点的二值图。

3)Hu

Hu矩是局部不变特征的一种,由Hu于1962年提出,因其具有的旋转、平移和比例不变性,能更好地描述图像的本质属性,近年来在SAR图像解译领域受到研究者越来越广泛的关注[12]

对于包含目标的SAR图像切片Imn),其p+qpq为自然数)阶二维中心矩定义为。

$ {\mu _{pq}} = \sum\limits_m {\sum\limits_n {{{\left( {m - {m_0}} \right)}^p}{{\left( {n - {n_0}} \right)}^q}} } I\left( {m,n} \right) \text{,} $ (13)

定义 ${\eta _{pq}}$ 为归一化的p+q阶中心矩,即

$ {\eta _{pq}} = {\mu _{pq}}{\rm{/}}\mu _{00}^r \text{。} $ (14)

其中, $r = 1 + {{\left( {p + q} \right)}/ 2},p + q = 2,3,$ …。Hu矩即为基于 ${\eta _{pq}}$ 构造的7个矩不变量,具体表达式如下:

$\left\{ \begin{array}{l} {M_1} = {\eta _{02}} + {\eta _{20}}\text{,} \\ {M_2} = {\left( {{\eta _{20}} - {\eta _{02}}} \right)^2} + 4\eta _{11}^2\text{,} \\ {M_3} = {\left( {{\eta _{30}} - 3{\eta _{12}}} \right)^2} + {\left( {3{\eta _{12}} - {\eta _{03}}} \right)^2}\text{,} \\ {M_4} = {\left( {{\eta _{30}} + {\eta _{12}}} \right)^2} + {\left( {{\eta _{21}} + {\eta _{03}}} \right)^2} \text{,}\\ {M_5} = \left( {{\eta _{03}} - 3{\eta _{12}}} \right)\left( {{\eta _{30}} + {\eta _{12}}} \right)\left[ {{{\left( {{\eta _{03}} + {\eta _{12}}} \right)}^2} - 3{{\left( {{\eta _{21}} + {\eta _{03}}} \right)}^2}} \right] \\ + \left( {3{\eta _{21}} - {\eta _{03}}} \right)\left( {{\eta _{21}} + {\eta _{03}}} \right)\left[ {3{{\left( {{\eta _{03}} + {\eta _{12}}} \right)}^2} - {{\left( {{\eta _{21}} + {\eta _{03}}} \right)}^2}} \right] \text{,}\\ {M_6}{\rm{ = }}\left( {{\eta _{20}} - {\eta _{02}}} \right)\left[ {{{\left( {{\eta _{30}} + {\eta _{12}}} \right)}^2} - {{\left( {{\eta _{21}} + {\eta _{03}}} \right)}^2}} \right] \\ + 4{\eta _{11}}\left( {{\eta _{30}} + {\eta _{12}}} \right)\left( {{\eta _{21}} + {\eta _{03}}} \right) \text{,}\\ {M_7} = \left( {3{\eta _{21}} - {\eta _{03}}} \right)\left( {{\eta _{30}} + {\eta _{12}}} \right)\left[ {{{\left( {{\eta _{30}} + {\eta _{12}}} \right)}^2} - 3{{\left( {{\eta _{21}} + {\eta _{03}}} \right)}^2}} \right]\text{,} \\ + \left( {3{\eta _{21}} - {\eta _{30}}} \right)\left( {{\eta _{21}} + {\eta _{03}}} \right)\left[ {3{{\left( {{\eta _{03}} + {\eta _{12}}} \right)}^2} - {{\left( {{\eta _{21}} + {\eta _{03}}} \right)}^2}} \right] \text{。} \end{array} \right. $ (15)
3 特征选择算法设计

目前主流的特征选择策略有过滤式(Filter)和封装式(Wrapper)。其中Filter策略不依赖于识别模型,而是通过分析特征之间的相关系数、互信息以及信息熵[13]等数学关系进行筛选,特点是速度快,效率高,缺点是脱离了后续分类算法,导致筛选出的特征组合用于分类识别时不能保证结果的准确率。相比之下,本文使用的Wrapper策略,直接以分类器的正确分类率为评价指标,再结合粒子群算法进行启发式搜索,既能保证最终结果的准确率,又兼顾了搜索效率。算法设计思想如下:

1)提取第2节所述特征,将数据归一化,并随机抽取适当数量的样本;

2)初始化粒子群,计算粒子群中个体与样本中特征向量的点积得到特征子集,并随机划分为训练集和测试集;

3)在训练集上训练得到SVM分类器,将测试集数据输入分类器计算正确分类率,即为适应度值;

4)计算个体极值和群体极值;

5)粒子速度和位置更新,适应度值更新;

6)比较当前和上一代的个体和群体极值大小,若满足判别条件,则个体极值和群体极值更新,并保存使个体和群体极值达到最大的粒子速度和位置;

7)若未达到最大迭代次数,则返回第3步,否则终止搜索;

8)输出最优解。

具体算法流程如图1所示。

图 1 算法流程示意图 Fig. 1 The Algorithm flow diagram
4 对比实验及结论

本实验利用美国“布什”号航母(CVN-77),“伯克”级驱逐舰(Burke)和日本“金刚”级驱逐舰(Kongo)三型舰船的SAR图像仿真数据(如图2所示),比较了特征选择前后分类器识别的精度和速度。

图 2 三型舰船及其仿真SAR图像 Fig. 2 Three-type ship and its simulated SAR image

实验随机抽取的样本集中包含每型舰船的数据各70个,在该样本集中划分的分类器训练集维数为160,测试集维数为50,样本类别标签如表2所示。

表 2 样本类别标签对照表 Tab.2 The table ofsample category label comparison

实验的环境配置如表3所示。

表 3 实验的环境配置 Tab.3 The experimental environment configuration

实验结果如图3图5所示。

图 3 特征选择前测试集分类结果图 Fig. 3 The classification result before feature selection

图 4 特征选择后测试集分类结果图 Fig. 4 The classification result after feature selection

图 5 优化过程中适应度值(%)的变化图 Fig. 5 The fitness value during optimization

特征选择前后分类的速度和精度的对比如表4所示。

表 4 特征选择前后分类性能指标对照 Tab.4 Comparison of classification performance indicators before and after feature selection

实验中,PSO算法的粒子种群规模设置为10 000,进化次数为100,在表3所示的环境下,程序平均运行时间为1 964.78 s,多次运行待结果稳定后输出的最优个体为[0 1 0 1 0 0 1 1 1 1 0 1 0 1 0 0],对应的最优特征组合为 $\left( {S,G,\delta ,\Delta ,\eta ,{M_1},{M_3},{M_5}} \right)$ 。实验结果表明,样本数据经过特征选择后的分类精度比之前提高了22%,且由于特征选择后数据维度的降低,分类时间也比原来缩短了2.16 s。

5 结 语

特征组合选取的优劣直接影响了SAR图像舰船目标识别算法的精度和速度,从而影响到产品末制导的性能。本文对当前应用比较广泛的典型特征进行提取与选择,将分类结果与未进行特征选择的情况做对照。实验证明,本文所提取的特征组合用于目标识别时,分类的速度和准确率2个重要指标都有很大提升,为特征选择和目标识别提供了一种新途径。

参考文献
[1]
种劲松. 合成孔径雷达图像舰船目标检测算法与应用研究[D]. 北京: 中国科学院研究生院(电子学研究所), 2002.
[2]
HOU X, ZHANG L. Saliency detection: a spectral residual approach[C]// 2007 IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2007.
[3]
高贵, 匡纲要, 李德仁. 高分辨率SAR图像分割及目标特征提取[J]. 宇航学报, 2006, 27(2): 238-244. DOI:10.3321/j.issn:1000-1328.2006.02.019
[4]
陈文婷. SAR图像舰船目标特征提取与分类识别方法研究[D]. 长沙: 国防科学技术大学, 2012.
[5]
陈文婷, 邢相薇, 计科峰. SAR图像舰船目标识别综述[J]. 现代雷达, 2012, 34(11): 53-58. DOI:10.3969/j.issn.1004-7859.2012.11.013
[6]
YANG Wei, LI Qiqiang. Overview of Particle Swarm Optimization Algorithms[J]. China Engineering Science, 2004, 6(5): 87-94.
[7]
郑华. SVM在合成孔径雷达图像目标识别中的应用[J]. 舰船科学技术, 2016(2): 115-117.
[8]
种劲松, 朱敏慧. SAR图像舰船目标检测算法的对比研究[J]. 信号处理, 2003, 19(6): 580-582. DOI:10.3969/j.issn.1003-0530.2003.06.019
[9]
熊伟, 徐永力, 姚力波, 等. 基于SVM的高分辨率SAR图像舰船目标检测算法[J]. 遥感技术与应用, 2018.
[10]
李德胜, 孟祥伟, 张颢, 等. SAR图像舰船目标长宽特征提取技术[J]. 舰船科学技术, 2016, 38(5): 115-119.
[11]
周琳. SAR图像目标切片特征提取方法研究[D]. 长沙: 国防科学技术大学, 2007.
[12]
邹滨益, 刘辉, 尚振宏, 等. 基于局部Hu矩的非局部均值去噪算法[J]. 计算机工程, 2018, 44(3): 241-244. DOI:10.3969/j.issn.1000-3428.2018.03.040
[13]
熊伟, 徐永力, 崔亚奇, 等. 高分辨率合成孔径雷达图像舰船目标几何特征提取方法[J]. 光子学报, 2018, 47(1): 49-58.