舰船科学技术  2022, Vol. 44 Issue (1): 146-149    DOI: 10.3404/j.issn.1672-7649.2022.01.028   PDF    
基于特征融合的舰船目标识别方法
王莹, 侯朋, 吴迪, 王文冠, 李光远     
大连测控技术研究所,辽宁 大连 116013
摘要: 传统的被动目标识别主要依靠声呐员的作用,随着人工智能的迅速发展,水下目标智能识别成为未来发展的趋势。针对这一问题,根据舰船辐射噪声特性,提出基于特征融合的舰船目标识别方法,通过提取基于人耳听觉感知的梅尔倒谱系数特征、基于循环平稳分析的谱相关密度函数特征,构建特征层融合和决策层融合的特征融合模型,利用深度学习中的卷积神经网络进行舰船目标识别。利用4种舰船辐射噪声实测数据进行验证,结果表明,所提出的决策层融合算法能够明显提高舰船目标识别率。
关键词: 舰船辐射噪声     梅尔倒谱系数     谱相关密度函数     特征融合     卷积神经网络    
Ship target recognition method based on Feature Fusion
WANG Ying, HOU Peng, WU Di, WANG Wen-guan, LI Guang-yuan     
Dalian Scientific Test and Control Technology Institute, Dalian 116013, China
Abstract: The traditional passive target recognition mainly depends on the sonarman. With the rapid development of artificial intelligence, underwater target intelligent recognition becomes the future development trend. To solve this problem, according to the characteristics of ship radiated noise, a method of ship target recognition based on feature fusion is proposed. Based on the Mel frequency cepstrum coefficient feature and spectral correlation density function feature,a feature fusion model is constructed by using convolution neural network.The measured data of four underwater acoustic signal is verified. The result shows the decision level fusion algorithm can improve the recognition accuracy.
Key words: ship radiation noise     Mel frequency cepstrum coefficient     spectral correlation density function     feature fusion     convolution neural network    
0 引 言

利用舰船辐射噪声进行目标识别是水声目标识别的常用方法,近年来,随着人工智能的兴起,水声目标识别方法有了新的进展,将深度学习应用到目标识别中取得了良好的效果。程锦盛等[1]利用卷积神经网络和深度置信网络2种深度学习算法建立识别网络,提取水下目标的梅尔倒谱系数特征、Gammatone系数特征作为网络输入数据,经训练后对水下目标达到良好的识别水平和泛化能力。曾赛等[2]提出一种水下目标多模态深度学习分类识别方法,使用该方法识别精度显著提高。陈雪峰等[3]利用线谱提取技术提取目标辐射噪声功率谱的线谱分布特征,DEMON谱处理技术提取目标的轴频特征和螺旋桨桨叶数特征,利用BP神经网络设计分类器实现了水面、水下目标分类。特征融合是提升模型识别精度的一种方法,其原理是对多种特征进行融合并综合判定得到最终的识别结果。

本文通过提取舰船辐射噪声的梅尔倒谱系数特征和谱相关密度函数特征,构建基于特征融合的神经网络分类器,使不同特征之间进行互补、校准,以提高舰船目标分类识别能力。

1 舰船辐射噪声特征提取 1.1 梅尔倒谱特征提取

基于梅尔频率的倒谱系数(MFCC)是语音识别及说话人识别中广泛使用的特征[4],它利用了人耳的听觉感知特性,并结合语音产生的机理进行特征提取,提取出的特征不依赖于输入信号的限制,具有更好的鲁棒性。传统的被动目标识别依赖于声呐兵的听音,对听到的音色、音调等进行判断,这种识别方式与人耳对语音的识别方式原理基本相同,由此可见,将语音声学中的特征提取方法应用到水声中是完全可行的。因此,本文中将对舰船辐射噪声信号进行梅尔倒谱系数特征提取。

实践证明,人耳听觉有其独有的特性,存在掩蔽效应,对声音的响应随着频率的变化而变化。在语音信号处理中,常用梅尔(Mel)频率来表征人耳的这种非线性特性,它与赫兹频率的对应关系如下式:

$ {f_{Mel}} = 2\;595 \times \lg \left( {1 + f/700} \right) ,$ (1)

梅尔倒谱系数就是在梅尔频率上提取出来的倒谱特征,它的提取过程如图1所示。

图 1 梅尔倒谱系数特征提取过程 Fig. 1 Feature extraction process of Mel cepstrum coefficient

1)预处理

预处理包括预加重、分帧、加窗处理等。预加重的作用是补偿高频成分,使频谱变得平坦,利用一个高通滤波器进行滤波。由于信号具有短时平稳性,因此需要将信号分成长度较短的帧进行分析。为了避免遗漏信息,相邻帧之间留有重叠的部分。加窗的作用是增加每帧端点的连续性,同时能够减少频谱泄漏。

2)计算能量谱

对每一帧信号进行FFT变换得到其频谱,进而计算出能量谱为:

$ E\left( {i,k} \right) = {\left| {X\left( {i,k} \right)} \right|^2} = {\left| {FFT\left[ {{x_i}(m)} \right]} \right|^2},$ (2)

其中,i表示分帧后的第i帧信号。

3)Mel滤波

将计算出的能量谱通过一组梅尔尺度的滤波器组,得到在梅尔滤波器中的能量,如下式:

$ S(i,m) = \sum\nolimits_{k = 0}^{N - 1} {E(i,k){H_m}(k)},0 \leqslant m < M 。$ (3)

通常采用三角带通滤波器,频率响应为 ${H_m}(k)$ ,滤波器个数M取值为22−26。

4)计算DCT倒谱

将梅尔滤波器组输出的能量取对数,经离散余弦变换(DCT)得到MFCC系数:

$ mfcc(i,n) = \sqrt {\frac{2}{M}\sum\nolimits_{m = 0}^{M - 1} {\log \left[ {S(i,m)} \right]} \cos \left[ {\frac{{\text{π} n(2m - 1)}}{{2M}}} \right]} 。$ (4)

其中:m是指第m个梅尔滤波器;n是MFCC系数阶数。

1.2 谱相关函数特征提取

舰船辐射噪声中包含了螺旋桨轴频、叶频的调制信息,通过解调可以得到对应的线谱,利用此特征能够对目标进行识别。舰船辐射噪声是循环平稳信号,它是一种特殊的非平稳随机信号,其非平稳性表现为一定的周期性,通过非线性非线性变换,循环平稳信号可以产生有限强度的正弦波,而信号本身并不显性地包含任何有限强度的加性正弦量[5]。利用循环自相关的解调方法可以解调出目标噪声信号中所包含的调制信息,进而可以得到轴频、叶频特征。

循环自相关函数定义为:

$ {R_x}\left( {\tau ,\alpha } \right) = \left\langle {x{{\left( {t - \frac{\tau }{2}} \right)}^ * }x\left( {t + \frac{\tau }{2}} \right){e^{ - j2\text{π} \alpha t}}} \right\rangle ,$ (5)

其中, $\tau $ 为延迟时间, $\alpha $ 为循环频率。对循环自相关函数做傅里叶变换,可以得到其谱相关密度函数为:

$ {S_x}\left( {f,\alpha } \right) = \int_{ - \infty }^\infty {{R_x}\left( {\tau ,\alpha } \right)} {e^{ - j2\text{π} ft}}{\rm{d}}\tau 。$ (6)

从谱相关密度中可以提取到舰船辐射噪声中的载波信号频率、调制信号频率,可利用此特征对舰船目标进行识别。

2 基于特征融合的识别网络构建 2.1 卷积神经网络

卷积神经网络是深度神经网络中应用最广泛的一种[6],它由LeCun在1989年提出,2012年,有更深层次的AlexNet网络在图像分类任务中取得成功,此后卷积神经网络高速发展,被广泛用于机器视觉等领域,在很多问题上都取得了当前最好的性能。

卷积神经网络其基本思想在于不断地在输入的各个部分进行信息提取,从而产生最终的输出。典型的卷积神经网络主要由5部分构成,如图2所示。输入层是整个网络的输入,将经过提取得到的舰船辐射噪声的梅尔倒谱系数特征、谱相关密度特征存成图像,输入进该层。卷积层的作用是进一步提取特征,利用卷积核对输入图像进行卷积操作,每一个卷积核都是分区域进行卷积,同一层内所用卷积核都相同,即参数共享,避免了传统深度神经网络中的参数爆炸问题;池化层是对卷积层得到的特征图进行压缩,也叫做下采样,作用是减少数据量,防止过拟合并提高泛化性。全连接层用于综合前面提取到的特征并进行分类,输出层则输出分类结果。本文选用该网络模型作为舰船目标的识别分类器。

图 2 卷积神经网络结构 Fig. 2 Structure of convolution neural network
2.2 特征融合

单个特征往往具有局限性,无法全面表征目标,采用特征融合能够将多维特征进行融合,提高识别率,按照层次划分有3种融合方式,即数据层融合、特征层融合和决策层融合。本文选用特征层融合和决策层融合的融合方法,思路如图3图4所示。

图 3 基于特征层融合的舰船目标识别 Fig. 3 Ship target recognition based on feature layer fusion

图 4 基于决策层融合的舰船目标识别 Fig. 4 Ship target recognition based on decision level fusion

特征层融合是将提取的不同特征通过特定融合方式组合更高维更丰富的特征,融合后送入分类器进行识别分类,常用的特征层融合方法有串联融合、主成分分析(PCA)降维融合、线性判别分析(LDA)降维融合。决策层融合是在每个分类器得到输出结果后,再对这些结果进行综合判决,最终给出识别结果,常用的综合判决方法有加权法、求和法、最大值法和多数投票法等。

3 试验验证

根据上述方法,选取4种舰船目标实测数据进行验证,涵盖每种目标的不同工况。将数据样本分为3部分,一部分是训练样本集,用来训练网络模型,一部分是测试样本集,用来测试网络模型的分类性能,最后一部分是泛化样本集,用来测试网络模型对未训练样本的识别能力。该数据集包含4种目标训练样本集之外的不同工况数据,各个数据集样本数量如表1所示。

表 1 数据集样本标签及数量 Tab.1 Label and quantity of data set samples

首先对单一特征的识别方法进行网络模型训练和测试,分别提取基于人耳听觉感知的梅尔倒谱系数特征和谱相关密度函数特征,识别网络均选用卷积神经网络,经优化网络参数设置如下:

1)输入层

特征向量图;

2)卷积层1

8个卷积核、卷积核尺寸为2×2,步长为1;

3)池化层1

最大值池化,大小为2×2,步长为2;

4)卷积层2

16个卷积核、卷积核尺寸为2×2,步长为1;

5)池化层2

最大值池化,大小为2×2,步长为2;

6)全连接层

将池化层2的输出以全连接方式连接到输出层;

7)输出层

输出4个节点标签。

识别结果如表2所示。

表 2 单一特征识别方法测试结果 Tab.2 Test results of single feature recognition method

对基于特征融合的识别方法进行网络模型训练和测试,特征层融合采用的是串联融合方式,由于提取的2种特征矩阵数据范围相差较大,对2种特征矩阵依次进行了标准化处理,采用了min-max标准化和Z-score标准化方法,决策层融合采用的方法是将同一帧信号分别提取梅尔倒谱系数特征和谱密度相关函数特征,分别通过识别网络输出每个标签的概率,再将2个输出结果取均值,概率值最大的标签即为最终输出结果,测试结果如表3所示。

表 3 特征融合识别方法测试结果 Tab.3 Test results of feature fusion recognition method

通过测试结果可以看出,特征融合可以提高舰船目标的识别能力,对于未训练过的同型目标具有良好的识别能力,泛化性有显著提高,其中决策层融合相比于特征层融合识别效果更好。由于每个分类器输出的结果误差是相互独立的,通过融合处理可以提高识别精度。在特征层融合中,采用min-max标准化处理方法对测试集的识别率更高,Z-score标准化方法泛化性能更好。

4 结 语

本文提出一种基于特征融合的舰船目标识别方法,该方法选取了基于人耳听觉感知的梅尔倒谱系数和基于循环平稳分析的谱密度,作为舰船目标识别的特征,利用卷积神经网络作为分类器,分别建立了特征层融合、决策层融合的识别模型。利用实测的试验数据对该方法进行了验证。结果表明,所提出的基于特征融合的舰船目标识别方法相比单一特征识别方法,具有更高的识别准确率,且泛化性能更好。

参考文献
[1]
程锦盛, 杜选民, 等. 采用深度学习方法的水下目标听觉特征提取与识别技术研究[J]. 声学技术, 2018, 37(6): 167-168.
CHENG Jin-sheng, DU Xuan-min, et al. Research on extraction and recognition technique to auditory features of underwater target based on deep learning[J]. Technical Acoustics, 2018, 37(6): 167-168.
[2]
曾赛, 杜选民. 水下目标多模态深度学习分类识别研究[J]. 应用声学, 2019, 38(4): 589-594.
ZENG Sai, DU Xuanmin. Multimodal underwater target recognition method based on deep learning[J]. Journal of Applied Acoustics, 2019, 38(4): 589-594. DOI:10.11684/j.issn.1000-310X.2019.04.016
[3]
陈雪峰, 张中戈, 等. 基于线谱和DEMON谱的水声目标分类[J]. 指挥信息系统与技术, 2019, 10(4): 61-65.
CHEN Xuefeng, ZHANG Zhongge, et al. Classification for underwater acoustic targets based on line spectrum and DEMON spectrum[J]. Command Information System and Technology, 2019, 10(4): 61-65.
[4]
韩纪庆, 张磊, 等. 语音信号处理[M]. 北京: 清华大学出版社, 2019.
[5]
陈进, 董广明. 机械故障特征提取的循环平稳理论及方法[M]. 上海: 上海交通大学出版社, 2013.
[6]
魏秀参. 解析深度学习卷积神经网络原理与视觉实践[M]. 北京: 电子工业出版社, 2018.