舰船科学技术  2020, Vol. 42 Issue (12): 117-120    DOI: 10.3404/j.issn.1672-7649.2020.12.023   PDF    
基于无监督深度学习的线谱增强算法
鞠东豪1,2,3, 迟骋1,3, 李宇1,3, 张春华1,3, 黄海宁1,3     
1. 中国科学院声学研究所,北京 100190;
2. 中国科学院大学,北京 100039;
3. 中国科学院先进水下信息技术重点实验室,北京 100190
摘要: 水下目标探测是水下无人航行器的重要应用领域,而被动声呐则是水下无人航行器的最重要探测载荷之一。对于被动声呐而言,从接收到的微弱目标辐射噪声中检测出稳定的线谱分量是一个十分重要的研究内容。通常被动声呐在检测线谱之前会对接收信号进行线谱分量的增强,往往使用自适应线谱增强器(ALE)来实现线谱分量的的增强。但是,ALE算法对系统的输入信噪比(SNR)有一定要求。当输入信噪比太低时,ALE将无法正常工作。为了克服ALE在输入SNR方面的限制,本文提出一种基于无监督深度学习的线谱分量增强算法。仿真表明,当输入信噪比为−30 dB时,本文算法仍可实现20 dB的信噪比增益,ALE算法则无法对信号进行增强。利用海试数据进行验证,证明本文所提出的无监督深度学习线谱增强器算法在低信噪比环境下的优势。
关键词: 被动声呐     自适应线谱增强     无监督学习     神经网络    
Line enhancement algorithm based on unsupervised deep learning for passive sonars
JU Dong-hao1,2,3, CHI Cheng1,3, LI Yu1,3, ZHANG Chun-hua1,3, HUANG Hai-ning1,3     
1. Institute of Acoustics, Chinses Academy of Sciences, Beijing 100190, China;
2. University of Chinese Academy of Sciences, Beijing 100039, China;
3. Key Laboratory of Science and Technology on Advanced Underwater Acoustic Signal Processing, Chinese Academy of Sciences, Beijing 100190, China
Abstract: Detecting underwater targets is an important application of unmanned underwater vehicles. A passive sonar is one of key payloads of UUVs. Detection of acoustic tonals radiated from surfaces and underwater vehicles is important for passive sonars. Enhancing the tonals is usually necessary in passive sonars before detection. Conventionally, passive sonars use an adaptive line enhancer (ALE) to enhance the tonals. However, ALEs require their input signal-to-noise ratio (SNR) should higher than a threshold. If the input SNR is too low, ALEs will fail. To overcome the limit of ALEs, we proposes to use unsupervised deep learning to enhance the tonals for passive sonars. The proposed line enhancing algorithm is based on an deep neural network which is popular in unsupervised deep learning. Simulation shows that at the input SNR of −30 dB, the proposed line enhancing algorithm still achieves an SNR gain of 20 dB, but the reference ALE cannot work. The experiment also demonstrates the priority of the proposed method.
Key words: passive sonar     adaptive line enhancer     unsupervised learning     neural network    
0 引 言

水下无人航行器由于平台体积小、能耗低以及无人等特点近年来被广泛应用于军民各个领域[1-2]。水下无人航行器搭载被动声呐探测水下目标也成为了近年来的一个研究课题。而对于被动声呐探测技术而言,往往关注接收信号中的低频线谱分量,这些线谱分量主要由于目标螺旋桨转动和内部的机械往复运动产生,并且线谱分量往往比接收信号中的宽带分量具有更高的功率和稳定性[3]。对于UUV这样的小型平台而言,要提升对目标的检测性能,对这类线谱分量进行增强就显得尤为重要。

常规的自适应线谱增强器(ALE)已经被广泛地应用与被动声呐系统中[3-4],ALE算法应用了线谱分量和宽带噪声分量之间的相关性差异进行线谱增强,是自适应滤波器的一个重要应用,除此之外ALE算法还被广泛应用于语音校正以及生物医学信号处理等领域。在利用最小均方误差(LMS)迭代算法的线谱增强器中,由于存在迭代噪声,系统的增益和输入信噪比有关,当输入信噪比低于某一阈值时,系统增益迅速下降[4-5],因此,期望设计一种对输入信噪比有更强鲁棒性的线谱增强算法。

近年来深度学习算法在声学领域得到广泛的应用[6],但使用深度学习算法构建被动声呐的线谱增强器这一领域还未有人进行研究。本文尝试将深度学习算法应用于被动声呐线谱增强技术当中,提出基于无监督深度学习的线谱增强器。该方法同ALE一样可以实时自适应的进行线谱增强,且不需要预先收集大量数据训练模型,相比较于传统的深度学习算法具有更强的环境鲁棒性。

仿真结果表明,本文提出的深度学习线谱增强器算法在输入信噪比为−30 dB的情况下,该方法仍然可以实现约20 dB的信噪比增益,这意味着本文算法可以更好地应用于被动声呐探测中,具有一定的优越性。

1 常规自适应线谱增强算法 1.1 信号模型

为简化分析,本文假设被动声呐接收信号由宽带白噪声分量和线谱分量构成,信号模型如下式:

$x(k) = \sum\limits_{i = 1}^M {{A_i}\sin (2{\text{π}} {f_i}k + {\varphi _i}) + } n(k)\text{。}$ (1)

其中: $M$ 为线谱分量的个数; $k$ 为时间索引; ${A_i}$ ${f_i}$ 以及 ${\varphi _i}$ 分别为第 $i$ 个线谱分量的幅度、频率以及初始相位; $n(k)$ 为宽带噪声分量。为了便于推导,本文假设 $M = 1$

1.2 自适应线谱增强器

ALE是一种自适应的窄带滤波器,ALE算法可以从数据当中自动发现线谱所在的位置并增强线谱分量抑制宽带噪声分量,但常规的ALE算法在低信噪比输入的情况下难以正常工作。本文主要介绍在极低输入信噪比条件下对线谱分量进行增强,选用常规ALE算法作为参考算法,下面对常规ALE算法及其输入信噪比限制进行描述。

常规ALE算法的流程框图如图1所示,常规ALE算法利用了线谱分量和宽带噪声分量在相关长度上的差异性进行线谱的增强。ALE算法中使用了自适应滤波器,原始的输入信号 ${{x}}(k)$ 作为自适应滤波器的参考输入。延时输入为 ${{x}}(k{\rm{ - }}\Delta )$ ,其中 $\Delta $ 表示延时的长度。

图 1 常规ALE算法框图 Fig. 1 Schematic of the conventional ALE

假设自适应滤波器抽头长度为 $L$ ,那么权值向量 ${{w}}$ 可以表示为:

${{w}}(k) = {\left[ {{w_0}(k),{w_1}(k), \cdots ,{w_{L{\rm{ - }}1}}(k)} \right]^{\rm{T}}}\text{,}$ (2)

其中, ${\left[ \cdot \right]^{\rm{T}}}$ 为矩阵转置, $k$ 为时间索引。图1中的输出信号 $y(k)$ ,则可以通过式(3)得到:

$y(k) = {{{w}}^{\rm{T}}}(k){{x}}(k - \Delta )\text{,}$ (3)

其中, ${{x}}(k - \Delta )$ 是延时信号,可以写为:

$\!\!\!\!{{x}}(k - \Delta ) = {\left[ {x(k - \Delta ),x(k - \Delta + 1),\! \cdots \!,x(k - \Delta - L + 1)} \right]^{\rm{T}}}\!\!\text{,} $ (4)

ALE算法的估计误差 $e(k)$ ,可以通过下式得到:

$e(k) = x(k) - y(k)\text{。}$ (5)

LMS算法是基于梯度下降算法,在LMS自适应算法中,损失函数可以记为:

$J(k) = {e^2}(k)\text{,}$ (6)

损失函数的梯度向量为:

$\hat \nabla (k){\rm{ = }}\frac{{\partial \left[ {{e^2}(k)} \right]}}{{\partial {{w}}(k)}} = - 2e(k){{x}}(k)\text{。}$ (7)

在LMS自适应算法中,损失函数的梯度向量用于调整权重系数向量。ALE中权重系数向量的更新公式可以表示为:

${{w}}(k + 1) = {{w}}(k){\rm{ + }}\mu e(k){{x}}(k - \Delta )\text{。}$ (8)

ALE算法通过不断更新权值系数直至收敛,即可达到对线谱分量进行增强的目的。

与此同时有学者指出当ALE的输入信噪比低于某个阈值时系统的增益会急剧下降。定义ALE系统的信噪比增益 $G$ (dB)为[6]

$G \triangleq 10{\log _{10}}\frac{{SN{R_{in}}}}{{SN{R_{out}}}}\text{。}$ (9)

$SN{R_{in}}$ $SN{R_{out}}$ 分别表示输入输出信噪比。当滤波器抽头长度 $L > > 1$ 时存在一个信噪比临界值[3]

$SN{R_{in,cr}} = \frac{2}{{2\sqrt {{L^2} + 2{M_0}} - L}}\text{。}$ (10)

式中, ${M_0} = 1/4\mu \sigma _n^2$ 是以自适应周期为单位的迭代时间常数。

在水下微弱目标被动探测的应用中,被动声呐的接收信号信噪比可能会低于ALE输入信噪比的最低要求,如何在极低信噪比下增强线谱信号已经成为被动探测领域不可忽视的一个问题。

2 基于无监督深度学习的线谱增强算法

ALE利用了输入和延迟输入中只有线谱分量的输入是相似的这一特点,本文提出的无监督深度学习线谱增强算法同样也利用了输入和延迟输入之间的关系。受ALE算法的启发,无监督深度学习线谱增强器算法使用延时输入来训练神经网络。在使用经过训练的神经网络进行线谱的增强,同传统的神经网络信号增强模型相比,本文所提出算法可以自适应的对线谱进行增强,并且可以实时处理数据,无需事先训练。同时与传统的ALE算法相比,无监督深度学习线谱增强算法利用了神经网络的非线性能力,提升了系统在低输入信噪比下的增益。本文所提算法由训练和增强2个步骤组成。

无监督深度学习线谱增强算法使用经过 ${{x}}$ 预处理后的数据 ${{x}}'(k)$ 以及延时数据 ${{x}}'(k - \Delta )$ 作为训练数据,将神经网络模型的推测用函数形式表示为 $\hat y = h(x)$ ,最小化目标函数为:

$\mathop {\arg \min }\limits_{\theta ,\theta '} \frac{1}{n}\sum\limits_{i = 1}^n {\left[ {L(x'(i),h(x'(i - \Delta )))} \right]}\text{。} $ (11)

式中: $\theta $ $\theta '$ 表示神经网络模型参数集合; $n$ 为输入层神经元个数; $L$ 表示目标函数,一般使用平方误差,即 $L{\rm{(}}{{x}}, {{z}}{\rm{) = }}{\left\| {{{x}} - {{z}}} \right\|^2}$ 。当输入到神经网络的数据量变大时,计算速度变慢。为了实现实时处理,选择小批量梯度下降法(Mini-batch Gradient Descent, MBGD)法来更新权值:

$\theta = \theta - \eta \cdot {\nabla _\theta }L({x'_m}(i),h({x'_m}(i - \Delta )))\text{。}$ (12)

其中 $\eta $ 表示神经网络的学习率, ${x_m}$ 表示第 $m$ 批数据。通过上述方法对无监督深度学习线谱增强器模型进行训练,最终得到经过训练后的模型参数集 ${\theta ^*}$ ${\theta '^{\rm{*}}}$ 。再将经过预处理后的数据直接输入模型中,即可得到增强以后的数据,这一过程也等同于传统神经网络算法处理流程中的测试阶段,数学表达式如下式:

${{{x}}_{DLE}} = {h_{{{\theta '}^{\rm{*}}},}}_{{\theta ^*}}({{x}}')\text{。}$ (13)

${{{x}}_{DLE}}$ 表示系统的输出结果。基于深度学习的线谱增强算法的实现流程如图2所示。

图 2 无监督深度学习线谱增强器算法框图 Fig. 2 Schematic of the proposed algorithm

无监督深度学习线谱增强器算法并不需要大量的数据进行模型的预先训练,同ALE算法一样无监督深度学习线谱增强算法是在线对模型进行调优,因此线谱分量可以几乎实时的被增强。

3 实验与分析 3.1 仿真数据实验

仿真数据试验中使用式(1)中指出的信号模型,参数设定如表1所示。

表 1 仿真数据参数 Tab.1 Simulation data parameters

本文实验使用常规ALE作为对比,ALE及无监督深度学习线谱增强器算法参数如表2表3所示。

表 2 ALE算法参数 Tab.2 ALE algorithm parameters

表 3 无监督深度学习线谱增强器算法参数 Tab.3 ALE algorithm parameters

使用上述参数的2种算法对比在低信噪比(−30 dB)情况下各自的线谱增强结果,如图3所示。

图 3 两种方法线谱增强结果 Fig. 3 LOFAR of two mathods

对比2种方法的处理结果,从图3(b)可以看出,当信噪比为−30 dB时,在LOFAR谱中难以观察到线谱的存在。对于传统ALE,图3(c)显示300 Hz处的线谱几乎没有增益。而对于本文提出的无监督深度学习线谱增强器算法,可以在图3(d)中清晰地看到300 Hz处的线谱分量。

3.2 实际数据实验

为了更好地验证本文所提出的无监督深度学习线谱增强器算法,于渤海使用水下无人航行器舷侧阵采集水面合作渔船辐射噪声数据进行线谱增强实验。为了验证在低信噪比情况下的算法性能,在原有数据基础上加入了10 dB宽带噪声。实际数据采样率为10 kHz,算法参数同表2表3,处理结果如图4所示。

图 4 两种方法的处理结果 Fig. 4 The lofargrams of two mathods

图4可以看出,2种方法在应用于实际数据时都具有增强音调的能力。传统ALE算法对53 Hz处的线谱有较好的增强效果,但对于低信噪比的线谱,如300 Hz处的线谱增强效果较差,对不可见的线谱难以增强。而无监督深度学习线谱增强器算法对310 Hz,320 Hz,340 Hz甚至更低信噪比的线谱都有增强效果。

4 结 语

本文受到了传统ALE算法的启发,利用神经网络较强的非线性能力提出一种基于深度学习的线谱增强算法。仿真实验表明,无监督深度学习线谱增强算法能显著提高信噪比增益,当信噪比低于−30dB时,无监督深度学习线谱增强器算法仍能获得较高的增益,而ALE算法很难获得增益。实验表明,无监督深度学习线谱增强器算法可以增强低信噪比的线谱成分。与传统ALE算法相比,本文提出的无监督深度学习线谱增强算法在低信噪比条件下具有更好的增强效果。本文所提算法可应用于无人航行器搭载的被动声呐,提高其探测性能。

参考文献
[1]
潘光, 宋保维, 黄桥高, 等. 水下无人系统发展现状及其关键技术[J]. 水下无人系统学报, 2017, 25(2): 44-51.
[2]
钟宏伟, 李国良, 宋林桦, 等. 国外大型无人水下航行器发展综述[J]. 水下无人系统学报, 2018, 26(4): 273-282.
[3]
李启虎. 数字式声纳设计原理[M]. 合肥: 安徽教育出版社, 1985.
[4]
李启虎. 用于拖曳式线列阵的一种新的线谱增强系统[J]. 声学学报, 1988(3): 9-15.
[5]
RICKARD J. T., ZEIDLER J. R., “Second-order output statistics of the adaptive line enhancer,” IEEE Trans. Acoust. Speech Signal Process. 27, 31−39 (1979).
[6]
NEHORAI A., MALAH D D.. “On the stability and performance of the adaptive line enhancer,” in: Proceedings of IEEE ICASSP, Denver, USA (April 9-11, 1980), pp. 478−481.
[7]
BIANCO M. J., GERSTOFT P., TRAER J., et al. “Machine learning in acoustics: Theory and application,” J. Acoust. Soc. Am. 146, 3590−3628 (2019).
[8]
HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. science, 2006, 313(5786): 504-507. DOI:10.1126/science.1127647
[9]
VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders[C]//Proceedings of the 25th international conference on Machine learning. 2008: 1096−1103.