矢量水听器具有同时共点测量声压标量和振速矢量的能力,仅用一个矢量水听器就可完成对目标的方位估计,矢量水听器的这个特点被广泛应用于声呐浮标等小型声呐设备上。对单矢量水听器信号处理算法的研究主要集中在方位估计算法上,惠俊英等[1 - 2]基于矢量声强的物理研究提出使用平均声强器和复声强器分别可测量单个目标的方位和多个目标的方位。Hochwald等[3]提出了一种确定阵列处理模型最大声源数的一般方法,对单矢量水听器方位估计能力进行分析后得出单矢量水听器最多能够分辨2个方向的目标。杨士莪[4]和Agarwal等[5]提出可利用矢量水听器接收信号的高阶统计量构造非线性方程组,采用解非线性方程组的方法估计多个目标的方位,张维等[6]和孟春霞等[7]分别用量子粒子群算法和小生境遗传算法求解上述非线性方程组并完成了多个目标的方位估计。Tichavsky等[8]和梁国龙等[9]将基于子空间分析的ESPRIT算法和MUSIC算法应用于单矢量水听器目标方位估计,实现了较高方位分辨力,但这2种方法需预先知道目标数量。曾雄飞等[10]总结了单矢量水听器目标方位估计主要有参数估计法和功率谱估计法两类,并给出了单矢量水听器CBF和MVDR这2种波束形成法的功率谱。王超等[11]和王宇杰等[12]分别用稀疏近似最小方差法和解卷积法对矢量水听器接收信号的二阶统计量进行处理,提高了单矢量水听器目标方位估计的分辨力。
随着深度学习技术的发展,神经网络逐渐被应用于声呐的目标方位估计问题[13 - 16]。不同于传统方位估计方法,神经网络将方位估计问题看成分类问题,利用大量的训练数据自动学习提取输入样本的特征信息并完成归类。针对单矢量水听器输出信息少的问题(单矢量水听器只有3路或4路信号输出,而声压阵可拥有几十上百路的输出信号),使用神经网络能更高效的对输出信号进行特征提取,充分提取单矢量水听器输出信号所携带的信息。本文参照经典的单矢量水听器方位估计方法,采用被经典方法广泛关注的接收信号二阶统计量信息作为神经网络的输入信息,采用相较传统神经网络特征重用能力更强的稠密连接网络作为神经网络的主要模块,为了充分发挥仿真数据无穷无尽的优点,提高神经网络模型的泛化能力,本文采用不断生成新的训练集的方法训练神经网络。仿真和湖试结果表明,本文的方位估计方法在低信噪比下有相较经典方法更窄的主瓣和估计精度,在双目标情况下有较高的方位分辨力,在目标强度不等的情况具有突出弱目标检测能力。
1 经典方法 1.1 单矢量水听器信号模型在远场平面波假设下,单个矢量水听器可同时共点测量声场中某一点的声压p和振速的3个分量vx、vy、vz。理想情况下,声压传感器和振速传感器的灵敏度相同,单矢量水听器的接收信号可表示为:
$ \left\{\begin{array}{l}p\left(t\right)=\displaystyle \sum _{i=1}^{N}{s}_{i}\left(t\right)+{n}_{p}\left(t\right),\\ {v}_{x}\left(t\right)=\displaystyle \sum _{i=1}^{N}{s}_{i}\left(t\right)\mathrm{cos}{\theta }_{i}\mathrm{cos}{\phi }_{i}+{n}_{x}\left(t\right),\\ {v}_{y}\left(t\right)=\displaystyle \sum _{i=1}^{N}{s}_{i}\left(t\right)\mathrm{sin}{\theta }_{i}\mathrm{cos}{\phi }_{i}+{n}_{y}\left(t\right),\\ {v}_{z}\left(t\right)=\displaystyle \sum _{i=1}^{N}{s}_{i}\left(t\right)\mathrm{sin}{\phi }_{i}+{n}_{z}\left(t\right)。\end{array}\right. $ | (1) |
式中:si(t)为第i个声源的入射信号;θi和φi分别为第i个声源的入射水平方位角和俯仰角;np(t)、nx(t)、ny(t)、nz(t)分别为声压通道的噪声和3个振速通道的噪声。
对于二维矢量水听器,声源较远俯仰角较小时,cosφi≈1单矢量水听器的接收信号改写为:
$ \left\{\begin{array}{l}p\left(t\right)=\displaystyle \sum _{i=1}^{N}{s}_{i}\left(t\right)+{n}_{p}\left(t\right),\\ {v}_{x}\left(t\right)=\displaystyle \sum _{i=1}^{N}{s}_{i}\left(t\right)\mathrm{cos}{\theta }_{i}+{n}_{x}\left(t\right),\\ {v}_{y}\left(t\right)=\displaystyle \sum _{i=1}^{N}{s}_{i}\left(t\right)\mathrm{sin}{\theta }_{i}+{n}_{y}\left(t\right)。\end{array}\right. $ | (2) |
将上式改写为矩阵形式用于后续处理:
$ \boldsymbol{x}\left(t\right)=\boldsymbol{A}\cdot \boldsymbol{s}\left(t\right)+\boldsymbol{n},$ | (3) |
$ \boldsymbol{x}\left(t\right)={\left[\begin{array}{ccc}p\left(t\right)& {v}_{x}\left(t\right)& {v}_{y}\left(t\right)\end{array}\right]}^{\mathrm{T}},$ | (4) |
$ \boldsymbol{A}=\left[\begin{array}{cc}1& 1\\ \mathrm{cos}{\theta }_{1}& \mathrm{cos}{\theta }_{2}\\ \mathrm{sin}{\theta }_{1}& \mathrm{sin}{\theta }_{2}\end{array}\cdots \begin{array}{c}1\\ \mathrm{cos}{\theta }_{i}\\ \mathrm{sin}{\theta }_{i}\end{array}\cdots \begin{array}{c}1\\ \mathrm{cos}{\theta }_{N}\\ \mathrm{sin}{\theta }_{N}\end{array}\right] ,$ | (5) |
$ \boldsymbol{s}\left(t\right)={\left[\begin{array}{cc}{s}_{1}\left(t\right)& {s}_{2}\left(t\right)\end{array}\cdots {s}_{i}\left(t\right)\cdots {s}_{N}\left(t\right)\right]}^{\mathrm{T}},$ | (6) |
$ \boldsymbol{n}={\left[\begin{array}{ccc}{n}_{p}\left(t\right)& {n}_{x}\left(t\right)& {n}_{y}\left(t\right)\end{array}\right]}^{\mathrm{T}} 。$ | (7) |
矢量声强I[17]也称为瞬时声强流,定义为:
$ \boldsymbol{I}\left(t\right)=p\left(t\right)\boldsymbol{v}\left(t\right)。$ | (8) |
式中:p(t)为声压标量;v(t)为振速矢量。理想情况下各个声源与矢量传感器各通道噪声之间均不相关,对式(8)作时间平均后和式(2)可推出x和y轴方向的平均声强分量:
$ \left\{\begin{array}{c}{I}_{x}=\overline {p\left(t\right){v}_{x}\left(t\right)}=\displaystyle \sum _{i=1}^{N}{I}_{i}\left(t\right)\mathrm{cos}{\theta }_{i},\\ {I}_{y}=\overline {p\left(t\right){v}_{y}\left(t\right)}=\displaystyle \sum _{i=1}^{N}{I}_{i}\left(t\right)\mathrm{sin}{\theta }_{i}。\end{array}\right. $ | (9) |
将式(9)推广到频域可得到:
$ \left\{\begin{array}{c}{I}_{x}\left(f\right)=p\left(f\right){v}_{x}^{*}\left(f\right)=\displaystyle \sum _{i=1}^{N}{I}_{i}\left(f\right)\mathrm{cos}{\theta }_{i},\\ {I}_{y}\left(f\right)=p\left(f\right){v}_{y}^{*}\left(f\right)=\displaystyle \sum _{i=1}^{N}{I}_{i}\left(f\right)\mathrm{sin}{\theta }_{i}。\end{array}\right. $ | (10) |
式(9)为平均声强器,式(10)为复声强器。若存在一个目标,可利用平均声强计算目标方位:
$ \widehat{\theta }=\text{arctan}\frac{{I}_{y}}{{I}_{x}}。$ | (11) |
若存在多个目标,可利用复声强计算每个频点的方位,取整后统计每个方位的频点个数画成直方图,以此估计目标方位。
$ \widehat{\theta }\left(f\right)=\text{arctan}\frac{Re\left[{I}_{y}\left(f\right)\right]}{Re\left[{I}_{x}\left(f\right)\right]}。$ | (12) |
按平均声强器的计算方法对矢量水听器的接收信号排列组合可计算出一系列二阶统计量:
$ \left\{\begin{array}{l}{I}_{p}=\overline{p\left(t\right)p\left(t\right)}=\displaystyle \sum _{i=1}^{N}{I}_{i}\left(t\right),\\ {I}_{xx}=\overline{{v}_{x}\left(t\right){v}_{x}\left(t\right)}=\displaystyle \sum _{i=1}^{N}{I}_{i}\left(t\right)\mathrm{cos}{\theta }_{i}\mathrm{cos}{\theta }_{i},\\ {I}_{xy}=\overline{{v}_{x}\left(t\right){v}_{y}\left(t\right)}=\displaystyle \sum _{i=1}^{N}{I}_{i}\left(t\right)\mathrm{cos}{\theta }_{i}\mathrm{sin}{\theta }_{i},\\ {I}_{yy}=\overline{{v}_{y}\left(t\right){v}_{y}\left(t\right)}=\displaystyle \sum _{i=1}^{N}{I}_{i}\left(t\right)\mathrm{sin}{\theta }_{i}\mathrm{sin}{\theta }_{i}。\end{array}\right. $ | (13) |
观察式(9)和式(13)可发现,等式左边是可利用矢量水听器接收信号计算的声强和二阶统计量,等式右边为目标的声强和方位,即未知量。文献[6]提出可利用解非线性方程组的方法通过式(9)和式(13)计算3个目标的声强和方位,如果在此基础上计算更高阶的统计量,则理论上可计算更多目标的方位。
1.3 基于波束形成的单矢量水听器方位估计单个二维矢量水听器可接收一路声压和两路振速信号,因此可类比传统的声压阵对单矢量水听器的接收信号做波束形成,文献[12]给出了单矢量水听器使用CBF和MVDR 2种波束形成法进行方位估计的方位谱:
$ {P}_{CBF}={a}^{\mathrm{H}}Ra,$ | (14) |
$ {P}_{MVDR}=\frac{1}{{a}^{\mathrm{H}}{R}^{-1}a} 。$ | (15) |
式中:a为导向矢量;R为接收信号x(t)的协方差矩阵,对于二维矢量水听器:
$ a\left(\theta \right)={\left[\begin{array}{ccc}1& \mathrm{cos}\theta & \mathrm{sin}\theta \end{array}\right]}^{\mathrm{T}},$ | (16) |
$ {\boldsymbol{R}}=\overline {\boldsymbol{x}\left(t\right){\boldsymbol{x}}^{\mathrm{T}}\left(t\right)}=\left[\begin{array}{ccc}{I}_{p}& {I}_{x}& {I}_{y}\\ {I}_{x}& {I}_{xx}& {I}_{xy}\\ {I}_{y}& {I}_{xy}& {I}_{yy}\end{array}\right]。$ | (17) |
观察式(9)~式(17)不难发现,经典的单矢量水听器方位估计方法都通过寻找声强Ix、Iy及二阶统计量Ip、Ixx、Ixy、Iyy之间的特征信息来实现的。文献[13]和[14]也是在二阶统计量的基础上分别使用稀疏近似最小方差和解卷积的方法,提高了单矢量水听器方位估计的方位分辨力。深度神经网络作为一种能自主学习的特征提取算法,可发现人们还未发现的特征信息。使用深度神经网代替经典的方法寻找矢量水听器声强及二阶统计量的特征信息,有助于提高单矢量水听器方位估计的性能。
2 基于稠密连接网络的单矢量水听器目标方位估计 2.1 稠密连接网络文献[18]提出了稠密连接网络(DenseNet),这是一种基于卷积神经网络的深度神经网络,它以前馈的方式将每一层连接到每一层,与传统的卷积神经网络相比,稠密连接网络加强了特征传播和特征重用、减少了参数数量并缓解了梯度消失问题。稠密连接网络主要由稠密块(Dense block)和过渡层(Transition layer)组成,稠密块负责卷积操作和输入输出,过渡层负责控制通道数量。稠密连接网络的结构如图1所示。
采用蒙特卡洛法按式(3)~式(7)仿真不同信噪比不同目标数量的接收信号x(t),按式(17)计算接收信号x(t)的协方差矩阵R,对R作归一化后得到3×3的矩阵作为神经网络的输入样本。
本文将方位估计问题看成一个多标签分类[19]问题,构造一个360维的向量作为目标方位信息向量,有目标的方位上设置为1,没目标的方位设置为0,将这个向量作为神经网络训练时的标签。
2.3 训练过程本文采用不断生成训练集的方法训练神经网络。训练所用数据的目标信噪比在−10~20 dB内随机选取,目标方位在0~359°内随机选取,目标数也是随机设置但不大于最大目标数,最大目标数目从0开始随训练进度增加。
如图2所示,最大目标数在第200个epoch改为1,在第500个epoch改为2,在第6000个epoch改为3,当最大目标数增加至3时,训练损失难以下降至更低的值,这意味着使用本文方法也最多能分辨2个目标,这与文献[3]结论一致。
仿真目标位于179°,辐射800~4000 Hz的宽带噪声,信噪比−13~20 dB,以1 dB为间隔,矢量水听器采样频率12 kHz,一个快拍8192个采样点,一个快拍估计一次方位,分别用CBF、MVDR、平均声强器法、稠密连接网络估计目标方位,CBF、MVDR和稠密连接网络图中颜色深度表示输出方位谱的归一化幅值,平均声强器法图中表示计算所得方位随信噪比变化。
从图3中可看出,稠密连接网络相较CBF和MVDR在低信噪比下具有较窄主瓣宽度。为了对比这4种方法在不同信噪比下的方位估计精度,对每个信噪比下的方位估计进行1000次蒙特卡洛仿真并计算均方根误差,结果如图4所示。
可以看出,稠密连接网络在低信噪比条件下的方位估计精度优于平均声强器,在其他条件下的方位估计精度下不如其他3种方法。考虑到稠密连接神经网络拥有相较CBF和MVDR更窄的主瓣宽度以及在低信噪比下高于平均声强器的估计精度,稠密连接网络对单目标的方位估计能力大于其他3种方法。
2个目标信噪比相同,一个目标位于179°,另一个目标随时间变化从0°运动到359°,目标信号种类、矢量水听器采样频率、信号处理时长与单目标仿真时相同。分别用CBF、MVDR、复声强直方图、稠密连接网络这4种方法计算2个等强度目标信噪比为−5 dB、5 dB、15 dB时的时间方位历程图。
从图5~图7中可明显看出,无论在较低信噪比和较高信噪比时,稠密连接网络的双目标分辨能力明显优于其他3种方法,为了探究稠密连接网络在不同信噪比下的双目标分辨力,分别用稠密连接网络对双目标方位角间隔为10°、15°、20°、25°时的情况作仿真,双目标信噪比相同,为−10~20 dB,以1 dB为间隔。
从图8中可看出,当信噪比大于8 dB时,稠密连接网络能区分方位角差为15°的2个目标,当信噪比大于6 dB时,稠密连接网络能区分方位角差为20°的2个目标,当信噪比大于2 dB时稠密连接网络能区分方位角差为25°的2个目标。综上分析,稠密连接神经网络的等强度双目标分辨力在信噪比为6 dB以上时,能达到约20°,而其余3种方法中双目标分辨能力最强的MVDR在信噪比为15 dB时,双目标分辨力约为53°,在10 dB时双目标分辨力约为99.1°[12]。
考虑2个目标信噪比不同的情况,按等强度双目标仿真的方法进行仿真,运动目标的信噪比为3 dB,在179°的目标的信噪比分别为6 dB、9 dB、12 dB:
从图9~图12中可看出,2个目标信噪比相差大于6 dB后,只有稠密连接网络具备发现弱目标的能力,双目标分辨力约为30°。进一步用稠密连接网络仿真强目标比弱目标信噪比高12 dB、15 dB、18 dB、21 dB的情况:
从图13~图15中可看出,稠密连接网络在2个目标信噪比相差大于18 dB后,逐渐丧失了对弱目标的检测能力。综上分析,稠密连接网络可同时对相差18 dB以下的不等强度目标进行方位估计,而经典方法中方位分辨能力最强的MVDR只能同时对相差6 dB以下的不等强度目标进行方位估计。
2020年8月,于莫干山进行了一次矢量水听器目标方位估计试验,目标为电瓶船,未携带声源,先低速航行,后高速机动。信号处理带宽0.8~4 kHz,矢量水听器采样频率12 kHz,每8129个采样点估计一次目标方位。
从图16中可看出,在0~260 s的时间内,电瓶船低速航行阶段,信噪比较低,只有稠密连接网络发现了目标并估计出了近似方位,电瓶船高速运动后稠密连接网络以较窄的主瓣给出了目标方位。
针对单矢量水听器方位估计问题,本文将相较传统神经网络特征重用能力更强的稠密连接网络应用于单矢量水听器的方位估计,采用经典方法中广泛关注的接收信号二阶统计量信息作为神经网络的输入信息。仿真及湖试数据表明,对于宽带噪声信号:
1)稠密连接网络在低信噪比下,相较经典方法具有更窄的主瓣宽度和较高的估计精度,在高信噪比的情况下,主瓣宽度更窄但估计精度不如经典方法;
2) 在2个等强度目标信噪比6 dB以上的情况下,稠密连接网络的双目标分辨力能达到20°,相较经典方法中方位分辨能力最强的MVDR减小79°以上;
3)在2个目标信噪比相差小于等于6 dB的情况下,稠密连接网络和经典方法均能分辨2个目标,当2个目标信噪比相差大于6 dB后,只有稠密连接网络可发现弱目标,当2个目标信噪比相差大于18 dB后,稠密连接网络才逐渐丧失了对弱目标的检测能力。
本文方法基于矢量水听器接收信号的二阶统计量,未利用频谱及窄带线谱信息,在未来的工作中将使用复声强等携带频谱特征的数据作为神经网络的输入,进一步提高单矢量水听器方位估计的性能。
[1] |
惠俊英, 刘宏, 余华兵, 等. 声压振速联合信息处理及其物理基础初探[J]. 声学学报, 2000(4): 303-307. HUI Junying LIU Hong, YU Huabing, et al. Preliminary study on the joint information processing of sound pressure and vibration velocity and its physical basis[J]. Acta Acustica, 2000(4): 303-307. |
[2] |
惠俊英, 惠娟. 矢量声信号处理基础[M]. 北京: 国防工业出版社, 2009: 10−17.
|
[3] |
HOCHWALD B, NEHORAI A. Identifiability in array processing models with vector-sensor applications[J]. IEEE Transactions on signal processing, 1996, 44(1): 83-95. DOI:10.1109/78.482014 |
[4] |
杨士莪. 单矢量传感器多目标分辨的一种方法[J]. 哈尔滨工程大学学报, 2003(6): 591-595. YANG Shie. A method for multi target resolution of single vector sensor[J]. Journal of Harbin Engineering University, 2003(6): 591-595. |
[5] |
AGARWAL A, AGRAWAL M, KUMAR A. Higher-order-statistics-based direction-of-arrival estimation of multiple wideband sources with single acoustic vector sensor[J]. IEEE Oceanic Engineering., 2020, 45(4): 1439-1449.. DOI:10.1109/JOE.2019.2934211 |
[6] |
张维, 尚玲. 单矢量水听器水中多目标方位跟踪方法[J]. 国防科技大学学报, 2017, 39(2): 114-119. ZHANG Wei, SHANG Ling. A method for azimuth tracking of multiple targets in water using a single vector hydrophone[J]. Journal of National University of Defense Technology, 2017, 39(2): 114-119. DOI:10.11887/j.cn.201702017 |
[7] |
孟春霞, 李秀坤, 杨士莪. 单矢量水听器多目标方位估计的算法研究[J]. 舰船科学技术, 2007(2): 123-126. MENG Chunxia, LI Xiukun, YANG Shie. Direction estmation of multi-sources received by a single vector sensor[J]. Ship Science and Technology, 2007(2): 123-126. |
[8] |
TICHAVSKY P, WONG K T, ZOLTOWSKI M D. Near-field/far-field azimuth and elevation angle estimation using a single vector hydrophone[J]. IEEE Transactions on Signal Processing, 2001, 49(11): 2498-2510. DOI:10.1109/78.960397 |
[9] |
梁国龙, 张锴, 付进, 等. 单矢量水听器的高分辨方位估计应用研究[J]. 兵工学报, 2011, 32(8): 986-990. LING Guolong, ZHANG Kai, FU Jin, et al. Research on high-resolution direction-of-arrival estimation based on an acoustic vector-hydrophone[J]. Acta Armamentarii, 2011, 32(8): 986-990. |
[10] |
曾雄飞, 孙贵青, 李宇, 等. 单矢量水听器的几种DOA估计方法[J]. 仪器仪表学报, 2012, 33(3): 499-507. ZENG Xiongfei, SUN Guiqing, LI Yu, et al. Several approaches of DOA estimation for single vector hydrophone[J]. Chinese Journal of Scientifie Instrument, 2012, 33(3): 499-507. |
[11] |
王超, 笪良龙, 韩梅, 等. 单矢量水听器稀疏近似最小方差方位估计算法[J]. 声学学报, 2021, 46(6): 1050-1058. WANG Chao, DA Lianglong, HAN Mei, et al. Signal vector hydrophone sparse asymptotic minimum variance hearing estimation algorithm[J]. Acta Acustica, 2021, 46(6): 1050-1058. |
[12] |
王宇杰, 李子高, 迟骋, 等. 单矢量水听器的组合二阶统计量解卷积方位估计[J]. 声学学报, 2023, 48(4): 656−667. WANG Yujie, LI Zigao, CHI Pin, et al. Single vector hydrophone time-domain deconvolution bearing estimation method based on combined second-order statistics[J]. Acta Acustica, 2023, 48(4): 656−667. |
[13] |
ZHANG M, PAN X, SHEN Y N, et al. Deep learning-based direction-of-arrival estimation for multiple speech sources using a small scale array[J]. The Journal of the Acoustical Society of America, 2021, 149(6): 3841. DOI:10.1121/10.0005127 |
[14] |
LIU Y J, CHEN H X, WANG B. DOA estimation based on CNN for underwater acoustic array[J]. Applied Acoustics, 2021, 172: 107594. DOI:10.1016/j.apacoust.2020.107594 |
[15] |
余春祥, 王彪, 朱雨男, 等. 胶囊网络矢量水听器DOA估计[J]. 舰船科学技术, 2023, 45(4): 128−132. YU Chunxiang, WANG Biao, ZHU Yunan, et al. DOA estimation of vector hydrophone based on capsules network[J]. Ship Science and Technology, 2023, 45(4): 128−132. |
[16] |
曹怀刚, 任群言, 郭圣明, 等. 卷积神经网络单矢量水听器方位估计[J]. 哈尔滨工程大学学报, 2020, 41(10): 1524-1529. CAO Huaigang, REN Qunyan, GUO Shengming, et al. Source azimuth estimation with single vector sensor based on convolutional neural network[J]. Journal of Harbin Engineering University, 2020, 41(10): 1524-1529. |
[17] |
杨德森, B. A. Γордиенко, 洪连进,. 水下矢量声场理论与应用等[J]. 声学学报, 2015, 40(1): 124-125. YANG Desen, B. A. Γордиенко, HONG Lian-jin, et al. Underwater vector sound field theory and its applications[J]. Acta Acustica, 2015, 40(1): 124-125. |
[18] |
HUANG G, LIU Z, VAN DER MAATEN L, et al. Densely connected convolutional networks[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 4700−4708.
|
[19] |
TSOUMAKAS G, KATAKIS I. Multi-label classification: an overview[J]. International Journal of Data Ware- housing and Mining, 2007, 3(3): 1-13. DOI:10.4018/jdwm.2007070101 |