在主动声呐信号处理领域中,海洋混响是最常见的背景干扰。传统信号处理方法通常将混响视为局部平稳的高斯色噪声,然后对混响进行预白化处理,以期将混响干扰转变为高斯白噪声干扰[1 - 2]。但随着声呐向低频、大孔径和高分辨发展,混响的非高斯特性逐渐凸显,而对混响进行非高斯概率密度建模已成为一种趋势[3 − 7]。
混合高斯(Gaussian Mixture,GM)分布模型[5]和对称α稳定分布(Symmetric alpha-stable Distribution,SαS)模型 [6 - 7]是比较常用的2种非高斯模型,下文简称GM分布模型和SαS分布模型。在对海洋混响进行概率密度建模时,往往是将混响数据按时间先后顺序分成若干段,再对每一段数据预白、建模。但由于海洋混响局部平稳,每一段混响数据的概率密度特性都有所不同,这会导致某些段数据采用GM分布模型建模效果较好,但某些段数据采用SαS分布模型建模更为适合,即很难用一个确定的分布模型始终准确对混响建模,因此无论是GM分布模型还是SαS分布模型,其建模的稳健性都较弱,都会发生模型失配的情况。一旦模型失配,可能会导致后续信号处理效果明显下降[8]。因此,需要寻找一种稳健的概率密度建模方法。
本文参考GM分布模型和SαS分布模型的特点,采用高斯-污染混合分布模型对海洋混响建模,基于最大熵原则确定污染分布类型,并在此基础上进行参数估计,最后基于实际混响数据验证了所提模型的稳健性。
1 混响建模常用非高斯模型对海洋混响进行非高斯建模时,GM分布模型和SαS分布模型是2种较为常见的概率分布模型。
1.1 GM分布模型GM分布模型的概率密度函数(Probability Density Function,PDF)一般可表示为:
| $ {f_{gm}}\left( x \right) = \sum\limits_{m = 1}^M {{\varepsilon _m}} {\varphi _m}\left( x \right)。$ | (1) |
式中:
对混响建模时,多采用二阶零均值混合高斯模型,其PDF为:
| $ {f_{gm}}\left( x \right) = \left( {1{\text{ - }}\varepsilon } \right){\varphi _1}\left( x \right) + \varepsilon {\varphi _2}\left( x \right)。$ | (2) |
式中:
SαS分布模型没有显式的PDF表达式,一般是通过对其特征函数进行傅里叶变换得到其PDF,其表达式如下:
| $ {f_\alpha }\left( x \right) = \frac{1}{{\text{π}} }\int_0^\infty {\exp \left( { - \gamma {t^\alpha }} \right)\cos \left( {xt} \right){{\rm{d}}} t}。$ | (3) |
式中:
式(3)一般没有封闭的解析表达式,需要以数值积分方式计算,这对其应用造成很大不便。LI等 [9]指出,在
| $ {f_\alpha }\left( x \right) = \frac{{1 - \varepsilon }}{{2{\sigma _\alpha }\sqrt {\text {π}} }}\exp \left( { - \frac{{{x^2}}}{{4\sigma _\alpha ^2}}} \right) + \frac{{\varepsilon {\sigma _\alpha }}}{{{\text {π}} \left[ {{x^2} + \sigma _\alpha ^2} \right]}}。$ | (4) |
式中:
事实上,从式(4)可看出,它是均值为0、方差为
高斯-污染混合分布模型的PDF表达式如下[10]:
| $ f\left( x \right) = \left( {1 - \varepsilon } \right)\varphi \left( x \right) + \varepsilon g\left( x \right)。$ | (5) |
式中:
从式(5)可看出,高斯-污染混合分布是高斯分布和一个污染分布的线性组合。当污染分布已知时,它是一个确知的非高斯分布,当污染分布类型未知时,它是一个未知分布,但部分统计特性已知。
另外,对比式(2)、式(4)和式(5)可知,通过取不同的
由于混响是零均值的,不妨假设高斯分布和污染分布的均值都为0,即
| $ f\left( x \right) = \frac{{1 - \varepsilon }}{{\sqrt {2{\text{π}} {\sigma ^2}} }}\exp \left( { - \frac{{{x^2}}}{{2{\sigma ^2}}}} \right) + \varepsilon g(x)。$ | (6) |
式中:
当污染分布未知时,高斯-污染混合分布模型是一个未知的分布模型,因此对混响建模时首先需要确定污染分布模型。但满足均值为0的概率分布模型有无穷多个,需要选择一个稳健的污染分布类型,以适应混响的时变特性。所谓稳健,是指无论混响的真实概率密度特性如何变换,建模模型都不会与之产生较大偏差。这与最大熵原则比较接近,可基于最大熵原则确定污染分布模型。
最大熵原则[11]是由Jaynes在1957年提出,即:如果一种概率分布能在附加约束条件下使得其信息熵最大,则它是最少偏见的,也即最可能出现的分布。
对于污染分布模型
| $ H = - \int_R {g\left( x \right)\ln g\left( x \right){\rm{d}}x}。$ | (7) |
式中:
在给定约束条件下使得信息熵最大的污染分布模型即为最大熵污染分布模型。通常选择整数阶样本原点矩作为约束条件,由此构建的求解最大熵污染分布模型的优化问题为:
| $ \begin{gathered} \max H = - \int_R {g\left( x \right)\ln g\left( x \right){\rm{d}}x},\\ {\rm{s}}.{\rm{t}}.\;\;\;\;\int_R {g\left( x \right){\rm{d}}x = 1},\\ \;\;\;\;\;\;\;\;\int_R {{x^i}g\left( x \right){\rm{d}}x} = {\mu _i},\;i = 1,2,...,N。\\ \end{gathered} $ | (8) |
式中:
样本原点矩作为总体矩的替代,包含了样本的统计信息。一阶矩反映样本的均值信息;三阶矩反映样本的偏态信息。理论上,约束的矩阶数越多,概率密度建模越准确,但对海洋混响进行概率密度建模时,选择的概率密度模型为高斯-污染混合分布,因此样本的二阶、三阶矩反映的是高斯-污染混合分布的二阶矩和三阶矩,并不是污染分布的二阶矩和三阶矩。对于污染分布而言,已知的信息只有其均值为0,也即一阶矩为0,因此式(8)所示的优化问题可简化为:
| $ \begin{gathered} \max H = - \int_R {g\left( x \right)\ln g\left( x \right){\rm{d}}x} ,\\ {\rm{s}}.{\rm{t}}.\;\;\;\;\int_R {g\left( x \right){\rm{d}}x = 1} ,\\ \;\;\;\;\;\;\;\;\int_R {xg\left( x \right){\rm{d}}x} = 0。\\ \end{gathered} $ | (9) |
对于式(9)所示的约束优化问题,可采用拉格朗日乘子式将其转化为无约束优化问题,在信息熵最大时,
| $ g\left( x \right) = \exp \left( { - {\lambda _0} - {\lambda _1}\left| x \right|} \right)。$ | (10) |
式中:
| $ g\left( x \right) = \frac{1}{{2b}}{e^{ - \frac{{\left| x \right|}}{b}}} 。$ | (11) |
式(11)为拉普拉斯分布的概率密度函数,
由上述推导可知,均值约束条件下最大熵高斯-污染分布混合模型即为高斯-拉普拉斯混合分布模型(Gaussian-Laplace mixture, GL),下文简称GL分布模型。将式(11)代入式(6),可得GL分布模型的PDF为:
| $ f\left( x \right) = \frac{{1 - \varepsilon }}{{\sqrt {2\pi {\sigma ^2}} }}\exp \left( { - \frac{{{x^2}}}{{2{\sigma ^2}}}} \right) + \frac{\varepsilon }{{2b}}{e^{ - \frac{{\left| x \right|}}{b}}} 。$ | (12) |
记GL分布模型的概率密度函数为
| $ {f_{gl}}\left( x \right) = \left( {1 - \varepsilon } \right){f_g}\left( x \right) + \varepsilon {f_l}\left( x \right)。$ | (13) |
式中:
由式(13)可知,GL分布模型由高斯分布方差
EM(Expectation Maximization)算法[13],又称期望最大化算法,在GM分布模型参数估计中应用广泛。由于GL分布模型也属于混合分布模型的一种,故对EM算法进行改进,将其应用于GL分布模型的参数估计中。具体推导过程不再详述,直接给出EM算法估计GL分布模型参数的步骤。
步骤1 根据式(14)给定GL分布模型PDF参数初值
| $ \left\{ \begin{gathered} {\varepsilon _0} = 0.5,\\ \sigma _0^2 = \sqrt {\frac{{Var}}{2}} ,\\ {b_0} = \frac{{\sqrt {Var} }}{2}。\\ \end{gathered} \right. $ | (14) |
式中:
步骤2 根据式(15)计算
| $\left\{ \begin{aligned} &{{P}}\left( {k = 1|{x_i}} \right) = \frac{{\left( {1 - \varepsilon } \right){f_g}\left( {{x_i}} \right)}}{{\left( {1 - \varepsilon } \right){f_g}\left( x \right) + \varepsilon {f_l}\left( x \right)}},\\ &{{P}}\left( {k = 2|{x_i}} \right) = \frac{{\varepsilon {f_l}\left( x \right)}}{{\left( {1 - \varepsilon } \right){f_g}\left( x \right) + \varepsilon {f_l}\left( x \right)}}。\\ \end{aligned}\right. $ | (15) |
式中:
步骤3 根据式(16)对参数组
| $ \left\{ \begin{gathered} \hat \varepsilon = \frac{{\displaystyle\sum\limits_{i = 1}^N {{{P}}\left( {k = 2|{x_i}} \right)} }}{{\displaystyle\sum\limits_{i = 1}^N {{{P}}\left( {k = 1|{x_i}} \right) + \displaystyle\sum\limits_{i = 1}^N {{\text{P}}\left( {k = 2|{x_i}} \right)} } }},\\ {{\sigma ^2}} = \frac{{\displaystyle\sum\limits_{i = 1}^N {\left( {{{P}}\left( {k = 1|{x_i}} \right)x_i^2} \right)} }}{{\displaystyle\sum\limits_{i = 1}^N {{{P}}\left( {k = 1|{x_i}} \right)} }} ,\\ \hat b = \frac{{\displaystyle\sum\limits_{i = 1}^N {\left( {{{P}}\left( {k = 2|{x_i}} \right){x_i}} \right)} }}{{\displaystyle\sum\limits_{i = 1}^N {{{P}}\left( {k = 2|{x_i}} \right)} }} 。\\ \end{gathered} \right. $ | (16) |
步骤4 当前后2次估计值的差值平方和小于给定值时,迭代终止。
EM算法估计GL分布模型参数的具体流程图如图1所示。
|
图 1 EM算法流程图 Fig. 1 Flowchart of the EM algorithm |
取GL分布模型的PDF参数组为θ=[ε=0.3, σ2=1, b=2]T,生成
|
图 2 高斯-拉普拉斯样本序列 Fig. 2 Gaussian-Laplacian sample sequence |
样本的真实概率密度函数曲线和估计得到的概率密度函数曲线对比如图3所示,可以明显看出估计得到的曲线和理论值基本一致,这表明EM算法用以估计GL分布模型的PDF参数可行。
|
图 3 高斯-拉普拉斯序列PDF估计 Fig. 3 PDF estimation of the Gaussian-Laplacian sequence |
某次海试时(实验海区深度为300 m,泥沙底质,拖曳声源和拖曳线列阵平行布放,深度相同),发射的主动脉冲为LFM信号,脉冲宽度为0.2 s,中心频率为
|
图 4 混响波形图 Fig. 4 Reverberation waveform diagram |
对预白后的混响进行PDF建模,建模时分段进行,每段数据长度为0.2 s,步长为0.1 s(相当于重合率50%,总段数为40)。对每一段混响数据分别按照高斯分布模型、GM分布模型、SαS分布模型以及GL分布模型建模。由于混响的真实概率分布未知,故采用经典的核密度估计结果作为混响的真实概率分布。
图5分别给出了第8段数据和第10段数据的建模结果。整体来看,高斯分布模型建模结果与理论值偏差较大,表明混响数据呈现出非高斯特性。其次,从图5(a)可知,对于第8段混响数据,GL分布模型和SαS分布模型建模结果与理论值偏差较小;而对于第10段混响数据,从图5(b)可知GL分布模型和GM分布模型建模结果与理论值偏差较小。图5表明,对于不同的数据段,混响的概率密度特性确实有所不同,并且SαS分布模型和GM分布模型各有适用,但GL分布模型建模结果与真实分布偏差始终较小,表现出建模的稳健性。
|
图 5 不同数据段建模结果 Fig. 5 Modeling results of different data segments |
为进一步说明GL分布模型建模的稳健性,采用Kullback-Leibler (KL) 散度[14]定量描述建模模型与混响真实概率密度模型的偏差。KL散度的表达式如下:
| $ {D_{KL}}(p||q) = \int_{ - \infty }^{ + \infty } {p(x)\ln \frac{{p(x)}}{{q(x)}}{\rm{d}}x} 。$ | (17) |
式中:
不同建模模型的KL散度对比如图6所示。需要说明的是,由于混响的真实概率密度模型未知,故采用经典的核密度估计结果作为真实的概率密度值。
|
图 6 不同建模模型KL散度对比 Fig. 6 Comparison of KL divergence of different modeling models |
从图6中首先可知,采用高斯分布模型建模的KL散度值普遍较高,说明混响的非高斯性较强。其次,采用GM分布模型和SαS分布模型建模,其整体KL散度值相比高斯分布模型建模低,但起伏较大,有的数据段GM分布模型的KL散度值低,有的数据段则SαS分布模型的KL散度值低,这表明无论GM分布模型还是SαS分布模型,都无法做到始终准确对海洋混响建模,稳健性较弱。最后可知,采用GL分布模型建模,不仅KL散度曲线较为平滑,且取值始终较低,这表明GL分布模型建模与混响真实概率密度的偏差始终较小,稳健性强。
5 结 语本文采用高斯-污染混合分布模型对混响建模,即将混响的概率密度模型视为高斯分布和未知的污染分布的线性组合,然后基于最大熵原则确定了污染分布模型为拉普拉斯分布模型,然后应用EM算法估计GL分布模型的概率密度参数。最后基于真实海洋混响数据建模仿真,表明应用GL分布模型对海洋混响进行概率密度建模具有稳健性,对后续的信号检测、参数估计等处理具有重要意义。
| [1] |
KAY S, SALISBURY J. Improved active sonar detection using autoregressive prewhiteners[J]. The Journal of the Acoustical Society of America, 1990, 87(4): 1603–1611.
|
| [2] |
赵航芳, 祝献, 宫先仪. 混响背景下的信号检测[J]. 哈尔滨工程大学学报, 2004, 25(1): 34-37. ZHAO H F, ZHU X, GONG X Y. Detection of signals in reverberation noise[J]. Journal of Harbin Engineering University, 2004, 25(1): 34-37. |
| [3] |
ABRAHAM D A, GELB J M, Oldag A W. Background and clutter mixture distributions for active sonar statistics[J]. IEEE of Oceanic Engineering, 2011, 36(2): 231–247.
|
| [4] |
许彦伟, 何鑫彪, 刘明刚, 等. 干扰背景非瑞利混响参数估计[J]. 声学学报, 2023, 48(4): 733-742. XU Y W, He X B, LIU M G, et al. Parameter estimation for non-Rayleigh reverberation under background interference[J]. Acta Acustica, 2023, 48(4): 733-742. |
| [5] |
卫红凯, 王平波, 蔡志明, 等. 混响的混合高斯概率密度建模[J]. 声学技术, 2007, 26(3): 514-518. WEI H K, WANG P B, CAI Z M, et al. Gaussian mixture model for reverberation[J]. Technical Acoustics, 2007, 26(3): 514-518. |
| [6] |
王平波, 卫红凯, 娄良轲, 等. 海洋混响数据的SαS分布建模[J]. 哈尔滨工程大学学报, 2021, 42(1): 55-60. WANG P B, WEI H K, LOU L K, et al. Oceanic reverberation probability density modeling based on symmetric alpha-stable distribution[J]. Journal of Harbin Engineering University, 2021, 42(1): 55-60. |
| [7] |
李宗吉, 张西勇. 基于 α 稳定分布模型的水声信号白化滤波方法[J]. 舰船科学技术, 2014, 36(8): 53-56. LI Z J, ZHANG X Y. Whitening filtering method for underwater acoustic signal based on α-stable distribution model[J]. Ship science and technology, 2014, 36(8): 53-56. |
| [8] |
孙疆僵. 基于统计分析的混响抑制方法研究[D]. 哈尔滨: 哈尔滨工程大学, 2022.
|
| [9] |
LI X T, SUN J, WANG SH Y, et al. Near-optimal detection with constant false alarm ratio in varying impulsive interference[J]. IET Signal Processing, 2013, 7(9): 824-832. DOI:10.1049/iet-spr.2013.0024 |
| [10] |
周访滨, 朱建军, 陈永奇, 等. 污染正态分布的熵估算[J]. 中南大学学报(自然科学版), 2013, 44(3): 1269-1274. ZHOU F B, ZHU J J, CHEN Y Q, et al. Entropy estimation of contaminated normal distribution[J]. Journal of Central South University (Science and Technology), 2013, 44(3): 1269-1274. |
| [11] |
孙永厚, 周洪彪, 黄美发. 基于最大熵的测量不确定度的贝叶斯评估方法[J]. 统计与决策, 2008, 32(12): 143-145. SUN Y H, ZHOU H B, HUANG M F. Bayesian evalua–tion method of measurement uncertainty based on maxi–mum entropy[J]. Statistics and decision making, 2008, 32(12): 143-145. |
| [12] |
任博, 岳珠峰, 崔利杰, 等. 混合数据信息下不确定性描述的改进最大熵函数法[J]. 西北工业大学学报, 2022, 40(2): 450-457. REN B, YUE Z F, CUI L J, et al. An improved entropy-based representation for mixed uncertaintry about intervals and point data[J]. Journal of Northwestern Polytechnical University, 2022, 40(2): 450-457. DOI:10.1051/jnwpu/20224020450 |
| [13] |
YANG M S, LAI C Y, LIN C Y. A robust EM clustering algorithm for Gaussian mixture models[J]. Patter Recognition, 2012, 45(11): 3950-3961. DOI:10.1016/j.patcog.2012.04.031 |
| [14] |
梁志贞, 张磊. 面向 Kullback-Leibler 散度不确定集的正则化线性判别分析[J]. 自动化学报, 2022, 48(4): 1033-1047. LIANG Z Z, ZHANG L. Regularized linear discriminant analysis based on uncertainty sets from Kullback-Leibler divergence[J]. Acta Automatica Sinica, 2022, 48(4): 1033-1047. |
2025, Vol. 47
