舰船科学技术  2024, Vol. 46 Issue (18): 184-189    DOI: 10.3404/j.issn.1672-7649.2024.18.034   PDF    
基于 LDA 模型的国外潜艇声呐研究主题分析
崔丹1, 李赫2, 陈鹏3     
1. 哈尔滨工程大学 国际合作教育学院,黑龙江 哈尔滨 150001;
2. 哈尔滨工程大学 外国语学院,黑龙江 哈尔滨 150001;
3. 中国船舶集团有限公司第七一四研究所,北京 100101
摘要: 本文基于科学引文索引,检索了 1108 篇与“潜艇声呐”主题紧密相关的国外文献作为数据源。采用 LDA 主题建模技术,精确识别了六大核心主题:声呐技术与应用、声呐与机器人技术、声呐探测系统与应用、水下通信与导航、反潜作战领域的声呐技术、声呐与人工智能。基于这些主题,对原始数据进行了系统性的分类汇总与深入分析。本研究旨在通过深度剖析当前国外文献的研究焦点与趋势,为相关领域的研究者提供快速掌握领域发展脉络的途径。此举不仅有助于我国研究人员精准定位未来研究方向,更将积极促进我国潜艇声呐技术的进步与海洋强国战略的发展。
关键词: 水下声呐     LDA     主题建模     主题挖掘    
Foreign submarine sonar research topic analysis based on LDA model
CUI Dan1, LI He2, CHEN Peng3     
1. College of International Cooperative Education, Harbin Engineering University, Harbin 150001, China;
2. School of Foreign Studies, Harbin Engineering University, Harbin 150001, China;
3. The 714 Research Institute of CSSC, Beijing 100101, China
Abstract: This study utilized the Science Citation Index to retrieve 1108 international publications closely related to the topic of “submarine sonar” as its data source. By employing Latent Dirichlet Allocation (LDA) topic modeling techniques, six core themes were precisely identified: sonar technology and applications, sonar and robotics, sonar detection systems and applications, underwater communication and navigation, sonar technology in anti-submarine warfare, and sonar and artificial intelligence. Based on these themes, we conducted a systematic classification, summarization, and in-depth analysis of the original data. This research aims to provide researchers in related fields with a means to quickly grasp the developmental trajectory of the field by thoroughly analyzing the current research focus and trends in international literature. This effort not only helps Chinese researchers accurately pinpoint future research directions but also actively promotes the advancement of China's submarine sonar technology and the development of its maritime power strategy.
Key words: submarine sonar     LDA     topic modeling     text analysis    
0 引 言

党的二十大报告明确指出,我国致力于加速构建海洋强国的宏伟目标。在这一进程中,潜艇在捍卫国家领土主权与海洋权益方面所发挥的作用不言而喻,是维护国家海洋安全与利益的重要支撑。由于海洋环境的特性,声呐成为了不可缺少的观测、通讯和信息获取的装备之一[1]。潜艇声呐系统作为海洋探测与通信领域的核心技术,其应用范围广泛,不仅限于军事领域,同时也深入民用领域。这一技术体系涵盖主动声呐与被动声呐两大主要类型,重点聚焦于提升系统在水下目标探测、精确定位、准确分类及有效跟踪等方面。目前,针对潜艇声呐的综述类研究主要集中在声呐装备发展等方面,其涉猎范围相对狭窄,且研究对象主要集中于美国。

本文以国外潜艇声呐领域现有论文的研究成果为研究对象,运用潜在狄利克雷分布(Latent Dirichlet Allocation, LDA)模型作为研究方法,在无监督的机器学习环境下进行主题建模,明确并划分国外潜艇声呐研究领域的主题概率分布,进而进行归纳解读。通过对潜艇声呐领域进行系统的主题建模分析,能够全面把握当前国际在该领域的发展态势,更加客观地提炼出研究热点与未来方向,为我国在相关领域进一步开展研究工作提供参考与借鉴。

1 国外潜艇声呐研究概况 1.1 数据来源

为了确保研究的权威性与可靠性,本文选择科学引文索引(Web of Science)作为数据获取的主要渠道。通过主题词“submarine sonar(潜艇声呐)”进行检索。在检索过程中,在“国家/地区”选项中排除了“中国”,以确保所获取的文献均来源于境外。检索结果共显示有1226篇文献数据(截至2024年8月22日),随后经过人工筛选,去除了与主题相关性不强的文献,最终确定了1108篇符合要求的文章作为研究的基础。

1.2 文献概况分析

经过对检索结果剖析,发现2000年为该研究领域的分水岭。在此之前,相关文献的年度发表量极为有限,每年仅有个位数文章发表;然而,自2000年起,潜艇声呐领域的研究文献数量呈现出显著的增长趋势,表明该领域正受到越来越多的关注。图1直观地展示了自2000年以来,各年度潜艇声呐研究文献的数量分布情况。从文献作者国籍来看,除中国外,美国在该领域的研究兴趣最为浓厚。以“潜艇声呐”为主题,美国学者共计发表了378篇文章,位居全球首位,其发文量占该主题学术文献总量的30.807%,紧随其后的是英国(含英格兰地区)、意大利和加拿大,它们分别占据了18.174%、6.683%和6.601%的比例。图2则进一步展示了前10位刊文国别的分布情况。在研究领域方面,以“潜艇声呐”为主题的学术文献主要聚焦于工程学,该领域的刊文数量高达614篇,占比超过50%,占据了主导地位,此外,地质学(、海洋科学等领域也有涉猎。值得注意的是,近年来计算机科学与机器人学领域的相关文献数量显著增加,这表明潜艇声呐技术正逐步与智能化、数字化技术相融合,展现出广阔的发展前景。

图 1 各年度文献数量 Fig. 1 Number of publications by year

图 2 刊文国别出处 Fig. 2 Distribution of publications by country
2 研究方法与研究思路 2.1 研究方法

本文主要采用潜在狄利克雷分布(LDA)模型进行文献主题的深度挖掘。LDA模型作为一种无监督的三层贝叶斯模型,由Blei等人首次提出[2],其逻辑架构清晰明确,该模型基于一个基本假设,即每篇文档均包含多个主题,且每个主题又由多个词汇所构成,通过运用统计学的方法,LDA模型能够自动地从大规模文档集合中提取出潜在的主题结构,并最终生成2个关键的概率分布:一是“主题—词汇”概率分布,二是“主题—文档”概率分布。在这2种分布中,若某一“词汇”或“文档”在特定主题下的概率值较高,则表明该“词汇”或“文档”与该主题的关联性更为紧密。LDA模型的优势在于其无监督学习的特性,能够揭示文本数据中隐藏的主题结构,目前已被广泛应用于文本分类、信息检索、文本内容摘要等多个领域。

在运用LDA模型实施主题建模的过程中,为确保模型效果的优化,需借助若干核心指标来精准判定最优主题数量。回溯既往学术研究,发现“困惑度(Perplexity)”与“主题一致性(Topic Coherence)”常常被作为两项关键评估参数。具体而言,困惑度的降低通常预示着模型具备更佳的泛化能力,而主题一致性的提升则直接指向了主题更高的精确度和预测性能。基于对原有文献的参考,本文决定采纳“主题一致性”作为衡量标尺,以此为依据来判断建模过程中的最佳主题数量。

2.2 研究思路

本文旨在通过定量与定性分析相结合的方法,对国外文献数据进行主题建模与分析。具体步骤如下:

1)利用科学引文索引官网自带的工具,对检索筛选后的文献进行处理,仅保留文献的标题与摘要部分,并以.xlsx表格的形式进行保存。

2)对收集到的文献数据进行预处理工作。在Python环境下,采用NLTK库对英文文献进行分词、去标点、去停用词等处理,确保数据的纯净度。

3)预处理完成后,利用Python中的Gensim库进行LDA主题建模。通过这一步骤,能够发现文献数据中的潜在主题结构。

4)基于最佳主题数,进一步得出了“主题—词”概率分布与“主题—文档”概率分布。

5)根据关键词以及主题文档汇总情况进行定性分析。

3 结果与讨论 3.1 模型训练

在运用主题一致性来确定最佳主题数量时,需要对模型的一些参数进行设置,经过作者的反复对比与调参,最终确定当alpha(文档—主题分布的先验)=0.1,eta(主题—词分布的先验)=0.01,random_state(文本迭代次数)=100时,进行主题建模效果最佳,具体见图3。可以看出,当主题数为6时,主题一致性数值最大,因此最佳主题数为6。

图 3 主题一致性变化情况 Fig. 3 Changes in topic coherence
3.2 主题建模结果

确定过建模的最佳主题数量之后,得出“主题—词”概率分布与“主题—文档”概率分布。前者能够获取到各主题下最具相关性的前十个关键词,并据此进一步提炼出一个主题词,具体结果详见表1。后者则能够分析出每一篇文档中不同主题的占比情况,并据此推导出各个文档的主题概率分布特征。例如,在文档1中,各主题的概率分布呈现出显著差异,其中主题3的概率高达0.919,因此可以判断文档1主要围绕主题3“水下通信与导航”展开。具体详情参见表2

表 1 “主题—词”概率分布情况 Tab.1 Topic-word probability distribution

表 2 “文档-主题”分布情况(部分) Tab.2 Document-topic distribution (partial)
3.3 主题分析

目前针对潜艇声呐的研究主要集中在声呐技术与应用、声呐与机器人技术、声呐探测系统与应用、水下通信与导航、反潜作战领域的声呐技术、声呐与人工智能6个方面。为便于分析,本文根据这六大主题,利用Python当中的pandas库,对涉及各个主题的文档进行了归类汇总、查阅了解,并选取部分文献展开陈述。

3.3.1 声呐技术与应用

该主题词所涵盖的范围相对广泛,共计有140篇论文被纳入研究范畴。这些论文的研究内容呈现多元化特点,不仅涉及声呐信号处理算法的优化与创新,还涵盖了新型声呐硬件设备的研发与设计。在技术层面,研究的核心聚焦于波束形成技术、目标检测与跟踪机制、自动目标识别系统、声呐图像处理技术、水下声学通道建模方法、阵列信号处理策略以及合成孔径声呐技术等关键领域,这些技术的进步与革新,显著提升了潜艇声呐系统在水下信息获取方面的质量与效率。此外,该主题也广泛涵盖了潜艇声呐在军事应用与民用领域中的发展动态与潜在价值,展现了其重要的战略意义与广泛的应用前景。Yu, Y.和G. A. Maykut等利用了潜艇声呐数据来研究中央北冰洋海冰厚度分布在两个时间段(1958−1970年与1993−1997年)之间的变化,并分析了可能的驱动因素[3]。G. V. Krishna Kumar 等提出了一种用于模拟海洋船只辐射噪声(RN)信号的新方法,介绍了一种基于Matlab开发的时域RN信号仿真模型,对潜艇声呐的性能评估具有重要意义[4]。Moritz B. Fricke等则探讨了在德国专属经济区内海上风电场安声呐应答器以防止潜艇碰撞的研究,为潜艇声呐系统在海上风电场区域的应用提供了理论和实验支持[5]

3.3.2 声呐与机器人技术

该主题主要聚焦于潜艇声呐系统与机器人技术之间的深度融合。首先,自主水下航行器和遥控水下航行器的技术进步是该主题一个重要内容,Whitcomb等讨论了水下机器人的导航和控制系统设计,提到了潜艇声呐系统在深海环境中的应用,用于绘制海底地形和收集数据[6],这些水下机器人被广泛用于海底测绘、水下目标探测、海洋科学研究等领域。此外,文献中讨论了自主水下航行器和遥控水下航行器的导航系统、控制算法、传感器集成等关键技术,以及如何提高它们在复杂海洋环境中的作业能力,涉及了多种潜艇声呐系统的发展和应用,包括侧扫声呐、多波束声呐、合成孔径声呐等。Hagen等描述了自主水下航行器系统在军事行动中的应用,该系统配备了侧扫声呐和合成孔径声呐,可提供高分辨率的海底图像[7],Matthews等主要讨论了合成孔径声技术在自主水下航行中的应用,特别是其在目标识别、成像性能以及模块化设计方面的优势[8],这些先进的声呐系统为海底地形测绘、水下目标识别提供了高分辨率的图像和数据。这个主题强调了跨学科技术融合的重要性,如机器人技术、声学等在潜艇声呐应用中的结合,同时也体现了水下技术面临的挑战,如恶劣环境适应性、长时间自主作业、数据处理和解释等,这些都是未来研究的重要方向。

3.3.3 声呐探测系统与应用

该主题主要关注利用潜艇声呐对海底地貌和沉积物进行高分辨率勘探与测绘。研究人员使用多波束声呐、侧扫声呐、地震反射剖面等先进设备,对海底峡谷、海底滑坡、深水通道系统、海底火山等地貌进行了详细的测绘和研究,例如Hill等利用多波束回声探测仪和侧扫声呐数据,详细研究了Murray峡谷群的海底地形特[9],通过分析峡谷的几何形态、沉积物分布和内部结构,可以重建其演化历史,为了解该区域的地质演化提供了宝贵资料。Schlüter等主要探讨了利用侧扫声呐技术和其他方法研究潜流排放及其对波罗的海沿岸水域的影响[10],声呐在获取海底地形特征、识别流体排放路径和分析坑穴形成方面发挥了关键作用。同时,Lajeunesse等讨论了通过多波束声呐获取的海底图像,以研究北美冰川退缩时期冰川湖的洪水排放及其影响[11],为了解洪水的路径和机制提供了新的证据。随着潜艇声呐技术的持续进步,未来将能够实现对海底地貌信息的高分辨率捕捉和大范围覆盖,从而显著提升对海底环境的深入理解与认识。

3.3.4 水下通信与导航

“水下通信与导航”主要关注潜艇声呐在水下通信和导航领域的应用。随着潜艇和无人水下航行器的广泛使用,如何实现水下环境下的精确导航、通信和目标探测成为一个重要研究方向。由于水下环境的恶劣,声学模拟过程通常耗时较长,因此准确的目标检测和跟踪模型变得非常必要,Ghafoor等重点讨论了声呐技术在水下目标检测和跟踪中的应用,并探讨了与水下网络相关的声学通信和模拟模型的问题[12]。同时,由于水下环境对机器人技术提出了巨大挑战,因为电磁设备在水下的使用受到限制,必须使用声呐等声学设备,Vial等提出了一种基于惯性传感器和机械探测声呐的同时定位与地图构建系统,并设计了2个主要的子系统来处理定位和建图任务[13],此外,Rahman等提出了一种新型的紧密耦合的基于关键帧的同步定位与地图构建系统,该系统集成了声呐、视觉和惯性导航数据,大大提高了自主水下航行器在复杂水下环境中的定位和导航能力[14]。这些技术的发展为水下作业、军事侦察等领域提供了重要支持。

3.3.5 反潜作战领域的声呐技术

该主题主要关注反潜作战领域的声呐技术发展与应用,具体内容主要包括:声呐系统的发展与集成、自主水下航行器在反潜作战中的应用、多静态声呐网络、声呐信号处理技术、仿真与评估、水声通信技术、环境因素研究等等。例如Rockie Ricks等讨论了在反潜战场景中,被动声呐和多站点主动声呐系统的联合使用,描述了一种将被动声呐跟踪信息用于激活多站点主动声呐系统的方法[15],以提高反潜战中的目标检测、分类、定位和跟踪能力。Chu等通过环境对声呐系统的影响、声速剖面作用、数值模型应用等多方面出发,探讨了海洋环境对潜艇声呐系统性能的影响,优化了反潜战中的声呐技术能力和系统要求[16]。总的来说,这一主题反映了反潜作战技术的快速发展,特别是在利用先进传感器、自主平台和信息融合等方面取得了显著进展。

3.3.6 声呐与人工智能

该主题主要聚焦于潜艇声呐与智能化水下航行、目标检测技术的结合与发展,其中就包括自主水下航行、遥控水下航行器等各类水下机器人的设计与应用。Dale等评估了几种经典的特征提取方法在分离目标图像和非目标图像方面的潜力,探讨了如何改进自主水下航行器收集的合成孔径雷达海底图像的自动目标检测[17]。此外,还包括水下导航与定位技术的研究,包括利用声呐、惯性导航系统、地形辅助导航等方法来实现潜艇的精确定位与导航。Li等介绍了一种用于自主水下航行器的自主游泳技术,特别是在水下结构环境中的应用重点解决了如何在车辆远离结构或标记位置时,保持导航精度的问题[18]。关于水下环境感知与建图技术,Henthorn等介绍了MBARI(蒙特利湾水族馆研究所)开发的一种深海测绘自主水下航行器系统,该系统配备了多波束声呐、侧扫声呐和亚底层剖面仪,能够生成高分辨率的海底地形图[19],这些研究表明,潜艇声呐技术与人工智能的结合正在不断革新海洋探测和研究方法。

4 结 语

本文采用了潜在狄利克雷分布模型,对国外相关权威文献进行了主题建模分析,共识别出六大主题,分别为声呐技术与应用、声呐与机器人技术、声呐探测系统与应用、水下通信与导航、反潜作战领域的声呐技术、声呐与人工智能。针对每个主题,均进行了文献汇总与解析,以期为后续研究提供坚实的理论基础和丰富的参考资料。可以明确观察到,潜艇声呐技术的未来发展呈现出显著的多元化与跨学科融合趋势,正逐步与其他多种技术实现广泛融合。然而,需要指出的是,本文的研究范围仅限于科学引文索引数据库中的文献,因此所涵盖的文献数量较为有限。未来,为了更全面深入地探讨潜艇声呐领域,可以从多个数据库中汇总更多相关文献,并考虑从中外对比的角度出发,进一步拓展和深化对该领域的探索与讨论。

参考文献
[1]
光明日报. 为潜艇声呐贡献一切[EB/OL]. [2024-08-22]. https://www.gmw.cn/01gmrb/1999-11/15/ GB/GM%5E18241%5E2%5EGM2-1504.HTM.
[2]
BLEI D M. Latent Dirichlet Allocation[J]. Journal of machine Learning research, 2003: 993−1022.
[3]
YU Y, MAYKUT G A, ROTHROCK D A. Changes in the thickness distribution of Arctic sea ice between 1958—1970 and 1993–1997[J]. Journal of Geophysical Research: Oceans, 2004: 109.
[4]
KRISHNA KUMAR G V, PADMANABAM M, SREE M B et al. Simulation of Radiated Noise signature of a marine vessel[C]//2015 IEEE Underwater Technology (UT). Chennai, India. 2015: 1−4.
[5]
FRICKE M B, ROLFES R. Investigation of sonar transponders for offshore wind farms: Modeling approach, experimental setup, and results[J]. The Journal of the Acoustical Society of America, 2013, 134(5): 3536-3545. DOI:10.1121/1.4823841
[6]
WHITCOMB L L, JAKUBA M V, KINSEY J C et al. Navigation and control of the Nereus hybrid underwater vehicle for global ocean science to 10, 903 m depth: Preliminary results[C]//2010 IEEE International Conference on Robotics and Automation. AK, USA. 2010: 594−600.
[7]
HAGEN P E, STORKERSEN N, MARTHINSEN B E et al. Military operations with HUGIN AUVs: lessons learned and the way ahead[C]//Europe Oceans 2005. Brest, France. 2005: 810−813.
[8]
MATTHEWS A D, MONTGOMERY T C, COOK D A et al. 12.75" Synthetic Aperture Sonar (SAS), High Resolution and Automatic Target Recognition[C]//OCEANS 2006. Boston, MA, USA. 2006: 1−7.
[9]
HILL P, DE DECKKER P, EXON N. Geomorphology and evolution of the gigantic Murray canyons on the Australian southern margin[J]. Australian Journal of Earth Sciences, 2005, 52(1): 117-136. DOI:10.1080/08120090500100085
[10]
SCHLÜTER M, SAUTER E J, ANDERSEN C E et al. Spatial distribution and budget for submarine groundwater discharge in Eckernförde Bay (Western Baltic Sea)[J]. Limnology and Oceanography, 2004, 49(1): 157-167. DOI:10.4319/lo.2004.49.1.0157
[11]
LAJEUNESSE P, ST-ONGE G. The subglacial origin of the Lake Agassiz–Ojibway final outburst flood[J]. Nature Geoscience, 2008, 1(3): 184-188. DOI:10.1038/ngeo130
[12]
GHAFOOR H, NOH Y. An Overview of Next-Generation Underwater Target Detection and Tracking: An Integrated Underwater Architecture[J]. IEEE Access, 2019, 7: 98841-98853. DOI:10.1109/ACCESS.2019.2929932
[13]
VIAL P, PALOMERAS N, SOLÀ J et al. Underwater Pose SLAM using GMM scan matching for a mechanical profiling sonar[J]. Journal of Field Robotics, 2024, 41(3): 511-538. DOI:10.1002/rob.22272
[14]
RAHMAN S, LI A Q, REKLEITIS I. SVIn2: An Underwater SLAM System using Sonar, Visual, Inertial, and Depth Sensor[C]//2019 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). Macau, China. 2019: 1861−1868.
[15]
RICKS R, GRIMMETT D, WAKAYAMA C. Passive acoustic tracking for cueing a multistatic active acoustic tracking system[C]//2012 Oceans - Yeosu. Yeosu, Korea (South). 2012: 1−7.
[16]
CHU P C, AMEZAGA G, GOTTSHALL E L et al. Assessment of ocean prediction model for naval operations using acoustic preset[C]//Proceedings of OCEANS 2005 MTS/IEEE. Washington, DC, USA. 2005: 986−995.
[17]
DALE J, GALUSHA A, KELLER J et al. Evaluation of image features for discriminating targets from false positives in synthetic aperture sonar imagery[C]//Detection and Sensing of Mines, Explosive Objects, and Obscured Targets XXIV 11012. Baltimore, MD, United States. 2019: 110120A
[18]
LI J H, PARK D, KI G. Autonomous swimming technology for an AUV operating in the underwater jacket structure environment[J]. International Journal of Naval Architecture and Ocean Engineering, 2019, 11(2): 679-687. DOI:10.1016/j.ijnaoe.2019.02.002
[19]
HENTHORN R, CARESS D W, THOMAS H et al. High-resolution multibeam and subbottom surveys of submarine canyons, DeepSea fan channels, and gas seeps using the MBARI mapping AUV[C]//OCEANS 2006. Boston, MA, USA. 2006: 1−6.