舰船科学技术  2024, Vol. 46 Issue (18): 159-162    DOI: 10.3404/j.issn.1672-7649.2024.18.028   PDF    
舰船通信关联信息目标数据检索方法研究
李中, 郭云丽     
江苏海事职业技术学院,江苏 南京 211170
摘要: 舰船通信系统会产生大量的通信关联信息,难以在海量的通信关联信息中,捕获舰船通信数据的关键属性,对此,提出舰船通信关联信息目标数据检索方法。通过计算舰船通信关联信息全局检索的特征量,对舰船网络数据进行聚类和信息融合,结合深度卷积神经网络和哈希学习算法构建目标数据检索模型,得到目标数据的初步检索结果。使用汉明距离计算初步检索结果的相似度,比较目标检索数据与初步检索结果的哈希码之间的汉明距离,输出与舰船通信关联信息目标数据相似度最高的检索结果,实现目标数据检索。实验验证,该方法实现的目标数据检索MAP值能够达到98%以上,实现的不同信息种类数据检索的时间消耗均能保证在在8 ms以下,能够为相关人员提供更加便捷和可靠的信息服务,为舰船管理、维护和作战决策提供有力的支持。
关键词: 舰船通信     关联信息     目标数据检索     深度卷积神经网络    
Research on target data retrieval methods for ship communication association information
LI Zhong, GUO Yunli     
Jiangsu Maritime Institute, Nanjing 211170, China
Abstract: The ship communication system generates a large amount of communication related information, making it difficult to capture the key attributes of ship communication data in a massive amount of communication related information. Therefore, a target data retrieval method for ship communication related information is proposed. By calculating the feature quantity of global retrieval of ship communication correlation information, clustering and information fusion of ship network data are carried out, and a target data retrieval model is constructed by combining deep convolutional neural networks and hash learning algorithms to obtain preliminary retrieval results of the target data. Calculate the similarity of preliminary search results using Hamming distance, compare the Hamming distance between the target search data and the hash code of the preliminary search results, output the search result with the highest similarity to the target data related to ship communication, and achieve target data retrieval. Experimental verification shows that the target data retrieval MAP value achieved by this method can reach over 98%, and the time consumption for data retrieval of different types of information can be guaranteed to be below 8 ms. It can provide more convenient and reliable information services for relevant personnel, and provide strong support for ship management, maintenance, and combat decision-making.
Key words: ship communication     related information     target data retrieval     deep convolutional neural network    
0 引 言

舰船通信关联信息是指在舰船通信过程中产生、收集或与之相关的各类信息。这些信息对于舰船的航行安全、任务执行以及舰船间的协同合作等方面都具有重要意义[1]。通过对舰船通信关联信息的目标数据进行检索,有助于提升舰船的安全性能、优化航行计划和航线选择,管理人员能够便捷地获取实时数据,进行精准分析,从而优化舰船运营和维护策略[2]。因此,对舰船的目标数据检索方法的研究已成为众多学者关注的焦点。

张昇等[3]提出了一种针对电子海图目标信息的快速检索方法。该方法利用墨卡托投影技术将电子海图进行坐标转换,进而获取其位置信息。通过对构建的索引数据结构表关键特征进行提取,利用提取的特征实现指向性索引路径的构建,最终实现对目标信息进行检索。但电子海图数据是动态变化的,检索算法的高效性和实时性结果可能会出现偏差。赵松燕等[4]提出借助MapReduce技术,构建了一个智能化的输电监测数据检索模型。该模型对传统的SimHash算法进行了优化,使得在线监测输电线路的文本数据能够迅速转化为高效的检索向量。但该方法在处理大规模数据时会遇到资源利用率低的问题,导致计算资源分散,检索结果不准确,并且大量的中间计算结果需要在不同的节点间进行传输和交换,这会导致网络带宽的占用增加,进而增加数据检索的开销。Zhang等[5]提出了一种创新的加权方法实现图像检索,首先设计了一种高效的滤波器,有效地去除背景噪声对图像内容表示的干扰,通过一种新颖的信道选择和空间加权方法,准确地识别并区分目标物体与背景噪声,进一步提升了图像内容表示的准确性和可靠性,依据一种创新的信道加权策略,抑制图像内的视觉突发性,最终实现了对目标图像信息的检索。但高效滤波器虽然在一般情况下能够有效去除背景噪声,但其效果可能受到限制,实时性和精确度会受到影响。Zhuo[6]提出了一种创新的多源大数据融合标注(MSBDFA)模型,通过分析个性化图像的相关多源信息,找到与之相似的图像,并利用这些相似图像的注释来对目标图像进行标注,采用完全信息建模方法利用高维高斯分布对图像的连续视觉特征进行精确建模,运用了两级谱聚类算法,使模型能够对图像中的不同区域主题进行精准分布,将局部信息有效地嵌入到全局特征中。通过多源大数据的融合标注,实现了目标数据的检索。但舰船通信关联信息中的目标数据具有高度的复杂性和多样性,MSBDFA模型在处理大规模数据时,计算效率和实时性可能较差。

因此,本文提出一种舰船网络数据库目标数据检索方法,通过计算关联信息的全局检索特征量,精确地捕捉舰船通信数据的关键属性和模式,实现目标数据的精确匹配。采用深度卷积神经网络和哈希学习方法构建构建舰船通信关联信息目标数据检索模型,得到舰船通信关联信息的初步检索结果。使用汉明距离计算初步检索结果的相似度,通过比较目标检索数据与初步检索结果的哈希码之间的汉明距离,输出舰船通信关联信息目标数据的检索结果,实现准确度较高、效率较快的目标数据检索。

1 舰船通信关联信息目标数据检索方法 1.1 计算舰船通信关联信息全局检索特征量

在舰船通信中,各种关联信息可能来自不同的数据源、使用不同的格式或存储在不同的位置。本文将这些信息进行有效的聚类和融合,通过计算通信关联信息的全局检索特征量,精确地捕捉舰船通信数据的关键属性和模式,实现目标数据的精确匹配。这对于从海量数据中快速筛选出特定信息至关重要,为用户提供更加全面、准确的信息支持。

首先,用$ {A_1} $$ {A_2} $表示舰船通信关联信息不同聚类属性存储位置间交集关系,$ {B_c} $$ {B_d} $分别为舰船通信关联信息检索节点、冗余节点分布的相似度,计算属性舰船通信关联信息检索节点分布的相似度信息,如下式:

$ {B_c} = 2N\left( {{A_1} \cap {A_2}} \right)/\left[ {N\left( {{A_1}} \right) + N\left( {{A_2}} \right)} \right]。$ (1)

式中:$ N\left( {{A_1}} \right) $$ N\left( {{A_2}} \right) $分别为舰船通信关联信息中的有向图$ {A_1} $$ {A_2} $的数据检索节点数量。

其次,对舰船通信关联信息检索的节点分布数据进行提取。设舰船通信关联信息矢量$ {x_n} $$ {x_{n + s}} $,计算$ t $时刻和$ t + s $时刻,舰船通信关联信息中的目标数据,如下式:

$ \begin{gathered} \xi \left( t \right) = {B_c}\left( t \right) \times {\log _2}{B_c}\left( t \right),\\ \sigma \left( {t + s} \right) = \xi \left( {{x_n}} \right) - \zeta \left( {{x_{n + s}}} \right)。\\ \end{gathered} $ (2)

式中:$ \xi \left( t \right) $$ t $时刻采集的舰船数据;$ \sigma \left( {t + s} \right) $$ t + s $时刻采集的舰船数据。

然后,设数据的多种属性$ k = ({\eta _1},{\eta _2}, \cdots ,{\eta _n}) $为舰船通信关联信息流的增益。通过特征相空间重建方法[7]对舰船通信关联信息的目标数据分布多层矢量空间特征分布进行计算,如下式:

$ \gamma \left( z \right) = \frac{{\xi \left( t \right) + \sigma \left( {t + s} \right)}}{k}。$ (3)

设舰船通信关联信息的数据时间序列为{$ h( {t_0} + i\Delta t )$},$ i = 0,1, \cdots ,N $,则重组的待检索数据项轨迹为:

$ U = \left[ {h\left( {{t_0}} \right),h\left( {{t_0} + \Delta t} \right), \cdots ,h\left( {{t_0} + \left( {Q - 1} \right)\Delta t} \right)} \right]/\gamma \left( z \right)。$ (4)

式中:$ h\left( t \right) $为搜集到的舰船通信关联信息的原始数据;$ Q $$ \Delta t $为数据嵌入维数、获取数据的时间延迟。$ {\chi _i} $$ {t_w} $$ {t_s} $$ \iota $分别为步长、等待时间、检索时间、窗口大小。最终,得到的舰船通信关联信息全局检索的特征量:

$ V = {\chi _i}{h_i}\left( {{t_w} + {t_s}} \right)\iota /U。$ (5)
1.2 构建目标数据检索模型

舰船通信关联信息全局检索特征量能够覆盖舰船通信的多个方面,可以全面描述舰船通信的行为特征,使得在检索过程中可以快速地定位到符合特定条件的关联信息,减少了在大量数据中查找目标信息的时间。本文采用深度卷积神经网络和哈希学习方法[8]构建舰船通信关联信息目标数据检索模型,将舰船通信关联信息全局特征量作为检索模型的输入,得到舰船通信关联信息的初步检索结果。该模型可以准确理解用户的查询需求,从海量的通信数据中精确地找到与之相关的目标数据。

深度卷积神经网络具有出色的特征提取能力,能够提高检索模型泛化能力。哈希算法可以将任意长度的输入数据压缩成固定长度的哈希值。通过计算哈希值之间的相似性对数据进行快速检索,减少了数据的存储空间,同时保留了数据的关键特征。结合深度卷积神经网络和哈希学习方法,构建目标数据检索模型,如图1所示。

图 1 目标数据检索模型 Fig. 1 Target data retrieval model

经过深度卷积神经网络的特征提取后,数据被传递到哈希层。在哈希层中,应用哈希算法将提取的特征数据压缩成固定长度的哈希值(即二进制哈希码)。哈希值的生成保留了数据的关键特征,同时显著减少了数据的存储空间。联立式(5),得到的二进制哈希码如下式:

$ \omega = {\rm sign}\left( {\left[ {{f_6}\left( V \right);{f_7}\left( V \right)} \right]} \right)。$ (6)

式中:$ V $为输入的特征量;$ {f_6} $$ {f_7} $为连接层输出值。将所有生成的哈希码$ \omega $存储在二进制哈希码集$ H $中,输出舰船通信关联信息目标数据的初步检索结果。

1.3 实现舰船通信关联信息目标数据检索

输出的舰船通信关联信息目标数据初步检索结果能够缩小搜索范围,提高后续检索的效率。但由于哈希编码的局限性,当舰船通信关联信息的数据量非常庞大时,初步检索结果可能包含许多与查询相关度不高的数据项,降低了检索准确性。为解决该问题,提高检索的精度,本文使用汉明距离计算初步检索结果的相似度,通过比较目标检索数据与初步检索结果的哈希码之间的汉明距离,输出舰船通信关联信息目标数据的检索结果。

汉明距离是2个等长字码对应位不同的数量。如果汉明距离较小,代表这2个哈希码越相似。

假设需要检索的目标数据为$ q $,其哈希码为$ H\left( q \right) $,以及一个初步检索结果中的数据项$ {d_r} $,根据式(6)得到该初步检索结果的哈希码为$ H({\omega }_{{d}_{r}}) $。计算$ H\left( q \right) $$ H({\omega }_{{d}_{r}}) $之间的汉明距离,如下式:

$ \begin{aligned}[b] d=&{\mathrm{XOR}}\left[H\left(q\right)_1,H({\omega }_{{d}_{r}})_1\right]+\\ &\left[H\left(q\right)_2,H({\omega }_{{d}_{r}})_2\right]+ \mathrm{...}+\left[H\left(q\right)_n,H({\omega }_{{d}_{r}})_n\right]\end{aligned}。$ (7)

式中:$ n $表示$ H\left( q \right) $$ H({\omega }_{{d}_{r}}) $在位置$ n $上的二进制位;$ {\mathrm{XOR}} $表示异或操作。

设定汉明距离的阈值为$ T(T \in \left[ {0,j} \right]) $,其中$ j $为哈希码的长度。对于初步检索结果中的每一个数据项,通过式(7)计算汉明距离。如果汉明距离小于或等于阈值$ T $,认为这2个哈希码的完全相似,则表明输出的舰船通信关联信息与需检索的信息一致,即可将该条舰船通信关联信息目标数据作为检索结果输出。

2 实验与分析

舰船通信关联信息中包含大量的数据,包括船员信息、装备数据、维护记录等。由于当前的信息检索方法的效率较低,难以快速准确地找到所需数据。因此,本研究提出舰船通信关联信息目标数据检索方法,使相关人员能够快速获取所需信息,支持舰船的日常管理。为了验证本文方法能否可以更便捷地对舰船通信关联信息进行目标数据检索,选取某舰船作为实验对象,该舰船通信关联信息中包括的数据主要为船员和人员信息、舰船装备数据、舰船维护修理记录、航行数据、环境监测和气象数据、技术文档和手册。

通过将职务和姓名作为属性,进行检索,最终能够精准地检索出相关内容,并通过可视化方式呈现,方便相关人员能够直接查看。通过使用本文方法,可以更便捷地获取到所需的舰船信息,为舰船的管理、维护和作战决策提供有力支持。

为进一步验证本文方法实现的目标数据检索的效果,引入均值平均精度(MAP)指标对数据检索效果进行评价,该值越高证明实现的目标数据检索效果更好,通过对不同的数据检索模型训练次数下的MAP值进行研究,得到的本文方法实现目标数据检索MAP具体情况如图2所示。

图 2 数据检索MAP具体情况 Fig. 2 Data retrieval MAP details

可知,在不同的训练次数下,本文方法实现的目标数据检索MAP值呈现出明显的差异,反映了训练次数对检索效果的重要影响。在训练次数达到60次时,本文方法实现的检索MAP值显著上升,在训练次数达到80次时,MAP值达到98%以上,保持了一个较高的水平。这一结果证明了本文方法的有效性,也揭示了适当的训练次数对于提升检索性能具有重要意义。由此验证本文方法能够更准确地学习数据的特征和模式,从而实现对目标数据的精确检索,对于优化舰船通信关联信息的数据检索过程具有重要的指导意义。

随机选取15条舰船通信关联信息,对本文方法实现效果进行验证,将通过本文方法实现信息检索的数量和实际信息的数量进行对比。可知,通过采用本文方法实现的数据检索具有较好效果,与实际的舰船通信关联信息中的信息数量高度一致,证明了本文方法在数据检索中的有效性,能够精准地定位和检索出所需的目标数据,从而为相关人员提供更加便捷和可靠的信息服务,为舰船管理、维护和作战决策提供有力的支持。

通过将本文方法与实现目标数据检索中常用的kNN分类算法和深度学习算法实现的目标数据检索效果进行对比,采用3种方法对不同信息种类的数据进行检索,得到的舰船通信关联信息中的目标数据检索的消耗时间情况如图3所示。

图 3 目标数据检索消耗时间情况 Fig. 3 Time consumption of target data retrieval

可知,采用3种不同方法实现的舰船通信关联信息中的目标数据检索效果存在显著的差异,其中深度学习算法和kNN分类算法在检索不同信息种类数据时,消耗的时间存在明显的不同,且时间均超过15 ms,该时间差异源于这2种方法在处理不同信息种类时的复杂性和效率问题。然而通过本文方法实现的不同信息种类数据检索的时间消耗表现出较高一致性。均能保证在在8 ms以下,充分展示了该方法的高效性和稳定性。验证了本文方法具有更广泛的应用前景,能够满足实际使用中对于检索速度的高要求。

3 结 语

本文提出一种舰船通信关联信息目标数据检索方法,通过提取舰船通信关联信息特征,哈希算法生成哈希码与数据库进行比对,实现目标数据检索,通过实验验证:

1)在训练次数达到80次时,本文方法的MAP值高达98%,检索精度较高;

2)采用本文方法的数据检索结果与实际的舰船通信关联信息数量高度一致,检索效果好;

3)采用本文方法的检索时间始终未超过10 ms,检索效率更高。

通过上述结果表明,该方法实现的目标数据检索准确度较高、效率较快,可以为舰船的管理提供了一种较好的技术手段支持。

参考文献
[1]
关欣, 国佳恩, 卢雨. 用于跨模态舰船图像检索的判别性对抗哈希变换器[J]. 电子与信息学报, 2023(12): 4411-4420. DOI:10.11999/JEIT220980
[2]
缪岚芯, 雷雨, 曾鹏鹏, 等. 基于粒度感知和语义聚合的图像-文本检索网络[J]. 计算机科学, 2022, 49(11): 134-140.
[3]
张昇, 刘春宝. 船舶电子海图目标信息快速检索方法[J]. 舰船科学技术, 2022, 44(24): 137-140.
ZHANG Sheng, LIU Chunbao. Rapid retrieval method of ship electronic chart target information[J]. Ship Science and Technology, 2022, 44(24): 137-140.
[4]
赵松燕, 曲朝阳, 郭晓利, 等. 基于Map Reduce的输电监测数据智能检索模型[J]. 电力系统保护与控制, 2023, 51(22): 177-187.
[5]
Zhang B J, Liu G H, Hu J K. Filtering deep convolutional features for image retrieval[J]. International Journal of Pattern Recognition and Artificial Intelligence, 2022, 36(1): 2252003. 1−2252003. 22.
[6]
ZHUO W , HE Z , ZHENG M, et al. Research on personalized image retrieval technology of video stream big data management model[J]. Multimedia Tools and Applications, 2022, 81(29): 191-208.
[7]
虞文波, 游进国, 牛祥虞. 基于强化学习的数据库多属性索引推荐[J]. 计算机应用研究, 2023, 40(6): 1789−1793.
[8]
杨凤丽, 李娜, 刘仁芬. 基于多级索引的高维数据近似最近邻搜索[J]. 计算机仿真, 2022, 39(11): 398-401.