在大数据技术高速发展并广泛应用的背景下,声像情报信息愈发呈现海量化和碎片化特征。在舰船领域的情报研究工作中,为能够在海量的碎片声像数据中快速准确挖掘关键信息内容,更需要一种能够智能化识别判断视频图像中舰船型号的方法。当前基于视频图像的传统舰船识别方法一般仅能够识别舰船类型,较难对舰船的具体型号做出准确判断,本研究旨在探索基于声像情报信息的舰船型号识别技术,以满足装备科技信息研究工作中的实际需求。
1 基于声像情报信息的舰船型号识别主要特征与途径在基于声像情报信息的舰船型号识别主要特征与途径的研究中,结合声像情报的信息发掘需要和各国舰船型号实体特征,从舰船涂装、舷号和轮廓形状等特征为切入点,依托颜色、OCR、非自然轮廓等识别技术途径进行分析。
1.1 舰船涂装特征的颜色识别舰船涂装作为舰船的显著外观特征,通常包含特定含义的颜色和图案,这些颜色和图案在涂装颜色识别过程中具有较高的区分度,为识别舰船国别提供了重要参考。舰船型号与其所属国家或地区密切相关,因此在确定舰船国别后,可以结合情报研究成果来推断舰船的可能型号。
由于海上环境的复杂性,如光照条件的变化、天气因素的干扰等,声像视频图像中舰船涂装的颜色在图像中可能会呈现出较大差异。为克服这上述干扰因素,研究舰船涂装特征颜色直方图分析方法,提高涂装颜色识别的准确率和稳定性。
1.2 舷号特征的OCR识别舷号作为舰船的显著标识特征,承载着丰富的信息,如舰名、国籍和型号等。因此,舷号识别作为一项关键技术,能够为确认舰船型号提供重要依据,依托相应的情报研究成果,能够实现对舰船型号较准确的分析判断。基于舰船舷号特征的OCR识别(光学字符识别)是一种集成了计算机视觉和机器学习技术的识别方法,这个过程主要包括2个步骤:第1步是对舰船舷号进行检测和定位,第2步是应用OCR技术对舷号上的字符进行识别。
由于声像视频图像中舰船舷号所处的背景复杂多变,例如海浪、光照、舷号颜色等因素都会对舷号的检测和识别带来影响,需要结合机器深度学习、卷积神经网络等,以提高舷号的检测精度。结合舷号的特殊性,可能会存在特殊字符或者符号,需要在OCR识别的基础上,进行针对性的处理和优化。
1.3 舰船非自然特征的轮廓形状识别舰船的轮廓形状是其独特的标识之一,因舰船在刚性加工过程中形成的轮廓(如直立型首、前倾型首、球鼻首等强特征轮廓)与自然造物的形态存在显著差异,针对舰船非自然特征的轮廓形状识别进行研究,将有助于进一步提升舰船型号识别的效能。在海上航行中,舰船通常经历多次加工和改装,包括增设防御措施、改变武器装备以及舰体结构改造等,上述改动使得舰船的轮廓形状产生了显著变化,结合情报研究成果,在识别过程中针对轮廓形状进行比对,能够较明显地提升识别准确度。
由于声像视频中舰船轮廓形状可能会受到环境因素和视频采集设备的影响,导致视频中轮廓特征不显著;舰船的加工和改装情况复杂,非自然特征的轮廓形状可能呈现出多样性和繁复性,需要高性能的识别模型以应对不同情况;对于具备隐身设计的舰船型号,其非自然特征的轮廓形状可能会较为弱化,增加了识别难度。为解决上述问题,结合轮廓提取、特征表示、轮廓检测等方法,实现对非自然特征的轮廓形状的准确识别。
2 主要识别方法与流程结合上述特征与途径的分析,研究针对声像情报信息的舰船型号识别方法与流程,主要包括:声像信息关键帧提取、关键帧目标检测、舰船涂装特征的颜色直方图分析、OCR检测识别、舰船非自然特征的轮廓形状分析、基于声像情报信息的舰船型号识别模型训练等。
2.1 声像信息关键帧提取在舰船型号识别研究中,首先进行声像信息的关键帧提取,此流程有助于准确捕捉舰船的特征信息,为后续的识别和分析提供具有强特征性质的数据。当前主要的关键帧提取的方法包括帧差法、光流法、SIFT算法等,综合运用上述方法能够较有效地完成关键帧提取流程。
1)帧差法
帧差法是一种简单有效的关键帧提取方法。它通过比较相邻视频帧之间的像素差异,当像素差异超过预设阈值时,将该帧视为关键帧。这种方法适用于静态背景下的目标检测,但对于动态背景或摄像机移动情况下效果较差。
2)光流法
光流法通过分析相邻视频帧之间像素的运动情况来识别关键帧。它可以有效地捕捉视频中物体的运动轨迹,对于舰船在海上的移动情况具有较好的适应性。常见的光流法包括Lucas-Kanade算法和Horn-Schunck算法等。
3)SIFT算法
SIFT算法是一种基于局部强特征的关键帧提取方法。它能够提取图像中的稳定特征点,对于图像缩放、旋转等变换具有很好的不变性。通过对声像信息的关键帧进行SIFT特征提取,可以得到稳定且具有区分性的特征点。
2.2 关键帧目标检测基于提取的关键帧信息,进行关键帧目标检测。在R-CNN和Fast R-CNN这类的方法中[1],目标检测的一阶段采用了选择性搜索作为Region Proposal的方法,此方法的精度能够达到标准,但在大数据情境下,针对海量声像情报信息的处理效率仍需要提升。本研究在Fast R-CNN方法的基础上,结合舰船的一般外形特征,在流程环节和算法上进行了优化。
1)关键帧图像特征提取
首先对关键帧图像进行卷积神经网络(CNN)的运算,通过一系列的卷积和池化过程来抽取图像的特征。利用预训练的深度学习模型(如VGG、ResNet等)作为基础网络,用于执行特征提取的任务。
2)目标区域筛选
RPN(Region Proposal Network)是执行目标筛选的核心组件,负责创建候选目标区域。该组件在特征图上采用滑动窗口的策略,为每个位置产生多种不同大小和形状的候选目标框。通过对这些候选框进行分类和回归操作,选出可能的目标区域。
3)统一特征图区域
在RPN产生的候选目标区域的基础上,使用当前较主流的RoI池化方法将这些区域转化为固定尺寸的特征图,以便进行后续的目标分类和回归处理。
4)目标分类和回归处理
将RoI池化后得到的统一特征图输入到分类器和回归器,一般情况采用Softmax分类器识别目标的类别,回归器则负责精确的定位目标框的位置,并使用边界框回归器来调整和优化目标框的位置。
这种方法能够采取端对端的训练模式,优化了复杂的手动特征提取过程,从而使模型具有更强的泛化能力。采用RPN作为目标区域的筛选组件,可以有效地减少候选框的数量,从而提高检测效率。结合大数据下的海量声像情报资源进行预训练,进一步提升模型的性能。这种方法能够实现舰船图像目标的自动检测和定位,为后续的舰船型号识别工作提供支持。
为了提升模型对于舰船上小目标特征检测的精准度,在RPN中引入了锚框辅助策略(锚框:一种各尺寸检测框模板,其中心均相同)。该策略包括输入层、单一中间层和输出层。输入层是N×N窗口大小的卷积特征层,中间层是一个256维的低维向量,通过输入层降维(1×1卷积)得到。输出层对每个窗口分为两部分:1)分类模块,输出背景和前景的Softmax概率;2)回归模块,输出描述检测框(在原始关键帧上)的4个参数。不同的模板适用于不同尺度和长宽比的目标,这种辅助策略在确保准确性的同时,也进一步节约了计算时间。
2.3 舰船涂装特征颜色直方图分析在完成目标检测后,聚焦目标信息可以进行舰船涂装特征颜色直方图分析。颜色直方图是被广泛采用的颜色特征表示方法,其描述的是各颜色在整幅图像中所占的比例,可忽略各颜色所处的空间位置,适于描述如舰船涂装类型的与环境融合的色彩信息其基本步骤包括色彩模型转换、特征颜色提取、直方图构建以及颜色直方图匹配等。
1)色彩模型转换
在实际操作中,一般需要将RGB色彩模型转化为HSV色彩模型。RGB模型是一种光谱模型,它将红、绿、蓝3种颜色以不同的比例混合,可以生成丰富的颜色。但是,RGB模型对光照变化敏感,因此不适合进行颜色特征的提取。相比之下,HSV模型将色彩与亮度分离,使色彩对亮度变化的影响降至最低。在HSV模型中,H代表色调,S代表饱和度,V代表亮度。这种模型可以只关注色彩信息,而忽略亮度的变化。
2)特征颜色提取
由于舰船类的声像信息一般处于亮度相对一致的海洋背景中,因此在HSV色彩空间中,色彩主要分布在色调H和饱和度S两个通道。亮度V通道的影响相对较小,可以忽略。在H和S通道中,可以通过构建二维直方图来提取特征颜色。二维直方图的横轴代表色调,纵轴代表饱和度,声像关键帧中的每个区间都代表一种特定的颜色,区间的面积代表该颜色的分布比例。
3)直方图构建
直方图是一种统计图表,展示色彩空间中颜色的分布情况。在构建直方图时,计算每个颜色区间的像素数量,然后将这个数量转化为分布比例。直方图的大小和形状可以反映出舰船涂装的特征颜色分布特性。
4)颜色直方图匹配
颜色直方图匹配通常采用卡方距离、Bhattacharyya距离等度量方法,基于情报研究成果,比较待分类舰船涂装与已知类别舰船涂装的颜色直方图的差异。如果差异小,则可以认为与被比照模型属于同一类别;如果差异大,则认为与被比照模型属于不同类别。
2.4 OCR检测识别针对具备舰船舷号的声像信息内容,可以进行OCR检测识别。主要方法和流程包括:字符区域检测、字符区域分割、文字识别、后处理等。
1)字符区域检测
通过字符区域检测算法,识别判断关键帧中包含文字的区域。常见的字符区域检测方法包括基于边缘检测、候选区域生成、区域筛选、文字方向检测等。对于舰船图像,通常舷号等文字信息位于特定的位置,因此可以根据这些先验知识对字符区域进行限定和筛选。
边缘检测:通过边缘检测算法,可以找到图像中明显的边缘信息,有助于标记出潜在的文字区域。在本研究中,一般使用Canny边缘检测算法,通过检测图像中像素值的梯度变化,找到图像中的边缘。
候选区域生成:在边缘检测基础上,生成候选字符区域。一般复用关键帧目标检测的方法,在图像上滑动固定尺寸的窗口,并对窗口内的区域进行分类判断,判断该区域是否可能是文字区域。
区域筛选:在生成候选区域后,对区域内进行筛选和优化,去除非文字区域。例如,通过比对像素特征去除过小或过大的区域,并对不符合字符形态特征的区域进行过滤。
字符方向检测:对于关键帧中的舰船舷号字符区域,可能存在不同的字符方向,例如水平、垂直、倾斜等。一般采用倾斜图像快速检测和校正的方法[2],将文字区域统一为相同的方向,方便后续文字识别的处理。
2)字符区域分割
在字符区域检测之后,对检测到的字符区域进行分割,将文字和背景分离。因为关键帧中的舷号等字符可能存在不同的颜色、字体和尺寸,主要方法和流程包括:边界框定位、字符区域二值化、连接组件分析等。
边界框定位:在字符区域检测的结果中,每个检测到的字符区域通常用边界框表示,边界框包含了字符区域的位置和大小信息。根据边界框的位置信息,从原始图像中截取出对应的区域图像。
字符区域二值化:将字符部分置为白色,背景部分置为黑色。有助于进一步突出文字的特征,为后续文字识别提供更好的输入。
连接组件分析:在二值化后的区域图像中,可能存在多个连接的字符区域组件。连接组件分析技术可以将这些组件分离,得到独立的字符区,避免将多个字符区域错误地合并成一个。
3)字符识别
在字符区域分割后,利用OCR技术对分割得到的文字区域进行识别。本研究引入基于深度学习的OCR方法[3],通过深度神经网络自动学习特征,基于卷积神经网络(CNN)和循环神经网络(RNN)的方法,提高字符识别的准确率和鲁棒性。
4)后处理
在字符识别后,结合情报研究成果进行复核校验,包括错误校正和结果整合等。基于各国海军舰艇命名规则等研究成果[4],能够较大幅度提升舰船型号识别准确率。
2.5 舰船非自然特征的轮廓形状分析本文研究基于Snake轮廓检测法[5]完成关键帧分割,提取的形状轮廓特征。Snakes方法通过目标的控制点坐标相连形成的轮廓线,经过轮廓提取、轮廓特征表示、非自然特征检测等环节,结合情报研究成果的舰船型号数据,完成识别流程。
1)轮廓提取
结合舰船外观轮廓可能出现的复杂元素遮挡的特征性质,基于Snake轮廓检测法,能够提升舰船轮廓形状分析的准确性。不同于Canny边缘检测算法,Snake轮廓检测法能够较有效地解决不连续、不光滑边缘的识别问题。
在提取的关键帧中选取部分像素点作为初始轮廓的位置,一般固定在舰船外形轮廓的锐角顶点,如舰艏、舰桥顶端等。基于Snake轮廓在关键帧中运动,能量函数由内部能量和外部能量两部分组成:内部能量保持轮廓的平滑和连续,外部能量吸引轮廓边缘,使其与舰船的轮廓边界吻合。表示为
$ E_{\rm{snake}}=\int_{ }^{ }\left(E_{\rm{int}}\left(v\left(s\right)\right)+E_{\rm{image}}\left(v\left(s\right)\right)\right)\rm{d}s\text{。} $ | (1) |
其中,设
$ E_{\rm{int}}=\sum \mathrm{\alpha }|v_{\rm{i}}+1-v_{\rm{i}}|+\mathrm{\beta }|v_{\rm{i}}+1-2v_{\rm{i}}+v_{\rm{i}}-1|^2 \text{,}$ | (2) |
设
$ \begin{split} E_{\rm{image}}=\,& {I}({x},{y})+(-|\nabla{I}({x},{y})|^2)+\\ & \frac{{C}{y}{y}{{C}}_{{x}}^{2}-2{C}{x}{y}{C}{x}{C}{y}+{C}{x}{x}{{C}}_{{y}}^{2}}{{({{C}}_{{x}}^{2}+{{C}}_{{y}}^{2})}^{3/2}} \text{。} \end{split} $ | (3) |
最终得到舰船的精确轮廓,一般此流程后需要提取轮廓的特征表示,为舰船型号识别和分析提供数据基础。
2)轮廓特征表示
基于轮廓提取的信息对轮廓进行特征表示,将轮廓的形状信息转换为数值形式,为后续的比较和分析。本文引入形状上下文描述子、傅里叶描述子、Zernike多项式算法等。这些特征表示方法均可以有效地描述轮廓的形状特征,为后续的型号识别提供关键依据。
3)非自然特征检测
基于轮廓特征的表示数据,检测并分析舰船的非自然特征。这些非自然特征可能表现为凸凹变化、尺寸扩张或收缩、边缘形态变化等。通过比对舰船的非自然特征与已有的情报研究成果,可以判断舰船可能的型号。结合舰船涂装特征颜色直方图分析和OCR检测识别的方法与流程,经综合判断,能够较准确地识别舰船型号。
2.6 基于声像情报信息的舰船型号识别模型训练本文研究的识别模型训练基于Fast R-CNN方法,在此基础上进行优化提升。在原有模型的基础上,对二阶段的分类预测模块进行强化。将中间域的特征输入到全连接层进行训练,生成无标签数据的伪标签,这些伪标签模拟出近似真实的标签,取代实际标签用于模型训练,最终得到识别模型。
设源域中的一个批次关键帧经一阶段RPN后得到的候选框为
$ {{L}}_{\rm{classification}}=\left\{\begin{aligned} & {\lambda }\cdot {l}({\widehat{{x}}}_{{k}},{{x}}_{{k}})+{l}({\stackrel{~}{{x}}}_{{k}},{{x}}_{{k}})\text{,domain}={S}\text{,}\\ & {l}({\stackrel{~}{{z}}}_{{m}},{\widehat{{z}}}_{{m}})\text{,domain}={T}\text{。}\end{aligned}\right. $ | (4) |
其中:
$ {\stackrel{~}{{z}}}_{{m}}={{f}}_{\text{NN}2}\left({{f}}_{{r}}\right({{P}}_{{m}}^{{T}}\left)\right)\text{。} $ | (5) |
式中,
给定
对提出的基于声像情报信息的舰船型号识别方法有效性进行验证。
3.1 实验条件与方法按舰船类型合计筛选4型典型舰船型号(见表1),在各型舰船中随机选择相关的25条声像情报信息,合计样本数量100条。采用本文的识别方法,进行全部随机乱序识别,且每条信息仅识别一次,统计识别结果的正确率。
考虑到本文研究的训练集属于舰船领域的特种数据集,其特征属于分布极其相近的对象,要根据舰船细节来判断其类别和位置。对于同源的不同声像关键帧,假设其分布为一定程度的随机分布;对比不同源的不同关键帧,则认为其分布与另一个源的随机分布存在较大差距。基于上述的前提条件,能够忽略声像信息关联或相似影响,可以认为实验结论具备普遍性。
3.2 结果及分析分别统计各型舰船的识别情况,记录正确识别舰船型号数量,计算识别正确率。根据统计结果,“美国”级两栖攻击舰识别正确率最低,为76%。分析可能是因两栖攻击舰的舰岛和飞行甲板的结构特征(该特征为显性的强特征),与航空母舰有一定相似性,影响了识别结果的准确率。
综合上述实验结果,采用本文方法进行基于声像情报信息的舰船型号识别,平均识别正确率为81%,正确率较高,一定程度上验证了此方法的有效性,说明此方法具备一定的应用价值。考虑到一些潜在的影响因素,如舰船型号的选择以及样本数量的设定可能对识别准确率产生影响。不同类型的舰船可能在声像画面特征上存在差异,因此在进一步研究中,可以对不同类型的舰船型号进行更细致的比较,以评估其对识别性能的影响。
4 结 语本文研究的基于声像情报信息的舰船型号识别方法,具有较高的识别准确度。通过融合多源情报信息,识别结果的可靠性得到了进一步提升。此种舰船型号识别方法在实战化运用、情报研究等领域具备较好的应用潜力,能够作为舰上目标识别的辅助支撑手段,也能够作为科技情报工作的高效能辅助分析工具。在后续研究中,可以对提升识别准确率和效率进行更深入的探索。
[1] |
杨龙, 苏娟, 黄华, 等. 一种基于深层次多尺度特征融合CNN的SAR图像舰船目标检测算法[J]. 光学学报, 2020, 40(2): 132-140. |
[2] |
冯雷, 耿英楠. 基于hough变换的倾斜文档图像快速校正[J]. 内蒙古师范大学学报(自然科学汉文版), 2017, 46(2): 219-222. |
[3] |
赵巍. 基于人工智能技术的图像文字识别程序开发与设计[J]. 电脑编程技巧与维护, 2023(4): 125-126+161. DOI:10.3969/j.issn.1006-4052.2023.04.039 |
[4] |
薛亮, 周游. 基于知识图谱的舰船信息分析识别技术研究[J]. 舰船电子工程, 2021, 41(10): 48-51+145. DOI:10.3969/j.issn.1672-9730.2021.10.011 |
[5] |
张建丰. 基于视差信息的多重运动图像轮廓提取仿真[J]. 计算机仿真, 2020, 37(9): 214-217. DOI:10.3969/j.issn.1006-9348.2020.09.044 |