舰船科学技术  2023, Vol. 45 Issue (16): 149-152    DOI: 10.3404/j.issn.1672-7649.2023.16.031   PDF    
基于多媒体网络的舰船图像定位自动匹配系统设计
吴正英     
厦门海洋职业技术学院,福建 厦门 361102
摘要: 为了更好地实现船舶的安全航行,基于多媒体网络技术的优越性,本文构建基于多媒体网络技术的舰船图像定位自动匹配系统,并对整个系统的关键技术和系统性能进行研究,该系统能够实时处理、传输大量的多媒体数据,通过SIFT图像匹配算法,可以实现舰船图像定位的自动匹配。实验结果表明,系统性能良好,匹配平均时间为5.23 ms,匹配的成功率可以达到90%,为舰船的安全航行提供了可靠的保障。
关键词: 船舶定位     多媒体网络     自动匹配     图像处理    
Design of ship image location automatic matching system based on multimedia network
WU Zheng-ying     
Xiamen Ocean Vocational College, Xiamen 361102 , China
Abstract: In order to realize the safe navigation of ships, based on the superiority of multimedia network technology, this paper constructs an automatic matching system of ship image location based on multimedia network technology, the system can process and transmit a large amount of multimedia data in real time, and the SIFT image matching algorithm is used to solve this problem, the automatic matching of ship image location can be realized. The experimental results show that the system has good performance, the average matching time is 5.23 ms, and the matching success rate can reach 90%.
Key words: ship positioning     multimedia network     automatic match     image processing    
0 引 言

为了对航行安全性提供保障,需要对船舶进行实时定位、跟踪,以便实时掌握船舶航行状态,同时,在海上发生航行事故时,相关部门能够在第一时间收到相关事故信息并及时进行相应处理。

目前,船舶定位主要依靠卫星定位系统,比如美国的GPS(Global Positioning System),中国“北斗”系统,结合电子海图显示与信息系统(Electronic Chart Display and Information System)和船舶自动识别系统(Automatic Identification System)对船舶进行定位、追踪。

国内外对船舶定位都进行了较多研究,李阳[1]设计了基于北斗三号的船舶定位系统,定位精度可达4 m以内;范晓锋等[2]对基于智能自组网的船舶定位以及身份识别进行研究;陈宇[3]研究了物联网结构优化下的多源定位方法。本文基于多媒体网络技术,提出一种通过图像自动匹配定位的系统,能够实时、快速地处理信息,对船舶的安全航行提供了可靠的保障。

1 多媒体网络技术 1.1 多媒体网络的组成

多媒体采用的是数字信号,可以综合处理图片、视频等多种信息,数据形式比较丰富;多媒体提供了易操作并十分友好的界面,更加直观、便利地实现人机交互。同时,多媒体可以很方便地与各种外部设备实现连接,可以实现数据交换、监视控制等各种功能。由于具备这些显著优点,多媒体网络技术已经广泛地应用于生产、教学等多个领域。多媒体网络的主要构成和工作原理如图1所示。

数据采集模块完成对所需图像、文字等各种信息的采集,经过数模转换得到大量的数字信号,经过压缩处理,去除冗余信息,再对图像、视频进行增强等处理,传输至终端显示器及控制台,控制台也会根据用户需求对所需信息进行设定、筛选,再将指令发送给信息处理模块(图1中虚线部分)。终端显示器可以是多个用户,每个用户都可以对所生成的信息进行挑选。

图 1 多媒体网络组成及工作原理示意图 Fig. 1 Multimedia network composition and working principle schematic diagram
1.2 多媒体网络中的关键技术 1.2.1 文件压缩

文件压缩是指处理掉数据中的冗余部分,而保留确定需要或有关的信息,去掉不需要或无关的信息,这里的冗余主要包括空间冗余、时间冗余、结构冗余、视觉冗余等。

文件压缩编码的方法按原始数据是否有损失可分为有失真编码和无失真编码,按编码原理分为预测编码、变化编码、统计编码等。

预测编码是根据已经编码重建后的像素值预测待编码的像素值,对原始值和预测值的差值进行编码,预测编码可以分为差分脉冲编码调制(Differential Pulse Code Modulation,DPCM)和自适应差分脉冲编码调制(Adaptive Pulse Code Modulation,ADPCM),其原理图如图2所示。

变换编码在编码时,原始数据要从初始空间或时间域经过变化后变为一个更适于压缩的抽象域,目前最常用的是离散余弦变换。

图 2 预测编码工作原理 Fig. 2 Working principle of predictive coding

统计编码中常用的是霍夫曼编码,原理是统计不同信息出现的频率,对于出现次数多的信息,可以使用长度较短的编码,而对次数少的信息,则用较长的编码,这样可以提高编码效率,提高编码的有效性。

1.2.2 图像处理及图像分割

图像处理的目的是为了提取图像中重点信息,或者是去除无关信息。灰度直方图是用来反映图像中各个灰度值出现的概率,同时也统计了图像中具有某个特定灰度值的像素点的个数。另外,还可以对直方图进行强化,统计原始图像的直方图 $ {p_r}\left( {{r_k}} \right) = \dfrac{{{n_k}}}{n} $ $ {r_k} $ 是归一化的输入图像灰度级,同时计算出直方图累积分布函数:

$ {s_k} = T\left( {{r_k}} \right) = \sum\limits_{j = 0}^k {{p_r}\left( {{r_j}} \right)} = \sum\limits_{j = 0}^k {\frac{{{n_j}}}{n}} 。$ (1)

中值滤波是一种对图形进行非线性处理的平滑方法,方法是先确定一个含有奇数点的窗口 $ W $ ,在图像上移动这个窗口,把这个窗口 $ W $ 所包含的像素点的灰度值按一定顺序排列,则该点的灰度值可以用位于中间的灰度值代替。

图像锐化可以加重目标轮廓,使图像变得更清晰,单方向的一阶锐化是对某个特定方向上的边缘信息进行增强,以水平方向的一阶锐化为例,如图3所示。

图 3 水平方向的一阶锐化 Fig. 3 First-order sharpening in the horizontal direction

图像分割是图像识别和图像理解的基础,也是本文实现自动匹配的基础,是基于目标或区域的特征进行的,把图像分割成互不交叠的有意义区域,便于进一步分析,分开的区域一般是图像中用户感兴趣的部分,流程如图4所示。

图 4 图像分割流程 Fig. 4 Process of image segmentation

图像分割是基于图像亮度值的不连续性和相似性2个特征,常用的方法灰度阈值分割法、自适应阈值分割法、边缘检测和区域生长法。

假设图像为 $ f\left( {x,y} \right) $ ,其灰度值范围是[0,L],在0和L之间选择一个合适的灰度阈值 $ T $ ,灰度阈值分割法则表示为:

$ g\left( {x,y} \right) = \left\{ \begin{gathered} 1,f\left( {x,y} \right) \geqslant T,\\ 0,f\left( {x,y} \right) < T。\\ \end{gathered} \right. $ (2)

在有突发噪声或背景灰度变化较大时可以用自适应阈值分割法,这个算法的缺点比较复杂,但其抗噪声能力较强。在实际应用时,需要根据具体情况选择合适的方法和阈值。

图像的边缘检测是利用各种算子以及高通滤波处理方法对图像边缘进行增强。一阶算子主要有Roberts算子、Prewitt算子和Sobel算子,相对来说,Sobel算子的检测效果最好。

区域生长的原理是把具有相似性质的像素点集合成一个区域,把其中某一个种子像素作为生长的起点,将种子像素附近范围内与这个种子相似的像素合并到其所在的区域中,再将这个区域作为新的种子像素重复上述过程,直到没有符合条件的像素出现。

1.2.3 时延抖动消除及数据恢复

信息在离开发送端时,是按照一定的间隔均匀传输的,但在通过网络时,间隔会因不同原因而改变,从而产生时延抖动,在接收端间隔就会发生变化,如图5(a)所示。主要原因是网络路由状态频繁变化,网络节点流量拥堵,信息在各个节点缓存时间过长。

图 5 时延抖动及消除 Fig. 5 Delay jitter and elimination

为了消除时延抖动,在接收端增加一个缓存,当缓存中储存了一定数量的分组后,以固定速度按照顺序读出分组并进行还原。缓存其实是一个遵循先进先出规则的栈,图5(b)中的T表示播放延时。

在上述的信息传输过程中,可能会发生分组丢失,数据的丢失直接影响到接收端的多媒体文件,虽然(Transmission Control Protocol,TCP)可以有效解决分组问题,但同时会带来更大的时延抖动。因此,在多媒体数据传输过程中常使用前向纠错或数据恢复等技术来重获丢失的分组,或采用交织技术来减少丢失分组对多媒体质量的影响[4]

2 舰船图像定位自动匹配系统 2.1 定位系统组成和工作原理

本文基于多媒体网络技术,构建了舰船图像定位自动匹配系统,如图6所示。

图 6 基于多媒体网络技术的舰船图像定位系统 Fig. 6 Ship image positioning system based on multimedia network technology

摄像机实时获取静态、动态信息传输至多媒体网络模块,多媒体网络模块根据前文描述的原理对数据进行处理,用户可以根据终端显示器和控制系统接收到的处理后的多媒体数据进行查询访问,并可以根据需求对数据进行筛选,同时,有关部门也可以对航行中的舰船进行必要的实时监控[5-6]

摄像机获取的信息融合其他来源的信息,如卫星定位数据、AIS数据等,通过自动匹配算法对船舶进行定位,定位的信息也会实时传输至终端显示器和控制系统。整个系统需要对大量的多媒体数据进行实时处理、传输,以保证舰船的安全航行。

2.2 舰船运动方程

本文建立的运动方程的坐标系是以舰船重心为原点,并且固定在 $ E\xi \eta $ 平面上,假设舰船的运动速度为 $ {U_S} $ ,船角速度为 $ {\Omega _S} $ $ \chi $ 为潜浮角, $ \gamma $ 为航迹角, $ \alpha $ $ \beta $ 为水动角。舰船质量为 $ m $ ,受到的合力 $ F $ 在坐标系上的分量为 $ {F_\xi } $ $ {F_\eta } $ ,受到的转矩在坐标系上的分量为 $ {T_{\xi G}} $ ,转动惯量为 $ {J_{ZG}} $ ,则有:

$ {F_S} = \left( \begin{gathered} {F_\xi } \\ {F_\eta } \\ {\text{ }}0 \\ \end{gathered} \right) , {T_S} = \left( \begin{gathered} {\text{ }}0 \\ {\text{ }}0 \\ {T_{\xi G}} \\ \end{gathered} \right) 。$ (3)
$ F = \left( \begin{gathered} {X_{\sum {} }} \\ {Y_{\sum {} }} \\ {\text{ }}0 \\ \end{gathered} \right) , T = \left( \begin{gathered} {\text{ }}0 \\ {\text{ }}0 \\ {N_{G\sum {} }} \\ \end{gathered} \right) 。$ (4)

根据牛顿定律可得:

$ \left\{ \begin{gathered} {F_\xi } = m{{\ddot \xi }_G},\\ {F_\eta } = m{{\ddot \eta }_G},\\ {F_{\xi G}} = J_{ZG}^{}\ddot \psi。\\ \end{gathered} \right. $ (5)

由运动坐标系可知:

$ \left\{ \begin{gathered} {F_\xi } = {X_{\sum {} }}\cos \psi - {Y_{\sum {} }}\sin \psi,\\ {F_\eta } = {X_{\sum {} }}\sin \psi + {Y_{\sum {} }}\cos \psi,\\ {{\dot \xi }_G} = {u_G}\cos \psi - {v_G}\sin \psi,\\ {{\dot \eta }_G} = {u_G}\sin \psi + {v_G}\cos \psi 。\\ \end{gathered} \right. $ (6)

对式(5)进行求导,并将求导的结果和式(5)一起代入式(4)中前2个算式,根据 $ {T_{\xi G}} = {N_{G\sum {} }} $ $ r = \dot \psi $ ,可以得到运动坐标系原点位于舰船重心的运动方程:

$ \left\{ \begin{gathered} {X_{\sum {} }} = m\left( {{{\dot u}_G} - {v_G}\dot \psi } \right),\\ {Y_{\sum {} }} = m\left( {{{\dot v}_G} + {u_G}\dot \psi } \right),\\ {J_{ZG}}\dot r = {N_{G\sum {} }} 。\\ \end{gathered} \right. $ (7)
2.3 图像匹配

采用尺度不变特征变换算法(Scale-invariant Feature Transform,SIFT)对图像进行匹配,SIFT具有良好的稳定性和不变形、区分性好、高速性以及可扩展性。SIFT算法实现特征匹配可以分为提取关键点、定位关键点并确定特征方向、通过各关键点的特征向量三步来完成。

$ L\left( {x,y,\sigma } \right) $ 定义为原始图像 $ I\left( {x,y} \right) $ 与一个可变尺度的二位高斯函数 $ G\left( {x,y,\sigma } \right) $ 的卷积运算为:

$ L\left( {x,y,\sigma } \right) = G\left( {x,y,\sigma } \right) \cdot I\left( {x,y} \right) \text{,} $ (8)
$ G\left( {{x_i},{y_i},\sigma } \right) = \frac{1}{{2{\text π} {\sigma ^2}}}\exp \left( { - \frac{{{{\left( {x - {x_i}} \right)}^2} + {{\left( {y - {y_i}} \right)}^2}}}{{2{\sigma ^2}}}} \right) 。$ (9)

式中: $ \left( {x,y} \right) $ 为图像的像素位置, $ \sigma $ 为尺度空间因子。

2.4 实验结果

基于多媒体网络技术的舰船图像定位自动匹配系统,对自动匹配的时间和成功率进行实验研究,实验结果如图7所示。

图 7 自动匹配时间和成功率实验结果 Fig. 7 Automatically match time and success rate experiment results

可以看出,基于多媒体网络技术的舰船图像定位自动匹配系统能够实现舰船图像定位的自动匹配,匹配平均时间为5.23 ms,匹配的成功率可以达到90%。

3 结 语

基于多媒体网络技术的舰船图像定位自动匹配系统,能够实时处理、传输大量的多媒体数据,通过SIFT图像匹配算法,可以实现舰船图像定位的自动匹配。实验证明,系统性能良好,为舰船的安全航行提供了可靠的保障。在后续研究中,可以对图像匹配算法进行优化,进一步提高系统性能。

参考文献
[1]
李阳. 基于北斗三号星基增强系统的船舶定位应用研究[J]. 天津航海, 2023(1): 68-71.
[2]
范晓锋, 刘维超, 刘鹏辉, 等. 基于智能自组网的船舶定位和身份识别应用研究[J]. 中国水运(下半月), 2014(4): 67-69.
[3]
陈宇. 物联网结构优化的舰船监控中心多源定位方法[J]. 舰船科学技术, 2020, 42(24): 181-183.
[4]
林利祥, 刘旭东, 刘少腾, 等. 前向纠错编码在网络传输协议中的应用综述[J]. 计算机科学, 2022, 49(2): 292-303.
[5]
赵桂梅. 船舶航迹/航向控制系统仿真建模[D]. 哈尔滨: 哈尔滨工程大学, 2011.
[6]
陈建新, 唐丽玉. 一种SIFT-FREAK图像匹配算法[J]. 测绘与空间地理信息, 2023, 46(6): 32-35.