舰船科学技术  2022, Vol. 44 Issue (10): 151-154    DOI: 10.3404/j.issn.1672-7649.2022.10.032   PDF    
基于数据挖掘的船舶航迹自动识别系统
常青丽     
浙江交通职业技术学院 海运学院,浙江 杭州 311112
摘要: 以充分掌握船舶航行动态为目的,设计基于数据挖掘的船舶航迹自动识别系统。该系统使用跟踪监控单元内的海事雷达和船载单片机监控终端获取船舶航行数据后,利用无线通信单元内的无线传感器、网络协调器等设备将船舶航行数据发送至数据存储与集成单元;利用该单元对船舶航行数据进行打包分发、在线压缩和存储等处理。航迹识别单元从数据存储与集成单元内调取压缩存储的船舶航行数据,并对其进行区域航迹提取、坐标转换和时间校准后,再利用基于数据挖掘的轨迹融合方法完成其航迹识别,然后将识别结果发送至展示单元呈现给用户。实验结果表明:该系统在应用过程中其运行稳定性接近99.5%,并且具备良好的通信传输能力;也可在船舶航迹复杂交错和存在其他船舶干扰情况下有效识别目标船舶航迹,应用效果显著。
关键词: 数据挖掘     船舶航迹     识别系统     数据融合     坐标转换     监控单元    
Design of ship track automatic identification system based on data mining
CHANG Qing-li     
Zhejiang Institute of Communication, Marine Department, Hangzhou 311112, China
Abstract: In order to fully grasp the ship navigation dynamics, an automatic ship track identification system based on data mining is designed. The system uses the maritime radar in the tracking and monitoring unit and the ship borne single chip microcomputer monitoring terminal to obtain the ship navigation data, and then uses the wireless sensor, network coordinator and other equipment in the wireless communication unit to send the ship navigation data to the data storage and integration unit. The shipping data is compressed, packaged and distributed online by the unit. The track identification unit retrieves the compressed and stored ship navigation data from the data storage and integration unit, extracts the regional track, coordinates conversion and time calibration, and then completes its track identification by using the track fusion method based on data mining, and then presents the identification results to the user. The experimental results show that the program stability of the system is close to 99.5% and has good communication transmission ability. It can also effectively identify the target ship track in the case of complex and staggered ship tracks and other ship interference, and the application effect is remarkable.
Key words: data mining     ship track     identification system     data fusion     coordinate conversion     monitoring unit    
0 引 言

船舶在航行过程中如若遇到恶劣天气、复杂水文状况时,对船舶安全航行带来了一定风险[1-2],因此对船舶航迹识别是海事监管的重中之重。如王颢程等[3]按照船舶在河道内的运动模式使用标签矩阵方式对其运动模式进行划分后,从时间和空间2个角度的数据入手,提取其轨迹特征点再使用分类算法实现其航迹识别。刘文等[4]则利用AIS获取船舶航行数据后,对该数据进行去噪重构实现其航迹识别。虽然上述2种航迹识别系统均可达到航迹识别目的,但受船舶航行产生的数据量较大影响,二者在应用过程中耗费时间较长,致使其应用效果不佳。

面对海量的船舶航行大数据,使用数据挖掘技术获取大数据内可用数据,去除内部冗余数据尤为必要[5],受其应用环境影响可选择不同的方法实现在海量数据内获取有用数据的目的。鉴于海量船舶航行数据和数据挖掘技术,本文设计基于数据挖掘的船舶航迹自动识别系统,为海事监管提供有效的管理手段。

1 基于数据挖掘的船舶航迹自动识别系统 1.1 系统整体结构

以C/S架构为基础,设计船舶航迹自动识别系统。该系统由跟踪监控单元、无线通信单元、航迹识别单元等组成,其利用跟踪监控单元内船载单片机监控终端和海事雷达与地面站连接获取当前船舶航行相关数据后,经由路由器和网络协调器被传输到数据存储于集成单元内。数据存储与集成单元对船舶航行数据进行打包、分发、在线压缩和数据存储。轨迹识别单元调取数据存储与集成单元内的船舶航行数据后,对该数据进行区域航迹提取、坐标转换和时间校准后,使用基于数据挖掘的轨迹融合算法实现船舶航迹自动识别后,将识别结果发送到展示单元内。展示单元利用Web展示、动态回放和历史轨迹查询为用户呈现船舶航迹识别结果。

1.2 海事雷达架设

海事雷达是安装在船舶上,负责对船舶航行定位、引航等,其是获取船舶航行数据的基础设备[6]。将海事雷达安装在船舶上后,地面站内的机柜与若干个应用程序接口相连,负责为地面站工作人员提供船舶雷达信息。船舶上的雷达站使用供电模块为其供电,并利用应用程序接口与地面站的机柜相连,并利用船舶控制中心控制雷达信号处理板、船舶航行视频监控、船舶引航和通信传输功能。

1.3 船载单片机监控终端设计

船载单片机监控终端是数据收发和卫星定位的集成设备,其在船舶上主要负责航行状态告警、提供当前船舶航行经纬度信息、向地面站请求收发数据等。在此选择型号为GPS/CDMA 1X的船载终端作为本文系统单片机监控终端设备,单片机选择型号为MSP430F149,该单片机指令周期为40 ns,数据宽度可达16位。且该单片机在运行过程中电压仅为1.8~3.6 V,运行功耗极低[7],拥有若干通用I/O接口,可与USB等外接设备相连。以MSP430F149型单片机为基础,设计船载单片机监控终端。在船载单片机监控终端硬件结构内,利用CC2533单片机连接USB摄像头,利用该摄像头监控船舶航行画面,然后从GPS获取船舶导航数据后对其进行数据闪存和懂得随机存取等处理。CC2533单片机控制局域网处理芯片与无线通信网络连接,依据数据发送协议和异步收发通信串口,将船舶航行视频信息传输到地面站。

1.4 网络协调器设计

网络协调器是实现船舶与地面无线通信传输的重要硬件,网络协调器是无线通信的核心,其结构对通信传输的吞吐率和数据处理能力均有较大的影响[8-9],综合考虑船舶通信传输需求,以CC2533开发板作为网络协调器的主控芯片。CC2533开发板具备AES128位硬件加密功能,在通信传输时的安全性较好,灵敏度可达到−97 dBm,通信传输速率最大值为250 kbps。网络协调器通信节点由视频模块、GPRS模块、调试接口、传感器等构成。网络协调器利用电源模块为其供电,在进行无线通信过程中利用CC2533开发板控制传感器采集信息后,对该信息进行存储,然后利用GPRS模块和无线射频模块实现无线网络通信传输。网络协调器的调试接口则与路由器、本地PC端等设备相连,负责与其他设备实现信息交互与共享功能。

1.5 船舶区域航迹提取实现

船舶区域轨迹提取是船舶航迹自动识别的基础。在轨迹识别单元从数据存储与集成单元调取到船舶航行实时消息后,利用线程池内的线程对船舶航行实时消息进行时间戳、经纬度坐标等字段进行判断,若该船舶航行消息具备合法性,则判断当前航迹点是否符合其航行区域检索条件,若不符合则结束该程序,反之增更新船舶航迹状态并输出船舶区域航迹。当船舶航行区域检索条件发生变更时,则从船舶状态数据库内检索船舶航迹点数据,然后更新并输出即可。

1.6 基于数据挖掘的船舶航迹识别方法

利用船舶区域轨迹提取流程获取到船舶区域航迹后,对其进行坐标转换、时间校准和轨迹融合处理后,即可实现船舶航迹识别。由于海事雷达和船载单片机监控终端对船舶位置定位应用坐标系不同,船载单片机监控终端获取船舶位置信息来自其自身的GPS,其使用WGS-84坐标系。而海事雷达获取的船舶位置坐标则是极坐标和方位,因此需对海事雷达和船载单片机监控终端获取的船舶位置坐标进行转换处理。海事雷达和船载单片机监控终端在同一时刻获取船舶位置坐标时,二者所用的时间系统也不同,船舶航迹坐标需在统一时间下方可对其进行识别。在此使用3次样条差值算法并以世界时作为时间坐标对海事雷达和船载单片机监控终端获取其航迹坐标的时间进行校准。

对船舶航迹坐标进行转换和时间校准完成后,对海事雷达和船载单片机监控终端获取的同一船舶的航迹位置实施融合处理。在这里应用到数据挖掘技术内的基于模糊逻辑的数据融合算法,该算法以模糊集合论为基础,对数据的数理逻辑进行扩展,从不够精准的数据集合内获取不精确结论的推理过程,也被称为近似推理。利用模糊集合的近似推理步骤,获取同一船舶航迹的关联程度,依据该关联程度即可识别船舶航迹。海事雷达和船载单片机监控终端在获取船舶航迹点数据时,受不确定因素影响导致二者获取的船舶航迹点数据存在对应关系,但该关系内又存在不同程度的模糊性。在此利用模糊理论内的隶属度函数描述海事雷达和船载单片机监控终端在获取船舶航迹点数据的相似性, $ \xi ({Q}_{p}) $ 表示第 $ p $ 个船舶航迹点因素隶属度函数,其表达式如下:

$ \xi ({Q}_{p})=\mathrm{exp}\left[-\frac{{\eta }_{p}\cdot{Q}_{p}^{2}}{{\sigma }_{p}^{2}}\right] 。$ (1)

式中: $ {\eta _p} $ $ {Q_p} $ $ \sigma _p^{} $ 分别表示船舶航迹点模糊因素集内权重、欧式距离、展度。

公式(1)数值越大,则说明海事雷达和船载单片机监控终端在获取船舶航迹点数据关联程度越大。依据公式(1)结果,使用正态性隶属度函数法对船舶航迹点数据进行融合处理。其融合过程如下:

1)确定模糊因素集。以船舶位置、航行速度和航行方向作为影响其航迹的主要因素,建立模糊因素集为F(Q1,Q2,Q3),其中Q1Q2Q3分别表示船舶位置因子、速度因子和方向因子。

2)计算F(Q1,Q2,Q3)权重数值。

3)计算Q1Q2Q3的欧式距离后,将其数值代入到式(1)中,得到船舶航迹模糊因素的隶属度函数值。

4)依据船舶航迹模糊因素的隶属度函数值计算船舶所有航迹点数据的综合相似度,并建立船舶航迹点模糊相关矩阵。

5)设置综合相似度阈值,依据该阈值对船舶航迹点模糊相关矩阵进行一致性检验。在时刻为 $ t $ 时,海事雷达和船载单片机监控终端的航迹数据在任意时刻时均表现为相关关系,则该航迹来自同一船舶,即可对该海事雷达和船载单片机监控终端获取的船舶航迹进行合并处理,至此实现船舶航迹识别过程。

2 仿真实验

以某流域若干艘清淤作业船作为实验对象,应用本文系统对该流域若干艘清淤作业船航迹进行识别。

2.1 稳定性测试

以系统日志反馈的成功连接次数作为衡量指标,在服务器上使用nohup命令运行本文系统的各个程序,测试在不同启动次数下,本文系统成功连接反馈次数,分析其运行的稳定性,结果如图1所示。分析可知,程序连接成功概率上看本文系统程序运行稳定性可达到99.5%左右。该结果说明,本文系统在运行过程中具备较好的稳定性。

图 1 系统运行稳定性测试结果 Fig. 1 System operation stability test results
2.2 通信传输测试

以通信传输的吞吐量作为衡量指标,测试通信节点负载数值和本文系统负载数值均不同时,本文系统通信传输时的负载量与吞吐量之间关系,结果如图2所示。分析可知,在通信传输节点负载不同情况下,其节点负载数值越大,在本文系统负载量相同时通信传输的吞吐量数值越低。但不同通信节点负载时,本文系统的负载量和吞吐量差值相差较小。当本文系统负载超过0.6 Mb/s时,通信传输节点负载不同时的吞吐量数值呈现平稳状态。上述结果说明:本文系统在通信传输时的吞吐量数值受其负载量影响较小,具备较强的通信传输能力。

图 2 系统通信传输测试结果 Fig. 2 System communication transmission test results
2.3 船舶航迹识别测试

以船舶航行的经度作为指标,测试本文系统提取船舶区域航迹能力,结果如表1所示。分析可知,在船舶航行的不同时间时,本文系统提取其航行经度数值和实际值仅在时间为40 min时存在差异,但差异数值仅为0.001°,在宽阔的水域上该误差对其航迹识别不存在影响。而在其他航行时间时,本文系统提取其航行纬度数值和实际数值均完全相同。可知,本文系统可有效提取船舶区域航行的经度数值,且精度较高,可有效为后续识别其航迹打下良好的航迹数据基础,也从侧面说明本文系统具备较精准的船舶航迹识别能力。

表 1 船舶航迹区域精度提取测试结果 Tab.1 Test results of accuracy extraction of ship track area

以一艘清淤船作为实验对象,测试本文系统在存在其他船只干扰情况下和不存在干扰但航迹复杂交错情况下对其轨迹的识别能力,结果如图3所示。分析可知,当船舶航迹复杂交错时,本文系统可有效对其进行识别,识别出的船舶航迹与其实际航迹线均完全重合。而当船舶周围存在和其航行轨迹和方法较为相同的船舶时,本文系统依然可有效识别目标船舶航迹,但识别的航迹线与实际航迹线在某些区域未完全重合,但二者之间差值并未影响船舶航迹识别结果。综上所述,本文系统可在船舶航迹复杂情况下和存在其他船舶干扰情况下有效识别目标船舶航迹,具备较好的应用效果。

图 3 不同情况下本文系统船舶轨迹识别结果 Fig. 3 ship trajectory recognition results of this system under different conditions
3 结 语

本文利用海事雷达架设、数据挖掘等技术手段,设计了基于数据挖掘的船舶航迹自动识别系统。通过对该系统进行测试得知:其在运行过程中具备较好的稳定性,且在通信传输时的吞吐量不受通信节点的负载影响,通信传输性能较好。在识别船舶航迹时,对复杂航迹和存在其他船舶干扰航迹均可有效识别。

参考文献
[1]
鄢博冉, 高大为, 朱永生, 等. 基于低信噪比AIS数据的船舶航迹精准预测[J]. 船舶工程, 2021, 43(10): 111-117.
[2]
游兰, 韩雪薇, 何正伟, 等. 基于改进Seq2Seq的短时AIS轨迹序列预测模型[J]. 计算机科学, 2020, 47(9): 169-174. DOI:10.11896/jsjkx.190800060
[3]
王颢程, 左毅, 李铁山, 等. 基于宽度学习系统的内河航道船舶轨迹分类算法[J]. 上海海事大学学报, 2021, 42(3): 91-100.
[4]
刘文, 汪文博. 基于秩最小化矩阵去噪的船舶轨迹重构方法[J]. 交通运输系统工程与信息, 2022, 22(1): 106-114.
[5]
姜佰辰, 关键, 周伟, 等. 基于多项式卡尔曼滤波的船舶轨迹预测算法[J]. 信号处理, 2019, 35(5): 741-746.
[6]
徐垚, 李卓然, 孟金龙, 等. 基于大规模船舶轨迹数据的航道边界提取方法[J]. 计算机应用, 2019, 39(1): 105-112.
[7]
胡明月, 于双和, 李云云, 等. 基于指令滤波的全状态约束海洋水面船舶有限时间轨迹跟踪控制[J]. 南京理工大学学报(自然科学版), 2021, 45(3): 271-280.
[8]
凡甲甲, 祁云嵩, 葛霓琳. 基于改进BP神经网络的船舶轨迹识别方法[J]. 计算机工程与设计, 2019, 40(12): 3639-3644.
[9]
郑振涛, 赵卓峰, 王桂玲, 等. 面向港口停留区域识别的船舶停留轨迹提取方法[J]. 计算机应用, 2019, 39(1): 113-117. DOI:10.11772/j.issn.1001-9081.2018071625