2. 广西感知物联网生产力促进中心,广西 南宁 530007
2. Guangxi Perceived Internet of Things Productivity Promotion Center, Nanning 530007, China
近年来国际贸易交流愈加频繁,大宗货物流通均通过海上运输方式实现,海上运输方式是远距离货物运输最主要方式[1-2],具备较高的能源效率。但船舶在航行过程中,会遭遇特殊天气状况、洋流以及冰山等障碍物,导致航行轨迹发生偏移,对航行轨迹进行异常检测是船舶航行安全保障之一,因此船舶航迹异常检测在航海领域意义重大。郁舒昊等[3]提出船舶轨迹聚类方法,该方法通过采集船舶航向、航速、坐标等数据,提取该数据特征后,使用聚类方法得到船舶航行轨迹异常检测。但该方法在应用时,其聚类方法容易陷入极值情况,导致其输出结果不够准确。魏辉等[4]提出船舶调用轨迹异常检测方法,该方法以物联网为基础,建立轨迹异常检测框架,通过该框架输出船舶轨迹异常检测结果。但该方法对框架运行环境要求较高,因此应用范围较为狭窄。大数据驱动是通过采集海量大数据,通过聚类、统计等数据运算方法,从海量大数据内提取到有用信息的过程或方法。大数据驱动可实现目标的检测、诊断、预测等目的,在各个领域应用较为广泛[5]。本文以大数据驱动技术为基础,研究船舶航行轨迹异常检测,为保障船舶安全航行提供技术支持。
1 船舶航行轨迹异常检测研究 1.1 船舶观测大数据相似度方程构建利用角度传感器、速度传感器、方位传感器采集船舶在海上航行时的角度、速度和坐标等大数据,为保障该大数据来自于同一目标区域,构建传感器相似度方程,利用该方程得到某一艘船舶的航行大数据。船舶传感器观测方程表达式如下:
$ E(t) = Y(t)X(t) + W(t)。$ | (1) |
式中:
当时刻为
$ \left\{ \begin{gathered} {T_l} = \left\{ {{Z_i}(t),i = 1,2, \cdots ,N} \right\}, \\ {E_i}(t) = \left\{ {{E_{i1}}(t),{E_{i2}}(t), \cdots ,{E_{im}}(t),m = 1,2, \cdots ,N} \right\} , \\ {E_{ij}}(t) = \left\{ {{E_{ij1}}(t),{E_{ij2}}(t), \cdots ,{E_{ijk}}(t),j = 1,2, \cdots ,m} \right\}。\\ \end{gathered} \right. $ | (2) |
式中:
为便于计算,对式(2)进行简化处理,其变更如下:
$ \left\{ \begin{gathered} {E_{ij}}(t) = {B_l}(t) , \\ l = (i - 1) \times M + j 。\\ \end{gathered} \right. $ | (3) |
式中:
依据式(3)则传感器观测船舶航行大数据相似度方程如下:
$ {\rm{dist}}({B_i}(t),{B_j}(t)) = {\omega _k} \cdot \sqrt {\sum\limits_{k = 1}^N {\Delta {{({B_i}(t),{B_j}(t))}^2}} } 。$ | (4) |
式中:
设置传感器观测船舶航行大数据相似度阈值
以同一个目标船舶航行大数据为基础,建立其正常轨迹模型。使用大数据驱动技术中的多特征大数据聚类方法建立船舶正常轨迹模型,利用该模型获得船舶航行正常轨迹,其详细过程如下:
步骤1 将同一目标船舶航行大数据采样点看做船舶轨迹类簇,在每个类簇内,航迹点航向为其平均值,将航向看做类簇向[6-7],每一个航迹类簇均具备独立的类簇向,则航向表达式如下:
$ {U_w} = \frac{{{U_1}}}{n} + \frac{{{U_2}}}{n} + \cdots \frac{{{U_n}}}{n}。$ | (5) |
式中:
步骤2 按照航迹类簇向,划分轨迹点网格。航迹类簇网格划分示意图如图1所示,其网格宽度阈值为
步骤3 建立船舶航行轨迹采样点。在图1内,每个网格均为一个船舶航迹采样点,该采样点与船舶航行轨迹点不同,每个采样点均具备平均航速、平均航向、平均经纬度和中位数距离等特征属性。船舶航行轨迹采样点表达式如下:
$ S{G_i} = \left\{ {CO{U_{avg}},SG{E_{avg}},LO{N_{avg}},LA{T_{avg}},{D_{median}}} \right\}。$ | (6) |
式中:
经过上述步骤,利用式(6)即可得到船舶航行正常轨迹。
1.3 基于大数据驱动技术的船舶轨迹异常检测算法依据得到的船舶航行正常轨迹,使用大数据驱动技术内的Spark Streaming数据实时计算框架,实现船舶航行轨迹异常检测。船舶航迹位置异常检测是以实时接收到的船舶航迹点位置展开测定的,令
$ \sigma = \sqrt {{{({G_{i \cdot lon}} - S{G_{j \cdot lon}})}^2}} + \sqrt {{{({G_{i \cdot lat}} - S{G_{j \cdot lat}})}^2}}。$ | (7) |
式中:
令
由于船舶航线较长,为降低轨迹异常检测难度,需将其航线划分为若干个航迹段。设置航迹段长度为
$ H = \arccos \left(\frac{{{Q_1} \cdot {Q_2}}}{{\left| {{Q_1}} \right|\left| {{Q_2}} \right|}}\right) \times \frac{{180}}{{\text{π}} } 。$ | (8) |
式中:
经过上述步骤,实现船舶航行轨迹异常检测。
2 性能分析以某长距离海运船作为实验对象,该船航程较长,且航行海域暗礁、洋流错综复杂,为保障该船航行安全,使用本文方法对异常航迹展开检测,同时验证本文方法实际应用效果。
本文方法利用船舶大数据相似度方程获得实时航行数据,测试其在获得航行实时数据量不同情况下,数据相似度变化情况,结果如图2所示。分析可知,本文方法计算船舶航行数据相似度数值随着航行数据量的增加而降低。在航行数据量为6000个左右之前时,本文方法计算航行数据相似度数值接近1.0,当船舶航行数据量超过6000个之后,航行数据相似度数值呈现小幅度下降趋势。在航行数据量为10000个时,船舶航行数据相似度数值为0.95左右。该结果说明:本文方法可有效从海量船舶航行数据中获得同一船舶航行数据,从侧面说明其获得实际航迹和异常航迹检测能力较好。
验证本文方法获得船舶航行正常航迹能力。选择该船在海上航行某时间段,使用本文方法获取该时间段船舶航迹,结果如表1所示。分析可知,应用本文方法获取该船在该时间段内航迹时,航迹点经度和纬度数值与其实际数值吻合度极高,仅在08:30和16:30时,获得船舶经度与其实际数值存在偏差,在12:30船舶纬度与其实际数值存在偏差,但偏差区间仅为0.001°~0.002°之间,偏差数值较小。综上可知,本文方法可有效获得船舶实际航行轨迹,且获取结果精度较高。
验证本文方法检测异常航迹能力。选择该船舶完整航线,检测其在既定航线航行过程中航迹异常情况,结果如图3所示。由图3可知,该船在航行过程中,存在2段航迹异常情况。该结果说明,本文方法可有效检测船舶航行异常航迹,具备较为显著的应用效果。
本文研究基于大数据驱动的船舶航行轨迹异常检测方法。该方法应用大数据驱动技术,从海量的船舶航行数据内获取其航向偏差、航迹点偏差等数据,依此实现船舶航行轨迹异常检测。对本文方法展开实际验证,从验证结果得知,本文方法可有效检测船舶航行异常航迹,为船舶安全航行提供数据支持。
[1] |
张阳, 高曙, 何伟, 等. 基于多模型融合的内河船舶航行轨迹预测方法[J]. 中国机械工程, 2022, 33(10): 1142-1152. ZHANG Yang, GAO Shu, HE Wei, et al. Navigation traj ectory prediction method of inland ships based on multi-model fusion[J]. China Mechanical Engineering, 2022, 33(10): 1142-1152. |
[2] |
杨家轩, 刘元. 基于DBTCAN算法的船舶轨迹聚类与航路识别[J]. 上海海事大学学报, 2022, 43(3): 7-12. YANG Jiaxuan, LIU Yuan. Ship trajectory clustering and route recognition based on DBTCAN algorithm[J]. Journal of Shanghai Maritime University, 2022, 43(3): 7-12. |
[3] |
郁舒昊, 周辉, 叶春杨, 等. SDFA: 基于多特征融合的船舶轨迹聚类方法研究[J]. 计算机科学, 2022, 49(z1): 256-260. YU Shuhao, ZHOU Hui, YE Chunyang, et al. SDFA: Study on ship trajectory clustering method based on multi-feature fusion[J]. Computer Science, 2022, 49(z1): 256-260. |
[4] |
魏辉, 陈泽茂, 张立强. 一种基于顺序和频率模式的系统调用轨迹异常检测框架[J]. 计算机科学, 2022, 49(6): 350-355. WEI Hui, CHEN Zemao, ZHANG Li-qiang. Anomaly detection framework of system call trace based on sequence and frequency patterns[J]. Computer Science, 2022, 49(6): 350-355. DOI:10.11896/jsjkx.210500031 |
[5] |
李楠, 强懿耕, 樊瑞, 等. 基于异常因子的航空器飞行轨迹异常检测研究[J]. 安全与环境学报, 2021, 21(2): 643-648. LI Nan, QIANG Yigeng, FAN Rui. On the abnormal detection of the aircraft flight trajectory based on the abnormal factor statistics[J]. Journal of Safety and Environment, 2021, 21(2): 643-648. DOI:10.13637/j.issn.1009-6094.2019.1185 |
[6] |
郭奕杉, 刘漫丹. 基于时空轨迹数据的异常检测[J]. 计算机科学, 2021, 48(z1): 213-219. GUO Yishan, LIU Mandan. Anomaly detection based on spatial-temporal trajectory data[J]. Computer Science, 2021, 48(z1): 213-219. DOI:10.11896/jsjkx.201100193 |
[7] |
张黎翔, 朱怡安, 陆伟, 等. 基于AIS数据的船舶轨迹修复方法研究[J]. 西北工业大学学报, 2021, 39(1): 119-125. ZHANG Lixiang, ZHU Yi'an, LU Wei, et al. A detection and restoration approach for vessel trajectory anomalies based on AIS[J]. Journal of Northwestern Polytechnical University, 2021, 39(1): 119-125. DOI:10.3969/j.issn.1000-2758.2021.01.015 |