2. 中国民航航空飞行学院,四川 广汉 618307
2. Civil Aviation Flight University of China, Guanghan 618307, China
随着全球经济一体化进程的加速,海事贸易作为国际贸易的核心载体,呈现持续增长态势。据联合国贸易和发展会议(UNCTAD)统计,全球约80%的货物贸易通过海洋运输完成,船舶交通密度在主要航线、港口水域及近岸区域显著提升,随之而来的航行安全与监管挑战日益凸显。船舶碰撞、搁浅、非法作业等异常行为不仅会造成巨额经济损失和人员伤亡,还可能引发海洋污染、破坏海洋生态平衡,甚至威胁国家安全。
自动识别系统(Automatic Identification System,AIS)作为海事监管的核心技术手段,已被国际海事组织(IMO)强制要求各类船舶配备。该系统通过VHF频段实时广播船舶动态数据与静态数据,为船舶交通服务(Vessel Traffic Service,VTS)提供了海量的轨迹数据支撑。AIS数据的时空连续性与多维度特性,使其成为船舶行为分析与异常检测的核心数据源。AIS受海况干扰、设备故障、人为篡改等因素影响,AIS数据存在缺失、漂移、重复等质量问题,同时船舶异常行为呈现多样性、隐蔽性特征,传统依赖人工监控的方式已难以满足大规模、高精度的监管需求,亟需基于AIS轨迹数据构建智能化的异常检测技术体系。
国际上相关研究同样聚焦于船舶自动识别系统轨迹异常检测的精度与效率提升,形成了具有自身特色的研究方向,如依托转换器模型、图神经网络等新型模型优化时空特征提取效果,同时注重AIS与雷达、卫星遥感等多源数据的融合应用,既有效缓解了自动识别系统数据存在的缺陷,也通过轻量化设计提升了异常检测的实时性。国内关于船舶AIS轨迹异常行为检测相关研究成果丰硕且各有侧重。深度学习是核心研究方向,李业等[1]提出Encoder-Decoder LSTM(Long Short-Term Memory,长短期记忆网络)模型,通过轨迹预处理与精准预测识别偏离异常,冀娜等[2]聚焦卷积神经网络(CNN)、循环神经网络(RNN)等深度学习模型的特征学习能力以提取正常航行模式。机器学习方面,吕国华等[3]引入联邦随机森林算法,在保护数据隐私的同时通过轨迹分类辅助异常识别。数据支撑层面,王超等[4]提出一种通过优化轨迹数据压缩算法,提升预处理效率与数据质量的方法,为实时异常检测提供保障。整体而言,当前研究已覆盖模型构建、隐私保护、场景适配与数据预处理等关键环节,深度学习因时空特征捕捉优势成为主流研究方向,但仍面临实时性、可解释性等共性挑战,与实际监管需求的适配性仍需提升。
本研究聚焦AIS轨迹数据的特性,探索适用于船舶行为模式的异常检测方法,可丰富时空序列异常检测的理论体系,为海事大数据分析领域提供新的技术思路。同时,针对AIS数据质量问题构建的预处理策略,也可为同类时空轨迹数据的清洗与优化提供参考。
1 AIS轨迹数据预处理数据筛选与清洗是AIS轨迹数据预处理的核心环节,旨在剔除无效数据、分离独立船舶轨迹,为后续特征提取与模型训练提供高质量数据基础,主要包含3个步骤:
步骤1 基于船舶识别码(MMSI)的轨迹分段是实现单船行为分析的前提。MMSI具有全球唯一性,可作为区分不同船舶的核心标识。该步骤通过遍历原始AIS数据集,将具有相同MMSI的轨迹点按时间戳升序排列,形成单船连续轨迹;同时剔除MMSI缺失或无效的轨迹点,解决多船轨迹数据混淆的问题,确保后续分析聚焦于单一船舶的运动行为[5]。
步骤2 异常点识别与剔除采用物理约束和统计阈值的双重判定策略。结合船舶物理特性设定刚性约束,例如根据船舶类型确定最大加速度、最大转向角等阈值,超出该范围的轨迹点判定为物理异常点;同时采用统计方法分析轨迹点的空间分布,剔除偏离均值3倍标准差以上的漂移点、重复记录及设备故障导致的错误数据[6]。双重策略的结合可有效提升异常点识别的准确性,避免因单一判定标准导致的有效数据误删或异常数据遗漏。
步骤3 缺失值填充采用多策略混合方案以适配不同缺失场景。针对短时间连续缺失,采用邻近插值快速补全;针对长时间连续缺失且轨迹变化平缓的场景,采用3次样条插值拟合轨迹趋势,保证轨迹的平滑性;针对大面积的数据缺失情况,引入船舶运动趋势预测模型,基于缺失前的航速、航向等参数预测缺失点位置,最大限度还原轨迹的真实运动状态,降低缺失数据对后续分析的影响。
2 AIS轨迹异常检测模型构建 2.1 模型架构设计针对船舶AIS轨迹数据兼具空间关联性与长时序依赖性的核心特性,传统单维度检测模型难以充分捕捉复杂轨迹模式的问题,构建深度时空自编码网络(Spatio-Temporal Autoencoder,ST-AE),通过不断学习正常轨迹的时空分布模式,然后重构误差识别偏离模式,最终实现对多类型船舶异常行为的精准检测。
ST-AE模型采用编码-融合-解码的对称架构,通过空间编码模块提取轨迹空间分布特征,时间编码模块捕捉时序依赖关系,结合注意力机制实现时空特征的动态融合,最终通过解码模块重构轨迹数据。
1)输入层与数据预处理
输入数据为经特征工程处理后的时空轨迹序列,每条轨迹包含N个轨迹点,每个轨迹点由经度(lon)、纬度(lat)、航速(v)、航向(θ)、时间戳(t)5个维度构成,输入张量维度定义为X∈
| $ x_{i,j}^{{\mathrm{norm}}}=\frac{{x}_{i,j}-\min({x}_{j})}{\max({x}_{j})-\min({x}_{j})}。$ | (1) |
式中:xi,j为第i个轨迹点的第j维原始数据;min(xj)、max(xj)分别为第j维数据的最小值与最大值;
2)空间特征编码模块
采用二维卷积神经网络(2D-CNN)构建空间编码单元,针对轨迹的空间分布特性,设计多尺度卷积核(3×1、5×1)捕捉不同范围的空间特征:小尺度卷积核聚焦局部空间特征,大尺度卷积核捕捉全局空间趋势。卷积计算的核心公式为:
| $ {f}_{k,l}=\sigma \left(\sum\limits_{i=1}^{H}\sum\limits_{j=1}^{W}{x}_{i,j}\cdot {w}_{k,i,j}+{b}_{k}\right) 。$ | (2) |
式中:
3)时间特征编码模块
引入双向长短期记忆网络(Bi-LSTM)构建时间编码单元,通过正向LSTM层捕捉轨迹从过去到当前的时序依赖,反向LSTM层捕捉从未来到当前的时序关联,协同挖掘航速变化、航向调整的前后关联性。LSTM核心单元的状态更新公式如下:
| $ {i}_{t}=\sigma ({W}_{i}\cdot [{h}_{t-1},{x}_{t}]+{b}_{i}) \text{,} $ | (3) |
| $ {f}_{t}=\sigma ({W}_{f}\cdot [{h}_{t-1},{x}_{t}]+{b}_{f}) \text{,} $ | (4) |
| $ {c}_{t}={f}_{t}\odot {c}_{t-1}+{i}_{t}\odot \tanh({W}_{c}\cdot [{h}_{t-1},{x}_{t}]+{b}_{c}) \text{,} $ | (5) |
| $ {o}_{t}=\sigma ({W}_{o}\cdot [{h}_{t-1},{x}_{t}]+{b}_{o})。$ | (6) |
式中:it、ft、ot分别为输入门、遗忘门、输出门的激活值;ct为细胞状态;ht为隐藏层输出;Wi、Wf、Wc、Wo为权重矩阵;bi、bf、bc、bo均为偏置项;σ为sigmoid激活函数,⊙为元素积运算。将Bi-LSTM的正向与反向隐藏层输出拼接;得到时间特征向量Ft∈
4)时空特征融合层
引入基于方差的时空注意力机制,动态分配空间与时间特征的权重,强化异常敏感区域的特征响应。注意力权重计算为:
| $ w_{s}^{i}=\frac{var(F_{s}^{i})}{var(F_{s}^{i})+var(F_{t}^{i})} \text{,} $ | (7) |
| $ w_{t}^{i}=\frac{var(F_{t}^{i})}{var(F_{s}^{i})+var(F_{t}^{i})} \text{,} $ | (8) |
| $ F_{融合}^{i}=w_{s}^{i}\cdot F_{s}^{i}+w_{t}^{i}\cdot F_{t}^{i}。$ | (9) |
式中:
5)解码层与损失函数
解码层采用与编码层对称的反卷积+Bi-LSTM结构,将融合后的特征映射回原始轨迹空间,为提升模型对正常轨迹的重构精度,采用均方误差(MSE)与余弦相似度加权结合的混合损失函数为:
| $ {L}_{\mathrm{{total}}}=\alpha \cdot {L}_{MSE}+(1-\alpha )\cdot {L}_{\cos} \text{,} $ | (10) |
| $ {L}_{\mathrm{{MSE}}}=\frac{1}{N\times 5}\sum\limits_{i=1}^{N}\sum\limits_{j=1}^{5}{({{x}_{i,j}}-{{\hat{x}}_{i,j}})}^{2} \text{,} $ | (11) |
| $ {L}_{\cos}=1-\frac{\displaystyle\sum\limits_{i=1}^{N}{x}_{i}\cdot {\hat{x}}_{i}}{\sqrt{\displaystyle\sum\limits_{i=1}^{N}x_{i}^{2}}\cdot \sqrt{\displaystyle\sum\limits_{i=1}^{N}\hat{x}_{i}^{2}}}。$ | (12) |
式中:L为总损失;α为权重系数;LMSE为总损失的均方误差;Lcos为余弦相似度损失;xi,j、
为提升模型泛化能力、避免过拟合,同时保障训练效率,设计全流程训练策略,涵盖数据预处理、优化器选择、正则化与早停机制等关键环节。
1)训练数据预处理
训练数据采用正常轨迹优先原则,从AIS数据集中筛选无异常记录的船舶轨迹,涵盖货船、渔船、客船等多种类型,构建正常轨迹样本库。为解决样本量不足问题,采用2种数据增强策略:一是轨迹片段裁剪,从完整正常轨迹中随机截取长度为20~50个轨迹点的片段;二是微小噪声添加,对轨迹点的航速、航向数据添加服从正态分布N(0,0.01)的微小噪声,模拟真实海况下的轻微数据波动。最终将数据集按8∶2划分为训练集与验证集。
2)优化器与学习率调度
采用自适应动量估计(Adam)优化器,该优化器结合动量梯度下降与自适应学习率调整,能有效解决训练过程中的梯度消失或振荡问题。其核心参数设置为:学习率初始值lr=0.001,动量参数β=0.9,权重衰减系数ε=10。同时采用学习率预热和余弦退火的调度策略:前10个epoch进行学习率预热,从0线性提升至0.001,后续epoch采用余弦退火,学习率按下式周期性调整:
| $ lr=l{r}_{\min}+\frac{1}{2}\left(l{r}_{0}-l{r}_{\min}\right)\cdot \left(1+\cos\left(\frac{{T}_{{\mathrm{cur}}}}{{T}_{\max}}\text{π} \right)\right) 。$ | (13) |
式中:
异常判定的核心是通过重构误差区分正常与异常轨迹,同时针对AIS数据可能存在的噪声与缺失问题,优化模型鲁棒性。
1)自适应异常判定阈值
采用3σ原则结合验证集误差分布确定异常阈值。首先计算训练完成的模型在验证集上的重构误差E,采用L作为误差量化指标,统计误差的均值μ与标准差σ,异常阈值τ定义为:
| $ \tau =\mu +3\sigma 。$ | (14) |
对于测试集中的轨迹样本,计算其重构误差E,若E>τ,则判定为异常轨迹,反之则为正常轨迹。
2)模型鲁棒性优化
针对AIS数据中可能存在的少量噪声与缺失问题,设计以下优化策略:一是输入数据容错机制,在模型输入层添加数据校验模块,对缺失1~2个轨迹点的序列采用邻近插值补全,对含噪声的轨迹点采用滑动平均预处理后再输入模型;二是对抗训练增强,在训练过程中引入模拟噪声数据,让模型在学习正常轨迹模式的同时,适应轻微数据质量问题,提升对复杂数据的适应性。
3 仿真验证 3.1 数据集构建实验数据采用AIS数据+人工标注异常的混合数据集,确保覆盖多船舶类型、多航行场景与多海况。数据来源融合丹麦海事局(Danish Maritime Authority)公开AIS数据集(近岸港口场景)与北部湾海域实测AIS数据集(远洋航线场景),包含货船、渔船、客船等6类船舶的轨迹数据,时间跨度为3个月,共采集轨迹点约120万条。对于异常样本,本文采取人工标注5类典型异常样本,分别是异常转向、偏离航线、超速行驶、密集水域异常会遇以及非法逗留,共标注异常轨迹320条,正常轨迹
数据集划分:按8∶1∶1比例划分为训练集(
基于构建的AIS数据集,选取3类主流方法作为对比,分别是滑动窗口+3σ阈值、随机森林算法以及常规LSTM编码,同时确定准确率、召回率、单轨迹推理时间为评估指标,准确率指模型预测正确的样本占总样本的比例,反映模型整体检测的准确程度;召回率指异常样本中被模型正确识别的比例,直接关联漏报风险,关乎海事监管中异常行为的检出能力;单轨迹推理时间指模型处理单条船舶AIS轨迹的耗时,衡量模型实时性。
图1为不同算法对异常轨迹检测的结果对比,结果显示,本文ST-AE模型核心性能全面优于基线模型,准确率与召回率分别达93.26%、91.58%,单轨迹推理时间仅0.03 s,整体来看,和其他3种算法相比,本文提出的ST-AE模型整体性能较为优异。
|
图 1 不同算法对异常轨迹检测的结果对比 Fig. 1 Comparison of the results of abnormal trajectory detection by different algorithms |
为验证模型对多类异常轨迹的适配能力,选取5类典型船舶异常轨迹,测试ST-AE模型的检测性能,结果如图2所示。ST-AE模型对各类异常行为均保持较高检测精度,其中对“偏离航线”异常的检测效果最优,因其空间特征显著,易被模型的CNN空间编码模块捕捉;对“密集水域异常会遇”的检测精度相对较低,但仍保持85%以上的召回率,原因是该类异常涉及多船交互,单船轨迹特征不显著。
|
图 2 不同异常轨迹类型检测结果对比 Fig. 2 Comparison of detection results for different types of abnormal trajectories |
本研究针对海事贸易增长背景下船舶交通密度提升带来的安全与监管挑战,围绕AIS轨迹数据的智能化异常检测展开研究,对弥补传统监管方式不足、完善时空序列异常检测理论体系、提升海事监管的精准性与高效性具有重要意义。研究成果可广泛应用于近岸港口管控、VTS智能监管等场景,为海事部门的风险预警、违规查处及海洋生态保护相关的船舶作业监管提供技术支撑。
1)提出的ST-AE深度时空自编码模型通过CNN与Bi-LSTM的协同融合架构及注意力机制设计,捕捉船舶轨迹的时空依赖关系,同时依托轻量化网络设计实现了检测精度与实时性的平衡。
2)实验验证充分证明了模型的实用性与优越性。相较于滑动窗口+3σ阈值、随机森林算法、常规LSTM自编码等主流方法,本文模型在准确率、召回率及实时性上均表现更优,且能适配多种典型船舶异常行为的检测需求。
| [1] |
李业, 任鸿翔, 张政. 基于Encoder-Decoder LSTM的船舶轨迹预测方法[J]. 海洋测绘, 2024, 44(1): 21-25. LI Y, REN H X, ZHANG Z. Vessel trajectory prediction method based on encoder-decoder LSTM[J]. Hydrographic Surveying and Charting, 2024, 44(1): 21-25. |
| [2] |
冀娜, 胡磊. 深度学习算法下船舶航行轨迹异常行为检测方法[J]. 舰船科学技术, 2025, 47(15): 164-167. JI N, HU L. Abnormal behavior detection method of vessel navigation trajectory based on deep learning algorithm[J]. Ship Science and Technology, 2025, 47(15): 164-167. DOI:10.3404/j.issn.1672-7649.2025.15.027 |
| [3] |
吕国华, 胡学先, 杨明, 等. 基于联邦随机森林的船舶AIS轨迹分类算法[J]. 信息网络安全, 2022, 22(4): 67-76. LV G H, HU X X, YANG M, et al. Vessel AIS trajectory classification algorithm based on federated random forest[J]. Netinfo Security, 2022, 22(4): 67-76. |
| [4] |
王超, 刘润泽, 郭春燕, 等. 船舶AIS轨迹压缩算法应用发展研究[J]. 珠江水运, 2024(10): 131-134. WANG C, LIU R Z, GUO C Y, et al. Research on application and development of vessel AIS trajectory compression algorithm[J]. Pearl River Water Transport, 2024(10): 131-134. DOI:10.14125/j.cnki.zjsy.2024.10.019 |
| [5] |
孙波, 黄永忠, 李峥. 基于改进DBSCAN算法的船舶异常行为检测[J]. 武汉船舶职业技术学院学报, 2025, 24(5): 105-109. SUN B, HUANG Y Z, LI Z. Vessel abnormal behavior detection based on improved DBSCAN algorithm[J]. Journal of Wuhan Institute of Shipbuilding Technology, 2025, 24(5): 105-109. DOI:10.3969/j.issn.1671-8100.2025.05.018 |
| [6] |
杨阿华, 常鑫, 张强, 等. 基于AIS数据的敏感水域船舶异常行为检测[J]. 指挥信息系统与技术, 2023, 14(4): 32-37. YANG A H, CHANG X, ZHANG Q, et al. Vessel abnormal behavior detection in sensitive waters based on AIS data[J]. Command Information System and Technology, 2023, 14(4): 32-37. DOI:10.15908/j.cnki.cist.2023.04.006 |
2026, Vol. 48
