舰船科学技术  2023, Vol. 45 Issue (5): 160-163    DOI: 10.3404/j.issn.1672-7649.2023.05.031   PDF    
基于支持向量机的船舶交通流量预测方法
曾晓晴     
江苏航运职业技术学院,江苏 南通 226010
摘要: 提升航道和港口资源的高效、合理利用,需精准掌握船舶交通流量情况。为此,本文提出基于支持向量机的船舶交通流量预测方法。该方法以船舶交通流量数据为基础,经预处理后将其作为采用支持向量机的输入量,通过输入量和输出量之间的高维映射,预测船舶交通流量;通过鲸鱼优化算法优化支持向量机的核参数和惩罚项参数;通过迭代寻优获取最优的参数结果,以此保证舰船交通流量预测结果的精准程度。测试结果表明:该方法能可靠完成不同航行环境下的船舶交通流量预测,均等系数均在0.019以下;中心可依据预测结果对船舶进行管理,高效、合理实现港口资源利用,减少船舶等待进港时间。
关键词: 支持向量机     船舶交通     流量预测     高维映射     参数优化     资源利用    
Ship traffic flow prediction method based on support vector machine
ZENG Xiao-qing     
Jiangsu Shipping College, Nantong 226010, China
Abstract: To improve the efficient and reasonable use of channel and port resources by port departments, it is necessary to accurately grasp the ship traffic flow. Therefore, a ship traffic flow prediction method based on support vector machine is proposed. This method is based on the ship traffic flow data, which is preprocessed as the input of support vector machine, and predicts the ship traffic flow through the high-dimensional mapping between the input and output; The whale optimization algorithm is used to optimize the kernel parameters and penalty parameters of the support vector machine, and the optimal parameter results are obtained through iterative optimization to ensure the accuracy of the ship traffic flow prediction results. The test results show that this method can reliably predict the ship traffic flow under different navigation environments, with the equalization coefficient below 0.019. The port dispatching center can dispatch ships according to the prediction results, efficiently and reasonably realize the utilization of port resources, reduce the waiting time for ships to enter the port, and improve the throughput of ships.
Key words: support vector machine     ship traffic     flow forecast     high-dimensional mapping     parameter optimization     resource utilization    
0 引 言

海上交通快速发展,在进行海上交通管理过程中,为保证航道和港口资源的高效、合理利用和安全运行,避免发生交通事故[1],需精准掌握船舶交通流量情况。船舶交通流量指的是海面上或者内河航运内发生连续运动的全部船舶数量[2],其包含交通流量、交通流密度、宽度以及速度等。由于船舶类型较多[3],大小也存在差异,在海上的航行速度也存在显著区别,外加海上环境较为多变,导致船舶交通流量预测难度较高[4],预测结果误差较大。刘敬贤等[5]针对船舶交通流量预测需求展开相关研究,结合卷积神经网络及长短时记忆网络提出预测方法。但该方法主要用于短时间内的船舶交通流量预测,对于长时间内的预测效果较差。张矢宇等[6]为实现船舶交通流量预测,提出组合模型预测方法,该方法主要针对航道整治区域内的船舶交通流进行预测,对于海上的船舶交通流预测误差较大。

支持向量机(SVM)是一种通过监督学习实现目标二元分类的一种典型方法,其在多个识别领域中均具有较好的应用效果。因此,本文利用SVM的优势,提出基于SVM的船舶交通流量预测方法。

1 船舶交通流量预测 1.1 船舶交通流量预测方法架构

交通流量预测是港口管理的重要部分,其对于海上交通调度和协调控制以及安全管理具有重要意义,因此需可靠完成船舶交通流量预测。本文结合在交通流量预测时存在的不确定因素以及周期性或者区间性等特征,提出SVM的船舶交通流量预测方法,其总体流程用图1描述。

图 1 支持向量机的船舶交通流量预测流程 Fig. 1 Ship traffic flow prediction process based on support vector machine

该方法在进行船舶交通流量预测时,以历史船舶交通流量数据为基础,对数据进行预处理,并采用模糊信息粒化对数据进行二次处理,以保证数据的完整性,同时更好地刻画数据的语义,为预测提供可靠的数据依据。将处理后的数据输入SVM模型中,该模型通过输入数据和输出结果之间的映射,完成船舶交通流量预测。为保证预测结果的可靠性,采用鲸鱼算法对SVM参数进行优化,获取最优参数值,减少SVM模型的构建时间,提升交通流量预测的精确度。

1.2 基于SVM的船舶交通流量预测

SVM的本质是一个凸二次规划问题,能够获取高维空间内数据集的最佳拟合结果。本文选择SVM作为船舶交通流量预测方法的基础,将归一化处理后的船舶历史交通流量数据作为样本数据,进行交通流量预测。如果归一化处理后的已知数据样本集合用 $ {\boldsymbol{X}} = \left( {{x_i},{y_i}} \right) $ 表示,其中, $ {x_i} $ $ {y_i} $ 分别为输入值和输出值,均为第 $ i $ 个,则SVM的学习即为 $ {x_i} $ $ {y_i} $ 之间的映射关系,用f()表示。该映射能够保证任意的 $ {\boldsymbol{X}} $ 均具有f()=yi关系,通常情况下f()的计算公式为:

$ f\left( . \right) = w\phi \left( x \right) + b 。$ (1)

式中: $ w $ 为权重; $ b $ 为阈值; $ \phi \left( x \right) $ 为映射关系,其可将输入量映射至高维特征空间内。

在进行船舶交通流量预测时,为保证预测精度,需保证参数的合理性,确保结构的风险最小,因此引入经验风险函数,其计算公式为:

$ {\psi _{emp}} = \frac{1}{m}\sum\limits_{i = 1}^m L 。$ (2)

式中: $ m $ 为样本数据数量; $ L $ 为损失函数,计算公式为:

$ L\left( . \right) = \left\{ \begin{aligned} & {0,}&{{\rm{if}}\left| {{y_i} - f\left( {{x_i}} \right)} \right| < \varepsilon ,} \\ & {\left| {{y_i} - f\left( {{x_i}} \right)} \right| - \varepsilon ,}&{{\rm{else}}} 。\end{aligned} \right. $ (3)

式中, $ \varepsilon $ 为小数,且大于0。

在预测时如果数据样本数量较少,则结合SRM准则进行回归函数的选择,其公式为:

$ f\left( x \right) = {{\rm{sgn}}} \left[ {\sum\limits_{i = 1}^m {{w_i}\phi \left( x \right) + b} } \right]。$ (4)

依据SVM的最大间隔概念对船舶交通流量预测的非线性回归问题进行转换,形成函数规划问题,其表达式为:

$ \min \left[ {\frac{1}{2}{{\left\| w \right\|}^2} + C\sum\limits_{i = 1}^m {\left( {{\xi _i} + \xi _i^ * } \right)} } \right] 。$ (5)

在实际应用过程中,将上述公式转换成对偶形式进行求解,其公式为:

$ f\left( x \right) = \sum {\left( {\alpha _i^ * - {\alpha _i}} \right)K\left( {{x_i},x} \right)} + b 。$ (6)

式中: $ {\alpha _i} $ 为拉格朗日乘子; $ K\left( {{x_i},x} \right) $ 为核函数。选择径向基函数作为核函数,是考虑船舶交通流量预测问题具有非线性特点。保证预测可靠的预测效果,同时确保数据存在不可分情况时,也可完成数据映射,实现预测。

在进行船舶交通流量预测时,输入SVM中的输入量包含对船舶交通流量存在影响的因素,输出的结果为预测得出的交通流量结果。通过上述确定的核函数和SVM的其他相关参数,进行输入量和输出量之间的映射,获取船舶交通流量预测结果。

1.3 SVM参数优化

SVM对船舶交通流量预测过程中,K(xi,x)的参数 $ g $ $ C $ 的取值对于SVM的预测效果存在直接影响,因此,为保证船舶交通流量预测精度,对上述2个参数进行寻优,选择鲸鱼优化算法(WOA)完成。在优化时,为保证最佳参数的获取,先利用网格搜索法对 $ g $ $ C $ 两个参数进行大范围寻优,获取初始的寻优结果;再将该结果输入至WOA算法中,进行精确寻优,获取全局最优解,其寻优流程用图2描述。

图 2 参数优化流程 Fig. 2 Parameter optimization process

参数优化详细步骤如下:

步骤1 对WOA相关参数初始化处理,包含搜索代理X*(t)的维数、最大迭代次数、搜索范围的上限和下限等。

步骤2 判断寻优搜索时个体位置是否位于搜索范围内,如果越限后则对其进行调整。

步骤3 计算适应度函数,X*(t)当前位置定义为 $ g $ $ C $ 参数,以此获取当前的SVM预测模型,获取该模型的预测精准度,并将其作为WOA的适应度函数。

步骤4 当前最优解更新,通过WOA算法对X*(t)当前位置进行更新,以此获取全局最佳适应度函数,并完成当前X*(t)的更新。其更新公式为:

$ X\left( {t + 1} \right) = X_{rand}^ * - A.D 。$ (9)

式中: $ X_{rand}^ * $ 为群体中的某个个体位置; $ A $ 为系数向量; $ D $ 为距离,对应鲸鱼当前位置和当前最优个体之间。

步骤5 判断计算结果是否满足终止条件,如果预测结果精度是当前适应度函数和全局适应度函数的差值,即满足终止条件,则将SVM预测模型进行更新,使其为最佳模型。

步骤6 输出 $ {X^ * } = \left\{ {best\mathop {}\nolimits^{} c,best\mathop {}\nolimits^{} g} \right\} $ 结果,该结果即为SVM预测模型的最优参数。

2 实验结果分析

为验证本文方法对于船舶交通流量的预测效果,获取某港口管理中心通过海上船舶自动识别系统获取的2021年连续3个月的海上交通流量数据作为测试数据。该港口为中型港口,作为重要的海运枢纽,承载近邻多个城市的海运中转。该港口相关海域和航道在3个月内实际共经过83522艘船舶,包含货船、客船以及巡查船舶。

为验证本文方法对于船舶交通流量的预测效果,获取本文方法在海面和航道2种航行环境下,对于船舶交通流量的预测结果,如图3图4所示。由图3图4可知,本文方法应用后,能够精准预测不同时间段内,海上和航道内的船舶流量结果,预测结果和实际结果的吻合程度依较高。因此,本文方法具有较好的船舶交通流量预测能力,可靠完成船舶交通流量预测,为港口的船舶管理和调度提供可靠依据。

图 3 海面船舶交通流量预测结果 Fig. 3 Prediction results of ship traffic flow on the sea

图 4 航道船舶交通流量预测结果 Fig. 4 Prediction results of ship traffic flow in channel

为进一步验证本文方法对于船舶交通流量的预测效果,采用均等系数 $ \eta $ 作为评价指标,测试本文方法在进行不同数量船舶交通流量预测时的预测效果。该指标取值在0~1之间,其值越大表示预测结果的误差越大。计算在不同数量船舶下,本文方法的预测结果,用表1描述。由表1可知,在雾天和雨天2种天气下,随着海上船舶数量的逐渐增加,本文方法均可精准完成船舶交通流量预测, $ \eta $ 结果均在0.019以下,极大程度接近0。存在的少许误差对于船舶的管理影响极小,可忽略不计。

表 1 船舶交通流量预测结果的均等系数测试结果 Tab.1 Test results of equalization coefficient of predicted results of ship traffic flow

为直观验证本文方法的应用性,获取本文方法应用前后,港口管理部门依据交通流量预测结果对港口资源进行调度,获取调度后船舶吞吐量变化情况和航道内船舶等待进港的等候时间变化情况,结果用图5图6描述。由图5图6可知,本文方法应用后,能够可靠获取船舶流量情况,港口调度中心可依据预测结果对船舶进行调度,高效、合理实现港口资源利用,减少船舶等待进港时间,提升船舶吞吐量。因此,本文方法具有良好的应用性,对于港口的船舶管理具有重要作用。

图 5 船舶吞吐量变化情况 Fig. 5 Change of ship throughput

图 6 船舶进港等候时间变化情况 Fig. 6 Change of ship arrival waiting time
3 结 语

船舶交通流量会受到多种因素的影响,产生一定变化,对于港口的管理和资源的合理化应用造成一定影响。因此,港口管理部门需可靠掌握船舶交通流量情况,为港口管理提供数据依据。基于此,本文提出基于支持向量机的船舶交通流量预测方法,预测船舶交通流量情况。对该方法进行相关测试后可知:本文方法具有较好的应用效果,能够完成船舶交通流量预测,掌握船舶流量情况,为港口调度提供可靠依据。

参考文献
[1]
刘钊, 崔珑献, 李岩, 等. 基于二维矩阵分解的船舶交通流预测[J]. 中国航海, 2021, 44(3): 76-83.
LIU Zhao, CUI Longxian, LI Yan, et al. Ship Traffic Flow Prediction with Bidimensional Matrix Mode Decomposition[J]. Navigation of China, 2021, 44(3): 76-83. DOI:10.3969/j.issn.1000-4653.2021.03.013
[2]
王震, 李伟峰, 高邈. 多算法结合的船舶交通流框架提取[J]. 上海海事大学学报, 2021, 42(2): 45-52.
WANG Zhen, LI Weifeng, GAO Miao. Framework extraction of ship traffic flow with multi-algorithm combination[J]. Journal of Shanghai Maritime University, 2021, 42(2): 45-52.
[3]
祁朵, 毛政元. 基于自适应时序剖分与KNN的短时交通流量预测[J]. 地球信息科学学报, 2022, 24(2): 339-351.
[4]
黄富程, 刘德新, 曹杰, 等. 基于ABC优化BP神经网络的船舶交通流量预测[J]. 中国航海, 2021, 44(2): 78–83.
[5]
刘敬贤, 高广旭, 刘奕, 等. 基于卷积神经网络及长短时记忆网络的短时船舶交通流量预测[J]. 中国航海, 2022, 45(2): 56-61+68.
Liu Jingxian, Gao Guangxu, Liu Yi, et al. Short-Term Water Traffic Flow Prediction with Convolutional Neural Network and Long Short-Term Memory Network[J]. Navigation of China, 2022, 45(2): 56-61+68. DOI:10.3969/j.issn.1000-4653.2022.02.010
[6]
张矢宇, 杨宇昊, 陈尘, 等. 基于回归-卡尔曼滤波组合模型的航道整治区域船舶交通流时空预测[J]. 大连海事大学学报, 2021, 47(1): 37-44.
Zhang Shiyu, Yang Yuhao, Chen Chen, et al. Spatio-temporal prediction of ship traffic flow in waterway regulation area based on regression-Kalman filter combination model[J]. Journal of Dalian Maritime University, 2021, 47(1): 37-44.