舰船科学技术  2022, Vol. 44 Issue (23): 66-69    DOI: 10.3404/j.issn.1672-7649.2022.23.013   PDF    
一种实时船舶交通事故识别方法
丁振国, 张树奎     
江苏海事职业技术学院 航海技术学院,江苏 南京 211170
摘要: 为了提高实时船舶交通事故预测能力,基于支持向量机技术构建支持向量机预测模型。将历史事故数据和非事故数据按照7∶ 3的比例分成训练集样本和测试集样本,分别用来训练模型和检验预测精度,结果表明事故分类正确率为82.13%,整体分类正确率为80.34%。通过与其他预测模型分类结果比较,发现虽然支持向量机模型的非事故分类正确率稍低,但事故分类正确率明显高于其他模型。实例表明支持向量机模型用于事故预测有效。
关键词: 水道     交通事故     支持向量机     分类    
A identification method on real-time ship traffic accident
DING Zhen-guo, ZHANG Shu-kui     
Jiangsu Maritime Institute Navigation College, Nanjing 211170, China
Abstract: In order to improve the ability of real-time prediction of ship traffic accidents, support vector machine (SVM) prediction model is built based on SVM technology. The historical accident data and non accident data are divided into training set samples and test set samples according to the ratio of 7∶ 3 to train the model and test the prediction accuracy respectively. The results show that the accuracy of accident classification is 82.13%, and the overall accuracy of classification is 80.34%. Compared with the classification results of other prediction models, it is found that although the accuracy of non accident classification of the SVM model is slightly lower, the accuracy of accident classification is significantly higher than that of other models. The example shows that the SVM model is effective in accident prediction.
Key words: waterway     traffic accident     SVM     classification    
0 引 言

水路运输在国民经济发展中起到了重要作用,是大宗商品贸易的主要途径。随着水上交通运输业的快速发展,交通事故也成增加趋势,特别是在一些繁忙的水道,由于交通流量大,发生交通事故的概率明显高于其他水域。长江是我国最重要的内河航运水道,长江下游水道承载着内河航运70%的货运量,与此同时,发生的交通事故也是最多的。据统计,长江下游水道2010年至2020年间,共发生事故1027起。交通事故往往造成人员重大伤亡和财产巨大损失。近年来,随着水上交通服务水平的提高,交通事故率虽呈逐渐下降趋势,但与德国、美国、日本等国家相比,我国水上交通安全管理水平仍有改进空间。航道通航环境复杂,不安全因素众多,如何识别通航安全风险源,进而采取有效措施降低事故发生概率,已成为航道管理部门迫切需要解决的问题。交通事故的特征探究及对深层影响因素的分析是提高安全管理水平的基础,可为相关部门制订有针对性的改善措施提供理论参考。

关于船舶交通安全的研究,历史成果较多,这些成果在航道安全管理中发挥了积极的作用,提高了通航安全管理水平,但是这些进步与人民的期望还有一定的差距。当前,水上交通安全管理已经由被动安全管理向主动安全风险防控方面发展[1],我国交通管理部门也适时出台了相关措施或提供资金支持用于学科研究,以便用来改善水上交通安全服务水平。

船舶交通事故已由事后致因分析向事前主动预估方向发展,在实时船舶交通事故风险预测研究方面,目前主要技术有线性回归模型[2]、K近邻理论[3]、BP神经网络模型[4]、贝叶斯方法[5]等,这些技术都能够较好地预测事故风险,但也各有优缺点[6]。近来,支持向量机(SVM)模型在交通领域得到广泛应用,对预测交通领域、交通事故的效果更优[7]。本文将该技术引入船舶交通领域,用于实时预测船舶交通事故风险,并与其他预测模型预测结果比较,以验证其有效性。

1 支持向量机模型

支持向量机是Kecman提出的一种机器学习模型,用来事故分离或预测。支持向量机模型是一种用来解决分类问题的非参数方法,广泛地应用于统计分类以及回归分析中。建模过程如下:

步骤1 给定一个特定训练数据集, $ X $ 为输入空间, $ {x_i} $ 为其一个输入向量, $ {y_k} $ 为输出向量, $ Y = \left\{ {{y_k}} \right\} = \left\{ { - 1,1} \right\} $ ,当 $ y = - 1 $ 时, $ {x_i} $ 为负例, $ y = 1 $ $ {x_i} $ 为正例。

步骤2 构建分离超平面方程,用来确定负例或正例:

$ W \bullet X + {{b}} $

式中, ${{b}}$ 为常数。

步骤3 求解最优解,用来确定最优超平面:

$ \min \frac{1}{2}{W^{\text{T}}}W + C\sum\limits_{i = 1}^N {{\mu _i}} x $

式中, $ {\ \mu _i} $ 为松弛变量; $ C $ 为惩罚因子,其约束条件为

$ {y_k}({W^{\text{T}}}\omega ({x_i}) + {{b}}) \geqslant 1 - {\mu _i},$ (1)

式中, $ \omega (x) $ 为非线性映射函数。

步骤4 引入拉格朗日因子,则决策函数为

$ f(x)={\displaystyle \sum _{i=1}^{N}({\theta }_{i}}-{\theta }_{i}^{\ast })h({x}_{i}·{x}_{j})+{b} ,$ (2)
$ h({x}_{i}·{x}_{j})=\omega ({x}_{i})·\omega ({x}_{j})。$ (3)

式中: $ {\theta _i} $ 为拉格朗日算子; $ x $ 为支持向量; $ h({x}_{i}·{x}_{j}) $ 为核函数, $ j \leqslant N $

步骤5 确定各参数。利用下列核函数确定:

$ {h}_{\text{line}}({x}_{i}·{x}_{j})={x}_{i}^{\text{T}}{x}_{j} ,$ (4)
$ {h}_{\text{nonline}}({x}_{i}·{x}_{j})={\left[\eta ({x}_{i}·{x}_{j})+1\right]}^{p},$ (5)
$ {h}_{\text{high}}({x}_{i}·{x}_{j})=\mathrm{exp}(-\eta {\Vert {x}_{i}-{x}_{j}\Vert }^{2}) 。$ (6)

式(4)~(6)分别确定参数 $ C $ $ (C,\eta ,p) $ $ (C,\eta ) $

2 模型检验 2.1 数据选择

根据已有研究成果,影响航道内船舶交通安全的主要因素包括交通流密度、船舶平均速度、横向加速度、纵向加速度、船舶间距等。考虑到数据采集的可靠性及便利性,本文选择长江下游某水道为研究对象,信息采集时间为2017年1月~2019年12月,期间共发生102起交通事故,事故数据均由江苏海事局VTS中心提供,交通流等数据来自水道两侧的船舶检测器。为便于比较,同时采集了1000余条未发生交通事故的数据,这一比例能够真实地反映航道内交通状态[8]

2.2 模型检验

在检验模型之前,需要确定参数 $ C,\eta ,p $ 的值,根据历史经验数据,3个参数的取值范围分别为 $ C \in \left[ 0.01, 10 \right],\eta \in \left[ {0.01,10} \right],P \in \left[ {1,3} \right] $ ,具体数值需根据不同参数组合下对模型预测结果进行比较并结合十重交叉验证法最终确定[9]。利用确定出的参数值构建支持向量机分类器。

分别将102起事故数据和1000余条非事故数据按照7∶3的比例分成训练集样本和测试集样本,训练集样本用来训练支持向量机模型,测试集样本检验预测精度。模型优劣的判断采用交通事故分类正确率、非交通事故分类正确率和整体分类正确率3个指标确定。

2.3 分类结果及分析

通过对支持向量机模型进行样本训练并利用其进行分类测试集样本,不同参数条件下的支持向量机模型分类结果如表1所示。

表 1 不同参数条件下的支持向量机模型分类结果 Tab.1 Classification results of the SVM model under different parameters

可知,采用支持向量机模型分离器,虽然由于参数取值的不同,分类正确率有所不同,但是各指标都比较理想,其值均在74%以上,其中事故分类正确率最高可达82.13%,整体分类正确率最高也达到80.34%,且稳定性较好,表现为最大值与最小值之间的差值较小,分别为7.38%,2.53%和6.08%。当3个参数的值为(9,1,1)时,交通事故分类正确率、非交通事故分类正确率和整体分类正确率3个指标的值达到最大,因此,3个参数的最优值确定为(9,1,1)。检验结果表明支持向量机技术可以用于船舶交通事故风险预测。

2.4 与其他模型分类结果比较

为了进一步验证支持向量机模型分类的优越性,利用目前比较常用的分类模型对上述交通事故和非交通事故数据进行分类,并与支持向量机模型分类结果比较。常用分类模型有BP神经网络模型(BPNN)、贝叶斯方法(BN)等。

运用BP神经网络模型和贝叶斯方法分别对102起交通事故数据和1000余非事故数据进行分类,并将结果与支持向量机模型分类结果进行比较,如表2所示。

表 2 支持向量机模型与其他模型分类结果比较 Tab.2 Comparison of classification results between the SVM model and other models

可知,虽然支持向量机模型在非事故分类正确率方面稍微低于BP神经网络模型和贝叶斯方法(支持向量机模型为76.48%,BP神经网络模型和贝叶斯方法分别为77.15%和77.75%),但是在事故分类正确率方面明显高于两者,达到了82.13%;支持向量机模型在整体分类正确率方面也优于BP神经网络模型和贝叶斯方法,达到了80.34%。

通过比较可以得出,支持向量机模型不仅可以用于船舶交通事故的预测,而且预测效果较好,其方法优于BP神经网络模型和贝叶斯方法。

3 结 语

为了提高实时船舶交通事故预测能力,本文将支持向量机技术引入水上交通领域,用于船舶交通事故预测,为提高水上交通安全提供一种新的方法。

1)利用支持向量机技术构建了支持向量机模型,运用长江下游某水道历史数据验证了该模型的有效性,其中事故分类正确率可达82.13%,非事故分类正确率与整体分类正确率也达到较高水平。

2)通过与BP神经网络模型、贝叶斯方法分类结果比较,支持向量机模型在事故分类正确率和整体分类正确率方面更优,但非事故分类正确率却低于两者。

参考文献
[1]
PEREZ M A. SUDWEEKS J D. SEARS E. Performance of basic kinematic thresholds in the identification of crash and near-crash events within naturalistic driving data[J]. Accident Analysis & Prevention, 2017, 103: 10.
[2]
王雪松, 徐晓妍. 基于自然驾驶数据的危险事件识别方法[J]. 同济大学学报(自然科学版), 2020, 48(1): 51-59.
WANG Xuesong, XU Xiaoyan. Detection of Safety-critical Events Based on Naturalistic Driving Data[J]. Journal of Tongji University (Natural Science), 2020, 48(1): 51-59. DOI:10.11908/j.issn.0253-374x.19147
[3]
DOZZA M, GONZALEZ N P. Recognizing safety critical events: can automatic video processing improve naturalistic data analyses?[J]. Accident Analysis & Prevention, 2013, 60: 298.
[4]
SHEW C, PANDE A, NUWORSOO C. Transferability and robustness of real-time freeway crash risk assessment[J]. Journal of Safety Research, 2013, 46(9): 83.
[5]
SUN J, SUN J. Real-time crash prediction on urban expressways Identification of key variables and a hybrid support vector machine model[J]. IET Intelligent Transport System, 2016, 10(5): 331. DOI:10.1049/iet-its.2014.0288
[6]
游锦明, 方守恩, 张兰芳, 等. 高速公路实时事故风险研判模型及可移植性[J]. 同济大学学报(自然科学版), 2019, 47(3): 347-352.
YOU Jinming, FANG Shouen, ZHANG Lanfang, et al. Real-Time Crash Risk Prediction Modelsand Transferability Analysison Freeway[J]. Journal of Tongji University (Natural Science), 2019, 47(3): 347-352. DOI:10.11908/j.issn.0253-374x.2019.03.007
[7]
BOYLES S. A comparison of interpolation methods for missing traffic volume data[C]// Proceedings of the 90th Annual Meeting of the Transportation Research Board. Washington DC: Transportation Research Board, 2011: 23–27.
[8]
苗旭, 王忠宇, 邹亚杰, 等. 改进的固定交通检测器缺失数据综合修复方法[J]. 同济大学学报(自然科学版), 2019, 47(10): 1477-1484.
MIAO Xu, WANG Zhouyu, ZOU Yajie, et al. Improved Modification Method of Missing Datafor Location-specific Detector[J]. Journal of Tongji University (Natural Science), 2019, 47(10): 1477-1484. DOI:10.11908/j.issn.0253-374x.2019.10.013
[9]
ZOU Y, HUA X, ZHANG Y. Hybrid short-term freeway speed prediction methods based on periodic analysis[J]. Canadian Journal of Civil Engineering, 2015, 42(8): 570. DOI:10.1139/cjce-2014-0447