舰船科学技术  2022, Vol. 44 Issue (11): 68-71    DOI: 10.3404/j.issn.1672-7649.2022.11.014   PDF    
大数据分析的船舶航迹拟合研究
陶丽1,2, 陈天伟2     
1. 四川师范大学 计算机科学学院,四川 成都 610066;
2. 四川城市职业学院信息技术学院,四川 成都 610101
摘要: 船舶航行过程中所产生的海量航迹数据可通过拟合方法完成压缩,由此降低航迹数据存储的压力,考虑航迹数据采集过程中的误差与数据缺失问题,设计了大数据分析的船舶航迹拟合方法。以船舶自动识别系统为基础,根据参考物标采集船舶航迹数据。考虑所采集船舶航迹数据在时空2个维度上的误差与数据缺失问题,采用大数据分析技术中的三次样条插值法与中值滤波法,对所采集的船舶航迹数据实施预处理;针对预处理后的船舶航迹数据,通过坐标转换、曲线选择以及拟合计算等过程完成船舶航迹拟合处理。实验结果显示,所研究方法能够在不影响航迹数据局部趋势的条件下有效抑制航迹数据的波动性,得到更高精度的航迹拟合结果。
关键词: 大数据分析     航迹拟合     数据采集     插值法     中值滤波     曲线选择    
Research on ship track fitting based on big data analysis
TAO Li1,2, CHEN Tian-wei2     
1. School of computer science and technology, Sichuan Normal University, Chengdu 610066, China;
2. School of information technology, Urban Vocational College of Sichuan, Chengdu 610101, China
Abstract: The massive track data generated during ship navigation can be compressed by fitting method, so as to reduce the pressure of track data storage. Considering the error and data loss in the process of track data acquisition, the ship track fitting method of big data analysis is studied. Based on the ship automatic identification system, the ship track data is collected according to the reference object. Considering the error and data missing of the collected ship track data in two dimensions of time and space, the cubic spline interpolation method and median filter method in big data analysis technology are used to preprocess the collected ship track data. For the preprocessed ship track data, the ship track fitting processing is completed through the processes of coordinate conversion, curve selection and fitting calculation. The experimental results show that the proposed method can effectively suppress the volatility of track data without affecting the local trend in track data, and obtain higher precision track fitting results.
Key words: big data analysis     track fitting     data acquisition     interpolation method     median filtering     curve selection    
0 引 言

在船舶航行过程中会实时产生海量航迹数据,这些航迹数据汇总至船舶管控中心,对其输出存储性能提出更高要求[1]。考虑船舶管控中心存储能力以及仅可存储短时间内的航迹数据等局限性[2],急需研究一种有效的航迹数据压缩与存储周期延长方法。航迹拟合作为一种有效的压缩方法[3],在这一领域中具有较好的应用性能。

张杰等[4]在航迹拟合问题中引入循环神经网络,通过网络训练降低误差实现航迹拟合目的。陈影等[5]在船舶航迹分析过程中以AIS数据为基础,采用灰狼算法优化支持向量机模型,完成船舶航迹分析。夏辉宇等[6]基于AIS大数据,通过智能并行航迹密度分析法分析船舶的航迹分布,以此为基础进行船舶航迹拟合。

考虑航迹数据采集过程中的误差与数据缺失问题,研究基于大数据分析的船舶航迹拟合方法,实现船舶航迹拟合与数据压缩。

1 船舶航迹拟合方法 1.1 船舶航迹数据采集

船舶航迹数据采集过程以船舶自动识别系统为基础。用 $ \left( {{\varepsilon _W},{\varphi _W}} \right) $ 表示某参考物标 $ W $ 的经纬度,船舶自动识别系统的雷达显示, $ W $ 相对船舶的真方位和距离分别为 $ \theta $ $ L $ ,依照经纬线将 $ L $ 划分为 $ {S_Y} = L\cos \theta $ $ {S_X} = L\sin \theta $ ,由此确定船舶O处的经纬度信息。若 $ W $ 依照经线以最小距离达到 $ W' $ ,此过程中经度提升 ${\rm{d}}\varphi$ ,以 $ M $ 表示 $ W $ 所在位置经线曲率半径,如图1所示。

图 1 经线弧长计算示意图 Fig. 1 Calculation diagram of warp arc length

利用式(1)能够得到经线上对应的该段微分弧长:

$ \stackrel{⌢}{W{W}^{\prime }}=d\times {t}_{m}\times \partial =M\times {\rm{d}}\varphi\times \partial ,$ (1)

式中, $ \partial $ 表示误差修正系数。

$ B $ 表示船舶航迹上的随机点,其纬度值为 $ {\varphi _B} $ ,船舶由 $ W $ 依照经线达到 $ B $ $ {t_m} $ 表示从 $ {\varphi _W} $ $ {\varphi _B} $ 的经线长度, $ {t_m} $ 值可通过式(1)的积分运算确定,公式描述如下:

$ {t_m} = \int\nolimits_{{\varphi _W}}^{\varphi B} {M \times {\rm{d}}\varphi \times \partial },$ (2)

在式(2)中代入 $ M $ 值,以 $ {q_c} $ 表示地球椭圆体长半径,由此得到:

$ {t_m} = {q_c} - {q_c} \times y_1^1\left\{ \begin{gathered} \alpha \left( {{\varphi _B} - {\varphi _W}} \right) - \hfill \\ \frac{\beta }{2}\left( {\sin 2{\varphi _B} - \sin 2{\varphi _W}} \right) + \hfill \\ \frac{\gamma }{4}\left( {\sin 4{\varphi _B} - \sin 4{\varphi _W}} \right) - \hfill \\ \frac{\delta }{6}\left( {\sin 6{\varphi _B} - \sin 6{\varphi _W}} \right) \hfill \\ \end{gathered} \right\}。$ (3)

式中: $ e_1^{} $ 表示子午椭圆的第一偏心率, $ \alpha $ $ \beta $ $ \gamma $ $ \delta $ 均为参数,公式描述如下:

$ \alpha = 1 + \frac{3}{4}y_1^2 + \frac{{45}}{{64}}y_1^4 + \frac{{175}}{{256}}y_1^6 + \frac{{11025}}{{16384}}y_1^8 + \cdots ,$ (4)
$ \beta = \frac{3}{4}y_1^2 + \frac{{15}}{{16}}y_1^4 + \frac{{525}}{{512}}y_1^6 + \frac{{2205}}{{2048}}y_1^8 + \cdots ,$ (5)
$ \gamma = \frac{{15}}{{16}}y_1^4 + \frac{{105}}{{256}}y_1^6 + \frac{{2205}}{{4096}}y_1^8 + \cdots ,$ (6)
$ \delta = \frac{{35}}{{512}}y_1^6 + \frac{{315}}{{2048}}y_1^8 + \cdots,$ (7)

$ {\varphi _B} $ 值如下式所示的条件下:

$ {\varphi _B} = {\varphi _W} \pm {1^ \circ },$ (8)

能够确定船舶由 $ W $ 依照经线航行 $ {1^ \circ } $ 所对应的弧长,该值可通过 $ {D_Y} $ 描述。

利用 $ \Delta \varphi $ 表示船舶至 $ W $ 间的维度差,计算公式如下:

$ \Delta \varphi = \frac{{{S_Y}}}{{{D_Y}}},$ (9)

$ {\varphi _0} $ 表示船舶所处的纬度值,公式描述如下:

$ {\varphi _0} = {\varphi _A} + \Delta \varphi,$ (10)

基于上述理论能够确定船舶与 $ W $ 的经度差,以 $ {S_n} $ 表示 $ W $ 依照纬度圈航行至随机点C的距离,公式描述如下:

$ {S_n} = r\left( {{\varepsilon _C} - {\varepsilon _W}} \right) = N\cos {\varphi _W}\left( {{\varepsilon _C} - {\varepsilon _W}} \right),$ (11)

式中, $ r $ $ N $ 分别表示纬度平行圈半径和卯酉圈曲率半径,N的计算公式如下:

$ N = \frac{{{q_c}}}{{{{\left( {y_1^2{{\sin }^2}{\varphi _W}} \right)}^{\frac{1}{2}}}}} ,$ (12)

设定 $ {\varepsilon _C} - {\varepsilon _W} $ 值为1,利用式(11)就能够获取 $ W $ 依照纬度航行 $ {1^ \circ } $ 所对应的弧长 $ {D_X} $ 。以 $ \Delta \varepsilon $ 表示船舶同 $ W $ 间的经度差, $ \Delta \varepsilon $ 的计算过程如下:

$ \Delta \varepsilon = \frac{{{S_X}}}{{{D_X}}} 。$ (13)

$ {\varepsilon _0} $ 表示船舶航迹的经度,公式描述如下:

$ {\varepsilon _0} = {\varepsilon _W} + \Delta \varepsilon 。$ (14)

通过上述过程所采集的船舶航迹数据在时空2个维度上均具有一定的误差,严重时还会产生显著的数据缺失问题,针对这些问题,采用大数据分析技术对上述过程所采集的船舶航迹数据进行预处理,针对预处理后的船舶航迹数据进行过拟合处理。

1.2 基于大数据分析的船舶航迹数据预处理

由于多采集的船舶航迹数据发送频率有所差异等因素影响,所获取的船舶航迹数据数据时间间隔通常具有不一致性,所以可采用大数据分析技术中的三次样条插值法对其实施预处理。

$ \left[ {a,b} \right] $ 表示船舶航迹数据的时间序列区间,将 $ \left[ {a,b} \right] $ 划分为n个区间,由此得到 $ [ \left( {{x_0},{x_1}} \right), \left( {{x_1},{x_2}} \right), \cdots , \left( {{x_{n - 1}},{x_n}} \right)] $ ,总计存在 $ n - 1 $ 个数据点,与这些数据点相对应的函数值可通过 $ {h_0},{h_1}, \cdots ,{h_n} $ 表示。A(x)表示大数据分析技术中的差值函数,如果A(x)符合下式:

$ A\left( {{x_i}} \right) = {h_i} ,$ (15)

则式(15)在不同小区间上均为小于或等于三次的多项式,设定:

$ {A_i}\left( x \right) = {a_i}{x^3} + {b_i}{x^2} + {c_i}x。$ (16)

式中: $ {a_i} $ $ {b_i} $ $ {c_i} $ 均表示待定系数。

如果三次样条方程符合曲线平滑的要求,也就是A(x)、 $ A'\left( x \right) $ $ A''\left( x \right) $ 具有不间断特征,那么排除依照不同节点处的值构建方程组外,同样可依照上述不间断特征构建方程组:

$ \left\{ \begin{gathered} A\left( {{x_i} - 0} \right) = A\left( {{x_i} + 0} \right) \hfill ,\\ A'\left( {{x_i} - 0} \right) = A'\left( {{x_i} + 0} \right) \hfill,\\ A''\left( {{x_i} - 0} \right) = A''\left( {{x_i} + 0} \right) \hfill 。\\ \end{gathered} \right. $ (17)

基于式(17),结合边界条件就能够确定全部三次样条方程系数,由此生成整体插值函数。在确定某一点插值的过程中,即可将式(17)所示的方程引入其所处的区间进行计算。

考虑船舶航行过程中的速度与方向有较大概率产生转变,经纬度值存在显著变化,利用初始船舶航迹数据实施航迹集合将导致拟合结果产生显著误差。所以在三次样条差值完成后选取大数据分析技术中的中值滤波法,确定此时刻邻域内的若干个船舶航迹数据确定当前时刻的信息。在对初始船舶航迹数据实施差值处理后,采用中值滤波算法对船舶航迹数据实施去噪处理。x(i)表示插值后船舶航迹数据内第i个点,则 $ \left[ {x\left( {i - N} \right), \cdots ,x\left( i \right), \cdots x\left( {i + N} \right)} \right] $ x(i)周边 $ 2N $ 个数据点构建的数据集合:由此获取中值滤波后x(i)点的值为: $ x'\left( i \right) = Med\left[ {x\left( {i - N} \right), \cdots ,x\left( i \right), \cdots x\left( {i + N} \right)} \right] $ ,其中Me[]表示该数据集合的中间值。中值滤波算法的主要优势为针对海量船舶航迹数据在单位时间内位移变化较为显著的条件下能够更好地发挥去噪效果。

1.3 基于曲线的航迹拟合架构

。经由拟合降低船舶航迹的数据量,提升有效提升船舶航迹数据的存储周期。船舶航迹拟合的详细过程如下:

1)坐标转换。 $ \left( {J,K,{z_0}} \right) $ 表示极坐标系下的船舶航行点迹数据,将 $ \left( {J,K,{z_0}} \right) $ 转换至直角坐标系下点迹数据,以 $ U = \left( {x,y,z} \right) $ 表示。

2)曲线选择。考虑船舶在三维空间内航行,因此选择三维曲线拟合航迹更为合适。但实际拟合过程中,需设定大量参数与约束条件,因此导致最终的数据压缩效果并不理想考虑短时间窗内,船舶航行过程中高度波动并不显著,因此可采用二阶多项式曲线完成航迹拟合目的。

3)拟合计算。利用二阶多项式对船舶航迹段 $ \left\{ {{U_1},{U_2}, \cdots ,{U_L}} \right\} $ 实施拟合。各次拟合均输出一组曲线参数 $ \left( {a,b,c} \right) $ 。以第一个船舶航迹点与曲线参数的组合 $ \left\{ {{P_1},\left( {a,b,c} \right)} \right\} $ 取代原船舶航迹段,并通过拟合误差计算确定船舶航迹段长度,由此达到船舶航迹拟合与压缩的目的。

2 实验结果与分析

为验证本文所研究的大数据分析的船舶航迹拟合方法的实际应用性能,以某型号远航船舶为研究对象,采用本文方法对研究对象航迹进行拟合处理。

2.1 航迹数据采集测试

采用本文方法采集研究对象航迹数据,设定定位参考物标,实验对象在实际航行过程中,选择小量程、近距离参考物标,选取距离实验对象更远物标进行偏心显示。航迹数据采集所得结果如图2所示。分析图2可知,研究对象理论航迹误差为5 m范围内,但采用本文方法所采集的航迹数据误差上限超过10 m,同时本文方法所采集的航迹数据波动较为显著,这一结果符合实验对象航行过程中利用船舶自动识别系统探测物标数据产生随机误差的特征。

图 2 研究对象航迹数据采集测试结果 Fig. 2 Test results of track data acquisition of research object
2.2 船舶航迹数据预处理测试

针对航迹数据采集过程中产生的随机误差,本文方法采用基于大数据分析的船舶航迹数据预处理算法对所采集数据实施预处理,所得结果如图3所示。由图可知,采用本文方法进行航迹数据预处理前,经纬度差值的主要特征表现为,在经纬度差值平缓的阶段,其以某数据为核心,表现出明显的正弦式变换特征;在部分阶段中,航迹数据的经纬度误差表现出一定程度的局部提升或下降。

图 3 船舶航迹数据预处理前后对比结果 Fig. 3 Comparison results of ship track data before and after preprocessing
2.3 航迹拟合测试

采用本文方法对研究对象航迹实施拟合处理,同时为进一步说明本文方法的航迹拟合性能,以文献[5]中基于灰狼优化支持向量回归的方法和文献[6]中基于AIS大数据的方法为对比方法,分析图4结果可知,采用本文方法所得的航迹拟合结果与研究对象实际航迹一致度更高。

图 4 航迹拟合结果 Fig. 4 Ship track fitting results of two comparison methods

图 5 两种对比方法船舶航迹拟合结果 Fig. 5 Ship track fitting results of two comparison methods
3 结 语

本文研究大数据分析的船舶航迹拟合方法,对所获取的航迹数据分析处理后,进行拟合。实验结果显示本文方法能够准确拟合航迹数据并可以更好地实现航迹数据压缩。

参考文献
[1]
鄢博冉, 高大为, 朱永生, 等. 基于低信噪比AIS数据的船舶航迹精准预测[J]. 船舶工程, 2021, 43(10): 111-117.
[2]
郭杰, 刘轶华, 马利华. 基于多模态快速非奇异终端滑模的船舶航迹跟踪自抗扰控制[J]. 中国航海, 2020, 43(2): 7-13. DOI:10.3969/j.issn.1000-4653.2020.02.002
[3]
陈天元, 袁伟, 俞孟蕻. 基于显式模型预测控制的无人船航迹控制方法[J]. 船舶工程, 2020, 42(9): 122-127.
[4]
张杰, 王刚, 姚小强, 等. 双向RNN下的航迹拟合模型研究[J]. 计算机科学, 2019, 46(S2): 58-61+88.
[5]
陈影玉, 索永峰, 杨神化. 基于灰狼优化支持向量回归的船舶航迹预测[J]. 上海海事大学学报, 2021, 42(4): 20-25+46.
[6]
夏辉宇, 刘安林, 程佳. 基于AIS大数据的南京长江大桥水域规律航迹研究[J]. 水运工程, 2021(1): 189-195.