2. 广东海洋大学 船舶与海运学院,广东 湛江 524005;
3. 南京工程学院 机械工程学院,江苏 南京 211167;
4. 广东湛江港龙腾船务有限公司,广东 湛江 524002
2. Naval Architecture and Shipping College, Guangdong Ocean University, Zhanjiang 524005, China;
3. Nanjing Institute of Technology, Nanjing 211167, China;
4. Zhanjiang Port Longteng Shipping Company, Zhanjiang 524002, China
复杂开放水域具有独特且多变的自然环境特征,船舶航行在复杂开放水域中时,受海洋自然环境和暗礁、其他船舶等因素干扰,发生海上安全事故概率显著增加[1 - 2]。为保证航行安全,众多学者针对船舶避障航迹规划展开研究。
谭智坤等[3]提出改进动态窗口法的船舶路径规划方法,该方法考虑无人船运动学约束生成可行速度矢量窗口,速度障碍法构建区域筛选安全速度,通过综合评价函数评估安全矢量,选最优指令调整航向与速度,依环境更新窗口与区域,实现自适应避障航迹规划。但该方法综合评价函数权重依赖人工经验设定,在不同水域环境(如狭水道、桥区)下泛化能力弱,易导致避障保守或效率失衡,导致其船舶航迹规划效果不佳。
周寅飞等[4]提出无人船自主航行航线规划方法,该方法先依据无人船状态、约束及障碍物信息动态确定最大可航窗口序列,限定安全运动范围;再以窗口为约束构建贝塞尔曲线生成平滑航线;航行中实时更新窗口、调整曲线参数优化航线,实现复杂水域自适应避障航迹规划。但该方法实时更新最大可航窗口需高频处理环境数据,复杂场景下计算量激增,会导致实时性下降。
刘文博等[5]提出船舶航线的混合规划方法,该方法结合海图、气象及船舶能力生成参考航线,然后对每条参考航向适应性进行评估,选择适应性数值最高的航行作为最终规划后的航线。但该方法仅基于静态海图、气象数据生成参考航线,未考虑实时变化的海况易导致规划航线与实际环境脱节。
本文为实时感知船舶周围环境信息,结合强大的计算能力和智能算法,实现船舶航行的自动化、智能化决策和控制。提出复杂开放水域中船舶避障航迹自适应规划方法通过研究复杂开放水域中船舶避障航迹自适应规划方法,使船舶根据实时获取的环境信息和自身状态,自动规划出最优或次优的避障航迹,并实时调整航向和航速,以适应不断变化的环境条件,保证海上航行安全。
1 船舶避障航迹自适应规划 1.1 复杂开放水域中动态障碍物跟踪复杂开放水域的环境复杂多变,包括气象、海况、交通流量等因素的影响。其他船舶的运动受到这些环境因素的干扰,其航行轨迹也具有不确定性。将其作为动态障碍物考虑[6],能够使船舶的避障航迹规划更好地适应这种复杂多变的环境,提高规划的灵活性和适应性。
假设船舶在二维平面内的运动状态为匀速运动,则其状态向量表达式如下:
| $ x=\left[\begin{array}{*{20}{c}}x & y & v_x & v_y & c_x & c_y\end{array}\right]^{\mathrm{T}}。$ | (1) |
式中:
依据式(1),构建动态障碍物状态转移方程,表达式如下:
| $ {x_{k + 1}} = F{x_k} + {w_k} 。$ | (2) |
式中:
| $ F = \left[ {\begin{array}{*{20}{c}} 1&0&{\Delta t}&0&{0.5\Delta {t^2}}&0 \\ 0&1&0&{\Delta t}&0&{0.5\Delta {t^2}} \\ 0&0&1&0&{\Delta t}&0 \\ 0&0&0&1&0&{\Delta t} \\ 0&0&0&0&1&0 \\ 0&0&0&0&0&1 \end{array}} \right]。$ | (3) |
式中:
依据船舶雷达提供的动态障碍物坐标,获得动态障碍物级坐标下第
| $ {z_k} = {\left[ {\begin{array}{*{20}{c}} {{\mathchar'26\mkern-10mu\lambda _k}}&{{\theta _k}} \end{array}} \right]^\mathrm{T} }。$ | (4) |
式中:
以
| $ \Phi = \left[ {\begin{array}{*{20}{c}} {\sqrt {{{(y - {y_s})}^2}} + \sqrt {{{(y - {y_s})}^2}} } \\ {\arctan 2(y - {y_s},x - {x_s}) - \dot \psi } \end{array}} \right]。$ | (5) |
式中:
通过式(2)的动态障碍物状态转移方程不断更新式(5)即可实现复杂开放水域中动态障碍物的自适应跟踪,依据该跟踪结果,对复杂开放水域中的船舶避障航迹进行自适应规划。
1.2 基于强化学习的船舶避障航迹自适应规划在复杂开放水域中,可能存在多个动态障碍物,它们之间的运动可能会相互影响,导致新的碰撞风险。强化学习算法可以根据实时的环境信息和船舶状态,自动调整避障航迹规划策略,以适应不断变化的环境,实现船舶的自主避障和航迹规划。因此,经过在获得复杂开放水域内动态障碍物跟踪结果后,使用强化学习算法实现船舶避障航迹自适应规划,其详细实现过程如下:
1)复杂开放水域环境模型构建
使用python软件,按照当前船舶位置和1.2小节跟踪的动态障碍物跟踪结果,以及船舶GPS提供的岛礁障碍物位置,将其映射到一个二维坐标系内[7],得到复杂开放水域中船舶与障碍物的环境模型。
2)船舶动作空间表示
考虑船舶横荡、纵荡和艏摇三自由度,船舶的非线性运动函数可以表示为:
| $ \left\{ {\begin{aligned} &{\dot u = \dfrac{{{W_{{\rm{prop}}}} + {W_{{\rm{drag}}}}}}{m}},\\ &{\dot v = \dfrac{{{I_{{\rm{lift}}}} + {I_{{\rm{drag}}}}}}{m}},\\ &{\dot \psi = \dfrac{{{\Gamma _{{\rm{rudder}}}} + {\Gamma _{{\rm{drag}}}}}}{{{I_z}}}}。\end{aligned}} \right. $ | (6) |
式中:
船舶航行运动的约束条件如下:
舵角限制为
此时以船舶质点作为中心,将船舶动作空间分为上、下、左、右、上左45°、下左45°、上右45°和下右45°一共8个离散动作,则船舶动作空间模型表达式如下:
| $ A = \left[ {\begin{array}{*{20}{c}} { - 1,1}&{0,1}&{1,1}&{ - 1,0}&{1,0} \\ { - 1, - 1}&{0, - 1}&{1, - 1}&{}&{} \end{array}} \right]。$ | (7) |
式中:
3)构建强化学习激励函数
使用强化学习对船舶避障航迹进行自适应规划时,激励函数起到评价船舶航行行为有效性和避障安全性的作用。船舶在复杂开放水域中船舶更接近航行目标点时,其激励函数选择奖赏,而更接近障碍物时,则选择惩罚,此时强化学习的目标激励函数表达式如下:
| $ {\zeta _d} = - {\lambda _d}\left[ {\sqrt {{{(x - {x_g})}^2}} + \sqrt {{{(y - {y_g})}^2}} } \right]。$ | (8) |
式中:
为实现复杂开放水域中船舶避障,考虑其航行安全性,将复杂开放水域环境模型区域内划分
| $ {\zeta _c} = - {\lambda _c}\sum\limits_{i = 1}^{{N_0}} {\left( {\sqrt {{{(x - {x_{{o_i}}})}^2}} + \sqrt {{{(y - {y_{{o_i}}})}^2}} < {Z_0}} \right)}。$ | (9) |
式中:
在强化学习过程中,复杂开放水域环境状态和当前船舶状态均不断变化[8],但船舶航行的动作是一个连续的动作,因此,对式(8)、式(9)的激励函数进行泛化处理,得到自适应非线性分段函数,其表达式如下:
| $ \zeta=\left\{\begin{aligned} & 10,\delta_g(t)=0,\\ & 2,\; \; \chi=1\text{ }\mathrm{and\text{ }}(\delta_g(t)-\delta_g(t-1)) < 0,\\ & -1,\chi=0,\\ & -1,\chi=1\text{ }\mathrm{and}\text{ }(\delta_o(t)-\delta_o(t-1)) < 0,\\ & 0,\; \; \mathrm{other}。\end{aligned}\right. $ | (10) |
式中:
4)动作选择策略
强化学习算法对船舶臂长航迹自适应规划时,在复杂开放水域环境模型内展开搜索,当搜索行为使船舶动作得到奖赏期望最大时,则选择该动作,该动作被选择的概率由
| $ {\text{π}} (a|\chi ) \leftarrow \left\{ \begin{gathered} 1 - \phi + \phi \times \frac{1}{{\left| {A(\chi )} \right|}}a = \arg {{\max }_a}Q(\chi ,a),\\ \phi \times \frac{1}{{\left| {A(\chi )} \right|}},\mathop {}\limits^{} \mathop {}\limits^{} \mathop {}\limits^{} \mathop {}\limits^{} \mathop {}\limits^{} \mathop {}\limits^{} \mathrm{other}。\\ \end{gathered} \right. $ | (11) |
式中:
在式(11)基础上,复杂开放水域中船舶避障航迹自适应规划表达式如下:
| $ {Q^{\text{π}} }(\chi ,a) = {O_{{p^{\text{π}} }(t)}}[\beta (t)\mid {\chi _1} = \chi ,{a_1} = a]。$ | (12) |
式中:
利用式(12)在复杂开放水域环境模型内进行动作搜索,以其最高值作为动作选择点,进而获得从船舶当前位置到目标位置的避障航迹,由此实现复杂开放水域中船舶避障航迹自适应规划。
2 实验分析以西南海域内航行船舶作为实验对象。该海域是国际航运要道,承担全球海上贸易运输量的1/3,航行船舶较多,每条航线均较为繁忙,同时该海域内暗礁分布范围广泛,暗礁密集区域洋流方向混乱且海浪较急,部分地区在卫星导航内未标记自然障碍物,因此该海域发生碰撞、触角安全事故较多。在此应用本文方法对该海域内航行船舶进行避障航迹自适应规划,以降低该海域船舶航行安全风险。
构建船舶运动状态模型能够获取船舶基础航行状态数据,其是后续该船舶在复杂开放水域中避障航迹自适应规划的基础,以航行中的船舶作为实验对象,使用本文构建的船舶运动状态模型获得该船舶在一段时间内的航向角数据,分析本文方法构建船舶运动状态模型能力,测试结果如表1所示。
|
|
表 1 船舶航向角 Tab.1 Ship heading angle |
分析表1可知,本文方法通过构建船舶运动状态模型获取的船舶航向角数据,与船舶GPS设备提供的航向角数值高度吻合,在第50 min时,本文获取的船舶航向角为79.8°,该数值仅与GPS设备提供的航向角数值相差0.1°,在上述实验过程中,本文方法获得的船舶航向角数据最大偏差仅为0.2°,该偏差数值较小,说明本文方法构建的船舶运动状态模型较为精准,其获得的船舶运动数据能够为后续复杂开放水域中船舶避障航迹自适应规划提供基础。
船舶在复杂开放水域中航行时,需要及时躲避动态障碍物,在此将该水域内船舶A作为跟踪对象。使用本文方法对其进行自适应跟踪,跟踪结果如图1所示。
|
图 1 动态障碍物自适应跟踪测试结果 Fig. 1 Dynamic obstacle adaptive tracking test results |
分析图1可知,本文方法对动态障碍物进行跟踪时,从其初始位置开始,能够在间隔一定时间内获得该动态障碍物在二维水域平面内的坐标,通过该坐标变化,实现动态障碍物的自适应跟踪,从该跟踪结果中能获得当前动态障碍物的位置,为当前船舶避障航迹自适应规划提供障碍物状态。
以某船舶作为实验对象,使用本文方法对其进行避障航迹自适应规划,规划后的航迹结果如图2所示。
|
图 2 船舶避障航迹自适应规划结果 Fig. 2 Results of adaptive planning for ship obstacle avoidance trajectory |
可知,该船舶航行的水域内存在岛礁、暗礁静态障碍物区域,和其他船舶航行动态障碍物区域,利用本文方法对该船舶进行避障航迹自适应规划后,得到的船舶航行航迹精准避开了静态障碍物区域和动态障碍物区域,该结果表明本文方法具备对复杂环境中静态与动态障碍的跟踪与分析能力,可根据环境变化自适应调整航迹,避免碰撞风险,同时规划航线从起始点至目标地的连贯延伸,体现了方法在动态变化水域中持续优化路径的特性,保障船舶安全、高效地抵达目标地。
以8艘船舶作为实验对象,使用本文方法对其避障航迹进行自适应规划,以规划后船舶航线的路径平滑度作为衡量指标,分析本文方法对船舶避障航迹自适应规划能力,测试结果如图3所示。
|
图 3 船舶航线路径平滑度 Fig. 3 Smoothness of ship route path |
可知,本文方法对不同船舶进行避障航迹自适应规划后,其航线的路径平滑度在0.8~0.9,路径平滑度数值较高说明自适应规划的航线转折自然,无剧烈转向,既保障航行安全,又提升操作效率。上述结果表明:本文方法在复杂水域中,既能有效规避障碍,又能通过实时自适应调整,确保航线流畅连贯,避免频繁大幅转向,能够切实保障船舶在避障过程中安全、高效地驶向目标,充分验证了本文方法在船舶避障航迹自适应规划中的卓越能力。
3 结 语本文提出复杂开放水域船舶避障航迹自适应规划方法,在该方法内使用强化学习算法实现船舶避障航迹自适应规划。对本文方法进行实际验证后,从验证结果中得到本文方法对动态障碍物跟踪能力较强,规划航迹能避开动静障碍且平滑度高,提升了复杂水域船舶航行安全性与效率。但方法在极端海况等复杂场景的适应性或可进一步优化。该研究为航运智能化转型提供支撑,未来可探索与更多先进技术融合,以适应更复杂的航行环境。
| [1] |
颜明重, 李琛, 朱大奇. 基于生物启发神经网络的无人水面艇实时避障路径规划[J]. 上海海事大学学报, 2024, 45(3): 10-15+48. YAN M Z, LI C, ZHU D Q. Real-time obstacle avoidance path planning based on bio-inspired neural network for unmanned surface vehicles[J]. Journal of Shanghai Maritime University, 2024, 45(3): 10-15+48. |
| [2] |
李光泽, 俞万能, 廖卫强, 等. 基于动态窗口法的近海水域船舶避障算法研究[J]. 中国舰船研究, 2024, 19(1): 230-237. LI G Z, YU W N, LIAO W Q, et al. Obstacle avoidance algorithm for ships in complex waters based on dynamic window approach[J]. Chinese Journal of Ship Research, 2024, 19(1): 230-237. |
| [3] |
谭智坤, 张隆辉, 刘正锋, 等. 融合改进动态窗口法与速度障碍法的无人船局部路径规划[J]. 船舶力学, 2023, 27(3): 311-322. TAN Z K, ZHANG L H, LIU Z F, et al. Local path planning for USVs based on the fusion algorithm of improved dynamic window approach and velocity obstacle algorithm[J]. Journal of Ship Mechanics, 2023, 27(3): 311-322. |
| [4] |
周寅飞, 张立华, 贾帅东, 等. 最大可航窗口序列约束贝塞尔曲线的无人船自主航行航线规划方法[J]. 武汉大学学报(信息科学版), 2024, 49(7): 1224-1236. ZHOU Y F, ZHANG L H, JIA S D, et al. Autonomous navigation route planning method of unmanned ship based on bessel curves constrained by maximum navigable window sequence[J]. Geomatics and Information Science of Wuhan University, 2024, 49(7): 1224-1236. |
| [5] |
刘文博, 鲁阳, 薛彦卓. 面向冰区船舶航线的混合规划算法[J]. 哈尔滨工程大学学报, 2024, 45(11): 2065-2074. LIU W B, LU Y, XUE Y Z. A hybrid route planning algorithm for ship routing in ice areas[J]. Journal of Harbin Engineering University, 2024, 45(11): 2065-2074. |
| [6] |
庹玉龙, 康彩霞, 王莎莎, 等. 未知干扰下多船相邻交叉耦合同步编队避障控制[J]. 交通运输工程学报, 2023, 23(6): 314-326. TUO Y L, KANG C X, WANG S S, et al. Adjacent cross-coupling synchronous formation control with collision avoidance for multiple ships under unknown disturbances[J]. Journal of Traffic and Transportation Engineering, 2023, 23(6): 314-326. |
| [7] |
盛金亮, 董早鹏, 匡文琪, 等. 基于改进DWA的无人艇编队避障及MPC轨迹跟踪[J]. 大连海事大学学报, 2024, 50(4): 12-21. SHENG J L, DONG Z P, KUANG W Q, et al. Obstacle avoidance and MPC trajectory tracking of unmanned surface vehicle formation based on improved DWA[J]. Journal of Dalian Maritime University, 2024, 50(4): 12-21. |
| [8] |
唐裕峰, 宋瑶, 武浩正, 等. 雷达与AIS对海上低速目标航迹关联的特征选择[J]. 计算机仿真, 2023, 40(12): 193-199. TANG Y F, SONG Y, WU H Z, et al. Feature selection for correlation of radar and ais with low speed target tracks at sea[J]. Computer Simulation, 2023, 40(12): 193-199. |
2025, Vol. 47
