2. 中国科学院 机器人与智能制造创新研究院,辽宁 沈阳 110169;
3. 中国科学院大学,北京 100049
2. Institutes for Robotics and Intelligent Manufacturing, Chinese Academy of Sciences, Shenyang 110169, China;
3. University of Chinese Academy of Sciences, Beijing 100049, China
随着长续航力自主水下机器人、水下滑翔机、波浪滑翔机、无人帆船等面向海洋环境观测应用的长续航力海洋机器人(Marine Vehicle)技术逐步成熟[1],海洋机器人集群构建可控机动、组网协同、智能自主、持久在位的机器人化区域海洋环境观测网络成为研究和应用的重要发展方向。相对于海洋环境的时空尺度,海洋机器人观测网络获取的温度、盐度、海流流速等海洋环境观测数据通常较为稀疏。如何基于稀疏观测数据实现观测区域海洋环境温度、盐度、海流流速等海洋环境要素空间分布场的高分辨率预测,以满足军民等多方面应用对高分辨率海洋环境信息保障的需求,是海洋机器人观测网络应用需要研究和解决的一项重要问题。
针对该问题,国际上已开展诸多相关研究工作。在客观分析[2]、克里金[3]、高斯过程回归[4]等基于最优插值和统计估计等方法实施基于观测数据预测未观测位置的数据之外,建立海洋环境预测模型并通过同化观测数据估计模型结构与参数、修正模型预测输出,进而通过模型实现海洋环境状态高分辨率预测是该研究中的另一种主要方法。如文献 [5]~文献[7] 分别基于径向基函数、本征正交分解、动力学模态分解方法建立海洋环境预测模型,利用海洋机器人观测数据估计模型参数,进而使模型逼近海洋环境状态并实现准确的海洋环境预测。除上述方法之外,随着深度学习技术的发展,利用具有更强非线性函数逼近能力的人工神经网络建立海洋环境预测模型、实现数据驱动的海洋环境预测成为近年来热点研究方向。SHI等 [8] 提出用于空间场时间序列预测的卷积长短期记忆网络ConvLSTM已成为诸多海洋环境空间场时间序列预测研究的重要工具。
目前在基于深度神经网络模型实现海洋环境预测的研究工作中,主要通过历史数据训练海洋环境空间场时间序列预测模型[9]。本文在目前研究工作基础上,面向基于海洋机器人稀疏观测数据实现高分辨率、准确的海洋环境要素空间场预测需求,研究利用海洋机器人观测数据实现神经网络预测模型的在线学习。本文应用ConvLSTM建立高分辨率区域海洋环境预测模型,在应用历史数据训练的神经网络初始预测模型基础上,利用海洋机器人稀疏观测数据和序贯数据同化方法进一步优化模型参数,使模型不断逼近实时海洋环境状态、预测输出不断逼近海洋机器人观测。针对大尺度高空间分辨率预测带来的高计算复杂性问题,提出一种非均匀空间分辨率预测策略实施海洋环境预测,有效降低计算资源需求。利用中国科学院沈阳自动化研究所研发的“海翼”水下滑翔机,在南海北部实施的区域海洋环境观测实验中获得的观测数据,进行了区域海洋环境二维水平空间温度场预测实验,验证了方法的有效性。
1 海洋环境预测模型 1.1 空间场时间序列预测本文研究二维水平空间海洋环境要素空间场时间序列预测。给定空间区域
xfk+1=argmaxxk+1p(xk+1|xak,xak−1,⋯,xak−L+1)。 | (1) |
式中:
为实现选定海洋环境要素空间场的预测,将二维水平空间区域
![]() |
图 1 空间场内离散预测节点示意图 Fig. 1 Illustration of discrete prediction nodes within a spatial field |
本文通过数据驱动方法,利用人工神经网络建立上述海洋环境要素空间场预测模型。
1.2 ConvLSTM模型文献 [8] 提出的卷积长短期记忆网络模型ConvLSTM是实现上述预测任务的有效技术途径。ConvLSTM融合了卷积神经网络(CNN)和长短期记忆网络(LSTM)的优点,通过在输入到状态和状态到状态转换的过程中引入卷积结构,对传统全连接LSTM进行了扩展,从而能够有效地捕获高维数据中的时空相关性。ConvLSTM网络的单元结构如图2所示。
![]() |
图 2 ConvLSTM单元示意图 Fig. 2 Illustration of an ConvLSTM cell |
ConvLSTM的关键方程如下[8]:
ik=sigmoid(Wxi∗xk+WHi∗Hk−1+WCi∘Ck−1+bi), | (2) |
fk=sigmoid(Wxf∗xk+WHf∗Hk−1+WCf∘Ck−1+bf), | (3) |
Ck=fk∘Ck−1+ik∘tanh(WxC∗xk+WHC∗Hk−1+bC), | (4) |
ok=sigmoid(Wxo∗xk+WHo∗Hk−1+WCo∘Ck+bo), | (5) |
Hk=ok∘tanh(Ck)。 | (6) |
式中:
ConvLSTM适用于处理高维空间场的时序输入,以预测未来的高维空间场时序输出。
1.3 海洋环境预测模型设计基于上述ConvLSTM单元模型,本文构建海洋环境要素空间场时间序列预测模型
xfk+1=NN(xak,xak−1,⋯,xak−L+1,Wfk+1,bfk+1)。 | (7) |
式中:
基于ConvLSTM单元模型,本文设计的海洋环境要素二维空间场时间序列预测的神经网络模型结构如图3所示。
![]() |
图 3 设计的神经网络模型结构 Fig. 3 Illustration of the designed ConvLSTM architecture |
在每个时间步,ConvLSTM层的输入为一个张量,其维度为
ConvLSTM层输出序列中的最后一个时间步的输出特征维度为
本文对训练神经网络预测模型的样本数据应用Z-score方法进行归一化处理,将原始海洋环境要素数据映射为均值为
xZi,j=(xi,j−ˉxj)/δj,i=1,⋯,Nsa,j=1,⋯,Nlat×Nlon。 | (8) |
式中:
ˉxj=1Nsa∑Nsai=1xi,j。 | (9) |
δj=√1Nsa−1∑Nsai=1(xi,j−ˉxj)2。 | (10) |
通过该方法,有助于消除数据间的尺度差异、避免模型受到数据尺度影响,使模型更容易学习数据的特征和模式,在训练过程中有助于加速收敛,提高模型的训练效率和预测性能。
在应用模型进行海洋环境要素空间场预测时,对模型输入的要素空间场时间序列首先进行如下归一化处理:
xink−i,j=(xak−i,j−ˉxj)/δj,i=0,⋯,L−1,j=1,⋯,Nlat×Nlon。 | (11) |
式中:
xfk+1,j=xoutk+1,j×δj+ˉxj,j=1,⋯,Nlat×Nlon。 | (12) |
式中:
由于海洋环境特性动态变化,为了应用前述建立的神经网络模型在海洋环境要素空间场连续预测过程中保持较高的预测准确性,还需要通过观测数据在线学习神经网络模型参数
在神经网络模型中,权重
为了实施滤波,本文将
αfk=αak−1+ηk。 | (13) |
式中:
建立观测方程,用于通过滤波在线学习模型状态。在
yk=xk+εk。 | (14) |
式中:
在式 (14) 中,
xk=hk(αk)=GPR|S(NN(αk))。 | (15) |
式中:
基于以上方程,可得到如下形式的观测方程:
yk=hk(αk)+εk。 | (16) |
如式 (16) 所示,观测方程为非线性方程,因此针对该非线性系统模型,本文基于集合卡尔曼滤波方法实现模型参数学习。其具体过程如下:
共考虑
对于集合中各成员,有如下式的状态演化方程:
αfk,i=αak−1,i+ηk,i,i=1,⋯,Nem。 | (17) |
式中:
Pfk=1Nem−1∑Nemi=1(αfk,i−ˉαfk)(αfk,i−ˉαfk)T。 | (18) |
式中,
ˉαfk=1Nem∑Nemi=1αfk,i。 | (19) |
对
αak,i=αfk,i+Kk(yk,i−hk(αfk,i))。 | (20) |
式中,
Kk=Ak(Bk+σ2ϵI)−1。 | (21) |
式中:
Ak=Nem∑i=1(αfk,i−ˉαfk)(hk(αfk,i)−hk(ˉαfk))TNem−1, | (22) |
Bk=Nem∑i=1(hk(αfk,i)−hk(ˉαfk))(hk(αfk,i)−hk(ˉαfk))TNem−1。 | (23) |
Pak=1Nem−1∑Nemi=1(αak,i−ˉαak)(αak,i−ˉαak)T。 | (24) |
式中:
ˉαak=1Nem∑Nemi=1αak,i。 | (25) |
基于以上计算,
xak=h∗k(ˉαak)=GPR|D(NN(ˉαak)), | (26) |
COV(xak|yk)=Ck+σ2ϵI。 | (27) |
式中:
Ck=Nem∑i=1(h∗k(αak,i)−h∗k(ˉαak))(h∗k(αak,i)−h∗k(ˉαak))TNem−1。 | (28) |
在上述参数学习过程中,
对于实现高分辨率海洋环境预测,通常缺乏相应高分辨率的海洋环境要素历史数据。针对该问题,本文应用数值海洋模式预报系统输出的历史数据以及高斯过程回归方法生成高分辨率数据用于神经网络训练,以获得
对于应用梯度下降方法训练神经网络,本文设置代价函数如下:
JMSE=1Nlat×Nlon∑Nlat×Nloni=1(xpr,i−xtr,i)2。 | (29) |
式中:
此外,对于海流流速空间场预测,考虑到海水的流动性并假设海水不可压缩,在预测区域范围内,一段时间内的海水净流入量应为
JMSE=1Nlat×NlonNlat×Nlon∑i=1(xpr,i−xtr,i)2+λ|2×(Nlat+Nlon−2)∑j=1xpr,ej|。 | (30) |
式中:
目前海洋环境预测应用中,主要基于均匀空间分辨率网格节点划分实现预测。采用均匀空间分辨率网格节点划分,利用神经网络对大尺度海洋环境进行高分辨率预测,将需要计算大量节点进而导致庞大的网络规模和较高的计算资源需求,这对模型高效学习带来挑战。本文提出采用非均匀空间分辨率的预测网格节点划分策略,解决局部高分辨率预测与高计算资源需求之间的矛盾。
基于海洋环境要素空间分布的非均匀性,本文研究模型应用非均匀网格节点的环境预测,对关注区域进行加密预测,提高预测分辨率和准确性;对非关注区域进行稀疏预测,以实现在满足预测需求情况下降低模型复杂性和计算量,提升模型学习能力的目的。
为实施非均匀空间分辨率预测,首先需要确定分辨率调节目标,如对海洋环境不确定性较大或要素水平梯度变化剧烈区域实施加密预测。对于不同目标,本文生成非均匀空间分辨率预测网格节点的计算方法均相同,因此以对海洋环境要素随时间变化较大区域进行加密预测为例,给出如下所示非均匀节点位置的计算方法:
1)基于历史数据或神经网络模型预测输出数据,计算
2)通过有限元求解过程中常用的自适应网格划分方法[11],利用三角面元覆盖方差场,对方差场进行三角网格剖分,在方差大的位置加密计算网格,并得到由
3)采用聚类算法对点云进行聚类,获得设定预测节点数量
本文采用模糊C-均值聚类算法[12]实现聚类,通过最小化以下目标函数确定各聚类中心位置:
J(u,c)=∑Npi=1∑Ncj=1u2ij‖pi−cj‖2。 | (31) |
式中:
本节以区域海洋环境二维水平面温度场预测为例,应用中国科学院沈阳自动化研究所于2019年在南海北部布放的水下滑翔机观测数据,验证提出的区域高分辨率海洋环境预测方法的有效性。
4.1 预测区域水下滑翔机作为一种浮力引擎驱动的海洋机器人,已成为执行长期大范围海洋环境观测任务的重要工具。
本文应用6台“海翼”水下滑翔机于2019年在南海北部执行区域海洋环境观测任务中获取的部分观测数据,进行本文提出方法的有效性验证。图4所示为观测实验区域位置及区域范围内水下滑翔机轨迹,轨迹旁所示编号如“1000J026”为该观测任务设置的水下滑翔机编号。根据如图4所示的实验区域,本文设置实施预测的区域海洋环境为北纬 20.80°~21.76° N 、东经119.76°~120.72° E 范围内 0.96° × 0.96°区域。在本实验中,应用该区域6台水下滑翔机在观测过程中通过温盐深传感器获取的100 m深度的温度数据进行该深度二维水平空间温度场预测。
![]() |
图 4 实验区域位置以及区域范围内水下滑翔机轨迹 Fig. 4 Location of the experimental region and the trajectories of the underwater gliders within the region |
在该实验中,设置预测区域
为了确定预测节点的位置,本文基于HYCOM(Hybrid Coordinate Ocean Model)数值海洋模式预报输出数据计算预测区域范围内2019年05月14日08时前 24 h的方差分布场,并基于该分布场及本文采用的方法计算获得相应的非均匀预测网格节点,结果如图5所示。
![]() |
图 5 方差分布和非均匀预测节点 Fig. 5 Distribution of variance and non-uniform prediction nodes |
可知,采用非均匀空间分辨率的预测网格节点,在温度场随时间变化较大的区域得到较高空间分辨率的节点,由此计算得到的最小值可达约为 0.036 km 。而在应用均匀网格条件下,若达到相同的空间分辨率,在计算过程中共需要计算约
为了提高模型学习效率,在同化水下滑翔机观测数据前,本文首先利用HYCOM数值海洋模式的历史输出数据训练神经网络实施模型初始化。HYCOM输出数据的均匀网格水平空间分辨率为0.08°,时间分辨率为 3 h 。为了实施如上所述的高分辨率区域海洋环境预测,本文通过高斯过程回归方法生成预测区域范围如图5所示的预测网格节点位置的高空间分辨率数据。在训练神经网络初始预测模型时,选用HYCOM数据训练样本的时间范围为2019年05月14日08时—08月12日05时,共对应
在通过梯度下降方法训练得到的模型基础上,应用6台水下滑翔机的观测数据通过集合卡尔曼滤波方法学习模型参数。本实验过程共实施连续40次的学习,每次学习间隔时间为 3 h,每次学习时利用过去 3 h期间6台水下滑翔机获取的水下 100 m 深度的温度数据,该学习过程覆盖的时间范围为2019年08月12日08时—08月17日05时。学习过程中,模型状态变量数
为评估预测和学些结果,本文计算各学习周期在同化水下滑翔机观测数据后,基于
RMSE(tk)=√1NS∑NSi=1(xak(sS,i)−yk,i)2。 | (32) |
式中:
由图6所示及式(32)计算得到的RMSE随学习周期的变化情况。结果表明,通过观测数据在线学习神经网络模型参数后,模型在水下滑翔机观测位置的预测结果相对于水下滑翔机观测的均方根误差由初始预测模型的 1.10℃,在10个学习周期后达到约 0.26℃,降低了76%。
![]() |
图 6 RMSE随学习周期变化 Fig. 6 RMSE variations with learning cycles |
图7为模型在2019年08月17日05时于预测范围内的海水温度场预测输出结果,图8为相应的预测方差场结果。
![]() |
图 7 2019年08月17日05时温度场预测 Fig. 7 Predicted temperature field at 05:00, Aug 17, 2019 |
![]() |
图 8 2019年08月17日05时温度场预测方差 Fig. 8 Variance of the predicted temperature field at 05:00, Aug 17, 2019 |
面向基于海洋机器人集群构建的区域海洋环境观测网络实施海洋环境信息保障需求,提出一种基于海洋机器人观测网络稀疏,观测数据预测高分辨率海洋环境要素空间分布场的方法。基于卷积长短期记忆神经网络,建立了有效的数据驱动区域海洋环境空间场时间序列预测模型,在基于历史数据训练的模型参数基础上,应用海洋机器人观测数据与集合卡尔曼滤波方法,实现了神经网络模型的在线学习,使其预测输出逐步逼近实际观测数据。针对大尺度海洋环境高分辨率预测所带来的计算复杂性问题,应用非均匀空间分辨率预测节点有效平衡了预测分辨率与计算量之间的矛盾。应用水下滑翔机网络实测数据实施的区域海洋环境二维水平面温度场预测实验,验证了提出方法的有效性。
在本文研究的方法中,海洋机器人在不同位置获取的观测数据对于模型学习效率、以及预测结果都具有重要影响。在目前研究结果基础上,优化海洋机器人的观测位置和路径,使其获取的观测数据能够最大化提高模型参数估计的准确性,是需要进一步开展的研究工作。
[1] |
CHEN Z, YU J, ZHANG A. Overview on observation-oriented unmanned marine vehicles with high cruising ability: Development status and prospect[J]. Journal of Ocean Technology, 2016, 35(1): 122-130. |
[2] |
L'HÉVÉDER B, MORTIER L, TESTOR P, et al. A glider network design study for a synoptic view of the oceanic mesoscale variability[J]. Journal of Atmospheric and Oceanic Technology, 2013, 30(7): 1472-1493. DOI:10.1175/JTECH-D-12-00053.1 |
[3] |
GREGÓRIO R P A. Geostatistical prediction of ocean outfall plume characteristics based on an autonomous underwater vehicle[J]. International Journal of Advanced Robotic Systems, 2013, 10(7): 289. DOI:10.5772/56644 |
[4] |
FOSSUM T O, EIDSVIK J, ELLINGSEN I, et al. Information-driven robotic sampling in the coastal ocean[J]. Journal of Field Robotics, 2018, 35(7): 1101-1121. DOI:10.1002/rob.21805 |
[5] |
MUNAFÒ A, SIMETTI E, TURETTA A, et al. Autonomous underwater vehicle teams for adaptive ocean sampling: A data-driven approach[J]. Ocean Dynamics, 2011, 61(11): 1981-1994. DOI:10.1007/s10236-011-0464-x |
[6] |
GRASSO R, BRACA P, FORTUNATI S, et al. Dynamic underwater glider network for environmental field estimation[J]. IEEE Transactions on Aerospace and Electronic Systems, 2016, 52(1): 379-395. DOI:10.1109/TAES.2015.140935 |
[7] |
HEUSS J P, HALEY P J, MIRABITO C, et al. Reduced order modeling for stochastic prediction onboard autonomous platforms at sea[C]//Proceedings of Global Oceans 2020: Singapore – U. S. Gulf Coast. Biloxi, MS, USA, 2020: 1−10.
|
[8] |
SHI X, CHEN Z, WANG H, et al. Convolutional LSTM network: A machine learning approach for precipitation nowcasting[C]//Advances in Neural Information Processing Systems 28 (NIPS 2015). Montreal, Canada, 2015: 802−810.
|
[9] |
YANG Y, DONG J, SUN X, et al. A CFCC-LSTM model for sea surface temperature prediction[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(2): 207-211. DOI:10.1109/LGRS.2017.2780843 |
[10] |
EVENSEN G. Data assimilation: the ensemble Kalman filter[M]. Berlin, Heidelberg, Germany: Springer-Verlag, 2009: 1−307.
|
[11] |
PERSSON P-O. Mesh generation for implicit geometries[D]. Massachusetts: Department of Mathematics, Massachusetts Institute of Technology, 2005.
|
[12] |
BEZDEK J C. A convergence theorem for the fuzzy ISODATA clustering algorithms[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1980, 2(1): 1-8. |