文章快速检索     高级检索
  大地测量与地球动力学  2024, Vol. 44 Issue (3): 287-292  DOI: 10.14075/j.jgg.2023.06.155

引用本文  

王怀兵, 万晓云, Richard Fiifi Annan. 基于卷积神经网络预测南海海底地形[J]. 大地测量与地球动力学, 2024, 44(3): 287-292.
WANG Huaibing, WAN Xiaoyun, Richard Fiifi Annan. Seafloor Topography Prediction in the South China Sea Based on Convolutional Neural Network[J]. Journal of Geodesy and Geodynamics, 2024, 44(3): 287-292.

项目来源

国家自然科学基金(42074017)。

Foundation support

National Natural Science Foundation of China, No. 42074017.

通讯作者

万晓云,博士,副教授,主要从事卫星重力、卫星测高研究,E-mail:wxy191954@126.com

Corresponding author

WAN Xiaoyun, PhD, associate professor, majors in satellite gravity and satellite altimetry, E-mail: wxy191954@126.com.

第一作者简介

王怀兵,硕士生,主要从事海底地形反演研究,E-mail:b15650581186@126.com

About the first author

WANG Huaibing, postgraduate, majors in seafloor topography inversion, E-mail: b15650581186@126.com.

文章历史

收稿日期:2023-06-06
基于卷积神经网络预测南海海底地形
王怀兵1     万晓云1     Richard Fiifi Annan1     
1. 中国地质大学(北京)土地科学技术学院,北京市学院路29号,100083
摘要:针对南海区域,使用3种重力信号(垂线偏差、重力异常、垂直重力梯度异常)训练卷积神经网络模型,并将预测结果与船测数据和国外模型结果进行对比分析。将3种重力信号分成4组数据:重力异常,重力异常与垂直重力梯度异常,重力异常与垂线偏差,以及重力异常、垂线偏差和垂直重力梯度异常。4种组合方式的反演结果与船测水深之间的标准差分别为104.780 m、102.778 m、93.788 m、88.289 m,表明随着不同类型重力数据的加入,水深预测精度明显提高,并且在深度大于2 000 m时,反演结果精度提升效果更为显著。将训练集占总数据集的比例分别设置为80%、70%、60%和50%,反演结果与船测水深之间的标准差分别为88.289 m、91.256 m、92.833 m、96.022 m,表明数据量的增多可以有效提高模型学习结果的精度。
关键词卷积神经网络重力场信息深度学习海底地形频域法

海底地形测量作为海洋测绘的一项重要内容,对科学研究、资源探索、军事战略以及经济建设都具有重要作用[1]。海底地形模型的构建一方面可以为船舶航道和航行安全提供保障,另一方面可以为深海探测以及航行提供基础资料[2]。传统的水深测量是利用船载回声探测技术,这种技术虽然精度高,但价格昂贵、费力、费时[3]。卫星测高技术使得利用卫星重力数据获取海底地形成为可能,尤其随着重力反演理论的不断成熟,利用卫星测高资料获取海底地形成为一种新型技术[4]。该技术可极大弥补传统测量方法的不足,具有空间覆盖范围大、成本低等特点[5]

机器学习作为一种新型技术,开始主要用于图像识别、监督分类等方面[6],但随着技术的不断提高,近年也被用于近岸海底地形反演,并取得较好效果。Ai等[7]基于卷积神经网络对遥感影像部分波段的特征信息进行学习,并取得较好的预测结果;Liu等[8]提出一种一维卷积神经网络深度学习方法,根据原始实验回波数据直接反演水深,结果表明,该深度学习方法对于处理大量LiDAR测深回波波形具有可行性。

本文首先利用卷积神经网络对重力场信息进行训练学习,并将预测结果与船测水深数据、国外水深模型数据进行对比分析;然后,对加入同源重力场产品数据是否会提高模型预测效果进行研究;最后,简要分析训练集的占比(训练集占总数据集的比例)对卷积神经网络预测结果精度的影响。

1 理论方法 1.1 卷积神经网络原理

卷积神经网络(convolutional neural network,CNN)是一种基于深度学习的神经网络模型。与传统的神经网络不同,CNN利用卷积操作和池化操作,能够有效提取数据特征,从而完成对数据的高效分类和识别等任务[9]

CNN基本组成部分包括卷积层、池化层、激活函数、全连接层等。其中,卷积层是CNN的核心部分,其通过对输入数据进行卷积操作,可以提取出数据的各种特征。为了防止卷积过程中前层网络参数发生变化导致模型训练失败以及保证模型的快速收敛,在进行卷积之前,对输入数据统一进行归一化处理,然后利用3×3卷积核进行卷积。目前对于卷积层数的选取缺乏理论依据,均是通过实验经验进行设置[10]。通过实验分析,本文设置5个卷积层进行处理,第1层卷积使用128个神经元,第2、3层包含256个神经元,第4、5层包含512个神经元。在每个卷积层后面均加入归一化层以及修正线性单元(ReLU)层。加入归一化层的目的是为了使网络快速收敛,同时由于ReLU层中ReLU函数会将坐标和重力信号设置为负值,并且所有深度都设置为0,如果不进行归一化处理,将会导致训练模型出错[11]。在第1、2层卷积后面加入池化层,池化操作通常包括对特征图的某个区域进行最大值或平均值处理,从而减小特征图尺寸。本研究采用最大池化层以2×2为移动窗口、步长为2进行池化处理。在卷积和池化操作之后,CNN会通过全连接层将数据映射到输出类别上。全连接层通常是一个具有多个神经元的网络层,每个神经元都与前一层的所有神经元相连。最后加入dropout层以及回归层,前者是在模型参数过多但训练样本较少的情况下可以最小化网络的过拟合,在一定程度上达到正则化的效果,后者用于回归。对于模型参数,该网络以初始学习率0.001训练10个历元,每个历元迭代3 768次。用于更新权重的优化算法是带动量的随机梯度下降算法。本研究中CNN示意图如图 1所示。

图 1 CNN原理图 Fig. 1 CNN schematic diagram
1.2 模型评估指标

本文以决定系数(R2)、均方根误差(RMSE)以及平均绝对误差(MAE)3个指标对预测结果进行评价[12],表达式为:

$ R^2=1-\frac{\sum\limits_{i=0}^n\left(y_i-\hat{y}_i\right)^2}{\sum\limits_{i=0}^n\left(y_i-\bar{y}\right)^2} $ (1)
$ \mathrm{RMSE}=\sqrt{\frac{1}{n} \sum\limits_{i=1}^n\left(y_i-\hat{y}_i\right)^2} $ (2)
$ \mathrm{MAE}=\frac{1}{n} \sum\limits_{i=1}^n\left|y_i-\hat{y}_i\right| $ (3)

式中,y为预测水深,ŷ为实际水深,y为实际水深的平均值,n代表水深点个数,i代表第i个水深点。

2 研究区域及数据 2.1 研究区域

本文选取南海(112°~119°E,12°~20°N)作为研究区域,主要因为南海区域地形结构比较典型,且多位学者采用传统方法(如频域法、重力地质法)对该地区进行过研究计算,便于对比分析。

2.2 数据

本研究使用的船测数据来自美国国家海洋和大气管理局国家环境信息中心(NOAA, https://maps.ngdc.noaa.gov/viewers/geophysics/),主要用于深度学习预测海底地形和精度评估。垂直重力梯度异常(VGG)、重力异常(GA)、垂线偏差(DOV)均采用Scripps海洋研究所(SIO,https://topex.ucsd.edu/pub/)提供的模型数据。海底地形模型数据分别来自SIO发布的SIOV25.1模型、丹麦科技大学(DTU,https://ftp.space.dtu.dk/pub/DTU21/1_MIN/)发布的DTU21BAT模型以及国际海道测量组织(IHO) 和政府间海洋学委员会(IOC) 联合发布的世界大洋海底地形数据GEBCO_2022模型(https://www.gebco.net/data_and_products/)。

3 结果与分析

在训练过程中,本文使用3种重力信号数据集,并选取80%的水深数据作为训练集、10%作为验证集、10%作为测试集,每个数据集中水深点数分别为100 182、12 523和12 523,结合§1.1构建的CNN网络以及参数设置对模型进行训练,分析模型训练效果。完成训练后,通过训练集和验证集的误差曲线来分析模型性能(图 2)。

图 2 模型训练进度 Fig. 2 Model training progress

图 2可以看出,训练集和测试集的损失函数曲线在迭代约700次时达到饱和状态,曲线接近于0。结合图 34可以得出,本次模型训练效果良好,预测水深与船测水深具有较好的线性关系。通过计算可知,R2值为98.3%,测试点误差呈现标准正态分布,且大部分都在-300~300 m之间。

图 3 预测水深与测试水深关系 Fig. 3 Relationship between predicted and tested water depths

图 4 测试点误差分布直方图 Fig. 4 Histogram of test point error distribution
3.1 与船测水深数据对比分析

通过训练得到的模型对全部数据集进行预测,并与船测水深数据进行精度对比,绘制预测结果与船测水深空间分布图(图 5)。通过3σ准则筛选出异常值,并将精度统计结果呈现在表 1和反演误差分布直方图(图 6,图中蓝色线代表以100 m为间隔,反演误差在每个分段占总数的百分比曲线)中。

图 5 CNN预测水深和船测水深空间分布 Fig. 5 Spatial distribution of CNN and shipborne water depth

表 1 CNN预测水深模型与船测水深模型精度统计 Tab. 1 Accuracy statistics of CNN and shipborne water depth models

图 6 误差分布直方图 Fig. 6 Histogram of error distribution

通过图 6可以看出,反演误差符合正态分布,且在-300~300 m范围内点数占总点数的95%以上。结合表 1可知,CNN预测结果与船测水深的误差平均值为7.955 m,标准差为88.289 m。

3.2 与国外水深模型对比分析

将CNN训练得到的预测结果分别与SIOV25.1、DTU21BAT、GEBCO_2022模型进行对比分析。首先绘制CNN预测水深与其他各模型水深空间分布图(图 7),然后进行精度统计(表 2)。

图 7 预测水深与其他各模型水深空间分布 Fig. 7 Spatial distribution of water depth of predicted model and other models

表 2 精度统计 Tab. 2 Precision statistics

图 7可以看出,在浅海地区,CNN预测模型与其他模型存在较大差异,这主要是因为本次模型是利用水深数据进行学习,而船测数据在浅海地区数据相对较少,同时也缺乏陆地数据。由表 2可见,CNN预测结果与SIOV25.1、DTU21BAT、GEBCO_2022模型的误差平均值分别为-4.358 m、-3.749 m、0.014 m,标准差分别为124.989 m、127.563 m、130.826 m。

3.3 垂直重力梯度异常、垂线偏差、重力异常的不同组合反演结果对比分析

研究表明[13-14],利用重力场产品数据进行融合可以提高海底地形反演精度。§3.2使用3种重力信号进行反演,难以区分不同类型数据的影响。为了分析不同类型数据的贡献,使用不同数据类型进行深度学习,并对预测结果进行对比分析(表 3)。

表 3 不同组合的学习结果统计 Tab. 3 Statistics of learning results of different combinations

表 3可知,随着SIO模型重力场数据的加入,反演结果与船测数据之间的标准差逐渐减小。结果表明,同源重力场信息的加入可以有效提高深度学习算法反演海底地形的精度,图 8为全部水深点处误差分布,可以看出,反演误差在-200~200 m范围的比例在逐步提高,进一步验证了该结论。

图 8 全部水深点处反演误差分布直方图 Fig. 8 Histogram of inversion error distribution at all water depths

图 9可以看出,在水深大于2 000 m时,随着重力信息的加入,误差标准差在逐渐降低,说明重力信息的加入可以提高深海区域海底地形反演精度;而在水深小于1 000 m时,根据图中-1 000~0 m变化趋势可知,该区间水深反演精度的提升主要归功于垂线偏差数据的加入,重力梯度数据并未提升反演精度。理论上,在深度学习中,高精度数据的加入可以提高预测精度,精度较低数据的加入可能会导致预测结果较差,因此本研究出现以上结果可能是因为在水深小于1 000 m区域,重力梯度数据的精度较低。

图 9 标准差随水深的变化 Fig. 9 Variation of standard deviation with water depths
3.4 船测数据数量对反演结果精度的影响

§3.1~3.3都是基于以80%船测水深数据作为训练集、10%作为验证集、10%作为测试集对海底地形反演精度进行研究,为分析不同数量训练数据的影响,本节分别以80%、70%、60%以及50%的船测水深数据作为训练集,其他数据集占比不变,分析不同训练集数据量对海底地形反演精度的影响,统计结果见表 4

表 4 不同训练集数据量海底地形反演结果精度统计 Tab. 4 Accuracy statistics of seafloor topography inversion results with different data volume of training set

为了更直观地观察不同数据量的反演结果精度变化情况,图 10为反演误差随训练集数据量变化的标准差曲线。

图 10 标准差随训练集占比的变化 Fig. 10 Variation of standard deviation with proportion of training set

结合表 4图 10可以看出,分别以训练集占比80%、70%、60%以及50%进行模型训练,并将预测结果与船测水深数据进行精度统计,得到标准差分别为88.289 m、91.526 m、92.833 m、96.022 m,表明随着训练集数量的增多,CNN模型训练效果逐步提高,水深预测结果精度逐渐提高。

4 结语

本文利用重力异常、垂线偏差、垂直重力梯度异常数据和船测水深数据,对CNN神经网络模型进行训练,预测南海地区海底地形。通过与真实船测水深、SIO模型、DTU模型以及GEBCO模型数据进行对比,得到标准差分别为88.289 m、124.989 m、127.563 m、130.826 m。将重力信息分成4组进行训练并预测:重力异常,垂直重力梯度异常与重力异常,垂线偏差与重力异常,以及垂线偏差、重力异常与垂直重力梯度异常。根据统计结果可知,4组数据反演结果与船测水深之间的标准差分别为104.780 m、102.778 m、93.788 m、88.289 m,表明同源信息的融合可以提高水深反演精度。最后,研究分析训练集占比对CNN模型预测结果精度的影响,结果表明,数据量的增多可以有效提高模型学习结果的精度。基于深度学习的水深反演无需建立物理原理模型,且便于融合各类数据进行联合反演。未来随着海洋重力场数据的丰富[15],深度学习在海底地形反演中有望发挥更大作用。

参考文献
[1]
赵建虎, 欧阳永忠, 王爱学. 海底地形测量技术现状及发展趋势[J]. 测绘学报, 2017, 46(10): 1 786-1 794 (Zhao Jianhu, Ouyang Yongzhong, Wang Aixue. Status and Development Tendency for Seafloor Terrain Measurement Technology[J]. Acta Geodaetica et Cartographica Sinica, 2017, 46(10): 1 786-1 794) (0)
[2]
范雕, 李姗姗, 孟书宇, 等. 不同均衡补偿模式下海底地形反演方法比较分析[J]. 中国惯性技术学报, 2019, 27(1): 51-59 (Fan Diao, Li Shanshan, Meng Shuyu, et al. Comparison and Analysis on Seafloor Topography Inversion Methods with Different Isostatic Compensation Models[J]. Journal of Chinese Inertial Technology, 2019, 27(1): 51-59) (0)
[3]
安德超, 郭金运, 纪兵, 等. 顾及海底地形坡度的南海海底地形分区GGM反演[J]. 地球物理学进展, 2022, 37(5): 1 789-1 798 (An Dechao, Guo Jinyun, Ji Bing, et al. Considering the Gradient of Ocean Topography to Predict Bathymetry with the Gravity-Geology Method in the South China Sea[J]. Progress in Geophysics, 2022, 37(5): 1 789-1 798) (0)
[4]
胡敏章, 李建成, 邢乐林. 由垂直重力梯度异常反演全球海底地形模型[J]. 测绘学报, 2014, 43(6): 558-565 (Hu Minzhang, Li Jiancheng, Xing Lelin. Global Bathymetry Model Predicted from Vertical Gravity Gradient Anomalies[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(6): 558-565) (0)
[5]
彭聪, 周兴华, 王颖. 两种测高重力异常反演海底地形方法比较[J]. 海洋通报, 2020, 39(2): 223-230 (Peng Cong, Zhou Xinghua, Wang Ying. Comparison of Two Methods for Retrieving Sea Bottom Terrain Bathymetry Prediction from Altimetry Gravity Anomalies[J]. Marine Science Bulletin, 2020, 39(2): 223-230) (0)
[6]
Alevizos E. A Combined Machine Learning and Residual Analysis Approach for Improved Retrieval of Shallow Bathymetry from Hyperspectral Imagery and Sparse Ground Truth Data[J]. Remote Sensing, 2020, 12(21) (0)
[7]
Ai B, Wen Z, Wang Z H, et al. Convolutional Neural Network to Retrieve Water Depth in Marine Shallow Water Area from Remote Sensing Images[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2020, 13: 2 888-2 898 DOI:10.1109/JSTARS.2020.2993731 (0)
[8]
Liu Y X, Yue J, Shi P, et al. A Deep Learning Method for LiDAR Bathymetry Waveforms Processing[C]. International Conference on Neural Networks, Information and Communication Engineering, Qingdao, 2021 (0)
[9]
Al-Najar M, Thoumyre G, Bergsma E W J, et al. Satellite Derived Bathymetry Using Deep Learning[J]. Machine Learning, 2023, 112(4): 1 107-1 130 DOI:10.1007/s10994-021-05977-w (0)
[10]
Wang L, Scott K A, Xu L L, et al. Sea Ice Concentration Estimation during Melt from Dual-Pol SAR Scenes Using Deep Convolutional Neural Networks: A Case Study[J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(8): 4 524-4 533 DOI:10.1109/TGRS.2016.2543660 (0)
[11]
Annan R F, Wan X Y. Recovering Bathymetry of the Gulf of Guinea Using Altimetry-Derived Gravity Field Products Combined via Convolutional Neural Network[J]. Surveys in Geophysics, 2022, 43(5): 1 541-1 561 DOI:10.1007/s10712-022-09720-5 (0)
[12]
潘信亮, 杨仁辉, 江涛, 等. 基于Bi-LSTM的近岸水体深度反演[J]. 光学学报, 2021, 41(10): 134-143 (Pan Xinliang, Yang Renhui, Jiang Tao, et al. Depth Inversion of Coastal Waters Based on Bi-LSTM[J]. Acta Optica Sinica, 2021, 41(10): 134-143) (0)
[13]
范雕, 李姗姗, 孟书宇, 等. 联合多源重力数据反演菲律宾海域海底地形[J]. 测绘学报, 2018, 47(10): 1 307-1 315 (Fan Diao, Li Shanshan, Meng Shuyu, et al. Recovery of Bathymetry over Philippine Sea by Combination of Multi-Source Gravity Data[J]. Acta Geodaetica et Cartographica Sinica, 2018, 47(10): 1 307-1 315) (0)
[14]
胡敏章, 李建成, 金涛勇, 等. 联合多源数据确定中国海及周边海底地形模型[J]. 武汉大学学报: 信息科学版, 2015, 40(9): 1 266-1 273 (Hu Minzhang, Li Jiancheng, Jin Taoyong, et al. Recovery of Bathymetry over China Sea and Its Adjacent Areas by Combination of Multi-Source Data[J]. Geomatics and Information Science of Wuhan University, 2015, 40(9): 1 266-1 273) (0)
[15]
Wan X Y, Annan R F, Ziggah Y Y. Altimetry-Derived Gravity Gradients Using Spectral Method and Their Performance in Bathymetry Inversion Using Back-Propagation Neural Network[J]. Journal of Geophysical Research: Solid Earth, 2023, 128(2) (0)
Seafloor Topography Prediction in the South China Sea Based on Convolutional Neural Network
WANG Huaibing1     WAN Xiaoyun1     Richard Fiifi Annan1     
1. School of Land Science and Technology, China University of Geosciences, 29 Xueyuan Road, Beijing 100083, China
Abstract: For the South China Sea region, we use three types of gravity field signals(vertical deflection, gravity anomaly, and vertical gravity gradient anomaly) to train a convolutional neural network model, which is compared and analyzed with shipborne depth and foreign models. The three gravity signals are divided into four groups: gravity anomaly, gravity anomaly combined with vertical gravity gradient anomaly, gravity anomaly combined with vertical deflection, and gravity anomaly combined with vertical deflection and vertical gravity gradient anomaly. The standard deviations between the inversion results of four combinations and shipborne depths are 104.780 m, 102.778 m, 93.788 m, and 88.289 m, respectively, indicating that the accuracy of bathymetry prediction improves significantly with the increase of different types of gravity data. At depth greater than 2 000 m, the accuracy improvement of inversion results is more significant. By setting the proportion of training set to total dataset to 80%, 70%, 60% and 50%, respectively, the standard deviations between the inversion results and shipborne depths are 88.289 m, 91.256 m, 92.833 m and 96.022 m, respectively, indicating that the increase of data can effectively improve the accuracy of model learning results.
Key words: convolutional neural network; gravity field information; deep learning; seafloor topography; frequency domain method