文章快速检索     高级检索
  大地测量与地球动力学  2023, Vol. 43 Issue (2): 116-120  DOI: 10.14075/j.jgg.2023.02.002

引用本文  

杨鑫春, 游为, 万祥禹, 等. 利用多元线性回归模型重构中国九大流域陆地水储量变化[J]. 大地测量与地球动力学, 2023, 43(2): 116-120.
YANG Xinchun, YOU Wei, WAN Xiangyu, et al. Reconstruction of Terrestrial Water Storage Changes of Nine Major River Basins in China Using a Multiple Linear Regression Model[J]. Journal of Geodesy and Geodynamics, 2023, 43(2): 116-120.

项目来源

国家自然科学基金(41974013)。

Foundation support

National Natural Science Foundation of China, No. 41974013.

通讯作者

游为, 博士,副教授, 主要从事卫星重力测量及数据处理研究,E-mail: youwei@swjtu.edu.cn

Corresponding author

YOU Wei, PhD, associate professor, majors in satellite gravity measurement and data processing, E-mail: youwei@swjtu.edu.cn.

第一作者简介

杨鑫春,博士生,主要从事水文大地测量学研究,E-mail: xcyang@my.swjtu.edu.cn

About the first author

YANG Xinchun, PhD candidate, majors in hydrogeodesy, E-mail: xcyang@my.swjtu.edu.cn.

文章历史

收稿日期:2022-04-20
利用多元线性回归模型重构中国九大流域陆地水储量变化
杨鑫春1,2     游为1     万祥禹1     宋梦芝1     
1. 西南交通大学地球科学与环境工程学院,成都市犀安路999号,611756;
2. 西南科技大学环境与资源学院,四川省绵阳市青龙大道中段59号,621010
摘要:GRACE与GRACE-FO任务间的数据空缺导致无法连续监测陆地水储量变化。基于此,本文采用多元线性回归模型,以GRACE/GRACE-FO陆地水储量变化数据为参考值,以降水、气温和模型模拟的陆地水储量数据为预测参数,采用3种不同策略重构中国九大流域2002-04~2021-12连续的陆地水储量变化。结果表明,基于去趋势项和去季节项信号重构策略的重构结果略优于去趋势项信号重构策略,且两者结果均优于整体信号重构策略,在人类活动或冰川融化频繁的流域(如海滦河、长江、西南诸河和内陆河流域)这种优势更为明显。此外,重构结果的性能也受GRACE/GRACE-FO数据信噪比和预测参数与GRACE/GRCAE-FO数据的相关性影响。
关键词GRACE/GRACE-FO陆地水储量变化多元线性回归模型重构策略中国九大流域

GRACE卫星于2017-10退役,其提供的数据只更新至2017-06。但其继任者GRACE-FO卫星直到2018-05才发射升空,并于同年6月开始发布全球陆地水储量变化(terrestrial water storage changes, TWSC)信息。两代GRACE卫星数据之间存在11个月的空缺期,打破了GRACE/GRACE-FO监测TWSC的连续性,也会限制其进一步应用[1]。因此,填补11个月的数据空缺或重构连续的TWSC尤为重要。

部分学者采用机器学习方法来重构或预测连续的TWSC[1-2]。如Sun等[1]采用深度神经网络(deep neural network, DNN)、多变量季节性自回归整合移动平均模型(seasonal autoregressive integrated moving average with external variables, SARIMAX)和多元线性回归(multiple linear regression, MLR)3种机器学习方法,重构多种全球TWSC数据产品。结果表明,DNN性能略优于SARIMAX,明显优于MLR。Li等[2]联合多种统计分解、时间序列分解和机器学习方法重构全球TWSC信号,与采用整体信号重构不同,其首先分别重构TWSC时变模态上的季节项、年际变化项和残余项信号,然后将GRACE/GRACE-FO原有时变模态上的趋势项信号加回到重构的非趋势项信号,以生成重构的全频段时变模态信号,最后将GRACE/GRACE-FO原有空间模态乘以重构时变模型得到总的TWSC信号。同时,Li等[2]认为在联合使用统计分解方法时,相比于其他复杂的机器学习方法,虽然MLR方法在训练阶段表现并非最佳,但在测试阶段表现较好,因此MLR模型是一种可靠和稳健的重构方法。基于以上研究,本文将采用MLR方法,以降水、气温和水文模型模拟的陆地水储量数据作为预测参数,重构中国九大流域(边界数据由资源环境科学与数据中心(http://www.resdc.cn)提供)连续的TWSC;同时,对比分析整体信号重构、去趋势项信号重构和去趋势项去季节项信号重构等3种策略对重构数据质量的影响,以期提供最适合九大流域的重构策略。

1 数据处理 1.1 GRACE/GRACE-FO数据

GRACE/GRACE-FO观测数据产品具有2种不同的形式,即传统的球谐系数产品和最新的Mascon产品[1]。相较于传统的球谐系数产品,Mascon产品主要具有以下优势[3]:1)减少从陆地到海洋的泄漏误差,增加数据的信噪比;2)在处理过程中应用地球物理数据约束,几乎无经验后处理的平滑滤波要求,更方便非大地测量用户的使用。本实验采用CSR最新发布的RL06 v02 Mascon产品[4],下文简称CSR-M。CSR-M空间分辨率为0.25°×0.25°,所选择的时间跨度为2002-04~2021-12,即共计183个月的GRACE数据、43个月的GRACE-FO数据以及11个月的数据空缺。需要指出的是,本文重点关注GRACE/GRACE-FO系统间11个月空缺数据的重构问题,因此对于因GRACE/GRACE-FO卫星仪器问题、校准活动、电池管理等原因造成的系统1~2个月的数据空缺采用简单线性插值方法进行补全[5]

1.2 预测参数

降水和气温是陆地水储量变化的重要驱动因子[6],故常作为重构TWSC的主要预测参数[1-2]。此外,Sun等[1]指出虽然水文模型模拟的TWSC通常不包括地下水和表面水,但其与GRACE TWSC存在强相关性,增加该变量作为预测参数所重构的TWSC性能优于只考虑降水和气温作为驱动参数的重构数据。基于此,本文采用ECMWF发布的月度气候再分析数据集ERA5-Land中降水、气温和TWSC(包括土壤水和雪水)数据作为预测参数[7]。考虑到3个预测参数与GRACE/GRACE-FO TWSC存在相位差[6],选择时间窗口前3~0个月内的所有变量作为预测参数,即每个预测参数在2002-01~2021-12范围内将具有4个预测变量。同时,为了与CSR-M数据保持一致性,3个驱动参数的空间分辨率由0.1°×0.1°重新采样为0.25°×0.25°,并删除2004~2009年均值。

2 重构方法与策略 2.1 MLR模型

MLR模型是一种用于估计2个或多个自变量与1个因变量之间线性关系的统计方法。本文使用3个预测参数(降水、气温和水文模型模拟的TWSC)作为自变量,GRACE/GRACE-FO TWSC作为因变量,其对应的MLR模型计算公式为:

$ y_i=\beta_0+\beta_1 x_{i 1}+\beta_2 x_{i 2}+\beta_3 x_{i 3}+\varepsilon $ (1)

式中,yi为某个流域的GRACE/GRACE-FO TWSC时间序列;xi1xi2xi3为对应流域内3个预测参数的时间序列;β0β1β2β3为待估参数;ε为模型误差。本文使用183个月的GRACE数据,采用最小二乘方法估算MLR模型的待估参数,并采用43个月的GRACE-FO数据测试所确定MLR模型的可靠性。根据所确定的MLR模型,通过预测参数来重构2002-04~2021-12连续的TWSC。

2.2 重构策略

本文使用3种不同的重构策略。重构策略1为整体信号重构,是对GRACE/GRACE-FO TWSC整体信号使用式(1)直接重构生成连续的TWSC;重构策略2为去趋势项信号重构,是在使用MLR模型重构GRACE/GRACE-FO TWSC去长趋势项信号基础上加回GRACE/GRACE-FO TWSC原有的长趋势项信号以生成连续的TWSC;重构策略3为去趋势项去季节项信号重构,是在采用MLR模型重构GRACE/GRACE-FO TWSC去长趋势项去季节项信号后加回GRACE/GRACE-FO TWSC原有的长趋势项和季节项信号以生成连续的TWSC。

为获得信号的趋势项和季节项,采用最小二乘分解方法对GRACE/GRACE-FO TWSC和预测参数的时间序列进行分解[3, 8]

$ S_{\text {total }}=S_{\text {trend }}+S_{\text {seasonal }}+S_{\text {residual }} $ (2)

式中,Stotal为总的原有信号;Strend为信号的长期线性趋势项;Sseasonal为信号的季节项;Sresidual为信号的余项,主要包含年际变化项、次季节项和噪声。需要说明的是,虽然11个月数据空缺会导致GRACE/GRACE-FO TWSC趋势项值存在一定偏差,但这种偏差对重构数据质量的影响可以忽略[2, 8]。此外,GRACE/GRACE-FO TWSC季节项信号在重构时间范围内可认为并未发生实质性变化[2],因此GRACE/GRACE-FO TWSC季节项信号计算也不受数据空缺的影响。

2.3 精度评定指标

本文采用皮尔逊相关系数(Pearson correlation coefficient,CC)、归一化均方根误差(normalized root mean square error,NRMSE)和纳什效率系数(Nash-Sutcliffe efficiency coefficient,NSE)等3种常用的精度指标来评定重构TWSC的性能,各指标详细计算公式见文献[1]。CC、NRMSE和NSE的取值范围分别为[-1, 1]、[0, +∞)和(-∞, 1],CC和NSE数值越大、NRMSE数值越小,重构数据的性能越好。此外,采用重构的TWSC与GRACE/GRACE-FO TWSC位于测试阶段(2018-06~2021-12)的RMSE值作为重构数据的不确定性值[2]

3 结果与讨论

图 1为中国九大流域的CSR-M TWSC以及基于3种不同策略重构的TWSC,其相应的性能指标和不确定性值如图 2表 1所示。基于策略1重构的TWSC在松花江辽河、黄河、淮河、东南诸河和珠江五个流域表现出良好的性能(CC/NRMSE/NSE值分别优于0.80/0.10/0.70),但在海滦河、长江、西南诸河和内陆河四个流域表现出较差的性能。这种性能差异主要是因为本文只采用与气候变化有关的降水、气温和水文模型模拟的TWSC数据作为驱动参数,未考虑人类活动和冰川融化等其他影响因子。松花江辽河、黄河、淮河、东南诸河和珠江流域TWSC主要受气候变化影响,而海滦河、长江、西南诸河和内陆河流域TWSC除考虑气候变化影响外,还应考虑人类活动或冰川融化的影响[5]。此外,重构的TWSC在海滦河和西南诸河两个流域存在异常的不确定性,其对应数值分别高达13.55 cm和8.67 cm。因此,基于整体信号重构策略重构的TWSC不宜作为九大流域的最后重构结果。

图 1 基于不同策略重构的中国九大流域TWSC Fig. 1 The reconstructed TWSC of nine major river basins in China based on different strategies

图 2 中国九大流域重构的TWSC性能指标对比 Fig. 2 Comparison of performance indexes of reconstructed TWSC of nine major river basins in China

表 1 不同策略重构的中国九大流域TWSC的不确定性 Tab. 1 Uncertainties of TWSC of nine major river basins in China reconstructed by different strategies

相较于策略1,策略2可显著提高九大流域重构数据的性能,特别是在海滦河、长江、西南诸河以及内陆河流域。例如在海滦河流域,重构数据的性能指标CC/NRMSE/NSE分别提高0.25/0.09/0.48,不确定性值降低9.71 cm。这种性能的提高得益于人类活动和冰川融化等因素主要影响GRACE/GRACE-FO TWSC趋势项信号的变化[2],而去趋势项信号重构策略完全保留该部分信号。

相较于策略2,策略3进一步提升重构数据的质量,但提升幅度并不明显。重构数据质量的进一步提升是因为策略3完全包含原有的GRACE/GRACE-FO TWSC趋势项和季节项信号,进而能最大限度地保留人类活动和冰川融化对TWSC的影响。此外还可以发现,基于策略3重构的TWSC在海滦河、淮河和东南诸河流域存在较大的不确定性,其值分别为3.82 cm、4.01 cm和3.66 cm,这主要受GRACE/GRACE-FO空间分辨率(从低纬度约200 000 km2到两极附近约90 000 km2范围[5])限制,较小流域的TWSC可能会存在明显的信号泄露[9]

根据以上分析,将基于策略3重构的TWSC作为九大流域最后的重构结果,表 2为重构数据的性能指标。从表 2可以看出,重构数据的性能在不同流域存在一定差异,这主要与各自流域的GRACE/GRACE-FO数据信噪比以及预测参数与GRACE/GRACE-FO TWSC的相关性有关。例如在信噪比以及相关性高的西南诸河流域(图 1(h)表 3),重构数据的性能指标CC/NRMSE/NSE高达0.97/0.05/0.94,而在信噪比和相关性低的内陆河流域(图 1(i)表 3),重构数据的性能指标CC/NRMSE/NSE值仅有0.77/0.12/0.60。因此在对比不同流域的重构数据性能指标时,应综合考虑各流域的GRACE/GRACE-FO数据信噪比以及预测参数与GRACE/GRACE-FO TWSC的相关性。

表 2 基于策略3重构的中国九大流域TWSC性能 Tab. 2 Performances of TWSC of nine major river basins in China reconstructed by strategy three

表 3 预测参数与GRACE TWSC在中国九大流域的最大相关系数(时间窗口为前3~0个月) Tab. 3 The maximum correlation coefficients between prediction parameters and GRACE TWSC of nine major river basins in China (the time window is from the first 3 to 0 months)
4 结语

本文利用MLR模型,采用3种不同的重构策略,重构中国九大流域的TWSC,得到以下结论:

1) 基于整体信号重构策略的重构结果仅在TWSC主要受气候变化影响的流域(如松花江辽河、黄河、淮河、东南诸河和珠江流域)表现出良好的性能,而在人类活动或冰川融化(如海滦河、长江、西南诸河和内陆河流域)频繁的流域表现较差。

2) 去趋势项信号重构策略的重构结果在九大流域均优于整体信号重构策略,在人类活动和冰川融化剧烈的流域优势更为明显。

3) 去趋势项去季节项信号重构策略的重构结果在九大流域均稍优于去趋势项信号重构策略。

4) 不同流域重构结果的性能还与该流域的GRACE/GRACE-FO数据信噪比以及预测参数(降水、气温、模型模拟的TWSC)与GRACE/GRACE-FO TWSC的相关性有关,信噪比和相关性高的流域(如西南诸河流域)其重构结果的性能优于信噪比和相关性低的流域(如内陆河流域)。

参考文献
[1]
Sun Z L, Long D, Yang W T, et al. Reconstruction of GRACE Data on Changes in Total Water Storage over the Global Land Surface and 60 Basins[J]. Water Resources Research, 2020, 56(4) (0)
[2]
Li F P, Kusche J, Chao N F, et al. Long-Term(1979-Present) Total Water Storage Anomalies over the Global Land Derived by Reconstructing GRACE Data[J]. Geophysical Research Letters, 2021, 48(8) (0)
[3]
Scanlon B R, Zhang Z Z, Save H, et al. Global Evaluation of New GRACE Mascon Products for Hydrologic Applications[J]. Water Resources Research, 2016, 52(12): 9 412-9 429 DOI:10.1002/2016WR019494 (0)
[4]
Save H, Bettadpur S, Tapley B D. High-Resolution CSR GRACE RL05 Mascons[J]. Journal of Geophysical Research: Solid Earth, 2016, 121(10): 7 547-7 569 DOI:10.1002/2016JB013007 (0)
[5]
Rodell M, Famiglietti J S, Wiese D N, et al. Emerging Trends in Global Freshwater Availability[J]. Nature, 2018, 557(7 707): 651-659 (0)
[6]
Humphrey V, Gudmundsson L, Seneviratne S I. Assessing Global Water Storage Variability from GRACE: Trends, Seasonal Cycle, Subseasonal Anomalies and Extremes[J]. Surveys in Geophysics, 2016, 37: 357-395 (0)
[7]
Muñoz-Sabater J, Dutra E, Agustí-Panareda A, et al. ERA5-Land: A State-of-the-Art Global Reanalysis Dataset for Land Applications[J]. Earth System Science Data, 2021, 13(9): 4349-4 383 (0)
[8]
Yang X C, Tian S Y, You W, et al. Reconstruction of Continuous GRACE/GRACE-FO Terrestrial Water Storage Anomalies Based on Time Series Decomposition[J]. Journal of Hydrology, 2021, 603 (0)
[9]
吴云龙, 李辉, 邹正波, 等. 基于Forward-Modeling方法的黑河流域水储量变化特征研究[J]. 地球物理学报, 2015, 58(10): 3 507-3 516 (Wu Yunlong, Li Hui, Zou Zhengbo, et al. Investigation of Water Storage Variation in the Heihe River Using the Forward-Modeling Method[J]. Chinese Journal of Geophysics, 2015, 58(10): 3 507-3 516) (0)
Reconstruction of Terrestrial Water Storage Changes of Nine Major River Basins in China Using a Multiple Linear Regression Model
YANG Xinchun1,2     YOU Wei1     WAN Xiangyu1     SONG Mengzhi1     
1. Faculty of Geosciences and Environmental Engineering, Southwest Jiaotong University, 999 Xi'an Road, Chengdu 611756, China;
2. School of Environment and Resource, Southwest University of Science and Technology, 59 Mid-Qinglong Road, Mianyang 621010, China
Abstract: Data gaps between the GRACE and GRACE-FO missions have prevented continuous monitoring of the terrestrial water storage changes (TWSC). We use the multiple linear regression model, take the GRACE/GRACE-FO solutions as reference values, the precipitation, air temperature, and model-simulated terrestrial water storage data as prediction parameters, and consider three different strategies to reconstruct the continuous TWSC of nine major river basins in China from April 2002 to December 2021. The results show that the reconstructed results based on the de-trended and de-seasonalized signal reconstruction strategy are slightly better than those dependent on the de-trended signal reconstruction strategy. These two reconstructed results are better than those using the overall signal reconstruction strategy, and this advantage is more evident in the basins with intense human activities or glaciers melt (such as Haihe and Luanhe rivers, Yangtze river, southeast rivers, and inland river basins). In addition, the performance of reconstructed result is also affected by the signal-to-noise ratio of GRACE/GRACE-FO data and the correlation of prediction parameters with GRACE/GRACE-FO data.
Key words: GRACE/GRACE-FO; terrestrial water storage changes; multiple linear regression model; reconstruction strategy; nine major river basins in China