| 基于LSTM神经网络的热层大气密度模型校正 |
大气阻力是作用在低轨道卫星上的最大的非引力摄动[1]。这种摄动是卫星与大气层之间能量和动量交换的结果[2]。热层质量密度的不准确建模会导致大气阻力计算值的不确定性。建立精确的大气密度模型对低轨卫星的高精度轨道确定和预报、卫星飞行任务的精准规划,以及可靠的碰撞规避有着重要意义。
目前,绝大部分大气密度模型为经验模型,包括MSIS(mass spectrometer and incoherent scatter)系列[3]、Jacchia-Bowman系列[4]和DTM(drag temperature model)系列[5]等。模型系数根据卫星、火箭和雷达等观测数据确定,最新模型还加入了利用CHAMP、GRACE等卫星的高分辨率加速度计数据反演的密度数据。但这些模型的误差仍有15%~ 30%,在空间环境高度扰动期间,由于太阳耀斑、地磁风暴等强活动,误差可能更大[6]。
因此,对现有模型进行改进以提高模型精度是近年的一个研究重点,其中一个有效手段是利用实测的轨道测量和密度数据进行模型校正。美国空军的高精度卫星阻力模型(high accuracy satellite drag model,HASDM)利用美国空间监测网(Space Surveillance Network,SSN)的75颗卫星的雷达跟踪数据校正Jacchia-70模型,在200~800 km的高度区间将密度模型误差降低至6%~8%[7, 8]。有学者提出了一种使用两行轨道根数(two-line element,TLE)数据校正热层密度的方法[9, 10],但其受限于TLE数据的时间分辨率和精度。此外,还有人将航天器的精确轨道(precise orbit determination,POD)数据作为观测值校正轨道沿线经验大气密度模型[11, 12]。这些方法均基于大气阻力与轨道变化之间的物理关系计算,其有效性不仅受数据质量和分布的影响,还与方法的基本假设是否合理有关。
人们已经将机器学习方法应用于空间天气领域。Pérez等[13]提出了利用前馈时延神经网络(feedforward time delay neural network,FTDNN)和循环时延神经网络(recurrent time delay neural network,RTDNN)两种神经网络模型预测航天器沿其轨道的大气密度的方法,并用于经验模型校正[14],改进了传统经验模型的精度。Gao等[15]使用机器学习中的高斯方法对NRLMSISE-00和JB2008模型进行校正,提出了一个基于经验模型、空间环境条件和卫星测量数据的大气密度估计框架。
本文提出一种基于长短期记忆(long short-term memory,LSTM)神经网络[16]的热层大气密度校正方法,以NRLMSISE-00模型计算的密度、太阳和地磁活动指数作为基础输入,利用CHAMP卫星加速度计反演的密度数据训练确定NRLMSISE-00密度的误差模型。并以CHAMP卫星2007年1月的密度数据为训练集和验证集,利用该卫星1个月及1年的数据进行测试,以考察校正后模型的长期校正性能及太阳和地磁活动较活跃期和平静期的校正性能。
1 模型1)NRLMSISE-00。该模型利用由卫星加速度计和轨道数据反演得到的总质量密度、氧分子密度数据、1981—1997年非相干散射雷达的温度数据建模[4]。NRLMSISE-00的输入包括年、年积日(dayof-year,DOY)、一天中的时间、大地高度、大地纬度和经度、当地太阳时、太阳通量F10.7及其81天平均值F10.7A、地磁指数Ap,输出包括大气温度和密度。本文将NRLMSISE-00计算的大气密度和F10.7、Ap指数作为基础输入。
2)LSTM。其最早由Hochreiter等[16]提出,通过引进输入门和输出门控制机制解决递归神经网络中的梯度消失和爆炸问题[17]。之后学者们又改进了原始模型,引入遗忘门和窥探孔连接等部分,进一步完善了LSTM对长序列的处理能力。LSTM通过输入门、输出门、遗忘门3个门控实现信息存储和更新。网络前向计算过程如下:
| $ i_t=\sigma\left(\boldsymbol{W}_{x i} x_i+\boldsymbol{W}_{h i} h_{i-1}+\boldsymbol{W}_{c i} c_{t-1}+b_i\right) $ | (1) |
| $ f_t=\sigma\left(\boldsymbol{W}_{x f} x_i+\boldsymbol{W}_{h f} h_{i-1}+\boldsymbol{W}_{c f} c_{t-1}+b_f\right) $ | (2) |
| $ c_t=f_t c_{t-1}+i_t \tanh \left(\boldsymbol{W}_{x c} x_t+\boldsymbol{W}_{h c} h_{t-1}+b_i\right) $ | (3) |
| $ o_t=\sigma\left(\boldsymbol{W}_{x o} x_i+\boldsymbol{W}_{h o} h_{i-1}+\boldsymbol{W}_{c o} c_{t-1}+b_o\right) $ | (4) |
| $ h_t=o_t \tan h\left(c_t\right) $ | (5) |
式中,x代表输入层数据;it、ot、ft分别表示当前时刻t的输入门、输出门和遗忘门;ct表示当前细胞状态;W表示对应的权重系数矩阵,如Wxi表示输入层到输入门之间的权重系数矩阵;b为偏置项;σ和tanh是LSTM常用的两种激活函数;ht表示当前输出值。
本文所使用的输入和输出值计算如下:
| $ \lg (\hat{\rho}(t))=f\left(\begin{array}{l} \lg \left(\rho_M(t)\right), \cdots, \lg \left(\rho_M\left(t-T_M t_s\right)\right) \\ F_{10.7}(t), \cdots, F_{10.7}\left(t-T_M t_s\right) \\ F_{10.7 A}(t), \cdots, F_{10.7 A}\left(t-T_M t_s\right) \\ A p(t), \cdots, A p\left(t-T_M t_s\right) \end{array}\right) $ | (6) |
式中,
CHAMP卫星[18]搭载了高精度加速度计,可提供高时间分辨率的准确密度值。CHAMP卫星加速度计反演的密度数据被广泛应用于验证经验模型和物理模型[13]。本文将由加速度计数据反演得到的密度作为“真实”值,所使用的CHAMP卫星密度数据来自文献[19]。对于数据中的缺失部分,采用插值处理使其连续。大气密度的数值一般比较小(10-12 ~10-13 kg/m3),故本文对大气密度值进行lg对数处理,以避免数据量级对处理结果的影响。
太阳和地磁活动对热层大气密度有着显著影响。本文选取F10.7、F10.7A、Ap作为模型的外部环境参数。F10.7及F10.7A用于描述太阳活动,Ap指数是地磁活动的有效代表。NRLMSISE-00模型也使用这些指数。采用插值方法保证这些环境参数和密度数据的时间分辨率一致。
2.2 方法本文利用2007-01-01—2007-01-28的CHAMP卫星密度数据进行训练/验证,其中70% 的数据作为训练集,30% 的数据作为测试集,这些数据随机选取,以保证模型的学习和泛化能力。
为了确定合适的TM及ts,本文使用2007年1月31日的数据作为验证集,分别改变时延值和采样间隔,评估模型在测试集的校正效果,该时间记为T1;分别以2007-02-01—2007-02-28和2007-03-01— 2008-02-29的数据为测试集,测试本文方法在较长时间内的模型校正能力,两时间段分别记为T2和T3。此外,本文选取了2007年第30天(DOY30)和第231天(DOY231)分别作为太阳/地磁活动较活跃期和平静期(相对于测试集其他天)的代表,考察模型在不同环境条件下的校正性能,两时间分别记为T4- DOY30和T4-DOY231,文献[14, 15]同样使用了这两天进行研究。图 1和表 1展示了训练、验证、测试期间的太阳和地磁活动变化。
![]() |
| 图 1 不同时间的太阳和地磁活动指数 Fig.1 Solar and Geomagnetic Activity Indexes at Different Times |
| 表 1 不同时间的太阳和地磁指数平均值 Tab.1 Average Values of Solar and Geomagnetic Activity Indexes at Different Times |
![]() |
2.3 性能指标
本文采用均方根误差(root mean square error,RMSE)和相关系数R来评价校正性能。RMSE表示两个变量之间的偏差程度,其值越小代表校正能力越好;R表示变量之间的线性相关值,是相关关系密切程度的指标,其绝对值越接近1,代表变量之间的相关程度越高。计算公式如下:
| $ \operatorname{RMSE}=\sqrt{\frac{\sum\limits_{i=1}^n\left(\hat{\rho}_i-\rho_i\right)^2}{n}} $ | (7) |
| $ R=\frac{\sum\limits_{i=1}^n\left(\rho_i-\overline{\rho_i}\right)\left(\overset\frown{{{\rho }_{i}}}-\overline{\overset\frown{{{\rho }_{i}}}}\right)}{\sqrt{\sum\limits_{i=1}^n\left(\rho_i-\overline{\rho_i}\right)^2 \sum\limits_{i=1}^n\left(\overline{\rho_i}-\overline{\overset\frown{{{\rho }_{i}}}}\right)^2}} $ | (8) |
式中,
本文选取了2007年第31天(DOY31)的数据作为测试集,分别改变时延值和采样率,观察模型校正性能,确定合适的时延值TM和采样间隔ts。首先控制采样间隔为60 s,改变时延值,结果见表 2。本文以LSTM-NRL表示经过LSTM校正后的NRLM SISE-00模型。然后控制时延值,改变采样间隔,研究模型性能,结果见表 3。
| 表 2 不同TM时的模型表现 Tab.2 Performance of Models for Different TM Values |
![]() |
| 表 3 不同ts时的模型表现 Tab.3 Performance of Models for Different ts Values |
![]() |
由表 2可以看出,相较于NRLMSISE-00,LSTM-NRL的精度有了明显提高。TM =200时,RMSE值最小,此后,随着TM的继续增大,虽然R有小幅度增加,但RMSE值呈现变大趋势,此时会出现过拟合现象。可以认为,TM取值在100~300之间时,结果最好。综合考虑RMSE和R两个指标,本文取TM =200进行后续研究。
由表 3可以看出,在ts = 60 s时,模型的RMSE值最小,随着采样间隔的增加,模型性能呈变差趋势。在ts取300 s和600 s时,其精度出现了明显的下降,表明当数据量较少时对于模型校正性能具有负面影响。可以认为,ts取60 s或120 s时,结果最好。综合考虑RMSE和R两个指标,本文取ts =60 s进行后续研究。
3.2 校正结果表 4给出了测试期间(T2、T3)的LSTM-NRL和NRLMSISE-00的性能指标。图 2和图 3分别展示了T2和T3期间每天的RMSE和R。
| 表 4 T2、T3期间LSTM-NRL和NRLMSISE-00的性能指标 Tab.4 Performance Metrics of LSTM-NRL and NRLM SISE-00 in the Periods of T2 and T3 |
![]() |
![]() |
| 图 2 T2期间LSTM-NRL和NRLMSISE-00的RMSE和R Fig.2 Performance Metrics of LSTM-NRL and NRLM SISE-00 in the Periods of T2 |
![]() |
| 图 3 T3期间LSTM-NRL和NRLMSISE-00的RMSE和R Fig.3 Performance Metrics of LSTM-NRL and NRLM SISE-00 in the Periods of T3 |
在T2、T3期间,LSTM-NRL模型的RMSE和R两个指标明显优于NRLMSISE-00,RMSE分别减小了63.2% 和68.1%,且在RMSE校正幅度上优于文献[14, 15]的结果。同时,相比于NRLMSISE-00,LSTM-NRL的R也有较大提升。这意味着,利用LSTM方法和28 d数据训练的模型在长达一年的时间内仍能有效校正原始模型,校正后模型的密度精度显著提高。
表 5给出了T4期间LSTM-NRL和NRLM SISE-00的性能指标,并与文献[14, 15]在相同天的结果进行对比。图 4展示了2007年DOY30和DOY231使用LSTM-NRL、NRLMSISE-00求得的密度以及真实密度(CHAMP加速度计密度)。在与CHAMP加速度计密度的对比中,由LSTM-NRL求得的密度显著优于利用NRLMSISE-00模型求得的密度。LSTM-NRL在RMSE和R上有明显改善,其中,RMSE在2007年DOY30和DOY231分别减小了66.6%、73.0%,由表 5可以看出,本文方法在不同太阳/地磁环境中依然有良好的校正效果,且在太阳/地磁活动平静期的校正效果更好。本文得到的结果在RMSE方面均优于文献[14, 15]中的结果。
| 表 5 T4期间LSTM-NRL和NRLMSISE-00的性能指标 Tab.5 Performance Metrics of LSTM-NRL and NRLMSISE-00 in the Periods of T4 |
![]() |
![]() |
| 图 4 2007 年 DOY30 和 DOY231 使用 LSTM-NRL、NRLMSISE-00 求得的密度以及 CHAMP 加速度计密度 Fig.4 Density Calculated by LSTM-NRL,NRLMSISE-00 and CHAMP Accelerometer Derived Density on DOY30 and DOY231,2007 |
4 结束语
本文提出了一种基于LSTM神经网络的热层大气密度经验模型校正方法,以NRLMSISE-00模型计算的密度、太阳和地磁活动指数作为基础输入,利用CHAMP卫星加速度计反演的密度数据训练NRLMSISE-00密度的误差模型,以校正NRLM SISE-00模型。实验结果表明,利用28 d数据训练LSTM神经网络,本文方法在长达一年期内仍能有效校正原始模型,校正后模型的密度精度显著提高。同时,在不同的太阳/地磁活动期,相比于未校正的经验模型,校正后模型的精度均有显著提升。根据实验结果,本文采用的LSTM神经网络与普通时延神经网络和高斯过程方法相比,在处理大气密度这样具有时序特征的数据集时可能具有一定优势。
本文基于加速度计反演的密度数据进行实验,未来将尝试基于TLE或者POD数据反演得到的密度进行密度模型校正。
| [1] |
Montenbruck O, Gill E. 卫星轨道: 模型、方法和应用[M]. 王家松, 译. 北京: 国防工业出版社, 2012
|
| [2] |
Mostaza P D, Graziano B P, Roberts P C E. Spacecraft Drag Modelling[J]. Progress in Aerospace Sciences, 2014, 64: 56-65. DOI:10.1016/j.paerosci.2013.09.001 |
| [3] |
Picone J M, Hedin A E, Drob D P, et al. NRLM SISE-00 Empirical Model of the Atmosphere: Statistical Comparisons and Scientific Issues[J]. Journal of Geophysical Research: Space Physics, 2002, 107(A12): SIA15-1. DOI:10.1029/2002JA009430 |
| [4] |
Bowman B, Tobiska W K, Marcos F, et al. A New Empirical Thermospheric Density Model 2008 Using New Solar and Geomagnetic Indices[C]. AIAA/AAS Astrodynamics Specialist Conference and Exhibit, Honolulu, Hawaii, USA, 2008
|
| [5] |
Bruinsma S. The DTM-2013 Thermosphere Model[J]. Journal of Space Weather and Space Climate, 2015, 5: A1. DOI:10.1051/swsc/2015001 |
| [6] |
Marcos F, Bowman B, Sheehan R. Accuracy of Earth's Thermospheric Neutral Density Models[C]. AIAA/AAS Astrodynamics Specialist Conference and Exhibit, Keystone, Colorado, USA, 2006
|
| [7] |
Bowman B, Storz M. Time Series Analysis of HASDM Thermospheric Temperature and Density Corrections[C]. AIAA/AAS Astrodynamics Specialist Conference and Exhibit, Monterey, California, USA, 2002
|
| [8] |
Storz M F, Bowman B R, Branson M J I, et al. High Accuracy Satellite Drag Model (HASDM)[J]. Advances in Space Research, 2005, 36(12): 2 497-2 505. DOI:10.1016/j.asr.2004.02.020 |
| [9] |
Emmert J T, Picone J M, Lean J L, et al. Global Change in the Thermosphere: Compelling Evidence of a Secular Decrease in Density[J]. Journal of Geophysical Research: Space Physics, 2004, 109(A2): A02301. |
| [10] |
Picone J M. Thermospheric Densities Derived from Spacecraft Orbits: Accurate Processing of Two-Line Element Sets[J]. Journal of Geophysical Research, 2005, 110(A3): A03301. |
| [11] |
McLaughlin C A, Hiatt A, Lechtenberg T. Precision Orbit Derived Total Density[J]. Journal of Spacecraft and Rockets, 2011, 48(1): 166-174. DOI:10.2514/1.47624 |
| [12] |
Sang J, Smith C, Zhang K. Towards Accurate Atmospheric Mass Density Determination Using Precise Positional Information of Space Objects[J]. Advances in Space Research, 2012, 49(6): 1 088-1 096. DOI:10.1016/j.asr.2011.12.031 |
| [13] |
Pérez D, Wohlberg B, Lovell T A, et al. Orbit-Centered Atmospheric Density Prediction Using Artificial Neural Networks[J]. Acta Astronautica, 2014, 98: 9-23. DOI:10.1016/j.actaastro.2014.01.007 |
| [14] |
Pérez D, Bevilacqua R. Neural Network Based Calibration of Atmospheric Density Models[J]. Acta Astronautica, 2015, 110: 58-76. DOI:10.1016/j.actaastro.2014.12.018 |
| [15] |
Gao T Y, Peng H, Bai X L. Calibration of Atmospheric Density Model Based on Gaussian Processes[J]. Acta Astronautica, 2020, 168: 273-281. DOI:10.1016/j.actaastro.2019.12.014 |
| [16] |
Hochreiter S, Schmidhuber J. Long Short-Term Memory[J]. Neural Computation, 1997, 9(8): 1 735-1 780. DOI:10.1162/neco.1997.9.8.1735 |
| [17] |
Hochreiter S. The Vanishing Gradient Problem During Learning Recurrent Neural Nets and Problem Solutions[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 1998, 6(2): 107-116. DOI:10.1142/S0218488598000094 |
| [18] |
Reigber C, Lühr H, Schwintzer P. CHAMP Mission Status[J]. Advances in Space Research, 2002, 30(2): 129-134. DOI:10.1016/S0273-1177(02)00276-4 |
| [19] |
Mehta P M, Walker A C, Sutton E K, et al. New Density Estimates Derived Using Accelerometers on Board the CHAMP and GRACE Satellites[J]. Space Weather, 2017, 15(4): 558-576. DOI:10.1002/2016SW001562 |
2022, Vol. 47










