2) 中国北京 100045 中国地震台网中心
2) China Earthquake Networks Center, Beijing 100045, China
傅承义(1963)指出地震预报的直接标志是前兆,而寻找前兆是地震预报研究的一条重要途径。马宗晋等(2014)通过对全球地震演化特征、地震预测预报历史和中国陆区地震预测途径的探索,提出地震前兆观测效能图谱。黄辅琼等(2017)指出发展数值地震预报首先需要对各种观测资料进行同化分析。使用LSTM神经网络预测时间序列数据较为有效,但是该方法在处理强非线性数据时存在不理想情况。EMD-LSTM神经网络是近年发展起来预测时间序列数据的一种有效方法。
使用经验模态分解方法对原始时间序列数据进行分解得到IMFs(intrinsic modefunctions)信号,IMF信号由非平稳信号和非线性数据分解得到,EMD方法假设任何信号都可能包含IMF。IMF被定义为:①与数据集中的极值点数相等或最多相差一个的零点数;②在信号上任意一点,最大值点确定的上包络线和最小值点确定的下包络线之间的平均值为0。用EMD-LSTM神经网络预测分解过的各个IMF信号,叠加各分量预测结果可得到最终结果,通过误差水平评判方法预测的有效性。本文尝试利用该方法对一组实际观测数据进行时间预测分析,以检验方法对观测数据的预测性能。
2 实现步骤第一步:对数据进行预处理,以重力数据为例,对数据的处理步骤是去除潮汐影响、去除长期趋势、滤波。
第二步:使用EMD方法对预处理数据进行分解,得到IMFs分量。
第三步:使用TensorFlow的Keras学习库搭建LSTM模型,Python环境需要安装相关TensorFlow和Keras库,导入主程序,选择Sequential模型,设置神经元个数为64个,Dropout设置为0.5,隐藏层设置为1层,激活函数选择Relu,损失函数选择Mae,优化器选择Adam,把数据集划分为训练集和验证集,这里的数据集为分解后的IMF分量组成。
第四步:划分数据集训练LSTM神经网络,把IMFs数据的前80%作为训练集,后20%作为验证集,以经训练的神经网络预测后面20%的数据,把预测数据叠加恢复最终预测结果,与原始数据验证集中的数据进行比较,判断LSTM神经网络的预测精度。
3 研究结果采用上述设置,选取一段时长为28天的重力连续实测数据,搭建LSTM神经网络预测模型,其中前22天数据设置为训练集,后6天数据设置为验证集,最终得到如图 1所示预测数据与实测数据对比结果。在反归一化数据中,均方误差为17 976.796,均方根误差为134.077,平均绝对误差为90.871,相对误差水平为0.091%(图 1)。因此,EDM-LSTM方法可以应用于时间序列的异常识别分析。
![]() |
图 1 预测数据与实测数据对比结果 Fig.1 Comparison between predicted data and measured data |
研究表明,EMD-LSTM作为一种前兆数据处理方法,其预测结果与实测结果的相对误差为0.091%,可以用来分析地震前兆信号中存在的非平稳和非线性的预测问题。下一步工作是,结合Scholz提出的具有物理约束的扩容扩散模型,对不同前兆数据进行同化分析。
傅承义. 有关地震預告的几个問題[J]. 科学通报, 1963, 11061106(3): 30-36. |
黄辅琼, 张晓东, 曹则贤, 等. 关于推进数值地震预测的思考[J]. 国际地震动态, 2017, 11061106(4): 4-10. |
马宗晋, 蔡晋安, 陈会忠. 中国陆区大震预测途径探索战略研究[M]. 北京: 地震出版社, 2014: 132-147.
|