2) 中国北京 100045 中国地震台网中心
2) China Earthquake Networks Center, Beijing 100045, China
地震预测是世界性的科学难题,其困难之处,一方面是涉及地震前兆的地球物理观测基本属于远离震源地方的地表观测,所观测物理量除可能的地震孕育信息外,更多的是与环境、路径、干扰等有关的信息;另一方面是对地震孕震机理尚无清晰认识,即地震预测的理论问题远未解决。由此,也导致地震预测目前基本停留在基于观测资料的现象类比和统计分析层面。近几十年来,人工智能技术和应用飞速发展,如计算机视觉、图像识别、时间序列分析、异常检测、生物医学等应用行业的成功经验表明,在理论问题未解决之前,人工智能技术对识别未知特性、发现系统隐含规律、解决实际问题等作用巨大。由于近年来观测站网密度增加、地震和地球物理观测技术的进步,地震观测数据急剧增加,基于已有观测数据的人工智能技术也在地震预测领域开始得到更广泛的应用,通过对大量观测数据的学习,可以发现某些隐含的特征或规律,一方面有利于深化对地震机理的认识,更重要的是可以利用这些数据建立/训练模型,对未来数据进行拟合进而开展地震预测,这在机理和内在规律尚不清楚的情况下,可在一定程度上改善地震预测的准确性。
本文从机器学习的实际应用角度,介绍其在地震预测的一般流程,并基于数据特征、模型算法和评价指标等,简要介绍机器学习在地震预测领域的最新研究进展,并对相关问题进行初步讨论。
2 机器学习在地震预测中的应用 2.1 一般流程目前,机器学习在地震预测领域的应用基本集中于有监督学习算法,其基于观测数据某些特征来进行,例如地震活动性指标、地震前兆、地震波以及卫星监测数据等。通过数据预处理,将其转换为适合分类或回归算法的形式,找到数据中隐藏的模式,以达到预测地震强度、发生时间和可能地点的目的。一般的机器学习地震预测模式和流程包括数据集建立、数据预处理、分类/回归模型构建、外推预测、结果或模型评估等5个环节,具体流程见图 1。
在目前已开展的研究中,以地震目录为主的地震观测数据由于其易获取、具有较好的完备性、无干扰、有较长时期的数据积累等特点,成为机器学习地震预测常用的输入数据。大多通过简单预处理将地震目录转换成适合模型输入要求的形式,作为机器学习的输入来训练模型和开展预测。除基于地震目录构建的各类特征以外,在地震预测中还用到其他类型数据,例如静态库仑应力变化、地脉动、氡浓度、地电信号、强度函数、模型表面变形特征等。
2.3 模型评价用于地震预测模型评估的指标中,可简单通过混淆矩阵来进行评测,这是机器学习中的常见模型评估方法,主要用于诸如地震事件是否发生的二分类问题。但总的来看,由于混淆矩阵仅统计地震次数,单一统计值难以全面衡量模型优劣,因此在混淆矩阵的基本统计结果上又延伸出准确率、无震报准率、有震报准率、R评分、马修斯相关系数(MCC)等综合评价指标。此外,与混沌矩阵有关的模型评估曲线(例如P—R曲线、ROC曲线、AUC曲线等)可以更直观地显示预测效能评价结果。在一些地震预测回归算法中,还使用了预测值和观测值之间的平均绝对误差(MA)、均方误差(MSE)、均方根误差(RMSE)、相对误差(RE)等指标,来表征预测与结果之间的差异。
2.4 地震预测机器学习算法及预测效果地震预测的重点是地震的震级、时间、地点三要素预测,但从目前已发表的机器学习地震预测相关文献来看,大多数仅涉及震级预测问题,即在固定区域、固定时间前提下,评估某级以上地震的发震可能性。换言之,大多数研究实际上是将地震预测问题进行降维处理,转化为在固定区域、固定时间段内“有”或“无”某级以上地震发生可能的分类问题。本文从指定时空窗的地震震级预测、发震位置和时间预测2个角度,对现有地震预测机器学习算法进行梳理和预测效果比较。
3 结论与讨论(1)机器学习技术的应用,开拓了作为非线性复杂系统的地震孕育发生过程的研究新途径,对提升地震预测能力可能会起到一定的促进作用。但实际上,相对于真正的大数据,用于地震预测的数据和学习样本仍较匮乏,加之同一模型、相同特征在不同区域的预测效能差异极大,基于机器学习的地震预测研究仍存有诸多亟待解决的问题,这些问题会显著影响模型的预测效能。
(2)目前已发表的研究大多采用基于区域地震活动特征的特征提取方法,由于每个地震带都有其独特的地震活动特点,为建立精确的区域地震预测,需要考虑特征参数的区域性差异。由于基于机器学习的地震预测模型主要由数据驱动,而地震发生又是小概率事件,因而对于一个特定地区,模型训练和检验样本数据的匮乏是显而易见的。这不仅仅需要未来在更多地区、更长时段、对更多震例的积累和研究,还应创建基准地震数据集,对地震模型进行测试,以简化不同模型的比较过程(Banna et al,2020)。
(3)地震预测包括时间、地点及震级3个维度,目前大多数机器学习地震预测研究集中于指定时空域内地震活动的震级预测,这主要由地震发生过程的极端复杂性使然。随着计算机处理速度的提升、AI技术的进步和可用资料的进一步积累,应思考如何能够同时提升地震时、空、强三要素的预测能力。
(4)地震与区域构造环境之间、地震之间具有复杂的非线性相互作用。当前的机器学习并不能清晰解释特征与标签之间高度的非线性关系,因此仍需从物理上进一步研究各个地震参数的相互关系,找出其影响因素和物理成因。从这个角度,结合现有对地震及地震前兆成因、特点、震例的认识,考虑物理约束的半监督学习方法,采用物理模型约束下的数据驱动方式,可能是机器学习等人工智能技术在地震预测领域能够更好发挥作用的重要途径之一。此外,基于机器学习对输入特征重要性的进一步认识,也可提示某些强相关特征与未来强震活动之间可能存在的物理关联,这为深化地震前兆物理机理的认识提供了一条可能途径。
Banna M H, Taher K A, Kaiser M S, et al. Application of artificial intelligence in predicting earthquakes: state-of-the-art and future challenges[J]. IEEE, 2020(8): 192 880-192 923. |