Processing math: 100%
  中国科学院大学学报  2025, Vol. 42 Issue (2): 209-220   PDF    
S型和I型锆石的机器学习划分及其在超大陆演化中的应用
孙之晗, 张毅刚     
中国科学院大学地球与行星科学学院 中国科学院计算地球动力学重点实验室, 北京 100049
摘要: 使用堆叠思想和框架融合常见的8种机器学习方法,并采用曲线下面积和正确率指标, 建立碎屑锆石的S(sedimentary)型和I(igneous)型分类模型。将该模型应用于碎屑锆石数据集,获得S型和I型锆石随时间的分布。与古地磁和地质记录对比显示,S型锆石的年龄峰同时对应着上一个超大陆裂解的终点和下一个超大陆聚合的起点,S型锆石的年龄谷(也是I型锆石的小年龄峰)对应超大陆最聚合的状态和其裂解的起始。根据S型锆石年龄峰与整体锆石大年龄峰,以及S型锆石的年龄谷与整体锆石小年龄峰的对应关系,提出整体锆石随时间分布图上的大年龄峰代表板块比较离散的状态,这时岩浆活动多,I型和S型花岗岩均有产出,板块移动速度快;而小年龄峰代表板块比较聚合的状态,这时板块比较稳定,岩浆活动少,产出以I型为主,板块移动速度慢。最后,给出一个更高准确率的判断S型和I型的决策函数和分类图解,可直接应用于相关研究工作。
关键词: 机器学习    S型和I型碎屑锆石    超大陆演化    堆叠    主成分分析    
Classification of S- and I-type detrital zircon by machine learning and its application to supercontinental evolution
SUN Zhihan, ZHANG Yigang     
CAS Key Laboratory of Computational Geodynamics, College of Earth and Planetary Sciences, University of Chinese Academy of Sciences, Beijing 100049, China
Abstract: Supercontinent evolution and distribution of detrital zircon with time is a long-term hot research topic. By using the stacking framework involving eight different machine learning methods and the area under curve (AUC) and accuracy proxy, a model is established to classify S- and I-type zircons. Applying the model to global detrital zircon dataset gives the distribution of S- and I-type zircon with time. After comparing the distribution with paleomagnetism and geological records, it is found that the S-type zircon distribution peak corresponds to the end of a supercontinent breakup and the start of assembly of the next supercontinent, and that the S-type zircon distribution valley (also the small peak of I-type zircon) is related to the maximum packing of a supercontinent and the start of its breakup. Based on the correlation of S-type zircon peak with global zircon big peak and the valley of S-type zircon with the global zircon small peak, it is proposed that big peaks of global zircon distribution with time represent a dispersive state of continents, during which magmatic activity is high producing both I- and S-type granites with also a high velocity of continent movement. By comparison, the small peaks in global zircon distribution represent a packing state of continents during which the supercontinent is stable with low magmatic activity producing mainly I-type granites and with a low velocity of continent movement. Finally, a high-accuracy decision function is provided to judge S- and I-type zircons and can be applied in related studies.
Keywords: machine learning    S- and I-type detrital zircon    supercontinent cycle    stacking    primary component analysis    

超大陆研究一直是地球科学研究的热点。超大陆的聚合、增生、拉张和裂解过程被称为超大陆旋回[1-2]。过去很多学者对超大陆进行了广泛的研究,其中主要研究数据包括两类:一类是古地磁数据,用来重建超大陆旋回期间的古地理位置[3-4]和不同超大陆旋回的演化样式[5-6];另一类是地质记录,包括碎屑锆石年龄峰[7-11]、大火成岩省和造山带[12]、变质事件[13]、锆石Hf和O同位素[14-15]等。

锆石历来被称为是研究地壳的时间胶囊,一方面是因为锆石的物理和化学性质稳定,另一方面则是已发表的可用锆石的数据越来越多。Campbell和Allen[8]最早从在河流中收集的碎屑锆石的年龄数据中发现碎屑锆石年龄峰的区间与超大陆聚合时间几乎完全一致。Voice等[7]和Hawkesworth等[11]通过更多的数据支持了这一观点,这主要是因为超大陆聚合往往伴随着全球性的碰撞造山事件,进而地壳部分熔融产生花岗质岩浆,提高了碎屑锆石产量。此外,也有很多学者将碎屑锆石与大陆地壳生长联系起来[9]。最近,Zhu等[16]使用P的累积分布图和磷钇矿替代两种方法对主要河流碎屑锆石进行S(sedimentary)型和I(igneous)型锆石分类,其中S型锆石来自于有沉积物加入的S型花岗岩,而I型锆石来自于源岩只有火成岩的I型花岗岩。他们发现与超大陆更加相关的是S型锆石(花岗岩),并提出了可能的S型花岗岩的形成环境。

Zhu等[16]的磷钇矿替代法是根据P、Y等元素指标使用二维图解对碎屑锆石进行分类。尽管图解分类取得了一定的效果,但仍存在大量的误分类情况(S型有约16%误判,I型有约7%的误判)。误判的原因可能是训练数据中存在离群点、重叠点或者二维图解对多维复杂信息进行分类的局限性,这彰显了使用机器学习方法的必要性。

使用不同方法对该分类问题降维(图 1),发现非线性方法效果更好,所以本研究采用非线性、高维度的机器学习方法。在地学领域中常用的机器学习算法有很多,包括:逻辑回归,一种广义的线性回归分析模型;随机森林,用有放回采样的样本训练多棵决策树,最终用这些树的预测结果进行投票;极度随机树,比随机森林更加随机地选择特征并最终建树预测;梯度提升树,用多棵决策树的线性组合来预测,以残差为优化目标;XGBoost,对梯度提升树进行了优化,计算更加迅速;LightGBM,也是对梯度提升树的优化,但细节不同;AdaBoost,同样用多棵决策树的线性组合来预测,训练时重点关注错分的样本,准确率高的弱分类器权重大;支持向量机,最大化分类间隔的线性分类器;深度神经网络,一个极其复杂的多层复合函数。本文使用堆叠(stacking)思想和结构把8种常用机器学习方法的预测结果融合起来。使用受试者工作特征曲线(receiver operating characteristic curve, ROC)和正确率综合评价模型效果,最终提高了结果的准确性和可靠性。利用新方法对大量的碎屑锆石进行S型和I型分类,将两种类型锆石随时间的分布与锆石氧同位素、Hf同位素、独居石分布和变质过程进行对比,通过与超大陆演化的古地磁成果相结合,最终建立两种锆石分布与超大陆演化的关系。

Download:
图 1 碎屑锆石训练集不同降维方法结果 Fig. 1 Different dimension reduction methods' effect on training set of detrital zircon
1 数据和方法 1.1 数据

本文用于训练机器学习模型的已知母岩的锆石来自Zhu等[16]以及Burnham和Berry[17],主要来源于Lachlan褶皱带,是1974年Chappell等最早提出定义S型与I型花岗岩的地方,也是最为经典的S型和I型分布区,还有一部分锆石来自未公开发表的喜马拉雅和南非TTG样本。总共454颗,包括221颗S型锆石和233颗I型锆石。相比前人的分类研究仅使用Lachlan褶皱带数据的情况,本项研究拓宽了训练集数据来源地和年龄分布的广度。用于预测的碎屑锆石的年龄和微量元素数据来自Zhu等[16]和Tang等[18],2个数据集中的重复数据已去除。选取这2个数据集的原因如下:1)2个数据集均包含P元素,P是区分I型和S型锆石不可或缺的元素;2)数据集锆石年龄分布图谱与全球碎屑锆石的分布图相比有很好的相似性,从而对全球锆石具有较好的代表性。最终预测集共有5 997条碎屑锆石数据。

输入模型的数据需要进行预处理。预处理包括数据清洗和数据标准化两部分。数据清洗的目的是去除年龄不准确的、可能变质的或受到水热扰动的以及数据不完整的锆石,确保送入模型的锆石数据是合理的,以提高预测的准确性和可靠性。数据清洗的规则如下:1)缺失部分微量元素数据的锆石会被去除(直接去除的原因是如果用插值或其他填补缺失值的方法可能会影响结果);2)对所有锆石应用了磷(P)<2×10-3的标准,P是判断S型和I型的关键元素[16-17],如果部分S型锆石P存在极大值,会严重影响数据的质量和分布;3)去除所有镧(La)>0.1×10-6的锆石,这些锆石可能受到了包裹体或蚀变的影响[19];4)用钍(Th)<1×10-3和铀(U)<3×10-3的标准去除可能存在的变质锆石[20],这个指标会比Th/U<0.1更加严格一些;5)去除年龄不一致性>5%的锆石,锆石年龄不准确同样会影响结果。此外,以950 Ma为分界,小于950 Ma的采用U-Pb年龄,大于950 Ma的则采用Pb-Pb年龄,减少Pb丢失对较老的样品中年龄的影响;6)LREE-Index≥30。LREE-Index=(Dy/Nd)+(Dy/Sm),因为轻稀土元素容易受到流体作用的影响,所以通过这个指标可以去除可能发生蚀变或者受到流体扰动的锆石[21]

数据清洗后,选择哪些元素作为输入模型的特征需要综合考虑元素的可用性和重要性,即需要保证数据集中绝大部分锆石拥有该特征并且对结果有一定的贡献。本文数据集可用特征较少,尝试过使用La和Sm元素,因为这2个元素值本身非常小,数据分布偏度很大,标准化后甚至对模型产生负作用,所以最终采取P、Y、Ce、Eu、Dy、Lu、Th、U共8种元素作为输入模型的特征。Hf作为锆石中非常重要的一个元素并不包含在其中的原因是预测集中大部分锆石没有Hf特征。对所用8个元素的主成分分析(primary component analysis,PCA)如图 2所示。其中主成分1和主成分2是PCA下的第1个和第2个主成分,主成分1约含63%判断的信息量,主成分2约含22%信息量。

Download:
图 2 训练集锆石成分数据的Biplot[22] Fig. 2 Biplot[22] of component data in the training set

数据标准化的具体步骤为:1)元素成分的单位由10-6转换为μmol/g。实际的训练测试中,10-6效果没有μmol/g好;2)对数中心比变换。微量元素属于成分数据,有“闭合效应”,即由于相邻元素之间互相联系制约,呈现表面的正或负的相关性[23]。所以通过中心化(除以几何平均值)并求对数的方式打开数据;3)正态分布标准化。即减去均值除以方差,转换为均值为0、方差为1的正态分布[24]。标准化后的数据可以让模型更快更稳定地收敛。以上对训练集数据的处理也必须完全一致地应用在测试集,保证模型的准确性。

1.2 方法

本项工作的模型采用的方法是stacking方法[25],核心思想为方法的集成,即通过融合多个基础的分类模型提升效果(图 3)。前人关于机器学习与地质学领域相结合的研究中,大多采用1种或2种机器学习方法[26],这通常也是可行的,如果研究中训练数据质量高(特征充足)或者数据量多,单一方法足以取得非常好的效果。但在本研究中,锆石可用的元素少,且训练集也小,单一方法追求高正确率可能会过拟合或陷入模型“归纳偏好”的困境,在这种情况下,stacking的最终模型能提升结果的准确性和稳定性。

Download:
图 3 Stacking原理示意图 Fig. 3 Illustration of the stacking model

Stacking是一个多层的框架。Stacking的实现通常是第1层用多个基础的分类器(或简单模型)对训练集进行预测,这一步可以看作是分类器去学习S型和I型锆石的判别模式,不同的分类器学到的判别模式也不同,然后这些分类器根据自己学习到的判别模式对样本给出自己的预测,最后将这些预测和训练集一起送入第2层的分类器中。第2层会设置一个分类器来判断第1层的哪个分类器学习到的判别模式及给出的预测结果更加准确,从而合理分配第1层中不同分类器给出预测结果的权重,提高预测结果的稳定性和正确率。Stacking可以根据上述原理扩展至第3层、第4层等再做最终的综合判断,但这样提高泛化性能的同时也增加了过拟合的风险。在本项工作的模型中,为减少过拟合风险,采取了以下手段:一方面采用仅2层的框架,并且在第2层使用简单方法;另一方面将原始特征与第1层输出结合作为第2层的训练集。

每个机器学习方法都具有大量参数,比如,随机森林中树的个数(图 4展示了该参数对方法的影响),神经网络中神经元数目等,这些模型默认的参数往往不能取得最佳效果,所以需要在调节过程中寻找最佳的参数组合使模型最优。经常用来寻找最优参数的方法包括随机搜索、网格搜索和贝叶斯优化。本文因为数据量不大,所以采用网格搜索,即对比合理范围内每一种可能存在的参数组合的效果,从中选取最优的组合。因为网格搜索考虑了每一种可能性,虽然耗时长,但找到的一定是最优组合。

Download:
图 4 随机森林参数中树的数量对模型正确率和ROC AUC值的影响(模型从树的数量≈20开始稳定) Fig. 4 Influence of the random forest parameter(the number of trees) on model accuracy and ROC AUC value (the model becomes stable after using about 20 trees)

训练机器学习模型时通常需要留下一部分数据来验证模型的准确性和可靠性,这部分数据称为验证集。把原始的训练数据随机分组,一部分用于训练,另一部分来验证模型的性能,这种方法被称作交叉验证。常用的交叉验证方法包括: 简单交叉验证、留一法和K-折交叉验证。本文采用5折交叉验证,即分为5组,训练5次最终取5次平均正确率代表模型性能。

在分类问题中通常用正确率来衡量模型的好坏,但是当数据是一个不均衡数据集时,正确率就会失效。在本文S型锆石少而I型锆石多的情况下,会尽可能去希望模型不误判,所以选择了ROC的曲线下面积(area under curve, AUC)和正确率综合评估模型效果。

据上所述,本项工作代码结构为:第1层由多个基学习器组成,输入为原始锆石训练集,输出模型预测的训练集的锆石的类型,并采用5折交叉验证。本文使用的基学习器方法包括逻辑回归(logistic regression, LR)、随机森林(random forest, RF)、极度随机树(extra trees, ET)、XGBoost、LightGBM、梯度提升决策树(gradient boosting decision tree, GBDT)、直推式支持向量机(transductive support vector machine, TSVM)及深度神经网络(deep neural network, DNN)。第2层使用的是逻辑回归,用线性简单模型来降低过拟合风险。输入为第1层基学习器对锆石的判断结果和原始锆石训练集合并,输出为最终判断出的锆石的类型。最终的模型AUC值约0.98,判断正确率达94%左右,相比Zhu等[16]约87%的正确率更加准确,且泛化性能极大提升。具体的模型正确率和损失随训练轮次的变化如图 5所示。

Download:
图 5 DNN模型训练过程中的正确率和损失 Fig. 5 The accuracy and loss during training a DNN model

图 6是由TSVM方法得到的S型和I型锆石分类图,其中P1=2.439 219 006 637 5×lnP+0.759 001 723 337 499×lnY+0.081 413 843 337 5×lnDy+1.056 857 843 337 5×lnTh,P2=0.791 300 956 662 499×lnCe+0.406 731 676 662 5×lnEu+3.059 872 426 662 5×lnLu+0.078 587 356 662 5×lnU,误判样本同样显示在图中。上述的stacking模型以及基模型中的非线性部分无法通过图示表达出来,所以采用了线性模型中相对较为准确的TSVM(约94%正确率)来展示效果并提供一个用来区分I型和S型锆石的决策函数(decision function, DF):

Download:
图 6 TSVM的分类图 Fig. 6 The TSVM classification diagram
DF=2.4392190066375×lnP0.759001723337499×lnY0.791300956662449×lnCe0.4067316766625×lnEu+0.0814138433375×lnDy3.0598724266625×lnLu+1.0568578433375×lnTh0.0785873566625×lnU14.5882488405192.

该判别函数元素成分单位为10-6,计算结果DF>0则为S型,DF <0 为I型。

2 结果与讨论 2.1 S型和I型锆石随时间的分布与地质和地球化学指标的对比

图 7展示了I型和S型锆石年龄峰与各种地质和地球化学指标的对应情况。其中图 7(b)为本项工作根据stacking模型将碎屑锆石进行分类给出的S型和I型分布图,并根据S型锆石年龄峰的情况,结合S型锆石在总体锆石中的比例(图 7(b)中绿线)、总体碎屑锆石分布(图 7(a))以及其他地球化学和地质数据,将S型锆石的分布划分为5个区间。图 7(b)~7(f)中每个淡橙色柱子对应一个S型锆石年龄峰。图 7(a)中灰色柱子对应碎屑锆石的年龄峰。

Download:
图 7 超大陆旋回下S型和I型锆石分布与各种地质和地球化学指标对比 Fig. 7 The distribution of S- and I-type zircons in supercontinent cycle and comparison with various geological and geochemical proxies

Hawkesworth等[10]和Voice等[7]很早就认为碎屑锆石年龄峰与超大陆聚合时间是重叠关系。最近,Zhu等[16]发现S型锆石与超大陆聚合联系密切,认为S型锆石的年龄峰代表了超大陆的聚合阶段,并且提出在此期间先陆陆碰撞形成超级山脉然后剥蚀并形成浊积岩从而形成大量的S型花岗岩。图 7(a)展示了总体碎屑锆石分布情况,从图 7(b)7(a)的对比中可以看出S型和I型锆石分布与总体碎屑锆石分布的趋势基本一致。但在具体细节上可以看出:1)图 7(a)中的总体碎屑锆石分布其实可以分为大年龄峰(简称大峰)和小年龄峰(简称小峰),大峰(图 7(a)中的灰色色柱处)在前人的研究中被认为与超大陆聚合相关,而大峰之间的小峰在前人的工作中并没有被讨论;2)在将碎屑锆石分为S型和I型以后(图 7(b)),可以看出图 7(a)中的大峰分别对应着I型和S型锆石年龄的高峰,但整体碎屑锆石的小峰对应的是I型锆石的小峰和S型锆石的极低值。这表明整体碎屑锆石的大峰和小峰(图 7(a))分别代表了不同的构造环境。

图 7(b)展示S型与I型锆石随时间的分布情况,采用非堆叠画法。绿色实线是S型锆石所占比例,由32个点直接连线画出,这32个点是预测集所有锆石按100 Ma区间分箱计算得到。其中每个点横坐标由箱内所有锆石年龄平均得到,纵坐标为S型锆石数量所占箱内所有锆石比例。只计算了小于等于3 200 Ma的部分,大于3 200 Ma的部分因为样本过少,部分时间区间内锆石数量不足10个,误判1个将很大程度影响比例,不具备参考价值。

图 7(c)展示独居石的全球分布情况。Mulder和Cawood[27]发现独居石与碎屑锆石具有高度相关性。图 7(c)与7(b)对比可看出S型锆石年龄的峰与独居石年龄的峰基本吻合。

图 7(d)展示锆石δ18O数据[28]的分布情况。Roberts和Spencer[15]通过锆石δ18O的变化发现了其与超大陆之间的相关性,即在超大陆的聚合期间,δ18O是升高的。他们认为超大陆聚合期间碰撞构造较多,导致明显的地壳增厚以及高δ18O沉积岩的侵蚀增加。锆石δ18O与S型锆石年龄峰有密切联系,每个S型锆石年龄峰都会对应δ18O的正漂移,这说明δ18O的正漂移与此时S型花岗岩的较多产出相关。

图 7(e)展示锆石的εHf分布情况。εHf揭示地壳源区的年龄,是锆石记录大陆演化的重要指标。Sundell和MacDonald[14]通过统计不同大陆的锆石εHf密度模式,发现了锆石εHf与超大陆聚合之间的关系。与代表S型锆石年龄峰的柱子对比可以看出,每个S型锆石年龄峰都对应一个锆石εHf的高密度区域,显示了花岗岩产出的不均一分布。图 7(e)与7(f)对比发现,锆石εHf和δ18O普遍是负相关的[29],变化趋势相反,在δ18O升高时εHf普遍降低。更重要的是,在S型锆石年龄峰的位置,εHf会处在一个比较低的值,这与花岗岩来自相对古老地壳的再循环相关。此外,500 Ma以来S型锆石占比降低,但是其εHf值具有明显升高的趋势,表明早古生代以来是年轻地壳生长的重要时期[14, 30]

图 7(f)展示不同T/P值变质作用[31]的分布情况。Liu等[13]通过变质作用的统计数据发现了变质作用与板块边界之间的联系。与图中代表S型锆石年龄峰的柱子对比可以看出,S型锆石随时间的变化趋势与变质作用几乎完全一致,说明了S型花岗岩产出与变质作用的密切相关性。

2.2 S型锆石年龄峰与超大陆旋回

图 8展示S型锆石分布与超大陆旋回的相关关系。图 8(a)为Condie等[12]根据LIPs、造山带、碎屑锆石年龄峰、板块速度、δ18O、εHf和古地磁数据等综合得出。与图 8(b)对比可以看出超大陆的最大离散处基本对应着S型锆石的年龄峰,最大堆积处基本对应着S型锆石的年龄谷。根据S锆石年龄峰的位置将图 7(b)的色柱一劈两半,可以看出新的色柱系统(图 8(b))与Condie等[12]的色柱系统(图 8(a))有很好的一致性,每个S型锆石年龄峰的右侧代表超大陆的裂解,年龄峰的左侧代表超大陆的聚合。每个S型锆石的年龄峰,也是I型锆石和整体锆石的大峰,表示的是超大陆最离散的状态,岩浆作用较多,S型和I型均有产出。每个S型锆石的年龄谷,也是I型锆石和整体锆石的小峰,代表的是超大陆最紧密的位置,岩浆作用很少,以I型为主。对于每一个S型锆石的年龄峰,从右侧谷底开始,代表一个超大陆开始裂解。到达这个S型锆石的年龄峰顶,裂解达到最大,同时是下一个超大陆聚合的开始。到达这个S型锆石年龄峰的左侧谷底,代表这个新的超大陆聚合达到最大,并且是这个新大陆裂解的开始处。本项研究的这一观点显然与前人把锆石年龄峰笼统地定义为超大陆聚合的观点是不同的。

Download:
图 8 S型锆石分布与超大陆旋回关系 Fig. 8 Relationship of supercontinent cycle and distribution of S-type zircon

图 8(c)展示Wang等[30]提出超大陆之间是巨大陆的观点。对比图 8(c)8(b)图 8(c)的色柱,不管是蓝色还是黄色色柱,基本处于图 8(b)色柱的转换处。具体来看,巨大陆大致对应的是S型锆石年龄峰的区间,这时大陆基本处于裂解状态,而超大陆对应的基本是S型锆石年龄谷的区间,是大陆分布比较聚合的阶段。总之,图 8的Condie等[12]、Wang等[30]和本项研究结果综合表明整体锆石的年龄峰(图 7(a))的大峰表示的是超大陆比较离散的状态,大陆板块比较活跃,对应的也是板块移动速度较高的阶段(参见Pesonen等[32]图 1.16(K)),岩浆活动较多;而整体锆石分布的小峰(图 7(a))表示的是超大陆比较聚合的状态,大陆比较稳定,板块移动速度慢,岩浆活动较少。

此外,模型给出的预测结果与主流的基于古地磁数据重建的Columbia(Zhao等[3])、Rodinia(Li等[4])和Pangea(Zhao等[33]) 超大陆古地理对比也支持根据S型锆石的年龄峰来判断超大陆的聚合和离散。不同超大陆旋回的具体对比结果如下。

2.2.1 Superia

太古代—古元古代的超大陆模型一直存在争议。部分学者认为是单一超大陆模式,包括Kenorland[34],或者盖层构造[35],但是古地磁数据可能并不支持这一模型[36]。主流的观点认为是由独立的不同克拉通自由漂移组成超级克拉通[37],而且这也符合太古代部分克拉通地质记录之间的相似性[38]。前人对于Superia的研究争议较大:Bleeker[37]根据古地磁和地幔柱作用推断Superia聚合在2.7 Ga并于2.45 Ga裂解;Salminen等[39]通过统计岩浆活动特征,认为属于Superia的几个克拉通在2.68~2.10 Ga具有相似的表现,此时Superia处于聚合状态,随后它们在2.06~2.05 Ga解耦也就意味着Superia裂解了。根据图 8(b),我们认为Superia大概在2.6 Ga开始聚合,锆石双峰可能表示这里有短暂的聚散,2.3 Ga聚合达到最大并开始裂解,1.9 Ga裂解达到最大并开启了Columbia聚合之路。此外,Superia在最大稳定区间(约2.3 Ga前后区间)缺乏后期超大陆特有的I型花岗岩小年龄峰,这一方面可能是数据统计的问题,但另一方面可能是Superia超级克拉通与后期超大陆聚合有所不同。

太古代地质过程也存在明显的活跃期和平静期。Condie等[40]根据整体碎屑锆石记录、LIPs和同位素比较分析提出2.4~2.2 Ga的构造-岩浆间歇期,但之后Spencer等[41]通过统计造山事件、被动边缘、LIPs和较低的板块速度进一步提出构造-岩浆间歇期为2.3~2.2 Ga。虽然Pesonen等[32]等通过古地磁数据计算长区间(2.8~2.0 Ga)的平均板块速度反驳了这一观点,但是根据图 8(b)中2.3 Ga之前S型锆石年龄峰的存在,说明克拉通之间聚合形成超级克拉通引起了2.3~2.2 Ga的构造-岩浆间歇期。板块之间的聚合形成超大陆导致构造-岩浆间歇期在后期也有明显呈现,Pesonen等[32]在碎屑锆石年龄峰上提出了中元古代构造-岩浆间歇期1.75~1.35 Ga和新元古代构造-岩浆间歇期0.75~0.60 Ga,这2个阶段能够与图 8(b)中S型锆石年龄的谷(I型小峰)对应上。

2.2.2 Columbia

Columbia(Nuna)通常被认为是地质历史上第一个超大陆[3, 30, 42-43]。前人认为Columbia的聚合与全球2.0~1.8 Ga的碰撞造山带有关[3],在随后的1.8~1.3 Ga里,Columbia超大陆处在长时间的增生阶段(主要在大陆边缘),并且在1.6~1.3 Ga发生了内部的拉张[44]。最后在1.2 Ga左右Columbia超大陆发生裂解,进入下一个超大陆循环。在图 8(b)中根据我们的模型,Columbia超大陆在约1.9 Ga起始聚合,在约1.4 Ga聚合达到最大,并开始离散,在约1.1 Ga离散达到最大。

2.2.3 Rodinia

Valentine等[45]最早认识到新元古代可能存在超大陆,1990年McMenamin等[46]提出并将其命名为Rodinia。后来大量的研究推进了Rodinia的聚合、裂解、构造等认识[4, 47-51]。Rodinia的聚合一般认为是发生在1.1~0.9 Ga[4],对应格林威尔期碰撞造山事件。由于900~830 Ma的古地磁数据质量差,所以前人只能通过侵入来判断超级地幔柱的作用,而最早的侵入大概发生在870~850 Ma,所以较早的观点认为裂解发生在860~570 Ma[52]。较新的观点则认为这些侵入作用并没有造成洋盆的打开,所以Rodinia超大陆825~750 Ma仍处在增生阶段,裂解应主要发生在750~600 Ma[33]。从图 8(b)中可以看出Rodinia超大陆从1.1 Ga起始聚合,在约0.8 Ga达到峰值,并开启裂解之路,然后在约0.6 Ga裂解达到峰值。

2.2.4 Pangea

部分学者认为Pangea超大陆之前的Gondwana由于其重要性和不同于Pangea的部分地质特征可以当成是超大陆[53],但其他研究者认为Gondwana严格意义只是Rodinia向Pangea超大陆过渡的一部分[54]。Pangea的聚合过程首先是Gondwana聚合,是由650~530 Ma期间Adamastor(Khomas)和Mawson 2个海洋分别关闭导致[55],随后500~420 Ma原特提斯洋闭合东亚陆块拼合在Gondwana北缘,420~380 Ma东古特提斯洋打开,315~250 Ma古亚洲洋从西到东剪刀式闭合,250~220 Ma东古特提斯洋闭合,东亚大陆成为Pangea的一部分[33]。从图 8(b)可以看出,Gondwana从0.6 Ga开始启动聚合,大约在0.4 Ga处基本完成。在时间小于0.4 Ga时,通过图 7(b)7(a)对比可以看出可能由于数据缺乏,整体碎屑锆石分布(图 7(a))和S型、I型锆石分布(图 7(b))特征不尽相同,这里就不再对超大陆聚合离散与S型锆石随时间的分布做进一步比对。

3 结论

本项研究通过stacking方法将多种机器学习模型结合在一起,对碎屑锆石进行了S型和I型的分类,将S型和I型锆石随时间的分布与矿物学、地球化学、地质学数据与板块的古地理重建进行详细的对比,发现:

1) S型锆石的分布与氧同位素、Hf同位素、变质作用和独居石分布有较好的一致性。S型锆石的年龄峰分别对应高δ18O和低εHf值,与变质作用和独居石分布峰一致性较好。

2) S型锆石的年龄峰对应的是大陆板块比较离散的阶段。S型锆石年龄峰的位置与整体锆石年龄峰是一致的,这表明整体锆石的年龄峰对应的也是大陆板块相对离散的状态,岩浆活动较多,I型和S型锆石同时产出较多,板块移动速度较快。S型锆石年龄的谷对应的是整体锆石分布的小峰,这对应的是板块比较紧密的状态,岩浆活动总体较少。即使有岩浆活动,也以I型为主,这时板块移动速度较慢。

由以上分析,给出了一个更高准确率的判断S型和I型锆石的决策函数和分类图解,可直接应用于相关研究中。

未来可以通过机器学习方法对碎屑锆石产出的构造环境进行研究,这将能更好地发挥锆石的作用,细化对岩浆作用和超大陆旋回的认识。

感谢蒋济莲和邹心宇收集的本文训练集数据, 部分还未发表。
参考文献
[1]
Worsley T R, Nance D M, Moody J B. Global tectonics and eustasy for the past 2 billion years[J]. Marine Geology, 1984, 58(3/4): 373-400. Doi:10.1016/0025-3227(84)90209-3
[2]
Nance R D, Worsley T R, Moody J B. The supercontinent cycle[J]. Scientific American, 1988, 259(1): 72-79. Doi:10.1038/scientificamerican0788-72
[3]
Zhao G C, Cawood P A, Wilde S A, et al. Review of global 2.1-1.8 Ga orogens: implications for a pre-Rodinia supercontinent[J]. Earth-Science Reviews, 2002, 59(1/2/3/4): 125-162. Doi:10.1016/S0012-8252(02)00073-9
[4]
Li Z X, Bogdanova S V, Collins A S, et al. Assembly, configuration, and break-up history of Rodinia: a synthesis[J]. Precambrian Research, 2008, 160(1/2): 179-210. Doi:10.1016/j.precamres.2007.04.021
[5]
Mitchell R N, Kilian T M, Evans D A D. Supercontinent cycles and the calculation of absolute palaeolongitude in deep time[J]. Nature, 2012, 482(7384): 208-211. Doi:10.1038/nature10800
[6]
Evans D A D. True polar wander and supercontinents[J]. Tectonophysics, 2003, 362(1/2/3/4): 303-320. Doi:10.1016/S0040-1951(02)000642-X
[7]
Voice P J, Kowalewski M, Eriksson K A. Quantifying the timing and rate of crustal evolution: global compilation of radiometrically dated detrital zircon grains[J]. The Journal of Geology, 2011, 119(2): 109-126. Doi:10.1086/658295
[8]
Campbell I H, Allen C M. Formation of supercontinents linked to increases in atmospheric oxygen[J]. Nature Geoscience, 2008, 1(8): 554-558. Doi:10.1038/ngeo259
[9]
Cawood P A, Hawkesworth C J, Dhuime B. The continental record and the generation of continental crust[J]. Geological Society of America Bulletin, 2013, 125(1/2): 14-32. Doi:10.1130/b30722.1
[10]
Hawkesworth C, Cawood P, Kemp T, et al. A matter of preservation[J]. Science, 2009, 323(5910): 49-50. Doi:10.1126/science.1168549
[11]
Hawkesworth C J, Cawood P A, Dhuime B, et al. Earth's continental lithosphere through time[J]. Annual Review of Earth and Planetary Sciences, 2017, 45: 169-198. Doi:10.1146/annurev-earth-063016-020525
[12]
Condie K C, Pisarevsky S A, Puetz S J. LIPs, orogens and supercontinents: the ongoing Saga[J]. Gondwana Research, 2021, 96: 105-121. Doi:10.1016/j.gr.2021.05.002
[13]
Liu Y B, Mitchell R N, Brown M, et al. Linking metamorphism and plate boundaries over the past 2 billion years[J]. Geology, 2022, 50(5): 631-635. Doi:10.1130/g49637.1
[14]
Sundell K E, MacDonald F A. The tectonic context of hafnium isotopes in zircon[J]. Earth and Planetary Science Letters, 2022, 584: 117426. Doi:10.1016/j.epsl.2022.117426
[15]
Roberts N M W, Spencer C J. The zircon archive of continent formation through time[J]. Geological Society, London, Special Publications, 2015, 389(1): 197-225. Doi:10.1144/sp389.14
[16]
Zhu Z Y, Campbell I H, Allen C M, et al. S-type granites: their origin and distribution through time as determined from detrital zircons[J]. Earth and Planetary Science Letters, 2020, 536: 116140. Doi:10.1016/j.epsl.2020.116140
[17]
Burnham A D, Berry A J. Formation of Hadean granites by melting of igneous crust[J]. Nature Geoscience, 2017, 10(6): 457-461. Doi:10.1038/ngeo2942
[18]
Tang M, Chu X, Hao J H, et al. Orogenic quiescence in Earth's middle age[J]. Science, 2021, 371(6530): 728-731. Doi:10.1126/science.abf1876
[19]
Zou X Y, Qin K Z, Han X L, et al. Insight into zircon REE oxy-barometers: a lattice strain model perspective[J]. Earth and Planetary Science Letters, 2019, 506: 87-96. Doi:10.1016/j.epsl.2018.10.031
[20]
Yakymchuk C, Kirkland C L, Clark C. Th/U ratios in metamorphic zircon[J]. Journal of Metamorphic Geology, 2018, 36(6): 715-737. Doi:10.1111/jmg.12307
[21]
Bell E A, Boehnke P, Harrison T M. Recovering the primary geochemistry of Jack Hills zircons through quantitative estimates of chemical alteration[J]. Geochimica et Cosmochimica Acta, 2016, 191: 187-202. Doi:10.1016/j.gca.2016.07.016
[22]
Aitchison J, Greenacre M. Biplots of compositional data[J]. Journal of the Royal Statistical Society Series C: Applied Statistics, 2002, 51(4): 375-392. Doi:10.1111/1467-9876.00275
[23]
Zuo R G, Xia Q L, Wang H C. Compositional data analysis in the study of integrated geochemical anomalies associated with mineralization[J]. Applied Geochemistry, 2013, 28: 202-211. Doi:10.1016/j.apgeochem.2012.10.031
[24]
Ahrens L H. The lognormal distribution of the elements (2)[J]. Geochimica et Cosmochimica Acta, 1954, 6(2/3): 121-131. Doi:10.1016/0016-7037(54)90021-6
[25]
Wolpert D H. Stacked generalization[J]. Neural Networks, 1992, 5(2): 241-259. Doi:10.1016/S0893-6080(05)80023-1
[26]
Zhao Y, Zhang Y G, Geng M, et al. Involvement of slab-derived fluid in the generation of Cenozoic basalts in northeast China inferred from machine learning[J]. Geophysical Research Letters, 2019, 46(10): 5234-5242. Doi:10.1029/2019gl082322
[27]
Mulder J A, Cawood P A. Evaluating preservation bias in the continental growth record against the monazite archive[J]. Geology, 2022, 50(2): 243-247. Doi:10.1130/g49416.1
[28]
Spencer C J, Cawood P A, Hawkesworth C J, et al. Proterozoic onset of crustal reworking and collisional tectonics: reappraisal of the zircon oxygen isotope record[J]. Geology, 2014, 42(5): 451-454. Doi:10.1130/g35363.1
[29]
Brown M, Johnson T. Metamorphism and the evolution of subduction on earth[J]. American Mineralogist, 2019, 104(8): 1065-1082. Doi:10.2138/am-2019-6956
[30]
Wang C, Mitchell R N, Murphy J B, et al. The role of megacontinents in the supercontinent cycle[J]. Geology, 2021, 49(4): 402-406. Doi:10.1130/g47988.1
[31]
Brown M, Johnson T. Time's arrow, time's cycle: granulite metamorphism and geodynamics[J]. Mineralogical Magazine, 2019, 83(3): 323-338. Doi:10.1180/mgm.2019.19
[32]
Pesonen L J, Evans D A D, Veikkolainen T, et al. Precambrian supercontinents and supercycles: an overview[M]//Ancient Supercontinents and the Paleogeography of Earth. Amsterdam: Elsevier, 2021: 1-50. DOI: 10.1016/b978-0-12-818533-9.00020-5.
[33]
Zhao G C, Wang Y J, Huang B C, et al. Geological reconstructions of the East Asian blocks: from the breakup of Rodinia to the assembly of pangea[J]. Earth-Science Reviews, 2018, 186: 262-286. Doi:10.1016/j.earscirev.2018.10.003
[34]
Roscoe S M, Card K D. The reappearance of the Huronian in Wyoming: rifting and drifting of ancient continents[J]. Canadian Journal of Earth Sciences, 1993, 30(12): 2475-2480. Doi:10.1139/e93-214
[35]
Piper J D A. A planetary perspective on Earth evolution: lid tectonics before plate tectonics[J]. Tectonophysics, 2013, 589: 44-56. Doi:10.1016/j.tecto.2012.12.042
[36]
Evans D A D. Reconstructing pre-pangean supercontinents[J]. Geological Society of America Bulletin, 2013, 125(11/12): 1735-1751. Doi:10.1130/b30950.1
[37]
Bleeker W. The late Archean record: a puzzle in Ca. 35 pieces[J]. Lithos, 2003, 71(2/3/4): 99-134. Doi:10.1016/j.lithos.2003.07.003
[38]
Barley M E, Bekker A, Krapež B. Late Archean to Early Paleoproterozoic global tectonics, environmental change and the rise of atmospheric oxygen[J]. Earth and Planetary Science Letters, 2005, 238(1/2): 156-171. Doi:10.1016/j.epsl.2005.06.062
[39]
Salminen J, Pehrsson S, Evans D A D, et al. Neoarchean-Paleoproterozoic supercycles[M]. Amsterdam: Elsevier, 2021: 465-498. Doi:10.1016/b978-0-12-818533-9.00014-x
[40]
Condie K C, O'Neill C, Aster R C. Evidence and implications for a widespread magmatic shutdown for 250 My on Earth[J]. Earth and Planetary Science Letters, 2009, 282(1/2/3/4): 294-298. Doi:10.1016/j.epsl.2009.03.033
[41]
Spencer C J, Murphy J B, Kirkland C L, et al. A Palaeoproterozoic tectono-magmatic lull as a potential trigger for the supercontinent cycle[J]. Nature Geoscience, 2018, 11(2): 97-101. Doi:10.1038/s41561-017-0051-y
[42]
Hoffman P F. Speculations on Laurentia's first gigayear (2.0 to 1.0 Ga)[J]. Geology, 1989, 17(2): 135. Doi:10.1130/0091-7613(1989)0170135:solsfg>2.3.co;2
[43]
Hoffman P F. Tectonic genealogy of North America [C/OL]//van der Pluijm B A, Marshak S. Earth structure: an introduction to structural geology and tectonics. New York: McGraw-Hill, 1997: 459-464[2023-05-01]. urlhttps://ens9004-infd.mendoza.edu.ar/sitio/upload/05-VAN DER PLUIJM & MARSHAK-Earth Structure Introduction to Structural Geology and Tectonics. pdf.
[44]
Zhao G C, Sun M, Wilde S A, et al. A paleo-mesoproterozoic supercontinent: assembly, growth and breakup[J]. Earth-Science Reviews, 2004, 67(1/2): 91-123. Doi:10.1016/j.earscirev.2004.02.003
[45]
Valentine J W, Moores E M. Plate-tectonic regulation of faunal diversity and sea level: a model[J]. Nature, 1970, 228(5272): 657-659. Doi:10.1038/228657a0
[46]
McMenamin M A, McMenamin D L S. The emergence of animals: the Cambrian breakthrough[M]. New York: Columbia University Press, 1990.
[47]
Zhou M F, Yan D P, Kennedy A K, et al. SHRIMP U-Pb zircon geochronological and geochemical evidence for Neoproterozoic arc-magmatism along the western margin of the Yangtze Block, South China[J]. Earth and Planetary Science Letters, 2002, 196(1/2): 51-67. Doi:10.1016/S0012-821X(01)00595-7
[48]
Li Z X, Li X H, Kinny P D, et al. The breakup of Rodinia: did it start with a mantle plume beneath South China?[J]. Earth and Planetary Science Letters, 1999, 173(3): 171-181. Doi:10.1016/S0012-821X(99)00240-X
[49]
Rogers J J W. A history of continents in the past three billion years[J]. The Journal of Geology, 1996, 104(1): 91-107. Doi:10.1086/629803
[50]
Wang J, Li Z X. History of Neoproterozoic rift basins in South China: implications for Rodinia break-up[J]. Precambrian Research, 2003, 122(1/2/3/4): 141-158. Doi:10.1016/S0301-9268(02)00209-7
[51]
Zheng Y F, Zhao Z F, Wu Y B, et al. Zircon U-Pb age, Hf and O isotope constraints on protolith origin of ultrahigh-pressure eclogite and gneiss in the Dabie orogen[J]. Chemical Geology, 2006, 231(1/2): 135-158. Doi:10.1016/j.chemgeo.2006.01.005
[52]
Li X H, Li Z X, Zhou H W, et al. SHRIMP U-Pb zircon age, geochemistry and Nd isotope of the Guandaoshan pluton in SW Sichuan: petrogenesis and tectonic significance[J]. Science in China Series D: Earth Science, 2003, 46: 73-83. Doi:10.1360/03dz9029
[53]
Spencer C J, Hawkesworth C, Cawood P A, et al. Not all supercontinents are created equal: Gondwana-Rodinia case study[J]. Geology, 2013, 41(7): 795-798. Doi:10.1130/g34520.1
[54]
Doucet L S, Li Z X, Ernst R E, et al. Coupled supercontinent-mantle plume events evidenced by oceanic plume record[J]. Geology, 2020, 48(2): 159-163. Doi:10.1130/g46754.1
[55]
Torsvik T H, Cocks L R M. Gondwana from top to base in space and time[J]. Gondwana Research, 2013, 24(3/4): 999-1030. Doi:10.1016/j.gr.2013.06.012
S型和I型锆石的机器学习划分及其在超大陆演化中的应用
孙之晗, 张毅刚