岩石学报  2018, Vol. 34 Issue (11): 3189-3194   PDF    
基于GEOROC数据库的全球辉长岩大数据的大地构造环境智能判别研究
焦守涛1,2,3 , 周永章1,2,3 , 张旗4 , 金维浚4 , 刘艳鹏1,2,3 , 王俊1,2,3     
1. 中山大学地球环境与地球资源研究中心, 广州 510275;
2. 中山大学地球科学与工程学院, 广州 510275;
3. 广东省地质过程与矿产资源探查重点实验室, 广州 510275;
4. 中国科学院地质与地球物理研究所, 北京 100029
摘要:辉长岩是化学成分与玄武岩类似的侵入岩,前人认为它的形成过程太复杂,对应的岩浆可能经过了分离结晶作用、混染作用等,不能用Pearce判别图来判断岩浆岩形成的构造环境。本文利用GEOROC数据库的资料对辉长岩进行大数据挖掘。首先根据前人成果,将GEOROC数据库的辉长岩形成的大地构造环境分为大陆玄武岩环境、汇聚边界环境、板内火山岩环境和大洋岛弧玄武岩环境等4类;然后在数据清洗基础上,利用Python语言,依托sklearn库,实现支持向量机、K近邻和随机森林等3种机器学习算法,获得3种对应的分类器结果输出。对辉长岩的构造环境进行智能判别结果显示,随机森林方法效果最好,判断准确率可达97%,利用辉长岩的地球化学大数据来判断岩浆岩的构造环境是完全可行的。
关键词: 辉长岩     机器学习     大数据挖掘     支持向量机     随机森林     GEOROC     Python    
Study on intelligent discrimination of tectonic settings based on global gabbro data from GEOROC
JIAO ShouTao1,2,3, ZHOU YongZhang1,2,3, ZHANG Qi4, JIN WeiJun4, LIU YanPeng1,2,3, WANG Jun1,2,3     
1. Research Center for Earth Environment & Resources, Sun Yat-sen University, Guangzhou 510275, China;
2. School of Earth Sciences & Engineering, Sun Yat-sen University, Guangzhou 510275, China;
3. Guangdong Provincial Key Lab of Geological Processes and Mineral Resource Exploration, Guangzhou 510275, China;
4. Institute of Geology and Geophysics, Chinese Academy of Sciences, Beijing 100029, China
Abstract: The study of discrimination diagrams began in the 1970s. The basalt tectonic environmental discriminant diagrams are the most commonly used in academic circles and have achieved very good results. With the accumulation of data, many scholars have gradually discovered the limitations of the discriminating diagrams and tried to establish new discrimination diagrams with better effect. The gabbro is an intrusive rock with a chemical composition similar to that of basalt. The predecessors thought that the formation process of gabbro was too complicated. The magma may have undergone fractional crystallization, mixing, hybridization, and it cannot be used to determine the tectonic setting formed by magmatic rocks. In this paper, the data mining of gabbro was studied using the data from the database of Geochemistry of Rocks of the Oceans and Continents (GEOROC), and three different algorithms of machine learning (Support Vector Machine, K Nearest Neighbor, and Random Forest) were used for gabbro. The intelligent discriminant research for tectonic settings, compared with the previous discrimination diagrams, has obtained a better discriminant effect. The random forest method has the best effect, and the judgment accuracy rate can reach 97%. Therefore, it is considered that the geochemical data of gabbro can be used to determine the tectonic setting of magmatic rocks. Based on the existing results, the random forest algorithm has the best effect.
Key words: Gabbro     Machine learning     Data mining     SVM     Random forest     GEOROC     Python    

Pearce判别图的应用始于20世纪70年代,学术界经常把它应用于玄武岩构造环境,并在当时取得了被认为不错的效果(Pearce and Cann, 1973; Pearce, 1975, 1976, 1982, 1983; Glassley, 1974; Pearce et al., 1977, 1984; Pearce and Norry, 1979; Wood, 1980; 张旗等, 1990)。在板块构造学说的基础上,通过结合玄武岩的地球化学特征判断大地构造背景,极大丰富了岩浆岩石学和大地构造学的研究内容。早期Pearce判别图的主要做法是基于地球化学理论的推导,是一种因果关系的推导(张旗等, 2017, 2018)。

但随着数据的积累,学者发现Pearce判别图的局限,并尝试建立新的效果更好的判别图(Vermeesch, 2006; Li et al., 2015, 王金荣等, 2016, 2017; 杨婧等, 2016a, b; 陈万峰等, 2017; 第鹏飞等, 2017, 2018; 刘欣雨等, 2017; 罗建民等, 2018)。适逢大数据技术的兴起,大数据带来了一种思想的转变,科学家通过大数据方法挖掘数据之间的相关关系,得到很好的效果(周永章等, 2017, 2018a, b; 张旗等, 2018; 徐述腾和周永章, 2018)。

辉长岩是化学成分与玄武岩类似的侵入岩,前人认为辉长岩的形成过程太复杂,岩浆可能经过了分离结晶作用,不能用来判断岩浆岩形成的构造背景。那真实情况是否如此呢?从玄武岩判别图构建的初衷来说,玄武岩判别图应是严格限于玄武岩,不能应用于辉长岩的(Pearce and Cann, 1973; Pearce, 1975, 1976; Pearce et al., 1977)。已有研究主要限于岩浆岩微量元素之间因果关系的讨论,而对元素和元素对因果关系的了解仅限于部分元素,尤其是大离子亲石元素和不相容元素等方面,而对于绝大多数微量元素(分散元素、过渡元素、亲铜元素等)在岩浆演化过程中的行为几乎很少了解。

本文尝试采用大数据方法,立足对大数据相关关系的挖掘,对全球全辉长岩的尽可能多的元素(主元素和微量元素)进行分析,挖掘大数据中可能隐含的相关关系,从相关关系中探索它们之间的区别。所用机器学习的方法包括支持向量机、K近邻和随机森林算法。文中数据来自于GEOROC(Geochemistry of Rocks of the Oceans and Continents)数据库。

1 数据清洗

辉长岩SiO2含为量45%~52%,主要矿物是单斜辉石和基性斜长石,次要矿物是橄榄石、斜方辉石、角闪石、有的含少量黑云母、石英等。数据清洗首先是把非辉长岩(如SiO2小于或大于45%~52%)的清掉。然后对缺省值进行处理。

本次研究数据清洗的内容包括:1)从数据库中提取全部辉长岩的数据;2)保留尽可能多的数据,剔除全部为空值的列,计算过程中出现空值的地方本文采取了紧邻点均值充填的方案;3)最后采用GEOROC数据库共151维数据;4)构造环境仅选取数据库中数据较多的四种:Continental flood basalt, Convergent margin, Intraplate volcanic, Ocean island。这是数据库中的已有分类,在程序编写过程中分别定义为不同的四类即可,要解决的其实是一个分类问题;5)数据库中太古代的数据需要剔除,因为对太古代的构造环境尚有争论,不确定是否存在板块构造。

清洗后全部全球辉长岩样品数据在全球范围内的时空分布如图 1所示。

图 1 全球辉长岩分布图 Fig. 1 Global distribution of gabbro samples
2 智能判别算法

本研究重点应用支持向量机、K近邻和随机森林三种智能算法。这三种算法是学者应用较多的算法(Cortes and Vapnik, 1995; Breiman, 2001; Vermeesch, 2006; Cracknell and Reading, 2013; Belgiu and Drǎguţ, 2016; Petrelli and Perugini, 2016; Ueki et al., 2018)。

2.1 支持向量机算法

支持向量机(SVM)是一种常见的分类器(Cortes and Vapnik, 1995),其原理是通过构造超平面将数据进行分离,常用来解决二分类问题(图 2)。分为线性可分SVM、线性SVM和非线性SVM。线性可分SVM是用一个分割平面将两组数据完全分离,线性SVM是指分割面虽不能完全分割所有数据,但可以使大多数数据被正确的分类,非线性SVM是将前两种加一个核函数,构造一个超平面将数据分开。

图 2 线性SVM原理(左)和非线性SVM原理(右) Fig. 2 Principles of linear SVM (left) and non-linear SVM (right)

前人(Cortes and Vapnik, 1995; Joachims, 1998; Smola and Schölkopf, 2004)研究显示, SVM理论基础扎实,算法简单,还有很好的鲁棒性。

2.2 K近邻算法

K近邻(KNN)指如果一个样本在特征空间中的k个最相似(特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别(Cover and Hart, 1967)。KNN也是一个理论上比较成熟的算法,也是最简单的机器学习算法之一。

前人(周永章等, 2018b)研究表明该算法常用来解决分类和回归等问题,具有算法简单,适合多分类任务的优点,因为要计算各样本间的距离,所以计算量比较大。

2.3 随机森林算法

随机森林算法(RF)是一种由多颗决策树组成的集成学习算法(Breiman, 2001),集成学习中主要分为套袋法和提升法,随机森林算法是套袋法。套袋法是指从原始样本中随机抽取n个样本,共进行k轮抽取,得到k个训练集,训练k个模型,对于分类问题,由投票表决产生分类结果;对于回归问题,由k个模型预测结果的均值作为最后预测结果。

随机森林算法通常有极高的准确率,可以处理很高维度的数据,既可以处理离散型数据,也可以处理连续型数据,训练速度快,容易实现并行化计算等优点(Belgiu and Drǎguţ, 2016; Ueki et al., 2018)。随机森林中的决策树很多时,训练需要的空间和时间会较大,随机森林模型中也有许多不好解释的地方。

3 结果与讨论

根据GEOROC数据库的分类,辉长岩的4种大地构造环境如下:

A:大陆玄武岩环境Continental flood basalt

B:汇聚边界环境Convergent margin

C:板内火山岩环境Intraplate volcanics

D:大洋岛弧玄武岩环境Ocean island

本研究使用Python语言,依托sklearn库,分别编写了支持向量机、K近邻和随机森林三种智能算法的程序,把清洗后的辉长岩导入,获得三种对应分类器的结果输出。

在实验过程中,对5175条数据的151维数据,选取其中80%数据作为测试集,选取其他20%数据作为验证集。

表 1展示了智能算法输出结果。

表 1 三种智能算法输出结果 Table 1 The results of the three algorithms

表 1可以看出,在三种智能算法中,随机森林的分类效果最好,准确率最高达97%。支持向量机的分类效果最差。

本文采用精确率(Precision)、召回率(Recall)和二者调和平均数F1分数(F1 Score)评价模型分类效果。精确率体现了模型对阴性样本的区分能力,即精确率越高,模型区分能力越强;召回率体现了分类模型对阳性样本的判别能力,即召回率越高,模型判别能力越强;F1得分是二者的综合,F1得分越高,模型对数据分类状况越稳健。本文将F1得分视为准确率评价标准。

在对四类构造环境的区分效果看,对板内火山岩构造环境的区分效果最差,对汇聚边缘构造的区分效果最好。大陆上和洋岛环境的区分效果介于两者之间。

总体上看,K近邻算法和随机森林算法,可以达到明显区分不同的构造环境的效果。也就是说,用机器学习的方法对辉长岩构造环境的判别是可行的,辉长岩跟构造环境之间相关关系是可以通过数据进行区分的。

4 结论

通过收集GEOROC数据库全球辉长岩的数据,采用机器学习三种不同的算法(SVM、KNN、RF)对辉长岩的构造环境进行智能判别,结果表明:

(1) 随机森林的方法效果最好,判别正确率可以高达97%;

(2) 尽管辉长岩的形成过程复杂,涉及到岩浆演化、分离结晶、同化混染等复杂过程,但岩浆源区的某些信息仍然可能保留在分离结晶的堆晶矿物(橄榄石、辉石、尖晶石等)和残余岩浆中,不会全部消失,可以依据大数据对其进行构造环境判别;

(3) 机器学习算法的速度快、效率高、准确率也高,相比于传统的玄武岩的构造环境判别图重叠区多具有明显优势。

上述的辉长岩的智能判别本质上是一种关联关系的研究,如果能对关联关系进行深入分析,找到深层次的因果关系,将可以将构造环境与矿床相关联,具有广阔的应用前景。

参考文献
Belgiu M and Drǎguţ L. 2016. Random forest in remote sensing:A review of applications and future directions. ISPRS Journal of Photogrammetry and Remote Sensing, 114: 24-31. DOI:10.1016/j.isprsjprs.2016.01.011
Breiman L. 2001. Random forests. Machine Learning, 45(1): 5-32. DOI:10.1023/A:1010933404324
Chen WF, Wang JR, Zhang Q, Liu YX, Ma L and Jiao ST. 2017. Data mining of ocean island basalt and ocean plateau basalt:Geochemical characteristics and comparison with MORB. Acta Geologica Sinica, 91(11): 2443-2455.
Cortes C and Vapnik V. 1995. Support-vector networks. Machine Learning, 20(3): 273-297.
Cover T and Hart P. 1967. Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13(1): 21-27. DOI:10.1109/TIT.1967.1053964
Cracknell MJ and Reading AM. 2013. The upside of uncertainty:Identification of lithology contact zones from airborne geophysics and satellite data using random forests and support vector machines. Geophysics, 78(3): WB113-WB126. DOI:10.1190/geo2012-0411.1
Di PF, Wang JR, Zhang Q, Yang J, Chen WF, Pan ZJ, Du XL and Jiao ST. 2017. The evaluation of basalt tectonic discrimination diagrams:Constraints on the research of global basalt data. Bulletin of Mineralogy, Petrology and Geochemistry, 36(6): 891-896.
Di PF, Chen WF, Zhang Q, Wang JR, Tang QY and Jiao ST. 2018. Comparison of global N-MORB and E-MORB classification schemes. Acta Petrologica Sinica, 34(2): 264-274.
Du XL, Li YQ, Du J, Zhang Q and Wang JR. 2018. Data mining and machine learning of clinopyroxene in mafic-ultramafic rocks. Chinese Journal of Geology, 53(4): 1215-1227.
Glassley W. 1974. Geochemistry and tectonics of the crescent volcanic rocks, Olympic Peninsula, Washington. GSA Bulletin, 85(5): 785-794. DOI:10.1130/0016-7606(1974)85<785:GATOTC>2.0.CO;2
Han S, Li MC, Ren QB and Liu CZ. 2018. Intelligent determination and data mining for tectonic settings of basalts based on big data methods. Acta Petrologica Sinica, 34(11): 3207-3216.
Joachims T. 1988. Text categorization with support vector machines: Learning with many relevant features. In: Proceedings of the 10th European Conference on Machine Learning. Chemnitz: Springer, 137-142
Li CS, Arndt NT, Tang QY and Ripley EM. 2015. Trace element indiscrimination diagrams. Lithos, 232: 76-83. DOI:10.1016/j.lithos.2015.06.022
Li YQ, Du XL, Du J, Zhang Q, Wang JR and Ma Z. 2018. Preliminary big data research of mid-ocean ridge basalt (MORB), ocean island basalt (OIB) and island arc basalt (IAB). Chinese Journal of Geology, 53(4): 1228-1239.
Liu XY, Zhang Q and Zhang CL. 2017. A discussion on the tectonic setting of global Cenozoic andesite. Chinese Journal of Geology, 52(3): 649-667.
Luo JM, Wang XW, Song BT, Yang ZM, Zhang Q, Zhao YQ and Liu SY. 2018. Discussion on the method for quantitative classification of magmatic rocks:Taking it's application in West Qinling of Gansu Province for example. Acta Petrologica Sinica, 34(2): 326-332.
Pearce JA and Cann JR. 1973. Tectonic setting of basic volcanic rocks determined using trace element analyses. Earth and Planetary Science Letters, 19(2): 290-300. DOI:10.1016/0012-821X(73)90129-5
Pearce JA. 1975. Basalt geochemistry used to investigate past tectonic environments on Cyprus. Tectonophysics, 25(1-2): 41-67. DOI:10.1016/0040-1951(75)90010-4
Pearce JA. 1976. Statistical analysis of major element patterns in basalts. Journal of Petrology, 17(1): 15-43. DOI:10.1093/petrology/17.1.15
Pearce JA and Norry MJ. 1979. Petrogenetic implications of Ti, Zr, Y, and Nb variations in volcanic rocks. Contributions to Mineralogy and Petrology, 69(1): 33-47. DOI:10.1007/BF00375192
Pearce JA. 1982. Trace element characteristics of lavas from destructive plate boundaries. In: Thorpe RS (ed.). Andesites. Chichester: Wiley, 528-548
Pearce JA. 1983. Role of the sub-continental lithosphere in magma genesis at active continental margins. In: Hawkesworth CJ and Norry MJ (eds.). Continental Basalts and Mantle Xenoliths. Nantwich: Shiva Publishing Ltd., 230-249
Pearce JA, Lippard SJ and Roberts S. 1984. Characteristics and tectonic significance of supra-subduction zone ophiolites. In: Kokelaar BP and Howells MF (eds.). Marginal Basin Geology. Geological Society, London, Special Publications, 16(1): 77-94
Pearce TH, Gorman BE and Birkett TC. 1977. The relationship between major element chemistry and tectonic environment of basic and intermediate volcanic rocks. Earth and Planetary Science Letters, 36(1): 121-132. DOI:10.1016/0012-821X(77)90193-5
Petrelli M and Perugini D. 2016. Solving petrological problems through machine learning:The study case of tectonic discrimination using geochemical and isotopic data. Contributions to Mineralogy and Petrology, 171(10): 81. DOI:10.1007/s00410-016-1292-2
Smola AJ and Schölkopf B. 2004. A tutorial on support vector regression. Statistics and Computing, 14(3): 199-222. DOI:10.1023/B:STCO.0000035301.49549.88
Ueki K, Hino H and Kuwatani T. 2018. Geochemical discrimination and characteristics of magmatic tectonic settings:A machine-learning-based approach. Geochemistry, Geophysics, Geosystems, 19(4): 1327-1347. DOI:10.1029/2017GC007401
Vermeesch P. 2006. Tectonic discrimination diagrams revisited. Geochemistry, Geophysics, Geosystems, 7(6): Q06017.
Vermeesch P. 2006. Tectonic discrimination of basalts with classification trees. Geochimica et Cosmochimica Acta, 70(7): 1839-1848. DOI:10.1016/j.gca.2005.12.016
Wang JR, Pan ZJ, Zhang Q, Chen WF, Yang J, Jiao ST and Wang SH. 2016. Intra-continental basalt data mining:The diversity of their constituents and the performance in basalt discrimination diagrams. Acta Petrologica Sinica, 32(7): 1919-1933.
Wang JR, Chen WF, Zhang Q, Jiao ST, Yang J, Pan ZJ and Wang SH. 2017. Preliminary research on data mining of N-MORB and E-MORB:Discussion on method of the basalt discrimination diagrams and the character of MORB's mantle source. Acta Petrologica Sinica, 33(3): 993-1005.
Wood DA. 1980. The application of a Th-Hf-Ta diagram to problems of tectonomagmatic classification and to establishing the nature of crustal contamination of basaltic lavas of the British Tertiary Volcanic Province. Earth and Planetary Science Letters, 50(1): 11-30. DOI:10.1016/0012-821X(80)90116-8
Xu ST and Zhou YZ. 2018. Artificial intelligence identification of ore minerals under microscope based on deep learning algorithm. Acta Petrologica Sinica, 34(11): 3244-3252.
Yang J, Wang JR, Zhang Q, Chen WF, Pan ZJ, Du XL, Jiao ST and Wang SH. 2016a. Global IAB data excavation:The perfor-mance in basalt discrimination diagrams and preliminary interpretation. Geological Bulletin of China, 35(12): 1937-1949.
Yang J, Wang JR, Zhang Q, Chen WF, Pan ZJ, Jiao ST and Wang SH. 2016b. Back-arc basin basalt (BABB) data mining:Comparison with MORB and IAB. Advances in Earth Science, 31(1): 66-77.
Zhang Q. 1990. The correct use of the basalt discrimination diagram. Acta Petrologica Sinica, 6(2): 87-94.
Zhang Q and Zhou YZ. 2017. Reflections on the scientific research method in the era of big data. Bulletin of Mineralogy, Petrology and Geochemistry, 36(6): 881-885.
Zhang Q, Jiao ST and Lu XX. 2018. Discussion on causality and correlation in geological research. Acta Petrologica Sinica, 34(2): 275-280.
Zhou YZ, Li PX, Wang SG, Xiao F, Li JZ and Gao L. 2017. Research progress on big data and intelligent modelling of mineral deposits. Bulletin of Mineralogy, Petrology and Geochemistry, 36(2): 327-331, 344.
Zhou YZ, Chen S, Zhang Q, Xiao F, Wang SG, Liu YP and Jiao SJ. 2018a. Advances and prospects of big data and mathematical geoscience. Acta Petrologica Sinica, 34(2): 255-263.
Zhou YZ, Zhang LJ, Zhang AD and Wang J. 2018b. Big Data Mining and Machine Learning in Geoscience. Guangzho: Sun Ya-tsen University Press: 1-269.
陈万峰, 王金荣, 张旗, 刘懿馨, 马骊, 焦守涛. 2017. 洋岛和洋底高原玄武岩数据挖掘:地球化学特征及其与MORB的对比. 地质学报, 91(11): 2443-2455. DOI:10.3969/j.issn.0001-5717.2017.11.005
第鹏飞, 王金荣, 张旗, 杨婧, 陈万峰, 潘振杰, 杜学亮, 焦守涛. 2017. 玄武岩构造环境判别图评估——全体数据研究的启示. 矿物岩石地球化学通报, 36(6): 891-896. DOI:10.3969/j.issn.1007-2802.2017.06.003
第鹏飞, 陈万峰, 张旗, 王金荣, 汤庆艳, 焦守涛. 2018. 全球N-MORB和E-MORB分类方案对比. 岩石学报, 34(2): 264-274.
杜雪亮, 李玉琼, 金维浚, 杜君, 张旗, 王金荣, 马蓁. 2018. 镁铁-超镁铁岩中单斜辉石的数据挖掘及机器学习研究. 地质科学, 53(4): 1215-1227.
韩帅, 李明超, 任秋兵, 刘承照. 2018. 基于大数据方法的玄武岩大地构造环境智能挖掘判别与分析. 岩石学报, 34(11): 3207-3216.
李玉琼, 杜雪亮, 金维浚, 杜君, 张旗, 王金荣, 马蓁. 2018. 大洋中脊(MORB)、洋岛(OIB)、岛弧玄武岩(IAB)中橄榄石特征对比初步研究. 地质科学, 53(4): 1228-1239.
刘欣雨, 张旗, 张成立. 2017. 全球新生代安山岩构造环境有关问题探讨. 地质科学, 52(3): 649-667.
罗建民, 王晓伟, 宋秉田, 杨忠明, 张琪, 赵彦庆, 刘升有. 2018. 岩浆岩定量分类方法探讨——以甘肃省西秦岭地区为例. 岩石学报, 34(2): 326-332.
王金荣, 潘振杰, 张旗, 陈万峰, 杨婧, 焦守涛, 王淑华. 2016. 大陆板内玄武岩数据挖掘:成分多样性及在判别图中的表现. 岩石学报, 32(7): 1919-1933.
王金荣, 陈万峰, 张旗, 焦守涛, 杨婧, 潘振杰, 王淑华. 2017. N-MORB和E-MORB数据挖掘——玄武岩判别图及洋中脊源区地幔性质的讨论. 岩石学报, 33(3): 993-1005.
徐述腾, 周永章. 2018. 基于深度学习的镜下矿石矿物的智能识别实验研究. 岩石学报, 34(11): 3244-3252.
杨婧, 王金荣, 张旗, 陈万峰, 潘振杰, 杜雪亮, 焦守涛, 王淑华. 2016a. 全球岛弧玄武岩数据挖掘——在玄武岩判别图上的表现及初步解释. 地质通报, 35(12): 1937-1949.
杨婧, 王金荣, 张旗, 陈万峰, 潘振杰, 焦守涛, 王淑华. 2016b. 弧后盆地玄武岩(BABB)数据挖掘:与MORB及IAB的对比. 地球科学进展, 31(1): 66-77.
张旗. 1990. 如何正确使用玄武岩判别图. 岩石学报, 6(2): 87-94. DOI:10.3321/j.issn:1000-0569.1990.02.010
张旗, 周永章. 2017. 大数据时代对科学研究方法的反思——《矿物岩石地球化学通报》2017大数据专辑代序. 矿物岩石地球化学通报, 36(6): 881-885.
张旗, 焦守涛, 卢欣祥. 2018. 论地质研究中的因果关系和相关关系——大数据研究的启示. 岩石学报, 34(2): 275-280.
周永章, 黎培兴, 王树功, 肖凡, 李景哲, 高乐. 2017. 矿床大数据及智能矿床模型研究背景与进展. 矿物岩石地球化学通报, 36(2): 327-331, 344. DOI:10.3969/j.issn.1007-2802.2017.02.016
周永章, 陈烁, 张旗, 肖凡, 王树功, 刘艳鹏, 焦守涛. 2018a. 大数据与数学地球科学研究进展——大数据与数学地球科学专题代序. 岩石学报, 34(2): 255-263.
周永章, 张良均, 张奥多, 王俊. 2018b. 地球科学大数据挖掘与机器学习. 广州: 中山大学出版社: 1-269.