2. 甘肃省地质矿产勘查开发局, 兰州 730000
2. Bureau of Geology and Mineral Exploration and Development of Gansu Provinvial, Lanzhou 730000, China
近年来,大数据已成为社会热门话题,并成功用于互联网、物流、金融、医药、传媒等领域(迈尔-舍恩伯格和库克耶,2013;滕吉文等,2016;王秉和吴超,2017),“大数据正在引发地球科学领域一场深刻的革命”(张旗和周永章,2017),相比较而言,大数据应用于科学研究的理论研究与实践还很薄弱,或者说还未真正得到重视(郭华东,2014)。大数据的本质,不仅是数据量大,更是思维的新,是以海量数据为依据,查明数据间的相关关系,从中提取有价值的信息(张旗和周永章,2017)。
传统的物探、化探资料研究是以异常为研究对象,以地质理论为依据进行分析、解释,完全是一种“定量信息,定性研究”的思维方式(索孝东,2011;徐东,2014;于俊博等,2014;李富等,2016)。因受个人主观因素的影响,不但降低了信息的精度,而且增加了研究过程的不确定性、研究成果的片面性,从而导致研究、预测效果不佳,长期影响着人们对找矿靶区预测工作和成果的认可程度。
在“甘肃省北山地区综合信息找矿靶区定量预测研究”工作中,转变了思维方式,将区域航磁数据改变成与化探数据相同的格式(具有相同的数目和位置),与化探数据同时进行计算处理,建立起“甘肃省北山地区综合信息找矿靶区优选定量预测模型”。完全由区内全部物、化探数据的自身特征,判定各变量与不同类型矿床(点)的相关关系和相关程度,从定量的层面,客观、真实的判定出“预测单元”(尚未发现矿床(点)的区域)和“有矿单元”(已有矿床(点)产出的区域)的相似程度,从而,很大程度地提高了找矿靶区优选的效率和精度。本文着重探讨“规格单元划分、定量模型构建及找矿靶区预测效果评价”等问题。
1 甘肃省北山地区物化探综合信息找矿靶区定量预测模型 1.1 原始数据特征甘肃省北山地区(含敦煌地块)不同时期、不同测区的航空磁测数据资料共计10份,测量数据3 893 381个(表 1)。
|
|
表 1 北山地区航磁测量相关数据文件信息表 Table 1 Information of related files of aeromagnetic survey in the Beishan region |
1 ︰ 20万地球化学水系沉积物测量图幅29幅,成图样品间距2km×2km,样品数24 825件,各样本测试元素39种;区内现已发现Au矿床(点) 109个(中型5个,小型23个,矿点61个,矿化点20个)(图 1)。
|
图 1 北山地区不同规模金矿数目百分比图 Figure 1 Percentage distribution of various scales of gold deposits in the Beishan region |
(1) 分幅平差:用自主研发的“分区、分幅平差处理模型”,对全区不同时期的物探、化探原始数据分别做分区、分幅平差处理,消除原始数据因系统误差对定量处理结果产生的影响,不同比例尺航磁测量数据接图部位的平差效果见图 2。
|
图 2 甘肃省北山地区局部区域不同比例尺航磁测量ΔT调平效果示意图 Figure 2 Sketch map of ΔT leveling of various scales of aeromagnetic survey in the Beishan region of Gansu Province |
(2) 物探数据格式转化:为使物探、化探数据能够同时进行相关定量处理,选取以化探数据坐标点为中心,以1 km为直径范围内平差后航磁数据的最大值(ΔTd、)和最小值(ΔTx、)作为新的航磁参数,如此选择即考虑到航磁的正、负异常,同时兼顾了航磁梯度带的特征。经整理构建起全区24 825个样本,41个变量(39个化学元素加两个航磁数据)的定量处理“基本数据库”。
1.3 物化探综合信息找矿靶区定量预测模型构建 1.3.1 建模思想以化探平差数据绘制区域Au元素地球化学图,将Au地球化学图分为五级(负异常及背景区、低异常区、中异常区、高异常区和特高异常区)。统计计算已有109个Au矿床(点)在不同异常区的分布百分比(图 3),分析区域Au矿床(点)在不同异常区的分布特征:
|
1-床(点)百分比;2-异常面积百分比;Ⅰ-特高异常;Ⅱ-高异常;Ⅲ-中异常;Ⅳ-低异常;Ⅴ-背景 图 3 北山地区不同异常区金矿百分比图(a)和金矿数目百分比与不同级别异常面积百分比对比图(b) Figure 3 Distribution of degrees of gold anomaly in the Beishan region(a) and contrasting histogram of gold deposits and various degree of anomaly areas(b) |
(1) 区内99个(占90.8%)Au矿床(点)分布在Au地球化探异常区,其中,85个(占78%)Au矿床(点)分布在占全区面积92.4%的低异常和背景区甚至在负异常区。由此可见,Au矿产出与区域Au异常有关,但大多数金矿床(点)与面积巨大的低异常甚至背景或负异常关系密切,因此,仅以地球化学异常无法有效地预测Au找矿靶区的分布位置和范围。
(2) 区内10个(占9.6%)Au矿床(点)分布在背景区甚至在负异常区。若以地球化学异常研究Au找矿靶区的分布位置和范围,会产生近10%的信息损失量,另外,组合元素异常的确定存在个人主观因素和地质理论差异等诸多影响。
综上所述,甘肃省北山地区综合信息成矿预测,选用以“规格单元为研究对象,以41个物、化探数据为变量,构建成矿预测模型”的指导思想开展找矿靶区定量优选工作,可以有效地弥补仅以化探异常或物探异常研究找矿靶区的不足。
1.3.2 找矿模型构建以“基本数据库”为基础,将全区按5 km间距绘制正方形网格,计算各网格范围内所有样本39个化学元素的均值,选择航磁数据的最大值和最小值(共41个变量)。以各网格为规格单元(研究对象),相应41个物、化探数值为变量,构建起规格单元“建模数据库”,全区共分4272个规格单元,其中有109个已知Au矿床(点)分布的单元为“有矿单元”,区内有矿规格单元占总单元数的2.55%,即区内规格单元平均见矿率2.55%(罗建民等, 2005a, 2005b)。
以“SPSS”软件对“建模数据库”做两类判别分析,建立起“甘肃省北山地区基于物化探信息的Au矿找矿靶区预测模型”(表 2)。
|
|
表 2 甘肃省北山地区规格化单元金成矿定量预测模型 Table 2 Au quantitative prospective model in normalized units in the Beishan region of Gansu Province |
(1) 全区共构建起3个Au矿找矿靶区预测模型,各模型完全由不同变量与区域已有矿床(点)的相关关系所决定,完全消除了人为主观因素和不同地质理论、成矿理论不确定性和差异性的影响。认为全区109个有矿单元在41个(39个化学元素、两个航磁变量)维度空间可明显分为三类,第一类(由模型Ⅰ确定)共48个有矿单元(占总数45%)在ΔTx、Fe2O3、Mn、ΔTd、Au等10个维度空间与其他有矿单元高度分离。
(2) 模型Ⅰ、Ⅱ中,Fp>F0.01,认为模型Ⅰ、Ⅱ在统计学意义上(置信度为0.01时)高度有效(Fp>F0.01,分类模型有效)(赵鹏大等,1994;王世称等,2002)。模型Ⅲ虽然Fp<F0.01,但3个模型各自对两类样本均有极高的正判率,而且,各模型各分级中有矿单元占比均大于矿床(点)在规格单元的平均百分数(2.55%)。认为3个模型均具有很好的预测效果。
(3) 由各模型有效性检验和预测结果,各分级见矿率(该分级中有矿单元所占百分比)分析,模型Ⅰ预测效果最佳,其中ΔTx、ΔTd变量系数同时为正值,由航磁地球物理特征推断,区内Au矿床(点)产出与航磁梯度带关系密切。
模型Ⅰ中Au元素变量系数为负值,其单独贡献仅占9.28%。表面得出Au化探数值与金矿靶区判定呈现负相关的伪结论,但这恰恰反映了69%的Au矿床(点)分布在低异常区,9.6%的Au矿床(点)分布在低异常区甚至负异常区这一事实。此结果较传统定性研究更为精细、真实。
模型Ⅰ中ΔTx、ΔTd航磁数据变量单独贡献分别高达30.79%和11.39%,均高于Au元素9.28%的单独贡献率,此结果充分证实了航磁数据经格式转变与化探数据一起构建区域Au找矿靶区预测模型,航磁数据展现出极好(甚至优于Au元素)的判别能力。此结果不但改变了传统(定性)地质研究中,认为航磁成果对Au矿找矿靶区判定效果不佳的结论,同时从另一角度证实了,物探信息不受采样代表性的影响,是较化探信息更加真实准确的测量信息。由此,更加充分说明,海量数据信息中存在着无限潜能,只有转变思维方式,依据大数据观念,通过定量研究的方法(用数学的方法,研究地质问题)才能将其充分挖掘出来。
1.5 区域Au找矿靶区预测结果简介以建立的3个模型分别对全区规格单元“建模数据库”进行预测,以各模型R0为临界值,选取判别得分高的规格单元为Au找矿靶区,模型Ⅰ确定Au找矿靶区(与已知有矿单元高度相似的规格单元) 272个,模型Ⅱ确定Au找矿靶区153个,模型Ⅲ确定Au找矿靶区188个。
汇总各模型确定的Au找矿靶区,将各模型判别得分经正规化处理后相加,选取合计得分大的规格单元275个为最终综合预测Au找矿靶区,以“黄金分割法则”将275个找矿靶区分为三级,一级Au找矿靶区53个,其中包含见矿靶区(内部有已知矿床(点)产出) 18个,靶区见矿率34.3%,二级Au找矿靶区85个,见矿靶区16个,靶区见矿率18.8%,三级Au找矿靶区137个,见矿靶区18个,靶区见矿率13.1%。各级别靶区见矿率远高于规格单元平均见矿率(2.55%)。由此认为,所建规格单元Au找矿定量预测模型,用于本区Au找矿靶区的确定和优选有着很高的准确性(图 4)。
|
1-一级靶区;2-二级靶区;3-一级远景区;4-二级远景区;5-三级远景区;6-区域大断裂;7-省界;8-行政区地名;Ⅰ -9-4-10:北山侏罗纪-第四纪拗陷盆地;Ⅲ -2-1-1:柳园、佟佟山、野马井、甜水井、垒墩山奥陶纪-二叠纪陆缘裂谷;Ⅲ -2-1-2:酒钢山、柳园、布特、大葫芦震旦纪-奥陶纪陆棚;Ⅲ -2-1-3:马鬃山、火石山、酒钢山、平头山、大葫芦中元古代-新元古代陆棚、台地;Ⅲ -2-1-4:柳园、平头山元古宙中深变质杂岩;Ⅲ -2-1-5:奥陶纪伸展板内碱性花岗岩带;Ⅲ -2-1-6:志留纪同碰撞过铝质花岗岩带;Ⅲ -2-1-7:柳园侏罗纪-第四纪拗陷及断陷盆地;Ⅲ -2-2-1:敦煌元古宙中深、中低变质杂岩;Ⅲ -2-2-4:志留纪—泥盆纪后造山板内钙碱性花岗岩带;Ⅲ -2-2-5:泥盆纪-三叠纪伸展双峰式侵入岩及碱性花岗岩带;Ⅲ -2-2-6:敦煌侏罗纪-第四纪拗陷及断陷盆地 图 4 甘肃省北山地区部分优选靶区示意图 Figure 4 Sketch map of optimized prospective zones in the Beishan region of Gansu Province |
(1) 通过“规格单元”开展区域找矿靶区定量预测,不但可以消除已有矿床(点)信息量的损失,同时也有效地避免了因低异常面积过大对预测结果精度的影响。
(2) 改变航磁数据格式与化探数据组合,构建区域Au找矿靶区预测模型,航磁数据展现出优于Au元素的判别能力,此结果不但改变了传统(定性)地质研究中,认为航磁成果对Au矿找矿靶区判定效果不佳的结论,同时更加充分说明,海量数据信息中存在着无限潜能,只有转变思维方式,依据大数据观念,通过定量研究的方法(用数学的方法,研究地质问题)才能将其充分挖掘出来。
(3) 模型很好的预测效果,不但证实了航磁信息是较化探信息更加真实、准确的测量成果,同时也丰富了航磁资料新的处理思想和方法,改写了人们对航磁资料不能很好地用于非磁性矿床找矿靶区研究的观念。
(4) 汇总各模型确定的Au找矿靶区,确定一级Au找矿靶区53个,其中包含见矿靶区(内部有已知矿床(点)产出) 18个,靶区见矿率34.0%,二级Au找矿靶区85个,见矿靶区16个,靶区见矿率18.8%,各级别靶区见矿率远高于规格单元平均见矿率(2.55%)。由此认为,所建规格单元Au找矿定量预测模型,用于本区Au找矿靶区的确定和优选有着很高的准确性。
总结以上Au找矿靶区定量预测建模过程和预测结果,可以简单的理解为:转变思维方式,改变航磁数据格式,应用多元统计分析方法建立基于物化探综合数据的区域成矿定量预测模型(数学函数),以定量预测模型(即相同的规则)对全区各研究单元与已知有矿单元做相似程度判定,选择相似程度高的53个找矿靶区为一级找矿靶区,其中34.3%的靶区内已经发现矿床(点),认为,其余56.7%的找矿靶区应该是寻找Au矿的有利区域。
| [] | 郭华东. 2014. 大数据、大科学、大发展-大数据与科学发现国际研讨会综述. 中国科学院院刊, 29(4): 500–506. |
| [] | 李富, 王永华, 焦彦杰, 祝向平, 马东方. 2016. 多龙矿集区物探异常特征及找矿方向. 地球物理学进展, 31(1): 217–224. DOI:10.6038/pg20160125 |
| [] | 罗建民, 侯云山, 张新虎, 彭德启, 牛宏斌. 2005a. 甘肃省金矿资源预测及潜力评价. 矿床地质, 25(7): 53–59. |
| [] | 罗建民, 张新虎, 彭德启. 2005b. 甘肃省岩金矿品位-储量分布模型. 地质与勘探, 41(5): 62–65. |
| [] | 索孝东, 张生, 陈德炙. 2011. 用重磁电异常信息模式识别石炭系火山岩岩性:以准噶尔盆地陆东地区为例. 新疆石油地质, 32(3): 318–320. |
| [] | 滕吉文, 刘有山, 皮娇龙. 2016. 科学与技术的发展与大数据的时代反响:地球科学新信息的获取与创新再造. 地球物理学进展, 31(1): 1–22. DOI:10.6038/pg20160101 |
| [] | 王秉, 吴超. 2017. 基于安全大数据的安全科学创新发展探讨. 科技管理研究, 37(1): 37–43. |
| [] | 王世称, 陈永良, 夏立显. 2002. 综合信息矿产预测理论与方法. 北京: 科学出版社. |
| [] | 维克托-迈尔-舍恩伯格, 肯尼思-库克耶. 2013. 大数据时代: 生活、工作与思维的大革命. 盛杨燕, 周涛, 译. 杭州: 浙江人民出版社, 1-261 |
| [] | 徐东, 刘建宏, 赵彦庆. 2014. 甘肃西秦岭地区金矿控矿因素及找矿方向. 西北地质, 47(3): 83–90. |
| [] | 于俊博, 宋云涛, 郭志娟, 徐仁廷, 王乔林, 韩伟. 2014. R型聚类分析在区域化探元素分组中的作用探讨. 物探化探计算技术, 36(6): 771–776. |
| [] | 张旗, 周永章. 2017. 大数据正在引发地球科学领域一场深刻的革命:《地质科学》2017年大数据专题代序. 地质科学, 52(3): 637–648. DOI:10.12017/dzkx.2017.041 |
| [] | 赵鹏大, 胡旺亮, 李紫金. 1994. 矿床统计预测. 2版. 北京: 地质出版社. |
2017, Vol. 36
