2. 重庆市地质矿产勘查开发局, 重庆 401121;
3. 重庆科技学院建筑工程学院, 重庆 401331
2. Chongqing Bureau of Geology and Minerals Exploration, Chongqing 401121, China;
3. School of Civil Engineering and Architecture, Chongqing University of Science and Technology, Chongqing 401331, China
0 引言
在岩土工程工作中,岩性识别是十分重要的内容。在现阶段的岩土工程中,通常采用人工识别的方法来判别岩样种类,这往往需要专业的地质从业人员来进行判断,不仅专业性强、耗时长,还非常容易受到主观因素影响,准确率不理想。随着计算机技术的迅速发展,机器学习逐渐被应用于岩性的自动识别,开启了岩样分类识别的新路径。与人工识别方法相比,机器学习具有效率高、自动化、智能化的特点。目前利用人工智能方法进行数据处理已经成为一种主流的研究方法,也符合当前时代智能化信息化的大趋势[1-4]。
国内外越来越多的研究人员都开始采用机器学习的分类方法实现对岩性的识别,如:刘延保等[5]利用最小二乘支持向量机对花岗岩图像进行处理,得到了96%的分类准确率;Singh等[6]利用多层感知器神经网络对玄武岩岩石薄片的图像进行了分类识别,得到了90%以上的识别准确率;M
综上所述,前人采用了各种机器学习方法用于岩性的识别,通常是先通过较为复杂的算法对岩石图像的特征进行提取然后进行分类,步骤较为繁杂,处理时间也较长。近些年随着人工智能技术的发展,深度学习已经开始广泛应用在岩性识别中,并取得了一定成果,但之前的研究更多采用的是岩石的宏观图像,并不能很好地表示各类岩石的特征,因此对成分相似的岩石无法准确区分。基于上述问题,本文通过测量电子显微镜采集了不同类型岩样的细观图像作为研究对象,引入GoogLeNet Inception V3深度卷积神经网络模型进行岩性识别,以期从细观图像角度进行岩样岩性的智能识别与分类,并利用岩样细观图像进行深度学习来探索一种耗时短、准确率高的识别方法。
1 岩样图像的采集 1.1 设备介绍采用SN0745-60U2K型2K测量电子显微镜进行岩样细观图像拍摄,该型2K测量电子显微镜主要由2K高清相机、可调节镜体支架、高清光学0.7~4.5倍变焦物镜、LED可调环形灯和显示屏等构成,电子放大倍数为15~80倍,拍摄图像像素达1 600万,还具有自动寻边、HDR(高动态光照渲染)、自动存储等功能,整体上操作简便,对岩样物理力学测试流程影响小。该电子显微镜的实物展示及拍摄方法如图 1所示。
1.2 图像采集方法泥岩、砂质泥岩、泥质砂岩和砂岩是重庆主城区域的分布最为广泛的4种典型岩样,因此本文将这4种岩样作为研究对象。运用测量电子显微镜进行大量岩样试件端面细观图像的拍摄,拍摄所用的试样均来自工程现场的标准岩样,大部分试样直径为7 cm左右,高为15 cm左右,所有试样的高径比均为2左右。
从4种典型岩样的细观图像(图 2)中可以看出,从细观角度着手,4种典型岩样不论在颜色、平整度,还是在颗粒显著程度、胶结形式上均表现出了十分明显的差异。其中:泥岩质地均匀,由大量黏土矿物构成,只有非常少的颗粒物;砂质泥岩也是由大量黏土矿物构成,在黏土物质中夹杂了少量较为明显的砂粒;泥质砂岩的主要成分是砂粒,但砂粒之间的胶结物往往是泥质;砂岩是由砂粒胶结而成,颗粒十分明显,胶结物通常是硅质或者钙质。尽管4种典型岩样的细观图像差异十分明显,但采用人工识别方法仍然存在效率低下的缺点;而且大部分岩样细观图像的特征并不明显,特别是绝大多数泥质砂岩和砂质泥岩的图像特征十分相似,难以区分。整个图像采集过程中,先对4种岩样共拍摄了16 000余张细观图像;随后,根据各种岩样的标准和特征对其进行了系统筛选与分类;最后,从所采集的图像中分别筛选出了1 371张泥岩图像、2 560张砂质泥岩图像、2 295张泥质砂岩图像和2 288张砂岩图像,用于后期图像识别模型的建立。
1.3 具体采集方法在岩样细观图像的采集过程中,对以上4种典型岩样进行了拍摄。整个拍摄过程均在实验室内进行,通过空调将室温保持在25 ℃左右。首先将岩样表面的泥沙用清水冲洗干净,用吹风机的冷风功能对岩样表面吹3 min,保证拍摄时岩样的含水率基本一致;再将其放在工业测量显微镜下进行拍摄。在实际拍摄时,若现场光线不足,则拍摄的图像过暗,若曝光过度,则图像无法如实显示岩样的真实颜色;针对该问题,对于不同的岩样应调节LED灯的光源到适合该类岩样的亮度,同时使用了显微镜的自动曝光功能,以尽可能拍摄到岩样的真实颜色。注意到放大倍数较小时无法体现岩样的细观特征,而放大倍数较大时又无法得到清晰的图像,经过反复调试后确认了90倍是最佳放大倍数。在对一个岩样的某个局部拍摄完成后,对岩样进行平移或者旋转,选取岩样的其他合适部位进行拍摄。拍摄时,先对每个岩样拍摄5张细观图像,再对拍摄得到的细观图像进行分类筛选,最后得到典型并且富有代表性的4种岩样的细观图像。
2 岩性识别深度学习模型 2.1 GoogLeNet Inception V3模型提升神经网络性能的最直接方法就是增加网络的深度和宽度,但这种方式存在过拟合、计算复杂度大以及难以优化等问题。针对上述问题,Google公司提出了如图 3所示的Inception网络结构,将其作为基础神经元进行堆叠,以搭建一个高性能、稀疏性的神经网络结构[17]。
GoogLeNet Inception V3[18]是Google公司所搭建的神经网络的第3个版本,其网络结构如图 4所示。图 4中:从输入端开始,首先设置了3个卷积层,连接1个最大池化层;然后再设置2个卷积层,连接1个最大池化层;随后连接11个基于Inception基础神经元进行改进的混合层,以及最后的Softmax(逻辑回归)层。
与其他深度学习模型相比,该模型采用了模块化的结构,方便增添和修改。Inception结构的混合层将不同尺寸的卷积层和池化层进行堆叠,其中1×1的卷积核能够降低维度,降低计算复杂度,同时还可以提取到更丰富的非线性特征[19]。另外在不同的尺度上进行卷积,能够对不同尺度的特征进行提取,提取的特征更为丰富,且会使最后的分类更为准确。该模型通过精心设计提高了网络的深度和宽度,同时保持了计算预算不变,提高了网络计算资源的利用率。
2.2 模型的参数设置与训练本文基于Inception V3卷积网络模型和迁移学习算法,建立了岩样细观图像深度学习模型,并通过前期利用测量电子显微镜所得到的岩样细观图像训练完成了模型的参数设置。具体的模型训练流程如图 5所示,将所采集的岩样细观图像的70%作为训练集、20%作为验证集、10%作为测试集。训练集是用于训练模型以及确定模型权重的样本集,验证集是用来调整例如学习率这样的超参数的样本集,测试集是用于测试模型识别能力的样本集。
一般来说,对于深度学习模型,训练集和验证集越大,识别结果越准确。因此本文将采集到的岩样细观图像进行不同程度的转动、偏移和翻转对样本集进行扩展,所得到的扩展图像如表 1所示。最终得到的训练集图像中有泥岩3 540张、泥质砂岩5 922张、砂岩5 655张、砂质泥岩6 708张;验证集图像中有泥岩573张、泥质砂岩963张、砂岩918张、砂质泥岩1 092张。由于将训练集一次全部输入到模型中对计算机负荷太大,因此会将训练集分批输入,每一批的图片数量被称为batch_size。本文中设置batch_size为32。迭代次数为300,初始学习率为0.001。
在训练过程中,首先将岩样细观图像数字化为299×299×3的矩阵,并以train.tfrecords的格式进行保存,这种文件格式能够大大加快模型的训练速度;然后将训练集输入到网络模型中,通过Inception V3模型中的卷积和池化操作,提取岩样细观图像的特征,并用2 048维向量进行表示;再利用Softmax回归模型输出预测值,计算出损失函数;之后利用反向传播算法对模型参数进行更新,在训练的同时会将模型在验证集上进行验证,同步观察该模型训练过程中在验证集上的表现如何,并适当地调整超参数,在经过一定次数的训练和验证后,得到当前的最优模型;最后将测试集输入到所得到的最优模型中,得到岩性分类的测试结果。虽然模型的训练过程较为耗时,但在模型训练完成后,只需要将待识别的岩样图像输入进模型中,即可得到岩样的识别结果,整个过程只需几秒钟,从而实现了一种自动快速的识别方法。
3 模型训练结果分析本文所建立的深度学习模型是端到端的模型。只要输入需要识别的岩样细观图像,模型会通过若干个卷积层与池化层自动提取岩样细观图像在不同维度下的关键特征,并自动建立图像特征与岩性之间的关系,无需像现有的机器学习方法一样先对岩样细观图像通过某种算法进行特征提取。在深度学习领域中,将模型对测试数据受干扰的容忍度称为鲁棒性。如果测试数据与训练数据的参数有一定差异时,模型仍能给出较好的结果,就可以认为该模型具有较好的鲁棒性。本识别模型对岩样细观图像大小和分辨率要求较低,只要在保证训练集包含尽可能多的岩样细观图像,便可得到较高准确率的识别结果。因此本识别模型具有较好的鲁棒性和泛化能力。
最终所得到的Inception V3模型的训练结果如图 6和图 7所示。图 6表示模型训练过程中识别准确率的变化过程,其中蓝色线表示训练集的准确率,橙色线表示验证集的准确率。图 7表示模型训练过程中损失值的变化过程,其中蓝色线表示训练集的损失值,橙色线表示验证集的损失值。Inception V3深度卷积神经网络模型在循环训练1 000次后,其训练集中的岩样细观图像分类准确率达到92.77%,验证集中的岩样细观图像分类准确率为76.31%。图 6中验证集的识别准确率有略微下降的趋势,可能是由于训练集中的图片不够多、种类分布不够平均以及注重训练集准确率导致的。在后续过程中我们会采集更多不同种类的岩样图像,并反复调整训练次数来获得最佳训练次数,以对训练集与验证集的准确率进行平衡,避免产生过拟合的现象。
验证集中各类岩样的识别准确率如表 2所示。表中的每一行表示的是将岩样细观图像识别为某一种类岩样的概率,对角线位置表示将该行岩样种类的细观图像正确识别的概率,其余位置元素均表示将其识别为其他种类岩样的概率。结果显示,砂岩识别准确率为97.28%,泥岩识别准确率为81.85%,泥质砂岩识别准确率为72.59%,砂质泥岩识别准确率为72.35%。此外,泥质砂岩有14.02%的概率被错认为砂质泥岩,砂质泥岩有12.18%的概率被错认为泥质砂岩,泥质砂岩有13.19%的概率被误认为是砂岩,砂质泥岩有15.20%的概率被误认为是泥岩。砂质泥岩和泥质砂岩的主要成分都是砂粒和黏土物质。当砂质泥岩中的黏土物质偏多,或者泥质砂岩中的砂粒偏多时,两者细观图像的结构极为相似,特征不明显,因此容易产生相互错认的情况。同样,当砂质泥岩中砂粒偏少时,细观结构就会与泥岩相似;泥质砂岩中的黏土物质偏少时,细观结构就会和砂岩相似。因此也出现了一定错认的情况。虽然在细观结构相似的情况下可能产生错认的结果,但泥质砂岩和砂质泥岩的识别准确率仍然分别达到了72.59%和72.35%,明显高于人工识别的准确率,特别是砂岩达到了97.28%的识别准确率,证明了模型有效地实现了岩性自动识别。后续将会继续对模型进行优化,进一步提高识别准确率。
% | |||||||||||||||||||||||||||||
准确率 | 泥岩 | 泥质砂岩 | 砂岩 | 砂质泥岩 | |||||||||||||||||||||||||
泥岩 | 81.85 | 0.52 | 0.00 | 17.63 | |||||||||||||||||||||||||
泥质砂岩 | 0.20 | 72.59 | 13.19 | 14.02 | |||||||||||||||||||||||||
砂岩 | 0.00 | 2.72 | 97.28 | 0.00 | |||||||||||||||||||||||||
砂质泥岩 | 15.20 | 12.18 | 0.27 | 72.35 |
由于训练集中只有泥岩、砂质泥岩、泥质砂岩和砂岩这4种岩性,因此本文模型目前只能识别这4种岩性。但本文模型具有普适性,后续如果需要识别其他岩性,只需要采集该岩性对应的宏观或者细观图像建立训练集并对模型进行训练即可。对于特征较为明显的岩性,也可以采集宏观图像进行训练,而对于特征不明显的岩性,采集细观图像进行训练则更为合适。目前利用深度学习进行岩性识别的研究通常只能识别特征较为明显的岩样,例如白林等[14]利用VGG模型识别安山岩、白云岩等几种岩石,得到了82.66%的识别准确率,程国建等[20-21]等通过搭建CNN(卷积神经网络)模型以及DBN(深度信念网络)模型分别得到了93.33%和94.75%的识别准确率。本文模型对于特征较为明显的砂岩达到了97.28%的识别准确率,而对于特征不明显、难以区分的泥质砂岩和砂质泥岩,也分别达到了72.59%和72.35%的识别准确率,充分说明了本文模型的优越性。
4 结论1) 以岩样细观图像为识别对象,基于GoogLeNet Inception V3卷积神经网络模型和迁移学习算法,建立了岩样细观图像深度学习模型,解决了岩性极为相近岩样难以辨别的难题。
2) 本识别模型实现了对重庆主城区泥岩、砂质泥岩、泥质砂岩和砂岩4种岩样的自动识别和分类,训练集中的分类准确率达到92.77%,验证集中的分类准确率为76.31%。其中,验证集中的砂岩识别准确率为97.28%,泥岩识别准确率为81.85%,泥质砂岩识别准确率为72.59%,砂质泥岩识别准确率为72.35%。与其他模型相比,本识别模型具有更高的识别准确率。
3) 本识别模型对岩样图像大小或者分辨率要求较低,且无需对图像进行预处理,通过卷积和池化对岩样图像特征进行自动提取,可大幅简化识别和分类流程。与现有模型相比,本识别模型具有较好的鲁棒性和泛化能力。
[1] |
陈建平, 李婧, 崔宁, 等. 大数据背景下地质云的构建与应用[J]. 地质通报, 2015, 34(7): 1260-1265. Chen Jianping, Li Jing, Cui Ning, et al. The Construction and Application of Geological Cloud Under the Big Data Background[J]. Geological Bulletin of China, 2015, 34(7): 1260-1265. DOI:10.3969/j.issn.1671-2552.2015.07.002 |
[2] |
肖克炎, 孙莉, 李楠, 等. 大数据思维下的矿产资源评价[J]. 地质通报, 2015, 34(7): 1266-1272. Xiao Keyan, Sun Li, Li Nan, et al. Mineral Resources Assessment Under the Thought of Big Data[J]. Geological Bulletin of China, 2015, 34(7): 1266-1272. DOI:10.3969/j.issn.1671-2552.2015.07.003 |
[3] |
严光生, 薛群威, 肖克炎, 等. 地质调查大数据研究的主要问题分析[J]. 地质通报, 2015, 34(7): 1273-1279. Yan Guangsheng, Xue Qunwei, Xiao Keyan, et al. An Analysis of Major Problems in Geological Survey Big Data[J]. Geological Bulletin of China, 2015, 34(7): 1273-1279. DOI:10.3969/j.issn.1671-2552.2015.07.004 |
[4] |
赵鹏大. 大数据时代数字找矿与定量评价[J]. 地质通报, 2015, 34(7): 1255-1259. Zhao Pengda. Digital Mineral Exploration and Quantitative Evaluation in the Big Data Age[J]. Geological Bulletin of China, 2015, 34(7): 1255-1259. DOI:10.3969/j.issn.1671-2552.2015.07.001 |
[5] |
刘延保, 曹树刚, 刘玉成. 基于LS-SVM的岩石细观图像分析方法探讨[J]. 岩石力学与工程学报, 2008, 27(5): 1059-1065. Liu Yanbao, Cao Shugang, Liu Yucheng. Discussion on Analytical Method for LS-SVM Based Mesoscopic Rock Images[J]. Chinese Journal of Rock Mechanics and Engineering, 2008, 27(5): 1059-1065. DOI:10.3321/j.issn:1000-6915.2008.05.023 |
[6] |
Singh N, Singh T N, Tiwary A, et al. Textural Identification of Basaltic Rock Mass Using Image Processing and Neural Network[J]. Computational Geosciences, 2010, 14(2): 301-310. DOI:10.1007/s10596-009-9154-x |
[7] |
Młynarczuk M, Górszczyk A, Ślipek B. The Application of Pattern Recognition in the Automatic Classification of Microscopic Rock Images[J]. Computers & Geosciences, 2013, 60(5): 126-133. |
[8] |
郭超, 刘烨. 多色彩空间下的岩石图像识别研究[J]. 科学技术与工程, 2014, 14(18): 247-251, 255. Guo Chao, Liu Ye. Recognition of Rock Images Based on Multiple Color Spaces[J]. Science Technology and Engineering, 2014, 14(18): 247-251, 255. DOI:10.3969/j.issn.1671-1815.2014.18.048 |
[9] |
程国建, 杨静, 黄全舟, 等. 基于概率神经网络的岩石薄片图像分类识别研究[J]. 科学技术与工程, 2013, 13(31): 9231-9235. Cheng Guojian, Yang Jing, Huang Quanzhou, et al. Rock Image Classification Recognition Based on Probabilistic Neural Networks[J]. Science Technology and Engineering, 2013, 13(31): 9231-9235. DOI:10.3969/j.issn.1671-1815.2013.31.014 |
[10] |
刘烨, 程国建, 马微, 等. 基于铸体薄片图像颜色空间与形态学梯度的岩石分类[J]. 中南大学学报(自然科学版), 2016, 47(7): 2375-2382. Liu Ye, Cheng Guojian, Ma Wei, et al. Rock Classification Based on Features Form Color Space and Morphological Gradient of Rock Thin Section Image[J]. Journal of Central South University(Science and Technology), 2016, 47(7): 2375-2382. |
[11] |
程国建, 刘丽婷. 深度学习算法应用于岩石图像处理的可行性研究[J]. 软件导刊, 2016, 15(9): 163-166. Cheng Guojian, Liu Liting. Feasibility Study of Deep Learning Algorithm Applied to Rock Image Processing[J]. Software Guide, 2016, 15(9): 163-166. |
[12] |
张野, 李明超, 韩帅. 基于岩石图像深度学习的岩性自动识别与分类方法[J]. 岩石学报, 2018, 34(2): 333-342. Zhang Ye, Li Mingchao, Han Shuai. Automatic Identification and Classification in Lithology Based on Deep Learning in Rock Images[J]. Acta Petrologica Sinica, 2018, 34(2): 333-342. |
[13] |
白林, 姚钰, 李双涛, 等. 基于深度学习特征提取的岩石图像矿物成分分析[J]. 中国矿业, 2018, 27(7): 178-182. Bai Lin, Yao Yu, Li Shuangtao, et al. Mineral Composition Analysis of Rock Image Based on Deep Learning Feature Extraction[J]. China Mining Magazine, 2018, 27(7): 178-182. |
[14] |
白林, 魏昕, 刘禹, 等. 基于VGG模型的岩石薄片图像识别[J]. 地质通报, 2019, 38(12): 2053-2058. Bai Lin, Wei Xin, Liu Yu, et al. Rock Thin Section Image Recognition and Classification Based on VGG Model[J]. Geological Bulletin of China, 2019, 38(12): 2053-2058. |
[15] |
王恒, 姜亚楠, 张欣, 等. 基于梯度提升算法的岩性识别方法[J]. 吉林大学学报(地球科学版), 2021, 51(3): 940-950. Wang Heng, Jiang Yanan, Zhang Xin, et al. Lithology Identification Method Based on Gradient Boosting Algorithm[J]. Journal of Jilin University(Earth Science Edition), 2021, 51(3): 940-950. |
[16] |
刘云鹏, 郭春影, 秦明宽, 等. 基于PCA-SVM算法对稀土元素与稀土判别指标耦合数据集的铀矿床分类[J]. 吉林大学学报(地球科学版), 2021, 51(3): 723-733. Liu Yunpeng, Guo Chunying, Qin Mingkuan, et al. Classfication of Uranium Deposits Based on PCA-SVM Algorithm for Coupling Data Set of Rare Earth Elements and Rare Earth Discrimination Indexes[J]. Journal of Jilin University(Earth Science Edition), 2021, 51(3): 723-733. |
[17] |
Szegedy C, Liu W, Jia Y, et al. Going Deeper with Convolutions[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston: Hynes Convention Center, 2015: 1-9.
|
[18] |
Szegedy C, Vanhoucke V, Ioffe S, et al. Rethinking the Inception Architecture for Computer Vision[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: Caesars Palace, 2016: 2818-2826.
|
[19] |
Lin M, Chen Q, Yan S C. Network in Network[EB/OL]. ArXiv Preprint, 2013: (2013-12-16)[2020-11-21]. arxiv. org/abs/1312.4400.
|
[20] |
程国建, 范鹏召. 基于深度信念网络的岩石粒度分类[J]. 西安石油大学学报(自然科学版), 2018, 33(3): 107-112. Cheng Guojian, Fan Pengzhao. Analysis of Rock Granularity by Deep Belief Network[J]. Journal of Xi'an Shiyou University(Natural Science Edition), 2018, 33(3): 107-112. |
[21] |
程国建, 马微, 魏新善, 等. 基于图像处理与神经网络的岩石组构识别[J]. 西安石油大学学报(自然科学版), 2013, 28(5): 105-110. Cheng Guojian, Ma Wei, Wei Xinshan, et al. Research of Rock Texture Identification Based on Image Processing and Neural Network[J]. Journal of Xi'an Shiyou University(Natural Science Edition), 2013, 28(5): 105-110. |