青天河景区位于焦作市西北20 km处的博爱县境内, 景区由佛耳峡、靳家岭、月山寺等七大游览区、308个景点组成, 是世界地质公园、国家5A级旅游景区、国家重点风景名胜区、国家水利风景区、国家猕猴自然保护区, 是素有"北方三峡"之美誉的综合型山水休闲度假旅游地. 近年来, 一方面由于前期修建青天河水库, 两岸形成高陡岸坡, 另一方面随着旅游业的快速发展及越来越多的新的景点被发现和开发, 以道路建设为主的人类工程活动不断增加. 受人类工程活动及自然的双重影响, 水库两岸地带、景区道路、景点附近亦存在崩塌、滑坡、泥石流隐患, 严重威胁游人的安全. 特别是2021年"7·20""9·30"极端气象条件的出现, 在景区内引发了崩塌、滑坡等地质灾害, 使景区受到了一定程度的破坏. 针对地质灾害的突发性与高危害性, 科学评价与防灾管理是减轻其损失的最佳方案, 根据以往资料显示❶, 研究区内易发性评价存在区划中网格较大、易发区划分效果较差等问题, 没有对研究区易发性真实情况进行细化研究、评价. 因此笔者在查明研究区雨后地质灾害空间分布及孕灾地质环境条件的基础上, 建立合适研究区的评价模型, 实现地质灾害易发性有效评价, 为景区科学防灾管理及保护当地社会经济发展提供依据.
❶ 宋鹏飞, 等.河南省博爱县1:5万地灾详查报告.河南省地质矿产勘查开发局测绘地理信息院. 2015.
地质灾害易发性评价是地质灾害危险性风险性评价的基础, 主要包括查明地质灾害特征、挖掘易发孕灾条件、建立评价方法体系、对潜在易发区域预测, 最终实现易发性高低合理分级[1-2]. 近年来, 以统计学法和人工智能算法为代表的新技术使得地质灾害易发性评价理论与技术的研究上了一个新台阶. 常用的方法有: 证据权法、逻辑回归法、信息量法、随机森林模型、支持向量机模型、神经网络模型及组合模型等. 其建立的评价模型一方面可得到更为科学且严谨的评价结果, 另一方面能较好地解决地质灾害复杂的多源性、时空性和非线性机理特征, 具有广阔的应用前景与研究价值[3-17], 丰富的成果为后续的研究奠定了坚实的理论技术基础及经验参考. 然而在上述研究中采用的地质灾害样本数量均较多, 其理论方法是否适用于小样本区域地灾评价?针对地质灾害数量较少的区域如何更好地开展相关评价研究等问题, 部分学者也开展了相关研究. 薛永安等针对小样本情况下基于CF(确定系数法)和SVM(支持向量机)地质灾害敏感性评价模型的适用性及成果的可靠性问题展开研究, 结果显示, 无论单体模型还是组合模型其评价精度均较好, 具有较高的适用性[18]. 另外, 有部分研究者发现, SVM与其他模型相比, 在小样本数据中表现良好, 被认为是目前针对小样本分类和回归问题的最佳方法, 更加适合样本数据有限的情况[19-22]. RF(随机森林)模型其集成学习算法在小样本数据中也展示了较好的模型预测精度[23-24].
基于上述研究现状, 本文尝试采用SVM-RF模型对青天河景区地质灾害易发性评价进行研究, 探讨该模型在研究区的适用性及预测性, 为青天河景区科学防灾提供有价值的依据.
1 研究方法 1.1 支持向量机模型支持向量机(SVM)作为一种在高维空间中寻找分割超平面的算法, 理论基础比较完善, 面对形成机理复杂的地质灾害, 能够通过核函数进行复杂的非线性分类[25-26]. 在地质灾害易发性评价中, 灾害的特殊性决定了其样本数据有限, 无法人为干预, 且与各评价因子呈非线性关系. 基于以上核心思想, 引入SVM可以高效地解决在灾害样本数量有限的前提下对高维数据进行非线性分类问题, 故本研究选择支持向量机二分类方法分析研究区地质灾害易发性.
1.2 随机森林模型随机森林(RF)是一种由多个决策树分类器构成的集成学习算法. 其基本原理为: 利用自主采样法随机产生k个训练集, 对k个样本分别建立k个决策树模型并形成k个分类结果, RF模型的输出结果为k个决策树中平均概率值最高的类型[27]. 整体工作流程见图 1.
![]() |
图 1 整体工作框架图 Fig.1 Frame diagram of overall work |
选取青天河景区西北部为研究区, 面积约26.7 km2. 区内海拔最高处为970 m, 最低处为300 m, 相对高差670 m, 地形起伏较大, 区内主要发育坚硬厚层状中等岩溶化石灰岩. 研究区气候属暖温带大陆性季风气候区, 降水时空分布不均, 根据博爱县多年降雨资料, 暴雨多发生于夏季(见图 2).
![]() |
图 2 研究区地理位置 Fig.2 Geographical location of the study area |
本研究数据源主要包括以下两个方面.
2.1 地质灾害及隐患充分考虑遥感数据的时效并选用暴雨前后两期影像作对比, 分别是2021年5月和2021年10月中旬高分二号卫星遥感影像, 进行地质灾害及隐患遥感解译.
通过影像的形态、色调、纹理结构等特征, 采用二维与三维相结合方式对研究区开展地质灾害及隐患遥感解译判别(见图 3). 经过野外实地验证, 最终确定该区域在"7·20""9·30"暴雨后引发的地质灾害及隐患点共26处, 其中滑坡18处、崩塌7处、泥石流1处, 大部分规模为小型(见图 4).
![]() |
图 3 研究区地质灾害遥感解译标志及野外核查照片 Fig.3 Remote sensing interpretation marks and field verification photographs of geological disasters in the study area a-滑坡(landslide); b-崩塌(collapse) |
![]() |
图 4 地质灾害及隐患点空间分布图 Fig.4 Spatial distribution map of geological disasters and hidden danger sites |
选取与研究区地质灾害易发性评价相关的孕灾背景因子用到的基础数据有: 1) 10 m分辨率数字高程数据(提取于1:10 000地形图), 用于获取坡度、坡向信息; 2) Sentinel-2A影像(2021年7月26日, 空间分辨率为10 m), 用于提取植被覆盖度; 3)博爱县1:5万岩土体工程地质类型分区图(源自博爱县地质灾害详查报告), 用于工程地质岩组分类; 4)高分二号影像(2021年10月中旬), 用于提取土地分类信息. 为了保证所有因子空间一致性, 首先对收集到的遥感影像数据做预处理, 数据处理主要包括遥感影像的辐射校正、正射纠正、图像配准、图像融合、图像增强以及遥感数据与其他地形、地质数据的几何配准等处理; 其次将部分因子栅格化至具有相同空间分辨率.
3 评价因子体系建立 3.1 评价因子的选取与分级根据研究区地质灾害发育的空间分布、地质环境条件并结合专家经验, 最终选取7个地质灾害易发性评价指标因子进行分析, 分别为高程、坡度、坡向、岩土体、植被覆盖度、道路距离、土地利用. 其中高程、坡度、植被覆盖度因子为连续型图层, 坡向、岩组、道路距离、土地利用因子根据研究区地质灾害实际分布情况及专家经验进行分级处理. 最终所有评价指标均由ArcGIS软件制成专题图(见图 5).
![]() |
图 5 研究区地质灾害易发性评价指标因子图 Fig.5 Evaluation index factors of geological hazard susceptibility in the study area a: 高程(elevation); b: 坡度(slope); c坡向(aspect): c1-平面(plane), c2-北(north), c3-东北(northeast), c4-东(east), c5-东南(southeast), c6-南(south), c7-西南(southwest), c8-西(west), c9-西北(northwest); d岩土体(rock-soil body): d1-砂岩、泥岩(sandstone, mudstone), d2-灰岩-白云岩(limestone-dolomite), d3-河流、水库(river/reservoir); e: 植被覆盖度(vegetation coverage); f道路距离(distance from road): f1~5-<50 m, 50~100 m, 100~150 m, 150~200 m, >200 m; g土地利用(land use): g1-采矿用地(mining land), g2-道路(road), g3-其他用地(other land), g4-旱地(dry land), g5-裸地(bare land), g6-居民用地(residential land), g7-水工建筑用地(hydraulic construction land), g8-河流沟渠坑塘(river, channel and pond), g9-水库(reservoir), g10-林草地(forest and grassland) |
提取的评价特征因子可能存在异常值、数值之间的数量级不同, 故做模型训练前须对其进行处理. 主要包含数据异常值处理、定性因子编码化处理、标准化处理, 处理后的因子数据集作为模型训练输入值.
4 基于SVM-RF模型的地灾易发性评价 4.1 模型构建及训练在Scikit-learn机器学习框架下, 使用Python语言编程, 构建基于SVM-RF地灾易发性评价模型. 选取7类经过处理的特征数据作为模型训练输入值; 训练样本随机抽取20个灾害点和20个非灾害点组成训练集, 测试样本为剩余的6个灾害点和6个非灾害点组成测试集. 因研究区样本数量较少, 将SVM四种核函数一起参与模型训练, 采取5折交叉验证法进行参数调优, 调优后参数C、gamma和tol分别设为5、auto和0.0001, 共生成40个SVM模型. RF模型通过GirdSearch方法网格搜索最佳参数, GirdSearch选择的指标参数是Acc, 同样是采取5折交叉验证的方法得到RF模型的最优参数值. 调优后模型决策树的最大深度为7, 决策树的个数为45, 通过选取4种不同的模型参数种子, 得到4个RF模型. 两种模型分别根据预测的结果概率通过加权法融合, 逐格点计算地灾发生的概率.
根据上述模型分别求出SVM和RF的致灾概率分布, 将两种模型结果进行加权融合, 得到最终模型预测概率, 输出为具有地理意义的TIFF格式空间数据并在GIS中绘制预测结果. 采用准确率、F1分数、召回率等指标对模型融合前后结果进行评估(见表 1), 从表 1各个指标可看出, 各模型的预测效果比较稳定, 融合模型精度优于单个模型.
![]() |
表 1 模型指标评价 Table 1 Index evaluation of models |
通过上述耦合模型得到研究区内地灾易发性概率分布, 并基于自然断点法将研究区划分为稳定区、低易发区、中易发、高易发区(见图 6). 将发生的地灾点与各易发区进行叠加, 统计各易发区内地灾点占比及地灾点密度, 统计结果见表 2. 根据研究区地质灾害易发性评价结果可看出: 研究区地质灾害高易发区主要分布于青天河水库两岸、青天河村-碗窑河一带及X030公路沿线. 其中高易发区面积占研究区总面积的11.66%, 发育的灾害点占总数的88.46%. 其主要原因: 一方面修建库岸及景区人工栈道形成较低的高程及斜坡地形, 另一方面活跃的人类工程活动形成不合理人工切坡使得地形坡度变陡. 此外, 该区域地层岩体主要为岩溶化石灰岩, 自身的物理特性不利于边坡稳定, 且该区域林地茂密, 根劈作用易破坏岩土体结构, 在降雨冲刷、风化剥蚀等外力因素下易引发崩塌、滑坡等地质灾害.
![]() |
图 6 研究区地质灾害易发性分区图 Fig.6 Zoning map of geological disaster susceptibility in the study area 1-地质灾害及隐患点(geological disaster and hidden danger point); 2-青天河水库(Qingtianhe reservoir); 3-稳定区(stable area); 4-低易发区(low risk area); 5-中易发区(medium risk area); 6-高易发区(high risk area) |
![]() |
表 2 研究区地质灾害与易发性分区关联统计表 Table 2 Correlation between geological disasters and susceptibility zoning in the study area |
从表 2和图 6中可以看出, 随着灾害易发性等级的提高, 地灾点密集程度亦逐渐增大, 在高易发区达到最大值. 根据研究区以往的地灾数据显示❶, 58%的地灾点在本研究灾害点调查中再次发生灾害, 均分布在高易发区中, 说明灾害在研究区有一定聚集特征, 侧面证明了易发性等级划分结果与本次地灾点分布规律较为一致.
❶ 宋鹏飞, 等.河南省博爱县1:5万地灾详查报告.河南省地质矿产勘查开发局测绘地理信息院. 2015.
4.2.2 精度分析采用成功率曲线做定量化分析, 说明SVM-RF模型在青天河景区地质灾害易发性评价中的准确性. 该曲线线下面积大小反映了模型的预测准确性, 越接近1准确性越高[28-29]. 由图 7可知, 该模型的线下面积(AUC)为0.9224, 即预测的准确率为92.24%, 说明该模型整体宏观上是可靠的.
![]() |
图 7 SVM-RF模型成功概率曲线 Fig.7 Success rate curve of SVM-RF model |
本文以博爱县青天河景区西北部为研究区, 通过建立SVM-RF耦合模型对研究区进行地质灾害易发性评价, 对耦合模型在研究区地灾易发性评价中的预测性能及适用性进行了探讨, 主要结论如下.
(1) 基于青天河景区的地质环境条件与地质灾害发育空间分布特征, 选取高程、坡度、坡向、道路距离、土地利用、岩土体、植被覆盖度等7个地质环境因子建立研究区地灾易发性评价体系.
(2) 本研究一方面从对模型选取到参数调优, 保证了模型训练精度, 另一方面通过模型训练总结该研究区形成地质灾害的行为模式. 根据研究区地质灾害易发性评价结果可看出: 研究区地质灾害高易发区主要分布于青天河水库两岸、青天河村-碗窑河一带及X030公路沿线. 通过成功率曲线定量分析, 得到SVM-RF模型预测的准确率为92.24%;与野外调查地灾数据对比, 预测结果与实际情况吻合较好. 显示出在研究区内地灾样本数量少, 随机选取非地灾样本进行训练的情况下, 其评价结果能较好地刻画模拟研究区地灾易发性规律, 填补青天河景区地灾易发性细化研究, 为青天河景区防灾减灾工作提供有效决策.
(3) 在未来的研究中, 将能够反映灾害体内部结构的指标因子纳入评价体系中, 进一步挖掘指标因子与地质灾害蕴藏的关系.
致谢: 文中地灾点野外调查照片及地形数据均来源于河南省资源环境调查一院, 在此表示衷心的感谢!
[1] |
赵晓东, 王顺东, 张泰丽, 等. 不同精度下地表稳定性模型的评价[J]. 科学技术与工程, 2020, 20(25): 10207-10213. Zhao X D, Wang S D, Zhang T L, et al. Model evaluation of geohazard susceptibility in different resolutions[J]. Science Technology and Engineering, 2020, 20(25): 10207-10213. |
[2] |
谭春. 基于3S技术的岩桑树水电站近坝区滑坡敏感性评价[D]. 长春: 吉林大学, 2013. Tan C. Susceptibility appraisal of landslide adjacent to the dam site of Yansangshu hydro-power station based on 3S technology[D]. Changchun: Jilin University, 2013. |
[3] |
胡燕, 李德营, 孟颂颂, 等. 基于证据权法的巴东县城滑坡灾害易发性评价[J]. 地质科技通报, 2020, 39(3): 187-194. Hu Y, Li D Y, Meng S S, et al. Landslide susceptibility evaluation in Badong County based on weights of evidence method[J]. Bulletin of Geological Science and Technology, 2020, 39(3): 187-194. |
[4] |
尚敏, 马锐, 张英莹, 等. 基于GIS的证据权重法的崩塌敏感性分析研究[J]. 工程地质学报, 2018, 26(5): 1211-1218. Shang M, Ma R, Zhang Y Y, et al. GIS based weights of evidence method for rock fall susceptibility[J]. Journal of Engineering Geology, 2018, 26(5): 1211-1218. |
[5] |
丁茜, 赵晓东, 吴鑫俊, 等. 基于RBF核的多分类SVM滑塌易发性评价模型[J]. 中国安全科学学报, 2022, 32(3): 194-200. Ding X, Zhao X D, Wu X J, et al. Landslide susceptibility assessment model based on multi-class SVM with RBF kernel[J]. China Safety Science Journal, 2022, 32(3): 194-200. |
[6] |
王毅, 方志策, 牛瑞卿, 等. 基于深度学习的滑坡灾害易发性分析[J]. 地球信息科学学报, 2021, 23(12): 2244-2260. Wang Y, Fang Z C, Niu R Q, et al. Landslide susceptibility analysis based on deep learning[J]. Journal of Geo-information Science, 2021, 23(12): 2244-2260. |
[7] |
Ebrahimy H, Feizizadeh B, Salmani S, et al. A comparative study of land subsidence susceptibility mapping of Tasuj Plane, Iran, using boosted regression tree, random forest and classification and regression tree methods[J]. Environmental Earth Sciences, 2020, 79(10): 223. DOI:10.1007/s12665-020-08953-0 |
[8] |
周天伦, 曾超, 范晨, 等. 基于快速聚类-信息量模型的汶川及周边两县滑坡易发性评价[J]. 中国地质灾害与防治学报, 2021, 32(5): 137-150. Zhou T L, Zeng C, Fan C, et al. Landslide susceptibility assessment based on K-means cluster information model in Wenchuan and two neighboring counties, China[J]. The Chinese Journal of Geological Hazard and Control, 2021, 32(5): 137-150. |
[9] |
樊芷吟, 苟晓峰, 秦明月, 等. 基于信息量模型与Logistic回归模型耦合的地质灾害易发性评价[J]. 工程地质学报, 2018, 26(2): 340-347. Fan Z Y, Gou X F, Qin M Y, et al. Information and logistic regression models based coupling analysis for susceptibility of geological hazards[J]. Journal of Engineering Geology, 2018, 26(2): 340-347. |
[10] |
鲍帅, 刘纪平, 王亮. 联合DBSCAN聚类采样和SVM分类的滑坡易发性评价[J]. 震灾防御技术, 2021, 16(4): 625-636. Bao S, Liu J P, Wang L. Landslide susceptibility evaluation based on combined DBSCAN cluster sampling and SVM classification[J]. Technology for Earthquake Disaster Prevention, 2021, 16(4): 625-636. |
[11] |
李坤, 赵俊三, 林伊琳, 等. 基于RF和SVM模型的东川泥石流易发性评价研究[J]. 云南大学学报(自然科学版), 2022, 44(1): 107-115. Li K, Zhao J S, Lin Y L, et al. Assessment of debris flow susceptibility in Dongchuan based on RF and SVM models[J]. Journal of Yunnan University (Natural Sciences Edition), 2022, 44(1): 107-115. |
[12] |
Peng L, Niu R Q, Huang B, et al. Landslide susceptibility mapping based on rough set theory and support vector machines: A case of the Three Gorges area, China[J]. Geomorphology, 2014, 204: 287-301. |
[13] |
夏辉, 殷坤龙, 梁鑫, 等. 基于SVM-ANN模型的滑坡易发性评价——以三峡库区巫山县为例[J]. 中国地质灾害与防治学报, 2018, 29(5): 13-19. Xia H, Yin K L, Liang X, et al. Landslide susceptibility assessment based on SVM-ANN models: A case study for Wushan County in the Three Gorges Reservoir[J]. The Chinese Journal of Geological Hazard and Control, 2018, 29(5): 13-19. |
[14] |
牛瑞卿, 彭令, 叶润青, 等. 基于粗糙集的支持向量机滑坡易发性评价[J]. 吉林大学学报(地球科学版), 2012, 42(2): 430-439. Niu R Q, Peng L, Ye R Q, et al. Landslide susceptibility assessment based on rough sets and support vector machine[J]. Journal of Jilin University (Earth Science Edition), 2012, 42(2): 430-439. |
[15] |
黄发明, 殷坤龙, 蒋水华, 等. 基于聚类分析和支持向量机的滑坡易发性评价[J]. 岩石力学与工程学报, 2018, 37(1): 156-167. Huang F M, Yin K L, Jiang S H, et al. Landslide susceptibility assessment based on clustering analysis and support vector machine[J]. Chinese Journal of Rock Mechanics and Engineering, 2018, 37(1): 156-167. |
[16] |
刘艺梁, 殷坤龙, 刘斌. 逻辑回归和人工神经网络模型在滑坡灾害空间预测中的应用[J]. 水文地质工程地质, 2010, 37(5): 92-96. Liu Y L, Yin K L, Liu B. Application of logistic regression and artificial neural network in spatial assessment of landslide hazards[J]. Hydrogeology&Engineering Geology, 2010, 37(5): 92-96. |
[17] |
Wang L J, Guo M, Sawada K, et al. A comparative study of landslide susceptibility maps using logistic regression, frequency ratio, decision tree, weights of evidence and artificial neural network[J]. Geosciences Journal, 2016, 20(1): 117-136. |
[18] |
薛永安, 王玉洁, 朱婧聪, 等. 基于CF与SVM的小样本斜坡地质灾害敏感性评价研究[J]. 太原理工大学学报, 2022, 53(4): 672-681. Xue Y A, Wang Y L, Zhu J C, et al. Study of slope geological hazard susceptibility valuation with small sample based on CF and SVM[J]. Journal of Taiyuan University of Technology, 2022, 53(4): 672-681. |
[19] |
Chapelle O, Haffner P, Vapnik V N. Support vector machines for histogram-based image classification[J]. IEEE Transactions on Neural Networks, 1999, 10(5): 1055-1064. |
[20] |
Burges C J C. A tutorial on support vector machines for pattern recognition[J]. Data Mining and Knowledge Discovery, 1998, 2(9): 121-167. |
[21] |
汪海燕, 黎建辉, 杨风雷. 支持向量机理论及算法研究综述[J]. 计算机应用研究, 2014, 31(5): 1281-1286. Wang H Y, Li J H, Yang F L. Overview of support vector machine analysis and algorithm[J]. Application Research of Computers, 2014, 31(5): 1281-1286. |
[22] |
赵传峰, 姜汉桥, 郭新华. 支持向量机在小样本预测中的应用[J]. 油气田地面工程, 2009, 28(2): 21-23. Zhao C F, Jiang H Q, Guo X H. Application of support vector machine in prediction for small-sample cases[J]. Oil-Gas Field Surface Engineering, 2009, 28(2): 21-23. |
[23] |
杨硕, 李德营, 严亮轩, 等. 基于随机森林模型的乌江高陡岸坡滑坡地质灾害易发性评价[J]. 安全与环境工程, 2021, 28(4): 131-138. Yang S, Li D Y, Yan L X, et al. Landslide susceptibility assessment in high and steep bank slopes along Wujiang River based on random forest model[J]. Safety and Environmental Engineering, 2021, 28(4): 131-138. |
[24] |
穆柯, 谢婉丽, 刘琦琦, 等. 基于LR-RF模型的滑坡易发性评价——以铜川市耀州区为例[J]. 灾害学, 2022, 37(3): 212-218. Mu K, Xie W L, Liu Q Q, et al. Research on landslide susceptibility evaluation based on logistic regression and LR coupling model[J]. Journal of Catastrophology, 2022, 37(3): 212-218. |
[25] |
林荣福. 基于优化支持向量机模型的滑坡易发性评价——以陕西省商洛市为例[D]. 阜新: 辽宁工程技术大学, 2021. Lin R F. Landslide susceptibility evaluation based on optimized support vector machine model: Taking Shangluo City of Shaanxi Province as an example[D]. Fuxin: Liaoning Technical University, 2021. |
[26] |
罗金. 基于各类机器学习方法的滑坡易发性评价及软件系统开发[D]. 西安: 长安大学, 2021. Luo J. Evaluation of landslide susceptibility and software system development based on various machine learning methods[D]. Xi'an: Chang'an University, 2021. |
[27] |
石辉, 邓念东, 周阳. 随机森林赋权层次分析法的崩塌易发性评价[J]. 科学技术与工程, 2021, 21(25): 10613-10619. Shi H, Deng N D, Zhou Y. Evaluation of collapse susceptibility based on random forest weighted analytic hierarchy process[J]. Science Technology and Engineering, 2021, 21(25): 10613-10619. |
[28] |
武雪玲, 任福, 牛瑞卿. 多源数据支持下的三峡库区滑坡灾害空间智能预测[J]. 武汉大学学报(信息科学版), 2013, 38(8): 963-968. Wu X L, Ren F, Niu R Q. Spatial intelligent prediction of landslide hazard based on multi-source data in Three Gorges Reservoir area[J]. Geomatics and Information Science of Wuhan University, 2013, 38(8): 963-968. |
[29] |
何书, 鲜木斯艳·阿布迪克依木, 胡萌, 等. 基于自组织特征映射网络-随机森林模型的滑坡易发性评价——以江西大余县为例[J]. 中国地质灾害与防治学报, 2022, 33(1): 132-140. He S, Xianmusiyan A, Hu M, et al. Evaluation on landslide susceptibility based on self-organizing feature map network and random forest model: A case study of Dayu County of Jiangxi Province[J]. The Chinese Journal of Geological Hazard and Control, 2022, 33(1): 132-140. |