基于空间多尺度分析的滑坡易发性评价——以三峡库区秭归-巴东段为例

引用本文

于宪煜, 熊十力. 基于空间多尺度分析的滑坡易发性评价——以三峡库区秭归-巴东段为例[J]. 大地测量与地球动力学, 2019, 40(2): 187-192.

YU Xianyu, XIONG Shili. Landslide Susceptibility Assessment Based on Spatial Multi-Scale Analysis: A Case Study of Zigui to Badong in the Three Gorges Reservoir Area[J]. Journal of Geodesy and Geodynamics, 2019, 40(2): 187-192.

项目来源

国家自然科学基金（41807297）；湖北省教育厅科研计划中青年人才项目（Q20171410）。

Foundation support

National Natural Science Foundation of China, No.41807297; Young Talents Project of Research Projects of Hubei Provincial Department of Education, No.Q20171410.

第一作者简介

于宪煜, 博士, 讲师, 主要研究方向为滑坡地质灾害分析与预测, E-mail:yuxianyu@mail.hbut.edu.cn。

About the first author

YU Xianyu, PhD, lecturer, majors in the analysis and prediction of landslide geological hazards, E-mail:yuxianyu@mail.hbut.edu.cn.

文章历史

收稿日期：2019-02-12

Contents Abstract Full text Figures/Tables PDF

基于空间多尺度分析的滑坡易发性评价——以三峡库区秭归-巴东段为例

于宪煜¹ 熊十力¹

1. 湖北工业大学土木建筑与环境学院, 武汉市南李路28号, 430068

收稿日期：2019-02-12

项目来源：国家自然科学基金（41807297）；湖北省教育厅科研计划中青年人才项目（Q20171410）。

第一作者简介：于宪煜, 博士, 讲师, 主要研究方向为滑坡地质灾害分析与预测, E-mail:yuxianyu@mail.hbut.edu.cn。

摘要：以三峡库区秭归-巴东段为例，将地理加权回归（GWR）模型引入到研究区的空间尺度分割方法中，利用粒子群优化（PSO）算法对支持向量机（SVM）模型参数进行优化，构建GWR-PSO-SVM耦合模型，完成研究区滑坡易发性评价，并与传统的PSO-SVM耦合模型结果进行对比。结果表明，在特定类别精度分析、总体预测精度分析和曲线下面积分析中，本文方法评价效果均优于传统方法。

关键词：滑坡；滑坡易发性评价；空间尺度；空间尺度分割；地理加权回归

目前对于区域性的滑坡预测主要以滑坡易发性评价非确定性方法为主^[1]，但这类方法往往忽视了滑坡灾害的空间性，在没有考虑模型空间适用性的情况下将其推广至整个研究区域，会降低滑坡易发性评价结果的准确性。为解决空间差异性问题，本文利用GWR模型将空间尺度的概念引入到滑坡易发性评价研究中，建立基于GWR-PSO-SVM的滑坡易发性评价耦合模型，揭示空间尺度对滑坡易发性评价结果造成影响的根本原因，解释滑坡易发性评价结果的空间不平衡性，提高滑坡易发性评价的科学性、准确性和可靠性。

1 滑坡易发性评价耦合模型 1.1 地理加权回归模型

GWR模型利用回归原理研究具有空间分布特征的2个或多个变量之间的数量关系，将局部特征作为权重从而改变全局回归模型中的多重共线性^[2]，相关函数定义为：

$ {{y}_{i}}={{\beta }_{0}}\left( {{\mu }_{i}}, {{v}_{i}} \right)+\sum\limits_{k=1}^{Q}{{{\beta }_{k}}}\left( {{\mu }_{i}}, {{v}_{i}} \right){{x}_{ik}}+{{\varepsilon }_{i}} $

(1)

式中，i=1, 2, …, L，(μ_i, v_i)为第i个样本的空间坐标，L和Q分别为样本和回归系数的个数，y_i为函数在i点的自变量，x_ik为i点的第k个解释变量的值，β_k(μ_i, v_i)为i点的第k个解释变量的局部回归参数，β₀(μ_i, v_i)为i点的截距参数。

1.2 支持向量机模型

SVM模型建立在VC维理论和结构风险最小原理基础上，根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中，以获得最好的推广能力。该模型在解决小样本、非线性及高维模式识别中具有许多特有的优势^[3]，其函数定义为：

$ \left\{ {\begin{array}{*{20}{l}} {\min \frac{1}{2}{{\left\| \mathit{\boldsymbol{w}} \right\|}^2}}\\ {{\mathop{\rm s}\nolimits} .t.\;{y_i}(\mathit{\boldsymbol{w}} \cdot {x_i} + b) \ge 1} \end{array}} \right. $

(2)

式中，x_i为位于超平面上的点，y_i为分类标记，i=1, 2, …, R，R为样本个数，w为一个垂直于超平面的向量，b为使得超平面不会通过坐标轴原点的常数，‖ w‖为w的2-范数。

1.3 粒子群优化算法

PSO算法是一种模仿鸟类觅食的智能寻优算法^[4]，其函数形式为：

$ \left\{ \begin{align} & V_{i}^{n+1}=t\cdot V_{i}^{n}+{{c}_{1}}\cdot {{r}_{1}}\cdot \left( p_{i}^{n}-x_{i}^{n} \right)+ \\ & \ \ \ \ \ {{c}_{2}}\cdot {{r}_{2}}\left( p_{g}^{n}-x_{i}^{n} \right) \\ & x_{i}^{n+1}=x_{i}^{n}+V_{i}^{n} \\ \end{align} \right. $

(3)

式中，i=1, 2, …, k，k为粒子的个数，n为当前迭代次数，t为非负数的惯性权重，p_iⁿ为第i个粒子的个体最优位置，p_gⁿ为第n次迭代中所有粒子的最优位置，V_iⁿ和x_iⁿ分别为第i个粒子在第n次迭代中的速度和位置，V_iⁿ⁺¹和x_iⁿ⁺¹分别为第i个粒子在第n+1次迭代中更新的速度和位置，c₁和c₂为学习因子，r₁和r₂为介于0和1之间的随机数。

1.4 基于空间多尺度的滑坡易发性评价耦合模型

本文以滑坡评价因子的空间自相关性为切入点，将滑坡评价因子的GWR系数作为研究区分割的数学依据，对研究区进行空间尺度分割。以滑坡易发性评价为核心进行模型整合，利用PSO算法对SVM模型进行参数优化。优化后的模型可以考虑到不同空间尺度的评价预测区中滑坡评价因子的实际情况，通过调节滑坡易发性评价模型的参数，可以提高在不同空间尺度下滑坡易发性评价结果的精度，从而实现空间多尺度的滑坡易发性评价模型的建立。图 1为建立基于空间多尺度分析的滑坡易发性评价耦合模型的流程。

图 1 建立基于空间多尺度分析的滑坡易发性评价耦合模型流程 Fig. 1 The flow chart of establishing the coupling model for landslide susceptibility evaluation based on spatial multi-scale analysis

2 基于GWR的滑坡易发性评价 2.1 滑坡易发性评价单元的选取

斜坡单元能在一定程度上反映不同的滑坡评价因子对滑坡的控制与影响作用，因此本文选择斜坡单元作为滑坡易发性评价的计算单元，并最终建立了2 790个斜坡单元。

2.2 滑坡易发性评价因子的获取

本文通过分析研究区的滑坡历史数据和总结前人的研究成果，将滑坡环境因素(滑坡易发性评价因子)分为控制因素和影响因素2个大类。控制因素包含地形地貌因子、地质因子、水文因子这3个亚类；影响因素包括地表覆被、大气降水及地震活动等几个方面的因子。本文利用地质图、地形图、遥感影像数据、野外勘察报告、典型滑坡监测报告等资料，通过遥感(RS)、地理信息系统(GIS)等技术提取出2个大类8个亚类共计58个滑坡评价因子。

2.3 滑坡易发性评价因子的筛选

上述58个因子中有很大一部分是通过数字高程模型(DEM)计算得到的，具有天然的相关性，因此需要对这58个因子进行分析和筛选。主要步骤为：

1) 利用皮尔逊相关系数分析和主成分分析筛选。为了能够保留多因子的有效信息，同时去除这些因子的线性相关性，利用皮尔逊相关系数分析和主成分分析(PCA)方法对因子组合进行处理，保留地形地貌因子的第1、第2和第3主成分，植被指数、湿度指数和建筑指数均保留第1主成分，筛选出32个滑坡易发性评价因子。

2) 基于SVM模型的因子重要性筛选。在SVM模型中，算法会根据滑坡易发性评价因子对滑坡的贡献程度计算出每个因子的重要性。经过反复实验和比对，结合前人研究成果，在包含主要滑坡易发性评价因子的基础上，确定滑坡评价因子的重要性选择阈值(0.005)，并最终筛选出18个滑坡易发性评价因子，如表 1所示。

表 1 筛选后最终的滑坡易发性评价因子 Tab. 1 Final landslide susceptibility evaluation factors after screening

2.4 基于GWR的研究区分割

为保证不同类别之间的地理加权回归系数差异较大，降低类与类之间滑坡评价因子的空间自相关性，在计算得到各滑坡评价因子的GWR系数的基础上，利用自然断点法(natured breaks method)对评价因子进行分类。研究区分割方法理论上应该将所有滑坡评价因子的地理加权回归系数的分类结果进行叠加，得到区域尺度的分割结果，降低每个滑坡评价因子的空间自相关性。但由于滑坡评价因子数目过多，分类结果相叠加会产生许多面积过小的区域，对后续的滑坡易发性评价造成极大的影响。过多的分割区域会使区域与区域之间的空间距离变小，从而在一定程度上增大滑坡评价因子的空间自相关性。经过反复实验，本文总结出在利用GWR模型进行区域分割时需要遵循的3项基本原则：

1) 对所有的滑坡评价因子选择相同且合适的分类数；

2) 仅选择最重要的滑坡评价因子作为分割因子对研究区进行尺度分割；

3) 针对区域分割结果，需要将过小的区域合并到相邻区域中，并且应该保证滑坡面的完整性。

根据上述原则，最终选择SVM模型中重要性排在前3位的滑坡评价因子——渠道网络等级、高程、水系距离作为区域分割因子，并将这3个滑坡评价因子利用自然断点法分成2类相叠加，得到最终的研究区区域尺度分割结果，共计18个预测区域，分割流程如图 2所示。

图 2 基于GWR的研究区尺度分割流程 Fig. 2 The process of study area scale segmentation based on GWR

2.5 基于GWR的滑坡易发性评价模型的建立

针对18个预测区域，将每个区域内的滑坡面斜坡单元数量与随机选择的非滑坡面斜坡单元数量按1 :1比例共同组成训练样本数据集，并对PSO-SVM耦合模型进行训练与建模。将区域内的所有斜坡单元作为验证样本数据集，输入到已经训练好的耦合模型中，得到每个斜坡单元对于滑坡事件的隶属度，即预测区域的滑坡易发性评价结果。

2.6 GWR-PSO-SVM滑坡易发性评价耦合模型实验结果

结合所有预测区域的滑坡易发性评价结果，得到基于空间多尺度分析的滑坡易发性评价结果，即GWR-PSO-SVM耦合模型的实验结果(图 3)。

图 3 GWR-PSO-SVM耦合模型实验结果 Fig. 3 The experimental results of GWR-PSO-SVM coupling model

3 基于空间多尺度分析的滑坡易发性评价实验分析 3.1 建立PSO-SVM耦合模型对比实验

在对比实验中，将PSO-SVM耦合模型作为对比实验组，删除利用GWR系数对研究区进行分割的部分，得到PSO-SVM耦合模型实验结果(图 4)。

图 4 PSO-SVM耦合模型实验结果 Fig. 4 The experimental results of PSO-SVM coupling model

为增强滑坡易发性评价结果的可读性，本文采用固定阈值法，取分类阈值为0.1、0.3、0.7和0.9，得到2组实验的滑坡易发性区划图，如图 5(a)和5(b)所示。

图 5 GWR-PSO-SVM和PSO-SVM滑坡易发性区划 Fig. 5 Landslide susceptibility zone map based on GWR-PSO-SVM and PSO-SVM coupling model

3.2 实验结果对比及分析 3.2.1 特定类别精度分析

特定类别精度分析法为一种改进的定量分析方法，可以用来解决传统方法不适用的具有两极分化特点的滑坡易发性评价定量分析问题^[5]，可表示为：

$ {{p}_{i}}=\frac{{{A}_{i}}}{{{B}_{i}}}\cdot 100% $

(4)

式中，i=1, 2, …, n，n为滑坡易发性区划的分类个数，A_i为在第i个滑坡易发性区划分类中滑坡所占斜坡单元的个数，B_i为在第i个滑坡易发性区划分类中斜坡单元的个数，P_i为在第i个滑坡易发性区划分类中的特定类别精度。

根据式(4)，2组实验的特定类别精度如表 2所示。

表 2 2组实验的特定类别精度分析 Tab. 2 Specific category accuracy analysis for two experiments

从表 2可以看出，在GWR-PSO-SVM耦合模型中，滑坡易发性评价结果(85.75%)要优于PSO-SVM耦合模型的滑坡易发性评价结果(68.35%)。

3.2.2 总体预测精度分析

总体预测精度分析是滑坡易发性评价中较为常用的评价方法之一。本文在GWR-PSO-SVM耦合模型分析中采用区域分割的方法对滑坡易发性评价进行研究，而在某些分割区域内不存在滑坡，因此需要对式(4)进行改写：

$ p=\frac{\sum\limits_{i=1}^{{{n}_{\text{pr}}}}{\left( {{a}_{i}}+{{b}_{i}} \right)}}{\sum\limits_{i=1}^{{{n}_{\text{pr}}}}{{{S}_{i}}}}\cdot 100% $

(5)

其中，i=1, 2, …, n，n_pr为预测区的个数，a_i为在第i个预测区内被正确预测为滑坡的斜坡单元个数，b_i为在第i个预测区内被正确预测为非滑坡的斜坡单元个数，S_i为在第i个预测区内总斜坡单元个数。表 3为2组实验的总体预测精度。

表 3 2组实验的总体预测精度分析 Tab. 3 Overall prediction accuracy analysis for two experiments

从表 3可以看出，GWR-PSO-SVM耦合模型的总体预测精度为87.86%，明显优于PSO-SVM耦合模型的84.44%。

3.2.3 ROC曲线分析

ROC曲线分析是统计理论中的经典内容，本文将每个斜坡单元是否为滑坡斜坡单元的真实数据作为状态变量，将连续型的不同尺度下滑坡易发性评价结果作为检验变量，构建ROC曲线(图 6)。

图 6 2组实验的ROC曲线 Fig. 6 ROC curve for two experiments

表 4为这2组实验的滑坡易发性评价结果ROC曲线的曲线下面积(AUC)。

表 4 2组实验的曲线下面积分析 Tab. 4 AUC analysis for two experiments

从表 4可以看出，GWR-PSO-SVM耦合模型的曲线下面积为0.965，大于PSO-SVM耦合模型的0.944，说明在ROC曲线评价中，GWR-PSO-SVM耦合模型的结果要优于PSO-SVM耦合模型。

4 实验讨论

基于前文的分析及滑坡易发性评价的特点，将对滑坡易发性评价结果造成差异的主要原因归纳为3点，即滑坡易发性评价的空间尺度、滑坡评价因子及预测模型的选择。在同一空间尺度下，导致滑坡易发性评价结果产生差异的主要原因是滑坡评价因子、滑坡易发性评价计算单元及滑坡易发性评价模型。但随着研究的深入和空间尺度问题的引入，滑坡易发性评价的空间尺度、滑坡评价因子及预测模型的选择成为主导滑坡易发性评价结果产生差异的根本原因。

滑坡易发性评价模型本身并不都是地质学或者地理学等相关学科原生的，更多的是借鉴于其他学科领域，如由统计学、数学、经济学等学科演化而来，这些模型经过时间的反复验证，其本身具有客观性、适用性和稳定性。计算单元以栅格单元为基础，栅格单元又是由遥感卫星成像及其数学物理特性决定的，其本身也具有客观性，因此本文的研究目标主要是滑坡易发性评价因子和空间尺度两个方面。

5 实验结论

在14组PSO-SVM耦合模型滑坡易发性评价实验中，各滑坡易发性评价因子在其中的重要性各不相同，如图 7所示。为对比方便，图例中的滑坡易发性评价因子是按PSO-SVM耦合模型中滑坡易发性评价因子的重要性评分值倒序排列的(0.241~0.005)。从图 7可以看出：

图 7 GWR-PSO-SVM耦合模型中各分割区域滑坡评价因子重要性变化示意图 Fig. 7 Schematic diagram of the significance changes of landslide evaluation factors in each segmented area based on GWR-PSO-SVM coupled model

1) 在PSO-SVM耦合模型中具有重要性的滑坡易发性评价因子在分割后的某些区域并不存在重要性(其值为0)，如斜坡结构、斜坡形态等，甚至在预测区域5中，在区域尺度下排名第1的滑坡评价因子也不存在重要性，这说明在不同空间尺度下滑坡易发性评价因子的重要性存在差异。

2) 研究区分割后，相邻编号之间存在较为相近甚至相邻的空间位置关系。但在图 7中，即使是相邻的区域2和区域3，其滑坡评价因子的重要性排序也都大不相同，表明滑坡评价因子的重要性在不同预测区域的变化及滑坡评价因子的局部性特点。

6 结语

综上所述，不同区域的滑坡易发性评价因子其实是不同的。将整个研究区的滑坡易发性评价因子先通过模型进行统计计算再赋权重值的方法显然是存在问题的，其本质还是在于研究区的空间尺度影响着滑坡易发性评价因子的重要性。因此，以滑坡易发性评价因子为基础，利用GWR理论计算得到主要因子的GWR系数，再通过GWR系数分类、重要因子叠加、人机交互修改等步骤得到的研究区空间尺度分割方法，是解决这一问题行之有效的方法。

参考文献

[1]	Mondal S, Mandal S. RS&GIS-Based Landslide Susceptibility Mapping of the Balason River Basin, Darjeeling Himalaya, Using Logistic Regression (LR) Model[J]. Georisk:Assessment and Management of Risk for Engineered Systems and Geohazards, 2018, 12(1): 29-44 DOI:10.1080/17499518.2017.1347949 (0)
[2]	Fotheringham A S, Charlton M E, Brunsdon C. Geographically Weighted Regression:A Natural Evolution of the Expansion Method for Spatial Data Analysis[J]. Environment and Planning A, 1998, 30(11): 1905-1927 DOI:10.1068/a301905 (0)
[3]	Vapnik V. The Nature of Statistical Learning Theory[M]. New York: Springer-Verlag, 2000 (0)
[4]	Eberhart R, Kennedy J. A New Optimizer Using Particle Swarm Theory[C]. The Sixth International Symposium on Micro Machine and Human Science, Nagoya, 1995 (0)
[5]	于宪煜.基于多源数据和多尺度分析的滑坡易发性评价方法研究[D].武汉: 中国地质大学(武汉), 2016 (Yu Xianyu. Study on the Landslide Susceptibility Evaluation Method Based on Multi-Source Data and Multi-Scale Analysis[D]. Wuhan: China University of Geosciences, 2016) http://cdmd.cnki.com.cn/Article/CDMD-10491-1016312027.htm (0)

Landslide Susceptibility Assessment Based on Spatial Multi-Scale Analysis: A Case Study of Zigui to Badong in the Three Gorges Reservoir Area

YU Xianyu¹ XIONG Shili¹

1. School of Civil Engineering, Architecture and Environment, Hubei University of Technology, 28 Nanli Road, Wuhan 430068, China

Foundation support: National Natural Science Foundation of China, No.41807297; Young Talents Project of Research Projects of Hubei Provincial Department of Education, No.Q20171410.

About the first author: YU Xianyu, PhD, lecturer, majors in the analysis and prediction of landslide geological hazards, E-mail:yuxianyu@mail.hbut.edu.cn.

Abstract: In this paper, we introduce the geographically weighted regression (GWR) into the spatial scale segmentation method of the study area, the particle swarm optimization (PSO) algorithm to optimize the parameters of support vector machine (SVM) model, and finally construct the GWR-PSO-SVM coupling model. In addition, the traditional PSO-SVM coupling model is constructed to compare with the new method. The results show that in the specific category accuracy analysis, the overall prediction accuracy analysis and the area under the curve analysis, the evaluation results of this method are better than the traditional methods.

Key words: landslide; landslide susceptibility evaluation; spatial scale; spatial scale segmentation; geographically weighted regression