| 优化极限学习机在城市轨道交通地表沉降预测中的应用 |
2. 成都市勘察测绘研究院,四川 成都,610081;
3. 高速铁路运营安全空间信息技术国家地方联合工程实验室,四川 成都,611756
2. Chengdu Institute of Surveying and Mapping, Chengdu 610081, China;
3. National & Local Joint Engineering Laboratory of Safe Space Information Technology for High-Speed Railway Operation, Chengdu 611756, China
由于地下工程的施工环境、建筑材料及工程体结构的复杂性,地表沉降变形表现出非线性、随机性、模糊性等特点,使得变形规律难以准确预测[1]。鉴于此,许多学者从不同角度地表沉降变形预测方面进行了大量研究,也取得了相应的成果。文献[2, 3]利用回归分析构建沉降预测模型;文献[4-6]以BP(back progation)神经网络为基础,构建组合模型算法对沉降进行预测;文献[7, 8]提出了改进支持向量机(support vector machine, SVM)隧道地表沉降预测模型。上述研究成果虽然都取得较好的沉降预测效果,但是仍存在问题:①回归模型较简单,但回归方程假设严格,易出现伪回归问题导致预测结果较差;②BP神经网络在预测过程中存在陷入局部最小值、收敛速度慢等局限性;③SVM模型网络参数复杂,容易对预测结果产生较大影响[9]。
极限学习机(extreme learning machine, ELM)模型只需要对网络的隐层节点个数进行设置,且具有更好的泛化能力,并且在小样本数据预测研究中拥有更好的预测能力[10]。本文先利用ELM构建预测模型,采用“试算法”确定隐含层节点数和最优激励函数,再通过遗传算法(genetic algorithm,GA)对ELM模型进行优化,确定网络最优输入权值和隐含层偏置,构建GA-ELM地表沉降预测模型,最后对实例多期沉降监测数据进行预测分析。
1 基本原理 1.1 极限学习机原理ELM是一种单隐层前馈网络(single-hidden layer feedforward neural networks,SLFNs)学习算法[11]。与传统神经网络不同,ELM算法将广义SLFNs的所有隐藏节点参数随机化,并通过分析确定SLFNs的权重。所有隐藏的节点参数都独立于目标函数或训练数据集。ELM由输入层、隐含层和输出层组成,其网络结构如图 1所示。
![]() |
| 图 1 极限学习机网络结构 Fig.1 The Net Structure of ELM |
设n、L、m分别为输入层、隐含层和输出层的节点数,假定存在N个样本(xi ,ti),其中xi为输入;ti为期望输出。ELM训练模型可表示为:
| $ {y_i} = \sum\limits_{i = 1}^L {{\beta _i}} g\left( {{w_i} \cdot {x_j} + {b_i}} \right), j = 1, 2, \cdots , N $ | (1) |
式中,yi表示ELM模型的输出;g(x)表示激励函数;wi表示输入层神经元与隐含层第i个神经元的连接权;bi为隐含层神经元的偏置;βi表示隐含层第i个神经元与输出层神经元间的连接权值。
ELM网络中的输入权值wi和偏置bi是随机设定的,与数据变化无关。假定隐含层神经元数量L与训练样本数量N相等,通过对输入权值wi和偏置bi的训练,可实现ELM模型的预测误差趋近于零,即
| $ \sum\limits_{j = 1}^N {\left\| {{t_i} - {y_i}} \right\|} = 0 $ | (2) |
综合式(1)、式(2)可改写为:
| $ {t_j} = \sum\limits_{i = 1}^L {{\beta _i}} g\left( {{w_i} \cdot {x_j} + {b_i}} \right) $ | (3) |
式(3)以矩阵的形式可表达为:
| $ \mathit{\boldsymbol{T}} = \mathit{\boldsymbol{H}} \cdot \mathit{\boldsymbol{\beta }} $ | (4) |
式中,T为网络输出矩阵;H为隐含层输出矩阵;β为隐含层与输出层连接权值矩阵。
ELM网络的训练目标可以归结为如式(5)的优化问题:
| $ {\mathop{\rm Minimize}\nolimits} :\left\| {\mathit{\boldsymbol{H}} \cdot \mathit{\boldsymbol{\beta }} - \mathit{\boldsymbol{y}}} \right\|\left. \& \right\|\mathit{\boldsymbol{\beta }} $ | (5) |
当激励函数g(x)无限可微时,参数wi和bi在随机给定情况下,隐含层输出矩阵H固定不变,则ELM的训练过程可以看作求解线性系统H·β=T关于
| $ \mathit{\boldsymbol{\widehat \beta }} = {\mathit{\boldsymbol{H}}^ + } \cdot \mathit{\boldsymbol{T'}} $ | (6) |
式中,H+为隐含层输出矩阵H的Moore-Penrose广义矩阵。
ELM具有操作简易、运行高效的优点,但由于输入层与隐含层间的连接权值、隐含层神经元的偏置是随机产生的,导致网络训练效果有时不是很好,可以利用遗传算法优化得到ELM网络最优的输入权值和偏置[12, 13]。
1.2 GA优化极限学习机原理GA模拟自然界的优胜劣汰和遗传进化,有很强的自适应能力和全局性搜索能力。遗传算法的主要步骤如下:
1) 确定参数,并对原始数据进行编码;
2) 定义适应度函数,并计算个体的适应度;
3) 对种群进行选择、交叉和变异,产生下一代新的种群;
4) 判断是否继续:如果完成了预定的进化次数或者种群中最优个体在连续若干代没有改进,则算法停止,否则重新进行编码继续迭代上述过程。
GA优化神经网络的方法一般有3种[14],本文通过GA训练ELM神经网络,优化网络的初始权值和偏置,构建一个稳定的“输入层—隐含层—输出层”3层网络结构,解决ELM的权值和偏置随机确定因而致使网络结构不稳定的问题。
1.3 预测思路根据上述原理,本文模型的预测步骤如下:
1) 采用三次样条插值对实测沉降监测数据进行处理,将数据非等距序列转为等距序列。
2) 确定ELM网络拓扑结构,构建简单ELM预测模型,采用试算法确定ELM模型的最优激励函数和隐含层节点数。
3) 利用GA优化ELM模型,确定最优输入权值和隐含层偏置,构建GA-ELM模型,对测试样本进行仿真预测。
4) 对不同监测样本进行预测分析,并与其他神经网络模型预测结果进行对比,验证GA-ELM模型的可靠性。
2 实例分析 2.1 工程概况某在建隧道为双线隧道,设计纵坡为12.20‰,其进口(JDK11+360)覆土厚1~2 m,基岩为泥岩,土层及风化层厚4 m左右。进口设置一环45 m长的Φ108大管棚加强支护,采用台阶+临时仰拱法控爆开挖;JDK11+390~JDK11+800段隧道洞身位于人工弃填土层中,工程地质条件差,开挖容易产生滑塌[15],采用交叉中隔壁法(CRD法)非爆开挖。为了确保隧道施工作业的正常进行,对隧道地表进行沉降变形监测,监测点沿隧道地面中线呈横断面(监测断面)布设,监测断面纵向间距25 m,每个监测断面布设7个监测点,其中JDK11+400、JDK11+425、JDK11+450监测断面中心监测点(400-1、425-1、450-1)的沉降变形数据如图 2所示,监测频率为1~2次/d,已获取98期监测数据。
![]() |
| 图 2 地表监测点沉降变形曲线 Fig.2 Settlement Deformation Curve of Surface Monitoring Point |
由图 2沉降变形曲线可以看出:①监测点400-1变形平缓,沉降变形量较小;②监测点425-1前38期沉降变形量很小,第39~44期沉降速率增大,第45~72期沉降变形平缓,在第73期沉降变形出现明显的增加,其变形量表现直线下沉趋势;③监测点450-1在前72期沉降变形较平缓,第73~91期变形表现出加速下沉趋势,后期沉降变形趋势放缓。
结合现场工况和监测时间分析各监测点变形状况:由于JDK11+400处隧道埋深较浅,且隧道开挖前设置超前支护,故地表监测点400-1沉降变形量较小,呈缓慢下沉趋势;至第38期监测时,隧道掌子面临近JDK11+425断面,受开挖影响,土体应力变化较大导致监测点425-1加速下沉,而第43~71期隧道停止开挖,土体应力变化放缓,地表沉降变化速度相应减小;第72期隧道重新开挖,导致地表发生断裂,监测点425-1骤然下沉28 mm,此时隧道掌子面临近JDK11+450断面,监测点450-1沉降速率也开始增加,受掌子面推进的影响,监测点425-1和450-1处于不断下沉状态;第92期隧道停止开挖,监测点425-1和450-1沉降变化速度随之放缓。
2.2 变形预测选取地表监测点450-1的沉降数据作为实验样本数据,对样本数据进行预处理。先利用3次样条插值,将非等时距序列转为等时距序列数据,共生成130期数据。选取前120期作为训练样本,最后10期作为测试样本,用于检验模型的预测精度和可靠性。采用滚动预测方法,以前10期沉降数据作为输入,紧跟着的下一期数据作为输出,对隧道地表的变形趋势进行建模预测。
建立简单的ELM预测模型,输入层节点数为10,输出层节点数为1,随机给定输入权值和偏置,通过“试算法”对比不同激励函数(Sigmiod型、Sine型和Hardlim型)和隐含层节点数的预测效果,确定ELM模型的最优激励函数和隐含层节点数,预测结果如表 1所示。
| 表 1 不同激励函数和隐含层节点数的预测结果/mm Tab.1 Prediction Results of Different Excitation Functions and Hidden Layers Nodes/mm |
![]() |
由表 1可知,当激励函数为Sigmiod型,隐含层节点数为14个时,ELM模型预测结果的均方误差和累计误差均较小。因此,确定ELM模型为10-14-1拓扑结构,Sigmiod型激励函数的网络。
利用遗传算法优化ELM模型的初始权值和偏置,构建GA-ELM预测模型。设置GA种群数目为50,最大遗传代数为500,代沟为0.9,交叉概率为0.7,编译概率为0.005,以训练样本输出结果的均方误差作为适应度函数(目标函数)。代入样本数据,GA-ELM模型经过500次进化计算得到最佳适应度的稳定迭代值为1.36,如图 3所示。
![]() |
| 图 3 GA-ELM进化过程 Fig.3 Evolutionary Process of GA-ELM |
使用进化后的GA-ELM模型对测试样本进行仿真预测,并与未经优化的ELM模型预测结果进行比较,结果如图 4和表 2所示。
![]() |
| 图 4 预测结果对比 Fig.4 Comparison of Prediction Results |
| 表 2 ELM模型与GA-ELM模型预测结果 Tab.2 Prediction Result of GA-ELM and ELM |
![]() |
采用ELM模型对监测点450-1沉降进行预测的结果为:均方根误差(root mean square error, RMSE)值为1.444 0,决定系数R2值为0.926 7;采用GA-ELM模型进行沉降预测的结果为:RMSE值为0.521 2,R2值为0.990 2。评估指标中,RMSE值越小,表明模型偏差越小;R2值越接近1,表明模型吻合程度越高。对比结果可知,优化后的GA-ELM模型预测效果得到明显改善,比未优化的ELM模型具有更高的泛化能力和预测精度。
2.3 可靠性验证为进一步测试GA-ELM预测模型的可靠性,采用GA-ELM模型、ELM模型和传统BP神经网络进行预测精度对比,各模型的网络拓扑结构相同。实验数据选择下一监测断面JDK11+475的监测点475-1实测数据,采用滚动预测方法对第51~55期进行沉降预测,从残差均值、均方根误差RMSE以及平均绝对百分比误差(mean absolute percentage error, MAPE)3个方面评定模型的预测精度,结果见表 3。
| 表 3 可靠性验证结果 Tab.3 Result of Reliability Verification |
![]() |
通过比较可看出,GA-ELM模型预测效果在残差均值、RMSE和MAPE这3个方面均明显优于ELM模型和BP神经网络模型,其预测精度达到亚毫米级。更换测试对象后,GA-ELM模型表现出更优的预测效果,而ELM模型预测精度有所下降,仅略优于BP模型,这说明在相同的训练样本和网络结构下,利用GA对ELM的权值和偏置进行优化搜索,不仅能很好的改善了模型的泛化能力,也加强了模型的鲁棒性。试验结果表明GA-ELM模型相较其他算法在沉降预测更具优越性,同时在施工隧道不同断面地表监测点沉降预测中也具有较好的可靠性和适用性。
3 结束语1) 通过遗传算法对ELM模型的输入权值和隐含层偏置进行优化,建立GA-ELM预测模型,可以很好的增强网络的泛化能力和鲁棒性,模型的预测精度明显提高(ELM和GA-ELM模型预测值的RMSE值分别为1.444 0和0.521 2)。
2) 与传统BP和ELM相比,相同网络结构下,GA-ELM模型在不同断面监测点沉降预测中表现出极好的预测效果,其预测精度达到亚毫米级,说明该预测模型在施工隧道地表沉降预测中具有较高的可靠性和适用性。
3) 本文仅研究了GA-ELM预测模型在人工回填土下CRD法施工隧道的地表沉降预测,该模型在其他地质环境和施工状况下的预测效果仍需进一步研究。
| [1] |
段宝福, 宋立坤, 周鑫明, 等. 浅埋暗挖地铁隧道地表沉降研究现状[J]. 现代隧道技术, 2017, 54(4): 25-32. |
| [2] |
杨超, 杨永林, 丁吉峰, 等. 基于实测数据的高填方工后预测模型研究[J]. 测绘地理信息, 2018, 43(4): 78-80. |
| [3] |
董志航, 侯越, 王冰琰. 基于回归分析的地铁施工地表沉降预测模型研究[J]. 兰州交通大学学报, 2016, 35(4): 30-33. DOI:10.3969/j.issn.1001-4373.2016.04.006 |
| [4] |
甘鹏路, 闫自海, 彭加强. 基于BP神经网络的杭州紫之隧道最大地表沉降预测[J]. 河南科学, 2018, 36(3): 356-363. DOI:10.3969/j.issn.1004-3918.2018.03.010 |
| [5] |
赵杰, 花向红, 刘闯, 等. ARIMA-BP组合模型在高铁沉降预报中的应用研究[J]. 测绘地理信息, 2015, 40(4): 54-56. |
| [6] |
赵凤阳. 小波神经网络在隧道施工沉降预测中的应用[J]. 测绘科学, 2016, 41(12): 283-287. |
| [7] |
吕福祥, 黄磊. 基于粒子群优化的支持向量机在地表沉降预测中的应用[J]. 测绘信息与工程, 2010, 35(2): 44-45. |
| [8] |
罗亦泳, 姚宜斌, 赵庆志, 等. 利用优化的组合核相关向量机算法构建地表下沉预测模型[J]. 武汉大学学报·信息科学版, 2018, 43(9): 1295-1 301. |
| [9] |
高彩云, 崔希民, 高宁. 熵权遗传算法及极限学习机地铁隧道沉降预测[J]. 测绘科学, 2016, 41(2): 71-75. |
| [10] |
郭云开, 朱善宽, 刘磊, 等. 超限学习机在高速公路路基沉降预测中的应用[J]. 长沙理工大学学报(自然科学版), 2017, 14(04): 44-48. DOI:10.3969/j.issn.1672-9331.2017.04.007 |
| [11] |
Deng C W, Huang G B, Xu Jia, et al. Extreme Learning Machines: New Trends and Applications[J]. Science China (Information Sciences), 2015, 58(2): 5-20. DOI:10.1007/s11432-014-5269-3/email/correspondent/c1/new |
| [12] |
温廷新, 陈晓宇, 邵良杉, 等. 参数优化GA-ELM模型在露天煤矿抛掷爆破的预测[J]. 煤炭学报, 2017, 42(3): 630-638. |
| [13] |
陈艳茹. 基于遗传算法和极限学习机的智能算法在基坑变形预测中的应用[J]. 隧道建设, 2018, 38(6): 941-947. |
| [14] |
任帅. 基于极限学习机的预测算法研究[D]. 西安: 西北大学, 2018
|
| [15] |
任建喜, 曹西太郎, 陈旭. 黄土地层地铁隧道CRD(交叉中隔墙)工法施工引起的围岩变形及地表沉降规律[J]. 城市轨道交通研究, 2018, 21(9): 41-44. |
2021, Vol. 46









