2. 桂林理工大学测绘地理信息学院,桂林市雁山街319号,541006;
3. 桂林理工大学广西矿冶与环境科学实验中心,桂林市雁山街319号,541006;
4. 武汉大学测绘学院,武汉市珞喻路129号,430079;
5. 东华理工大学江西省数字国土重点实验室,南昌市广兰大道418号,330013
在变形监测数据处理中,最早求解模型待定系数的最佳估计是多元回归分析法,后发展到统计推断分析、神经网络建模等[1]。统计推断分析建模常用的AR和ARMA模型对时间序列的平稳性和正态性要求极高,神经网络则容易陷入局部最小值、不易收敛而造成过拟合[1-2]。支持向量机(SVM)可根据有限的样本信息,在模型的复杂性和学习能力之间寻求最佳折中,最终将问题转换成用现成的QP (quadratic programming)优化包求解凸二次规划问题,在很大程度上避免了模型上的选择与过拟合、维数灾难和陷入局部最小等问题。
高铁变形监测数据不仅受环境和人为因素影响,使其在传输、接收过程中或多或少包含噪声,也伴随产生时间序列的系统本存的非线性、高维强相关和非平稳性,形成“小沉降、大波动”的数据特征[3]。对于这种均值具有趋向性的非平稳时间序列的预测,除正确选择和优化模型外,还应提取时间序列中所蕴含的不同时频特征的随机序列和近似序列,进而避免因短期波动造成的过拟合[4]。小波分解具有良好的时频多分辨分析能力,能把复杂的非平稳变形数据分解到不同频带上以得到随机和近似模式分量[4-5]。针对高铁变形监测数据的特征,考虑到小波分析和SVM对非平稳、非线性时间序列具备的良好分离和泛化能力,以及灰色模型对贫信息、小样本情况下的强大拟合功能,本文运用二进正交小波Mallat算法对高铁变形监测数据进行分解,得到平移不变、尺度相关的高频随机序列和低频近似序列,分别对各序列进行建模后叠加,从而得到原始时间序列的耦合模型。以贵广高铁某段路基基底沉降板的沉降时间序列为例,将小波分解与SVM和灰色理论相结合,借助组合模型进行应用分析,为高铁路基沉降变形预测提供新思路。
1 预测方法 1.1 回归型支持向量机(SVR)首先,通过核特征空间的非线性映射算法把样本点(xi, yi)(i=1, 2, …, n)变换到一个高维的Hilbert空间中的训练点(φ(xi), yi),然后对映射后的训练集D′={(φ(xi), yi), i=1, 2, …, n}进行线性回归,最后通过最优决策函数f(x)=[ω, φ(x)+b]将非线性映射φ(x)转化为更高维空间的线性函数[6]。
根据结构风险最小化准则寻找ω、b,SVM在优化目标中的损失函数ε为误差εi的二次项。优化过程为:
$ \left\{ \begin{array}{l} {\rm{min}}\frac{1}{2}{\left\| \mathit{\boldsymbol{\omega }} \right\|^2} + \frac{1}{2}C\sum\limits_{i = 1}^i {\xi _i^2} \\ {\rm{s}}{\rm{.t}}:{y_i} = \mathit{\boldsymbol{\omega }}\varphi ({x_i}) + b + {\xi _i}\;\;\;\;\left( {i = 1, \ldots ,l} \right) \end{array} \right. $ | (1) |
建立Lagrange函数优化上述问题:
$ \begin{array}{l} L\left( {\mathit{\boldsymbol{\omega }},b,\xi ,\alpha } \right) = \frac{1}{2}{\left\| \mathit{\boldsymbol{\omega }} \right\|^2} + \frac{1}{2}C\sum\limits_{i = 1}^i {\xi _i^2} {\rm{ + }}\\ \quad \quad \sum\limits_{i = 1}^l {{\alpha _i}\left[ {{\mathit{\boldsymbol{\omega }}^{\rm{T}}}\varphi \left( {{x_i}} \right) + b + \xi - {y_i}} \right]} \end{array} $ | (2) |
根据KKT(拉格朗日乘子与不等式约束的乘积)条件:
$ \frac{{\partial L}}{{\partial \mathit{\boldsymbol{\omega }}}} = 0,\frac{{\partial L}}{{\partial b}} = 0,\frac{{\partial L}}{{\partial \xi }} = 0,\frac{{\partial L}}{{\partial \alpha }} = 0 $ | (3) |
可得:
$ \begin{array}{l} \mathit{\boldsymbol{\omega }} = \sum\limits_{i = 1}^i {{\alpha _i}\varphi ({x_i})} ,\sum\limits_{i = 1}^i {{\alpha _i}} = 0,{\alpha _i} = C{\xi _i}\\ {y_i} - {\mathit{\boldsymbol{\omega }}^{\rm{T}}}\varphi ({x_i}) - b - {\xi _i} = 0 \end{array} $ | (4) |
定义核函数K(x, xi)满足Mercer条件,消去ξi和ω后,得到以下线性方程组:
$ \left[ {\begin{array}{*{20}{c}} 0&{{\mathit{\boldsymbol{e}}^{\rm{T}}}}\\ \mathit{\boldsymbol{e}}&{\mathit{\boldsymbol{Q}} + \frac{\mathit{\boldsymbol{I}}}{C}} \end{array}} \right]\left[ {\begin{array}{*{20}{c}} \mathit{\boldsymbol{b}}\\ \mathit{\boldsymbol{\alpha }} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} 0\\ y \end{array}} \right] $ | (5) |
式中,e = [1, 1, …, 1]T;I为单位矩阵;α = (α1, α2, …, αi)T;Qij=K(xi, xj), i, j=1, 2, …, l。本文选用径向基核函数(RBF):
$ K({x_i},{x_j}) = {\rm{exp}}\left( { - \frac{{{{\left\| {x - {x_i}} \right\|}^2}}}{{2{\sigma ^2}}}} \right),\sigma > 0 $ | (6) |
最后得到回归模型如下:
$ f\left( x \right) = \sum\limits_{i = 1}^i {{\alpha _i}K(x,{x_i}) + b} $ | (7) |
综上所述,SVR回归模型解决回归函数估计问题时,必须确定3个自由参数——正则化参数C、核参数σ和不敏感度ε,再采用支持向量机回归估计方法进行回归估计[7]。
1.2 小波分析基于小波函数ψ(t),经过平移和伸缩变换得到一簇函数[8]:
$ {\psi _{a,k}}\left( t \right) = {\left| a \right|^{ - 1/2}}\psi \left( {\frac{{t - k}}{a}} \right),a、k \in R,a \ne 0 $ | (8) |
式中,a和k分别是尺度因子和时间因子,反映的是频域特性和时域特性;ψa, k(t)为小波函数。将原始数据序列f(t)进行加权,可得:
$ {\omega _f}\left( {a,k} \right) = \int {f\left( x \right){\psi _{a,k}}\left( t \right){\rm{d}}t} $ | (9) |
为保证总输出与输入数据长度一致,方便最后的叠加,经Mallat塔式算法分解后的信号采用重构算法进行二次插值重构,其冲欧算法为[9]:
$ f\left( t \right) = \iint {\frac{1}{{{a^2}}}{w_f}\left( {a,k} \right){\psi _{a,k}}{\text{d}}a{\text{d}}k} $ | (10) |
设垂直沉降位移的原始时间序列为{x1, x2, …, xn},其中n为变形监测数据的总个数。对于这种非线性位移的时间序列预测,其实质是寻找t时刻的沉降值xt与前m个时刻的沉降值的关系,即
$ {x_t} = f({x_{t - 1}}, \ldots ,{x_{t - m}}) $ | (11) |
式中,非线性函数f指变形监测时间序列各数据之间的非线性关系。利用SVR强大的非线性映射能力对函数f进行表达时,为了得出最优的嵌入维数m,本文使用延迟坐标法对原始时间序列进行相空间重构,根据C-C法可以直接确定嵌入维数m。完成嵌入维数的确定后,对单一的时间序列进行重构得到m维向量的形式,即可得到SVM的m维输入训练,如表 1所示。
对得到的新序列进行以下处理。
1) 小波分解:根据样本特征选取合适的小波函数对沉降位移序列进行最佳的分解层次,分解到不同频率和不同尺度上,再利用一维小波单支重构算法分别对得到的随机和近似序列进行重构,得到cd1, cd2…cdj和caj,并对各子序列进行相关性分析,检验分解层数的合理性。
2) 对近似序列构建灰色SVR模型进行预测:通过灰色GM(1, 1)模型对caj进行一次累加,得到更加符合其变化规律的近似分量,进而作为SVR的输入。
3) 构建随机序列的SVR模型:为避免随机序列短期波动造成的过拟合,对随机序列均构建SVR预测。
4) 将第2)步和第3)步的预测结果进行对应的耦合叠加,即可得到最终的预测值。
对SVR预测性能有重要影响的参数包括正则化参数即惩罚因子C、核函数及其参数的选取[10]。本文选用RBF核作为SVR模型的核函数,通过RBF核函数进行惩罚因子C和内核参数g的选择[11];采用全局搜索能力强的遗传算法进行参数寻优,具体步骤见文献[12]。
2 实例分析以贵广高铁某段路基基底沉降板中LO1点的连续45期(观测时间为2013-05-03~2014-03-07,观测间隔时间为7 d)的垂直位移观测值为实例,验证基于小波分析的灰色GA-SVR预测模型的可行性。选取前35期沉降观测值为拟合样本,后10期为检验样本,设计以下几种方案:灰色SVR模型(方案2)、SVR模型(方案3)、BP神经网络模型(方案4)与本文模型(方案1)。以均方误差(MSE)、平均绝对误差(MAE)、平均绝对相对误差(MAPE)为评判指标,对以上各方案的预测结果进行分析。
根据C-C法计算所测样本的嵌入维数m为4,时延参数为2,选用没有线性相位且时频局部化能力最强的db6小波对高铁沉降时间序列进行2~4阶单一基底函数小波分解与重构。根据去噪前后信噪比最高、均方差最小原则,最终确定此样本的分解层数为3层,其信噪比为39.825 0,均方差为0.124 8,样本分布及分解后各系数如图 1所示。为检验分解效果,对各分解系数进行相关性分析,如表 2所示。根据图 1和表 2可以看出,进行3层分解后的低频序列ca3与原序列极为相近,相关系数达到99.2%,说明分解较为彻底;而高频随机序列cd3、cd2、cd1与原序列的相关性逐渐减小,说明随着分解层数的增加,随机项主要分布在最后一层,对SVR模型的随机序列预测起到显著作用。
对各高频随机序列进行GA-SVR模型预测,将cd3、cd2和cd1序列的基本参数统一设定:惩罚因子C的取值范围为[0, 100],内核参数g的取值范围为[0, 1 000],不敏感参数ε的变化范围为[0, 1]。对于遗传算法中的参数,其最大进化代数默认为200,种群最大数量默认为20,交叉概率设为0.9,变异概率为0.05,选用10倍交叉验证函数为适应度函数,以训练误差(MSE)作为目标函数进行迭代,得cd3序列的终止代数为50,种群数量为20,最优C为71.826 7,g为8.893 9,均方差MSE为0.049 3;cd2序列的终止代数为50,种群数量为20,C为1.653 9,g为6.009 9,均方差MSE为0.092 5;cd1序列的终止代数为50,种群数量为20,最优C为9.536 7×10-5,g为6.029 3,均方差MSE为0.130 6。对于低频ca3近似序列,用同样方法求得最优解:C为19.002,g为0.157 8,均方差MSE为0.003 9。将上述各子序列的预测结果进行耦合叠加,得到方案1的最终结果。
将上述3种方案与方案1进行比较,结果见表 3(单位mm)和图 2。可见,方案1最大误差为-0.295 2 mm,方案2、3和4分别为-0.559 3 mm、-0.700 5 mm、-0.781 1 mm,显示方案1预测效果最优,其结果与原始形变量最为接近。方案2的预测精度随时间推移而呈现偏离和急剧下降的趋势,但效果远高于方案3和方案4。
本文采用二进正交小波Mallat算法对高铁变形监测的时间序列进行分解,使得复杂时间序列的内在细节规律和外部沉降趋势表现得更为明显。建立了一种小波灰色支持向量机的组合模型并应用于实例。结果表明,当监测数据样本具有很强的非线性特征与随机性时,通过基于小波分析的GA-SVR组合模型不仅能够改善挖掘样本有限的情况,获得高质量学习样本,还能明显地提高短期预测精度,对现今高铁变形监测的安全预警起到重要作用。
[1] |
曾凡仔, 裘正定. 基于小波分解的AR-SVR一类非平稳时间序列预测[J]. 信号处理, 2004, 20(2): 108-111 (Zeng Fanzai, Qiu Zhengding. AR-SVR Forecasting of No-Stationary Time Series with Tendency Based Wavelet Decomposition[J]. Journal of Signal Processing, 2004, 20(2): 108-111)
(0) |
[2] |
秦永宽, 黄声享, 赵卿. 基于小波消噪和LS-SVM的混沌时间序列预测模型及其应用[J]. 大地测量与地球动力学, 2008, 28(6): 96-100 (Qin Yongkuan, Huang Shengxiang, Zhao Qing. Prediction Model of Chaotic Time Series Based on Wavelet De-Noising and LS-SVM and Its Application[J]. Journal of Geodesy and Geodynamics, 2008, 28(6): 96-100)
(0) |
[3] |
杨军, 侯忠生. 基于小波分析的最小二乘支持向量机轨道交通客流预测方法[J]. 中国铁道科学, 2013, 34(3): 122-127 (Yang Jun, Hou Zhongsheng. A Wavelet Analysis Based LS-SVM Rail Transit Passenger Flow Prediction Method[J]. China Railway Science, 2013, 34(3): 122-127)
(0) |
[4] |
黄巧玲, 粟晓玲, 杨家田. 基于小波分解的日径流支持向量机回归预测模型[J]. 西北农林科技大学学报:自然科学版, 2016, 44(4): 211-217 (Huang Qiaoling, Su Xiaoling, Yang Jiatian. Wavelet Based Support Vector Machine Regression Model for Daily Runoff Prediction[J]. Journal of Northwest A & F University:Natural Science Edition, 2016, 44(4): 211-217)
(0) |
[5] |
张华, 郁永静, 冯志军, 等. 基于小波分解与支持向量机的风速预测模型[J]. 水力发电学报, 2012, 31(1): 208-212 (Zhang Hua, Yu Yongjing, Feng Zhijun, et al. Wind Speed Forecasting Model Based on Wavelet Decomposition and Support Vector Machine[J]. Journal of Hydroelectric Engineering, 2012, 31(1): 208-212)
(0) |
[6] |
钱程, 李连基, 周子东. SVM-RBFNN组合模型在某混凝土双曲拱坝变形监测中的应用[J]. 水电能源科学, 2015(12): 93-95 (Qian Cheng, Li Lianji, Zhou Zidong. Application of SVM-RBFNN Model in Deformation Monitoring of Concrete Double Curvature Arch Dam[J]. Water Resources and Power, 2015(12): 93-95)
(0) |
[7] |
李粉玲, 常庆瑞, 刘佳岐, 等. 基于多纹理和支持向量机的ZY-1 02C星HR数据分类[J]. 武汉大学学报:信息科学版, 2016, 41(4): 455-461 (Li Fenling, Chang Qingrui, Liu Jiaqi, et al. SVM Classification with Multi-Texture Data of ZY-1 02C HR Image[J]. Geomatics and Information Science of Wuhan University, 2016, 41(4): 455-461)
(0) |
[8] |
文鸿雁. 基于小波理论的变形分析模型研究[D]. 武汉: 武汉大学, 2004 (Wen Hongyan. Research on Deformation Analysis Model Based on Wavelet Transform Theory[D]. Wuhan: Wuhan University, 2004) http://cdmd.cnki.com.cn/Article/CDMD-10486-2006035400.htm
(0) |
[9] |
沙磊, 任超, 文鸿雁. 基于小波多尺度分解的周期性变形信息探测[J]. 工程勘察, 2011, 39(8): 73-75 (Sha Lei, Ren Chao, Wen Hongyan. Detection of the Periodical Deformation Information Based on Wavelet Multi-Scale Decomposition[J]. Geotechnical Investigation & Surveying, 2011, 39(8): 73-75)
(0) |
[10] |
Vapnik V N. Statistical Learning Theory[M]. New York: Springer-Verlag, 1998
(0) |
[11] |
赵艳南, 牛瑞卿, 彭令, 等. 基于粗糙集和粒子群优化支持向量机的滑坡变形预测[J]. 中南大学学报:自然科学版, 2015, 5(6): 2324-2332 (Zhao Yannan, Niu Ruiqin, Peng Ling, et al. Prediction of Landslide Deformation Based on Rough Sets and Particle Swarm Optimization-Support Vector Machine[J]. Journal of Central South University:Science and Technology, 2015, 5(6): 2324-2332)
(0) |
[12] |
孟滔, 周新志, 雷印杰. 基于自适应遗传算法的SVM参数优化[J]. 计算机测量与控制, 2016, 24(9): 215-217 (Meng Tao, Zhou Xinzhi, Lei Yinjie. A Parameters Optimization Method for an SVM Adaptive Genetic Algorithm[J]. Computer Measurement & Control, 2016, 24(9): 215-217)
(0) |
2. College of Geomatics and Geoinformation, Guilin University of Technology, 319 Yanshan Street, Guilin 541006, China;
3. Guangxi Scientific Experiment Center of Mining, Metallurgy and Environment, Guilin University of Technology, 319 Yanshan Street, Guilin 541006, China;
4. School of Geodesy and Geomatics, Wuhan University, 129 Luoyu Road, Wuhan 430079, China;
5. Key Laboratory for Digital Land and Resources of Jiangxi Province, East China University of Technology, 418 Guanglan Road, Nanchang 330013, China