测绘地理信息   2019, Vol. 44 Issue (6): 110-113
0
一种变系数的ARIMA和GM(1, 1)组合高铁沉降预测模型[PDF全文]
李广源1,2, 花向红1,2, 韩浩然1,2, 续东1,2    
1. 武汉大学测绘学院, 湖北 武汉, 430079;
2. 武汉大学灾害监测和防治研究中心, 湖北 武汉, 430079
摘要: 根据高铁沉降监测和预测特点,提出了一种变系数的ARIMA和GM(1, 1)组合高铁沉降预测模型,给出了组合高铁沉降预测模型实施步骤。通过某一高铁沉降监测数据,对单一模型和组合模型预测进行分析比较,结果表明, 采用变系数组合模型求出的预测值精度更高。
关键词: 高速铁路     ARIMA     GM(1, 1)     组合预测模型     沉降预测    
A Changeable Coefficient Combination Model Based on ARIMA and GM (1, 1) in the Deformation of High-Speed Rail
LI Guangyuan1,2, HUA Xianghong1,2, HAN Haoran1,2, XU Dong1,2    
1. School of Geodesy and Geomatics, Wuhan University, Wuhan 430079, China;
2. Hazard Monitoring and Prevention Research Center, Wuhan University, Wuhan 430079, China
Abstract: According to the characteristics in thedeformation of high-speed railway, we present a changeable coefficient combinationmodel based on ARIMA and GM (1, 1) to predict high-speed railway settlement, and provide the steps in detail to build this model. A specific combination model based on the data of a high-speed railway project has been built. Comparing to the result of single model, it suggests that the changeable coefficients combination model has more accuracy and has more practicality.
Key words: high-speed railway     ARIMA     GM (1, 1)     combined forecasting model     settlement prediction    

中国高速铁路正处于快速发展阶段,高速铁路线路的平顺性对高速列车安全行车至关重要,线下工程结构的沉降变形必须进行严格控制,其中最主要的是线路纵向的不均匀沉降。因此,对高速铁路进行高精度的沉降变形观测和沉降预测,能够确保高速铁路的施工和安全运营。考虑到高铁沉降变形是一个非线性动态系统,涉及到自身结构和外界环境多种因素,实际工程中难以应用单一的模型进行沉降变形规律分析,而组合几种单一模型进行预测,可以顾及不同模型的优点,形成具有较高精度的预测效果[1]。时间序列分析模型是利用数据之间存在的自相关关系,对动态数据处理比较理想[2];灰色模型能有效解决贫信息建模问题,对不完全确知数据列能有效寻求内在的有序性[3]。本文根据高铁沉降监测和预测特点,将时间序列分析中的ARIMA(autoregressive integrated moving average model)模型和灰色模型中的GM(1, 1)模型一起构建组合模型,提出了一种变系数的ARIMA和GM(1, 1)组合高铁沉降预测模型,对沉降量具有理想的预测精度。

1 高铁沉降预测组合模型

在高铁沉降预测中,某一期的预测值可由n种模型确定[4],设每种模型确定的预测值为${\widehat Y_i}\left( {i = 1, 2, 3, \cdots } \right)$,该模型的系数为Wi,则组合预测模型[5]在该期为$\widehat Y = \sum\limits_{i = 1}^n {{W_i}} {\widehat Y_i}$。设Ei为第i个模型的预测误差即${E_i}{\rm{ = }}Y - {\widehat Y_i}$,其中Y为实测值。设E为组合模型的预测误差,即$E{\rm{ = }}Y - \widehat Y$

对于组合模型而言,关键在于确定其各模型系数,目前对于组合模型确定系数的方法主要3种:①以相对误差最大值达到最小为目标函数建立模型;②以绝对误差和达到最小为目标函数建立模型;③以误差平方和达到最小为目标函数建立模型[6]

误差平方和最小准则:目标函数$\sum\limits_{i = 1}^n {{{\left( {{W_i}{E_i}} \right)}^2}} $为最小,$\sum\limits_{i = 1}^n {{W_i} = 1} $时,根据目标函数便可确定各预测模型在建模点处的系数Wi

绝对误差和最小准则:目标函数$\sum\limits_{i = 1}^n {\left| {{W_i}{E_i}} \right|} $为最小,$\sum\limits_{i = 1}^n {{W_i} = 1} $时,同样,根据目标函数便可确定各预测模型在建模点处的系数Wi

本文采用ARIMA和GM(1, 1)模型进行组合预测[7, 8],其实现步骤如下:

1) 单一模型的建立。①ARIMA模型:对于非平稳的时间序列,通过差分将其转化为平稳的时间序列。如果一个时间序列{xt}的d次差分{Wt}是平稳的ARMA过程,且{Wt}服从ARMA(p, q)模型,则称{xt}服从ARIMA(p, d, q)模型。数据经过预处理后,形成平稳序列,利用R语言,通过自相关函数和偏自相关函数的变化特点,确定AR(p)和MA(q)的阶数,由此确定合适的ARIMA预测模型。②GM(1,1)模型:对原始数据x(0)进行一次累加生成x(1),对x(1)建立一阶微分方程求解灰参数,通过累减还原得到x(0)预测模型${\widehat x^{\left( 0 \right)}}\left( {k + 1} \right) = \left( {1 - {{\rm{e}}^a}} \right)\left( {{{\widehat x}^{\left( 0 \right)}}\left( 1 \right) - u/a} \right){{\rm{e}}^{ - ak}}$

2) 样本处组合模型最优系数的确定。利用建立的ARIMA模型和GM(1, 1)模型预测样本点的沉降量为${\widehat Y_{{\rm{ARIMA}}}}$${\widehat Y_{{\rm{GM}}\left( {1, 1} \right)}}$。由此可得ARIMA模型和GM(1, 1)模型在样本点的预测误差为EARIMAEGM(1, 1)

根据若${\sum\limits_{i = 1}^n {\left( {{W_i}{E_i}} \right)} ^2}$为最小,则$\sum\limits_{i = 1}^n {{W_i}} = 1$或者$\sum\limits_{i = 1}^n {\left| {{W_i}{E_i}} \right|} $为最小,$\sum\limits_{i = 1}^n {{W_i} = 1} $准则确定各单一模型样本点处最优组合系数WARIMAWGM(1, 1)

3) 预测处组合模型系数的确定。得到单一模型样本处系数序列Wi(i=1, 2, …, t)后,进行预测点处的系数预测生成,设模型的第t+1期的预测系数Wi, t+1,预测系数为:

$ \left\{ {\begin{array}{*{20}{c}} {{W_i}_{, t + 1} = \frac{1}{t}\sum\limits_{t = 1}^t {{W_i}} }\\ {{W_i}_{, t + 2} = \frac{1}{t}\sum\limits_{t = 2}^t {{W_i}} }\\ \vdots \\ {{W_i}_{, t + j} = \frac{1}{t}\sum\limits_{t = j - 1}^{t + j - 1} {{W_i}} } \end{array}} \right. $ (1)

这种确定预测系数方法的适用于样本量较少,或者系数无明显规律性的情况。

4) 组合预测模型的检验。利用单一模型在预测点处的预报值和生成的系数构建组合模型。因此在预测处的组合模型为$\widehat Y = {W_{{\rm{ARIMA}}}} \times {\widehat Y_{{\rm{ARIMA}}}} + {W_{{\rm{GM}}\left( {{\rm{1, 1}}} \right)}} \times {\widehat Y_{{\rm{GM}}\left( {{\rm{1, 1}}} \right)}}$。代入相关数值得到组合模型预测值,与单一模型预测值和实际沉降量进行比较。在本文中采用预测值绝对误差和、误差平方和这两个精度指标进行评定分析。

2 工程实例与预测精度分析

为了考察变系数的ARIMA和GM(1, 1)组合高铁沉降预测模型的效果,选取武汉某高铁桥墩17期的沉降观测数据进行分析,前15期作为建模样本,后两期进行预测检核。作出沉降曲线如图 1所示,纵轴为累计沉降量,单位为mm,横轴为期数。

图 1 沉降曲线图 Fig.1 Settlement Curve

1) ARIMA(pdq)模型。对15期数据进行平稳处理,做一阶差分得到平稳数据序列如图 2所示。对处理后的数据序列进行自相关函数和偏自相关函数的截尾性和拖尾性判断,粗估计ARIMA模型的pq

图 2 一次差分图 Fig.2 Once Differential of Settlement

贝叶斯信息准则(Bayesian information criterion,BIC)是判断ARIMA模型常用的准则,BBIC=-2lg(a)+klgn,式中,a为极大似然估计量, n为样本的有效容量, k为除去噪声方差后总的参数数量。以BBICmin为准则确定ARIMA模型的最适阶数,此实例中选用模型为ARIMA(2, 1, 0)。应用最小二乘估计求解模型参数为φ1=1.569 3,φ2=-0.151 2,φ3=-0.418 1。序列x最小均方误差预测形式为:

$ x\left( k \right) = 1.569\;3x\left( {k - 1} \right) - 0.151\;2x\left( {k - 2} \right) - 0.418\;1x\left( {k - 3} \right) + {a_k} $ (2)

2) GM(1,1)模型。对原始序列第11期~第15期进行一次累加生成,得到新生成数据列,进行紧邻均值生成构建B矩阵,通过最小二乘估计求出白化值a=-0.076 7,u=8.500 3,累减还原得到预测第16期和第17期的模型为:

$ {x^0}\left( {k + 1} \right) = \left( {1 - {{\rm{e}}^{ - 0.076\;7}}} \right)\left( {{x^0}\left( 1 \right) - 8.500\;\;3/a} \right){{\rm{e}}^{0.076\;\;7k}} $ (3)

3) 模型样本点处反向预测分析生成系数。对时间序列模型和灰色模型样本点进行反向预测分析,得出第6期~第15期模型反向预测值和残差值,根据误差平方和最小准则和绝对误差和最小准则生成组合模型的系数,如表 1所示。

表 1 模型反向预测值、模型内符合残差和两种准则的模型系数 Tab.1 Model Reserve Predictive Values and Internal Accord Accuracy of the Model and Generation of Model Coefficients for Two Criteria

表 1可以看出,ARIMA模型的内符合性优于GM(1, 1)模型。由误差平方和最小准则和绝对误差和最小准则确定的各期系数,运用式(1)推导出预测期系数如表 2所示。

表 2 预测期数处的组合系数 Tab.2 Combination Coefficients at the Forecast Period

利用误差平方和最小准则预测的第16期和第17期的组合模型为:

$ \left\{ {\begin{array}{*{20}{c}} {{{\widehat Y}_{16}} = 0.836\;8{{\widehat Y}_{{\rm{ARIMA}}}} + 0.163\;2{{\widehat Y}_{{\rm{GM}}}}\left( {1, 1} \right)}\\ {{{\widehat Y}_{17}} = 0.916\;9{{\widehat Y}_{{\rm{ARIMA}}}} + 0.083\;1{{\widehat Y}_{{\rm{GM}}}}\left( {1, 1} \right)} \end{array}} \right. $ (4)

利用绝对误差和最小准则预测的第16期和第17期的组合模型为:

$ \left\{ {\begin{array}{*{20}{c}} {{{\widehat Y}_{16}} = 0.782\;9{{\widehat Y}_{{\rm{ARIMA}}}} + 0.217\;1{{\widehat Y}_{{\rm{GM}}}}\left( {1, 1} \right)}\\ {{{\widehat Y}_{17}} = 0.884\;8{{\widehat Y}_{{\rm{ARIMA}}}} + 0.115\;2{{\widehat Y}_{{\rm{GM}}}}\left( {1, 1} \right)} \end{array}} \right. $ (5)

模型预测值和预测误差如表 3所示。

表 3 模型预测值和预测误差 Tab.3 Model Predictions and Prediction Errors

表 3中可以看出,在单一模型下,ARIMA的预测精度要高于GM(1, 1)模型。组合模型中,不同准则决定的模型的精度也有很大不同,根据误差平方和最小确定的预测模型精度比绝对误差和最小确定的预测模型精度高。

3 结束语

本文根据某一高铁沉降监测实例,分析了各单一模型和基于不同准则的组合模型的预测效果。当某一精度差的模型和某一精度高的模型组合时,组合精度可能会低于单一高精度模型的精度,通过对定系数准则的不同选取,可以减弱这种影响,并具有良好的预测效果。经过验证得出,基于ARIMA和GM(1, 1)的组合模型在误差平方和最小的系数的准则下,能够满足沉降数据的预测,通过对往期样本数据建模,可以分析出高铁在施工中的沉降变形情况,保证施工安全。

参考文献
[1]
Moustaoui M, Joseph B, Teitelbaum H. Mixing Layer Formation Near the Tropopause Due to Gravity Wave-Critical Level Interactions in a Cloud-Resolving Model[J]. Journal of the Atmospheric Sciences, 2004, 61(24): 3 112-3 124. DOI:10.1175/JAS-3289.1
[2]
Uccellini L W, Koch S E. The Synoptic Setting and Possible Energy Sources for Mesoscale Wave Distur-bances[J]. Monthly Weather Review, 1987, 115(3): 721-729. DOI:10.1175/1520-0493(1987)115<0721:TSSAPE>2.0.CO;2
[3]
梁晨, 薛向辉, 陈廷娣. 基于COSMIC卫星观测数据的平流层重力波的全球分布特征研究[J]. 地球物理学报, 2014, 57(11): 3 668-3 678.
[4]
刘丽, 梁月, 徐晓华, 等. 利用星载GPS无线电掩星数据分析全球水汽分布[J]. 测绘地理信息, 2014, 39(1): 19-22.
[5]
徐晓华, 高攀, 张小红. 利用COSMIC掩星弯曲角数据分析中国区域对流层顶结构变化[J]. 地球物理学报, 2013, 56(8): 2 531-2 541.
[6]
徐晓华, 郭金城, 罗佳. 利用COSMIC掩星资料分析大气重力波参数的全球分布特征[J]. 武汉大学学报·信息科学版, 2015, 40(11): 1 493-1 498.
[7]
Khan A, Jin Shuanggen. Effect of Gravity Waves on the Tropopause Temperature, Height and Water Vapor in Tibet from COSMIC GPS Radio Occultation Observations[J]. Journal of Atmospheric and Solar-Terrestrial Physics, 2016, 138/139: 23-31. DOI:10.1016/j.jastp.2015.12.001
[8]
Faber A, Llamedo P, Schmidt T, et al. On the Determination of Gravity Wave Momentum Flux from GPS Radio Occultation Data[J]. Atmospheric Measurement Techniques, 2013, 6(11): 3 169-3 180. DOI:10.5194/amt-6-3169-2013
[9]
Madineni V R, Tetzlaff G, Jacobi C. Global and Seasonal Variations of Stratospheric Gravity Wave Activity Deduced from the CHAMP/GPS Satellite[J]. Journal of the Atmospheric Sciences, 2004, 61(13): 1 610-1 620. DOI:10.1175/1520-0469(2004)061<1610:GASVOS>2.0.CO;2
[10]
Lindzen R S. Turbulence and Stress Owing to Gravity Wave and Tidal Breakdown[J]. Journal of Geophysical Research, 1981, 86(C10): 9 707-9 714. DOI:10.1029/JC086iC10p09707
[11]
Alexander P, Torre A D L. A Method to Infer the Three Cartesian Wavelengths of a Mountain Wave from Three Soundings[J]. Journal of Applied Meteo-rology and Climatology, 2010, 49(9): 2 069-2 074. DOI:10.1175/2010JAMC2348.1