扩展功能
文章信息
- 万玉龙, 李新春, 周红标
- WAN Yu-long, LI Xin-chun, ZHOU Hong-biao
- 基于WPD-PSO-ESN的短期交通流预测
- Prediction of Short-term Traffic Flow Based on WPD-PSO-ESN
- 公路交通科技, 2019, 36(8): 144-151
- Journal of Highway and Transportation Research and Denelopment, 2019, 36(8): 144-151
- 10.3969/j.issn.1002-0268.2019.08.018
-
文章历史
- 收稿日期: 2018-01-02
2. 淮安信息职业技术学院 商学院, 江苏 淮安 223003;
3. 淮阴工学院 自动化学院, 江苏 淮安 223003
2. School of Business, Huaian Vocational College of Information Technology, Huai'an Jiangsu 223003, China;
3. School of Automation, Huaiyin Institute of technology, Huai'an Jiangsu, 223003, China
近年来,随着城市建设的快速发展,道路拥挤程度愈发严重,人们的出行压力逐渐加剧,因此迫切需要建立城市智能交通系统(intelligent transportation systems, ITS)。ITS是由众多的子系统组成,其中交通控制子系统是最为关键的子系统之一[1]。在交通控制系统中,为了能够根据实时交通状态实施必要的交通控制信号,首先需要解决的问题就是如何实现短期交通流的精确预测。精准的交通流预测在实时交通信号控制、交通分配、路径自动引导和事故检测等方面起着关键性的作用[2]。同时,交通流的实时精准预测对提高交通运输效率、缓解交通阻塞、减少交通事故和降低能源消耗都有着有十分重要的意义。因此,设计短期交通流预测模型成为近年来的研究热点。
目前,交通流量预测模型主要分为3种[3]:物理模型、统计学模型和智能模型。物理模型主要采用城市经济发展程度、城市人口密集度、城市居民生活规律和其他人文因素等来预测交通流量。如文献[4]建立随机时间序列物理模型,并将其作为统计学模型的输入。统计学模型主要是利用历史交通流数据建立回归模型,具有理论简单,易于实现的特点。文献[5]基于交通流量历史数据,利用递归技术建立统计学方法中的自回归模型(time-varying autoregressive model, ARM)。文献[6]建立了自回归滑动平均模型(auto-regressive and moving average model, ARMAM)。但是,这些统计学模型都是建立在交通流数据规则分布这一假设基础之上的,而实际交通流量时间序列一般具有随机分布特性。文献[7]利用谱分析和统计波动模型构建了交通流的混合预测方法。文献[8]阐明了交通流量的随机性和间歇性,需要利用复杂的函数来表征这种非线性关系,但这些模型都是假定时间序列中存在线性相关结构,导致最终的预测效果难以达到预期目标。智能模型主要是利用人工神经网络、支持向量回归机等人工智能方法来实现短期交通流的精准预测。文献[9]利用前馈神经网络构建了交通流智能预测模型,并与时间序列方法进行了对比分析。文献[10]利用人工神经网络和统计学方法建立城市交通流预测模型。文献[11]利用粒子群优化算法(particle swarm optimization, PSO)和支持向量回归机(support vector regression, SVR)建立了交通流预测的混合模型。
2001年,Haas和Jaeger设计了一种新型的递归神经网络,即回声状态网(echo state network, ESN)[12]。ESN的核心是动态神经元池(dynamic neurons reservoir, DNR)。DNR是由大量完全随机连接的神经元组成,这一点与前馈神经网络全连接形式截然不同。ESN的学习过程简单,只需计算输出权重,因此在时间序列预测中得到了广泛应用[13]。文献[14]采用鲁棒ESN对混沌时间序列进行预测,结果显示ESN的预测效果要明显优于传统的前馈神经网络。文献[15]利用蛙跳算法优化ESN的参数,设计了短期电力负荷预测模型,结果显示参数优化的ESN预测精度比传统ESN更高。考虑到递归神经网络更加适合短期交通流信号的预测,本文采用ESN建立预测模型。
此外,原始的交通流数据一般都含有随机噪声干扰,如果不经处理直接使用,则不可避免地导致预测结果带有噪声信息,降低了预测精准度。因此,为了进一步提高交通流预测的精度,需要对原始交通流时间序列数据进行多尺度分解。研究表明,采用分解技术能够在一定程度上提高交通流预测模型的精度。文献[16]采用经验模态分解(empirical mode decomposition, EMD)和总体经验模态分解(ensemble empirical mode decomposition, EEMD)对电力负荷数据进行预处理,然后结合支持向量机(support vector machine, SVM)构建电力负荷精准预测模型。仿真结果表明EEMD-SVM能够有效地预测具有强非线性特点的混沌时间序列。文献[17]利用小波分解(wavelet decomposition, WD)和小波包分解(wavelet packet decomposition, WPD)对原始风速数据进行分解,然后与前馈神经网络构相集成,从而建立风速预测模型。仿真结果表明基于WPD的预测模型具有更好的预测性能。文献[18]利用WPD对原始电力负荷数据进行处理,然后结合ESN构建电路负荷预测模型。仿真结果显示WPD-ESN的预测精度能够较好地满足电力调度的实际需求。
针对上述问题,本研究首先采用WPD技术对原始交通流数据进行多尺度分解,降低模型的学习难度。由于PSO算法具有原理简单,可调参数少和飞行速度快的优点,因此利用PSO算法对ESN模型的储备池参数进行优化,以期提高ESN的泛化性能。最后,将由PSO-ESN组成的子模型进行有效整合,得到最终的预测结果,从而解决具有强非线性特点的交通流精准预测问题。
1 数学基础 1.1 小波包分解和单支重构小波分解(wavelet decomposition, WD)是由Mallat[19]提出的一种将信号分解成一系列不同频段的子序列的数学方法。对小波进行多分辨分析,把小波函数ϕ(t)记为u1(t),尺度函数φ(t)记为u0(t),即可得出如下的二尺度方程:
(1) |
定义的函数集合{un(t)}n∈Z称为由u0(t)=φ(t)所确定的小波包,其中h(k),g(k)是共轭滤波器系数。设x(t)为L2(R)空间函数,对其离散采样序列{x(p)}p=1, 2, …, N,小波包分解算法为:
(2) |
根据式(2)得到由高、低通组合的一组共轭正交滤波器h,g,把X(P)信号解分到其他各异的频带上这就是小波包分解的全过程[20],如图 1所示。
|
对小波包的细节和尺度空间同时再次分解就是其空间划分,小波包空间划分的作用是:可以获取大量的局部信息;解决了低频空间再次分解和预处理动态序列数据的难题;大大增加了频率的分辨率。将小波包分解之后每个子序列重新构建分解前最初的时间序列又或分解中所需要的尺度序列的这一系列过程就叫单支重构。Mallat算法在小波包分解中应用的结果是:小波包分解层数加大,其序列的长度反而逐渐减半,时域分辨率同时也逐渐降低。为了保证每层小波细节具有与原序列一样的时域分辨率,从而为后续在每个尺度上建立子预测模型,需要对每个尺度进序列行单支重构以保证每个序列长度一样。
1.2 PSO算法粒子群优化算法(particle swarm optimization, PSO)是通过模拟鸟类觅食行为提出的。假定由n个粒子组成的种群X=(X1, X2, …, Xn),其中第i粒子为Xi=(Xi1, Xi2, …, XiD),其表示第i个粒子在D维搜索空间中的位置,即待优化问题的一个潜在的可行解[21]。假设第i粒子速度为Vi=(Vi1, Vi2, …, ViD)T,个体极值为Pi=(Pi1, Pi2, …, PiD)T,种群极值为Pg=(Pg1, Pg2, …, PgD)T。PSO的速度和位置更新公式为:
(3) |
式中,w为惯性权重; c1和c2为加速度因子; r1和r2为[0, 1]之间的随机数; k为当前迭代次数。
1.3 回声状态网络回声状态网(echo state network, ESN)的拓扑结构如图 2所示,其由输入层、动态神经元池和输出层3部分构成[12],是一种新型的递归神经网络。动态神经元池由许多神经元以稀疏和完全随机的方式连接而形成,是ESN的核心部件,也是ESN具有记忆能力的关键所在[22]。
|
设网络输入为u(n)=[u1(n), …, uK(n)]T,状态为x(n)=[x1(n), …, xN(n)]T,输出为y(n)=[y1(n), …, yL(n)]T,其中K为输入维数,N为内部神经元个数,L为输出维数。则:
(4) |
式中,Win为输入权值矩阵;W为内部状态权值矩阵;Wb为输出至内部状态权值矩阵;Wo为内部状态至输出权值矩阵;f=(f1, f2, …, fN)表示内部神经元的激活函数,一般采用sigmoid函数;fo代表输出函数,一般采用线性函数。Win,W和Wb均采用随机方式生成,一旦确定,在学习过程中一般不再改变。因此,对于ESN来说,在训练当中仅需计算Wo的数值即可[12]。
ESN的权重采取如下方法进行训练:假设样本的训练个数是Ns,其输出是Y*=[d1, …, dNs]T,则有:
(5) |
式中,X+=(XTX)-1X表示为X的伪逆,X代表学习过程中内部神经元状态的序列矩阵。ESN通过输入信号激活储备池内部的神经元以产生响应信号,然后对这些响应信号进行线性组合,从而逼近期望输出信号,实现时间序列的精准预测。
2 WPD-PSO-ESN模型预测构建 2.1 模型框架本研究构建的WPD-PSO-ESN交通流预测模型的结构如图 3所示。其工作原理如下:首先,采用WPD把时间序列拆解为低频和高频两个分量,因为低频分量能够获得时间序列相关的信息,同时高频分量能够很好地解决原始ESN模型中矩阵问题;然后,将低频和高频分量同时作为输入信号以激发ESN的状态响应信号,并利用改进的PSO算法优化ESN的参数以提高预测精度;最后,通过各个状态响应信号间的线性组合逼近期望输出。
|
2.2 相空间重构
将交通流量时间序列{u(t), t=1, 2, …, T}扩展到高维空间,彻底显现出该序列所有隐含信息,这就是延迟坐标状态空间重构法,又称为相空间重构[23]。Takens有关相空间重构的观点是,将交通时间序列{u(t), t=1, 2, …, T}嵌入至m维的一个相空间内,能够得出一个新的时间序列X=[x(1), x(2), …, v(n-nstep-(m-1)τ)]T,该新的时间序列与原序列微分的胚相同,还包括:向量x(i)=[u(i), u(i-τ), …, u(n-(m-1)τ)];nstep代表预测步数;τ代表延迟时间。Takens还提出,F(·)映射可以得到:
(6) |
则有
(7) |
由u(t+n)=x(t+n)[1, 0, …, 0]T,若令映射
(8) |
所以,起始的序列数据相重构之后,只要让ESN靠近G(·),则能够通过x(t)解得u(t+n),进而能够直接精准预测。
2.3 PSO-ESN利用PSO算法优化ESN的模型参数,可以有效避免模型陷入局部最优,从而提高模型泛化能力和预测精度。对于PSO算法,惯性权重{un(t)}n∈Z对提高种群的收敛性有着至关重要的作用。因此,本研究利用粒子飞行过程中的状态信息,设计了惯性权重自适应调整策略。具体调整过程如下:
(9) |
式中,fit(pbestit)代表当前第i个粒子最优适应度值; fit(pbestit-1)代表上个时刻第i个粒子最优适应度值。惯性权重自适应调整公式如下:
(10) |
式中
Step1:初始化粒子群,包括加速常数c1和c2、最大迭代次数、种群初始速度和初始位置;将储备池参数隐射为种群中的粒子;
Step2: ESN开始学习,通过相对误差函数计算种群中粒子的适应度值;
Step3:个体最优pi(t)和全局最优g(t)的调整;
Step4:根据公式(10)计算惯性权重;
Step5:根据公式(3)计算粒子的速度与位置;
Step6:将当前迭代步的全局最优g(t)代入ESN,求解ESN的预测误差;
Step7:判断是否达到最大迭代步数,如果达到,则转至Step8,否则转至Step2;
Step8:输出最终的全局最优g(t)作为ESN优化参数的最优解,利用该ESN进行预测,得到预测结果。
2.4 岭回归融合计算在采用PSO-ESN对WPD分解出的8个子序列进行预测后,还需要对各子序列的预测结果进行融合计算,以得到最终的预测结果。具体表达式为:
(11) |
式中,f(·)表示选定的融合策略。本文采取简单的加权平均融合方式,具体公式为:
(12) |
式(13)可以矩阵形式简化表示,
(13) |
其中,
参数β可以通过最小二乘估计确定,即
(14) |
由于参数β病态解的情况经常发生,UTU发生奇异,掺杂入小噪声,UTU矩阵的性质就会发生变化,同时解的性能也会得到改变,模型的质量与噪声的大小有很大的关联性。应用岭回归的方法,则:
(15) |
式中,λ≥0表示岭回归参数; I为单位矩阵。
2.5 WPD-PSO-ESN算法流程Step1:交通流量的时间序列一般使用3层小波包的分解与单支的重构,从而得到WPDi(i=1, 2, …, 8)。
Step2:根据Takens定理进行相空间重构,通过分析交通流量时间序列的自相关系数确定嵌入维度为10,τ设置为1[23]。
Step3:根据单支重构后的序列WPDi(i=1, 2, …, 8)通过PSO分别训练ESNi(i=1, 2, …, 8)。
Step4:求解预测输出
(16) |
式中,系数ai(i=1, 2, …, 8)表示每一层预测分量
Step5:根据式(16)计算权值因子。
3 试验结果 3.1 数据集本研究数据来源于某市某路口2016年6月(工作日)的交通流量数据,采样周期为15 min,每天采集96个数据,如图 4所示。将交通流量数据组成时间序列,共1 728个数据点,如图 5所示。前1 632个样本作为训练集,后96个数据点作为测试集测试模型预测性能。
|
|
3.2 数据预处理
为了避免数据过大,造成神经网络饱和,数据输入网络前需要进行归一化处理,将各数值换算到[0, 1]区间,数据输出显示时还需要进行反归一化,得到真实预测值与实际值进行比较,公式如下:
(17) |
(18) |
式中,xmax和xmin分别表示输入数据的最大值和最小值;yi为数据归一化后的值。
3.3 参数选择采用粒子群算法进行优化时,适应度函数为模型预测值与实际值的绝对差值总和。PSO算法参数设置如下:种群规模M=20,种群初始化的区间为[-20, 20];加速常数c1=c2=1.49;最大迭代次数Nmax=400;变异概率因子P=0.05。
3.4 性能指标为了比较不同算法的性能,本文采用均方误差(mean square error, MSE)、均方根误差(normalized root mean square error, NRMSE)和平均绝对百分比误差(mean absolute percentage error, MAPE)作为评价指标。具体计算公式如下:
(19) |
(20) |
(21) |
式中,T代表样本点总数; y(t)代表预测值; yd(t)代表期望值。
3.5 试验结果与分析首先,采用3层小波包分解将原始交通流量数据分解,然后对分解的子序列进行单支重构,如图 6所示。
|
然后,利用WPD-PSO-ESN模型进行交通流预测,图 7给出了传统PSO-ESN和本研究改进PSO-ESN的适应度曲线。从图 7可以看出,改进PSO-ESN的收敛速度更快,精度也有很大程度的提高。图 8和图 9给出了ESN,PSO-ESN,WPD-PSO-ESN预测结果和预测误差百分比。从图 9可以看出,WPD-PSO-ESN的预测效果要明显好于ESN和PSO-ESN。
|
|
|
表 1给出了各种模型的预测结果。从表 1可以看出,WPD-PSO-ESN模型的NRMSE为0.12,MSE为97.54,MAPE为6.19,与BP神经网络、Elman神经网络、传统ESN以及PSO-ESN等预测模型相比,有较大程度的提高。
预测方法 | NRMSE | MSE | MAPE/% |
BP | 0.34 | 235.91 | 12.91 |
Elman | 0.29 | 211.60 | 12.55 |
SVR | 0.28 | 201.01 | 12.28 |
LSSVR | 0.21 | 136.56 | 10.34 |
ESN | 0.22 | 135.90 | 9.85 |
PSO-ESN | 0.18 | 127.47 | 8.44 |
WPD-PSO-ESN | 0.12 | 97.54 | 6.19 |
4 结论
交通流预测是智能交通控制中的重要一环。为了提高交通流预测的精准性,本研究提出一种基于WPD-PSO-ESN的预测模型。在该模型中,首先采用WPD技术将原始交通流数据分解成低频和高频子序列,并进行单支重构。然后,利用带自适应惯性权重策略的PSO算法优化ESN的关键参数,有利于获取全局最优解,从而构建泛化性能优越的PSO-ESN子模型。最后,通过对各子模型的预测值进行融合计算,得到最终的交通流预测结果。试验结果表明,与误差反传神经网络、Elman神经网络、传统ESN以及PSO-ESN相比,本研究所提的WPD-PSO-ESN预测模型具有较高的预测精度,能够满足实时交通流精准预测的需求,对智能交通系统的设计具有重要的参考价值。
[1] |
ZHANG J P, WANG F Y, WANG K F, et al. Data-driven Intelligent Transportation Systems:A Survey[J]. IEEE Transactions on Intelligent Transportation Systems, 2011, 12(4): 1624-1639. |
[2] |
GUERRERO-IBANEZ J A, ZEADALLY S, CONTRERAS-CASTILLO J. Integration Challenges of Intelligent Transportation Systems with Connected Vehicle, Cloud Computing, and Internet of Things Technologies[J]. IEEE Wireless Communications, 2015, 22(6): 122-128. |
[3] |
CHEN C, LIU Z, LIN W H, et al. Distributed Modeling in a Mapreduce Framework for Data-driven Traffic Flow Forecasting[J]. IEEE Transactions on Intelligent Transportation Systems, 2013, 14(1): 22-33. |
[4] |
SMITH B L, DEMETSKY M J. Traffic Flow Forecasting:Comparison of Modeling Approaches[J]. Journal of Transportation Engineering, 1997, 123(4): 261-266. |
[5] |
SUN Z, FOX G. Traffic Flow Forecasting Based on Combination of Multidimensional Scaling and SVM[J]. International Journal of Intelligent Transportation Systems Research, 2014, 12(1): 20-25. |
[6] |
姚亚夫, 曹锋. 基于ARIMA的交通流量短时预测[J]. 交通科技与经济, 2006(3): 105-107. YAO Ya-fu, CAO Feng. Short-time Traffic Flow Prediction Based on ARIMA[J]. Technology and Economy in Areas of Communications, 2006(3): 105-107. |
[7] |
ZHANG Y, ZHANG Y, HAGHANI A. A Hybrid Short-term Traffic Flow Forecasting Method Based on Spectral Analysis and Statistical Volatility Model[J]. Transportation Research Part C:Emerging Technologies, 2014, 43: 65-78. |
[8] |
CHAN K Y, DILLON T S, CHANG E. An Intelligent Particle Swarm Optimization for Short-term Traffic Flow Forecasting Using On-road Sensor Systems[J]. IEEE Transactions on Industrial Electronics, 2013, 60(10): 4714-4725. |
[9] |
LIPPI M, BERTINI M, FRASCONI P. Short-term Traffic Flow Forecasting:An Experimental Comparison of Time-series Analysis and Supervised Learning[J]. IEEE Transactions on Intelligent Transportation Systems, 2013, 14(2): 871-882. |
[10] |
MORETTI F, PIZZUTI S, PANZIERI S, et al. Urban Traffic Flow Forecasting Through Statistical and Neural Network Bagging Ensemble Hybrid Modeling[J]. Neurocomputing, 2015, 167: 3-7. |
[11] |
HU W, YAN L, LIU K, et al. A Short-term Traffic Flow Forecasting Method Based on the Hybrid PSO-SVR[J]. Neural Processing Letters, 2016, 43(1): 155-172. |
[12] |
JAEGER H, HAAS H. Harnessing Nonlinearity:Predicting Chaotic Systems and Saving Energy in Wireless Communication[J]. Science, 2004, 304(5667): 78-80. |
[13] |
YUENYONG S, NISHIHARA A. Evolutionary Pre-training for CRJ-type Reservoir of Echo State Networks[J]. Neurocomputing, 2015, 149: 1324-1329. |
[14] |
LI D, HAN M, WANG J. Chaotic Time Series Prediction Based on A Novel Robust Echo State Network[J]. IEEE Transactions on Neural Networks and Learning Systems, 2012, 23(5): 787-799. |
[15] |
DEIHIMI A, ORANG O, SHOWKATI H. Short-term Electric Load and Temperature Forecasting Using Wavelet Echo State Networks with Neural Reconstruction[J]. Energy, 2013, 57: 382-401. |
[16] |
王新, 孟玲玲. 基于EEMD-LSSVM的超短期负荷预测[J]. 电力系统保护与控制, 2015, 43(1): 61-66. WANG Xin, MENG Ling-ling. Ultra-short-term Load Forecasting Based on EEMD-LSSVM[J]. Power System Protection and Control, 2015, 43(1): 61-66. |
[17] |
LIU H, TIAN H, PAN D, et al. Forecasting Models for Wind Speed Using Wavelet, Wavelet Packet, Time Series and Artificial Neural Networks[J]. Applied Energy, 2013, 107: 191-208. |
[18] |
周红标, 王乐, 卜峰, 等. 基于PSO-WPESN的短期电力负荷预测方法[J]. 电测与仪表, 2017, 54(6): 113-119. ZHOU Hong-biao, WANG Le, BU Feng, et al. Short-term Power Load Forecasting Method Based on PSO-WPESN[J]. Electrical Measurement and Instrumentation, 2017, 54(6): 113-119. |
[19] |
MALLAT S, ZHONG S. Characterization of Signals From Multiscale Edges[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1992(7): 710-732. |
[20] |
ALVES D K, COSTA F B, DE ARAUJO RIBEIRO R L, et al. Real-time Power Measurement Using the Maximal Overlap Discrete Wavelet-packet Transform[J]. IEEE Transactions on Industrial Electronics, 2016, 64(4): 3177-3187. |
[21] |
POLI R, KENNEDY J, BLACKWELL T. Particle Swarm Optimization[J]. Swarm Intelligence, 2007, 1(1): 33-57. |
[22] |
许美玲, 韩敏. 多元混沌时间序列的因子回声状态网络预测模型[J]. 自动化学报, 2015, 41(5): 1042-1046. XU Mei-ling, HAN Min. Factor Echo State Network for Multivariate Chaotic Time Series Prediction[J]. Acta Automatica Sinica, 2015, 41(5): 1042-1046. |
[23] |
DELAFROUZ H, GHAHERI A, GHORBANI M A. A Novel Hybrid Neural Network Based on Phase Space Reconstruction Technique for Daily River Flow Prediction[J]. Soft Computing, 2018, 22(7): 2205-2215. |