扩展功能
文章信息
- 胡郁葱, 吴昊, 黄靖翔, 吕洪燕, 张筑杰
- HU Yu-cong, WU Hao, HUANG Jing-xiang, LÜ Hong-yan, ZHANG Zhu-jie
- 基于支持向量回归的高速公路路段平均速度估计方法
- A Method for Estimating Expressway Section Average Speed Based on Support Vector Regression
- 公路交通科技, 2019, 36(3): 137-143, 151
- Journal of Highway and Transportation Research and Denelopment, 2019, 36(3): 137-143, 151
- 10.3969/j.issn.1002-0268.2019.03.020
-
文章历史
- 收稿日期: 2018-04-17
2. 现代城市交通技术江苏高校协同创新中心, 江苏 南京 210096;
3. 广州国交润万交通信息有限公司, 广东 广州 510665
2. Jiangsu Province Collaborative Innovation Center of Modern Urban Traffic Technologies, Nanjing Jiangsu 210096, China;
3. Guangzhou Guojiao Run One Traffic Information Co., Ltd., Guangzhou Guangdong 510665, China
高速公路路段平均速度指单位时间段内,指定方向通过高速公路某一路段的交通车辆平均行程速度,能直观反映高速公路路段的实际运行状况,对高速公路的出行者和管理部门都具有重要的意义。目前,我国高速公路主要采用布设在某断面处的车辆检测器、高清摄像头等设备直接获取通过该断面的车辆平均速度,然而,这些设备的布设密度一般较低,导致所采集的数据覆盖范围小,且存在损坏率高、维护不及时的问题,无法真实反映高速公路系统的运行状态。因此,国内外专家学者开始研究使用检测器数据以外的其他数据源估计高速公路路段平均速度的方法,如翁剑成等[1]、沈旅欧等[2]沈强[3]都分别提出从收费数据中获取路段行程速度的计算模型;Cesar A.Quiroga[4],Rui Wang等[5]分别提出了基于浮动车定位数据的行程速度估计算法,S H Lee[6]等在此基础上做了改进,提出了基于模式分类的行程速度估计方法;何兆成等[7]在前人的基础上提出自适应估计模型估计高速公路区间平均速度;廖孝勇[8]、唐克双等[9]也分别对利用浮动车数据估计区间平均速度的方法提出了一定的改进策略。上述研究虽然有效避免了车检器覆盖范围小的问题,但是收费数据具有滞后性,受匝道长度影响,而浮动车数据具有检测目标随机性的缺陷,因此也还不能完全准确地反映实际的交通状态。
随着计算机技术的发展,多源数据的融合方法受到越来越多的研究者关注。与单一数据源相比,通过多源数据融合获得的结果将具有更高的准确性和可靠性。在高速公路路段平均速度估计方面,Kong Q J等[10]使用基于卡尔曼滤波和证据理论的融合算法,将车检器数据和浮动车数据进行融合计算,获得路段平均速度,并以实例证明融合结果更准确;解少博[11]等利用模糊线性回归方法建立了小轿车第85百分位运行车速区间预测模型, 该模型明显优于传统的线性回归方法;李慧兵等[12]分别提出BP神经网络融合模型,将车检器和浮动车采集的数据进行融合;在此基础上,Li R M等[13]提出了一种基于BP神经网络和D-S证据理论的路段平均速度融合方法,提高了模型精度;丁宏飞等[14]利用鱼群算法优化支持向量回归,提出融合车检器速度和浮动车速度的路段平均速度估计方法;尹春娥等[15]提出了基于混合粒子滤波的高速公路交通参数自适应估计方法,使估计模型更加稳定。
总结前人的研究成果,发现现有融合算法依然较多地在检测器数据的基础上进行优化,而检测器密度稀疏且损坏率较高是当前高速公路数据采集的硬伤,有必要研究避开检测器数据而能通过其他数据融合获取平均速度的方法。通过对高速公路收费数据和浮动车数据进行比较发现:收费数据具有车辆信息全面可靠、辐射路网范围广的优点,却存在滞后性、受道路匝道影响较大的缺陷,而浮动车数据则具有实时性好,路网分布相对均匀分散的优点,却存在检测目标随机性、对象不全面的缺陷,可见它们之间能够很好地优势互补,互相佐证。因此,本研究在前人的研究基础上,尝试采取支持向量回归对通过收费数据和浮动车数据获取的路段平均速度进行融合修正,并利用实际数据验证该方法的有效性。
1 路段平均速度估计方法 1.1 基本定义本研究的对象为路段平均速度,为便于讨论,提出如下定义:(1)将高速公路收费站抽象为“节点”;(2)相邻节点间的高速公路路段构成“基本路段”,不相邻的节点间高速公路路段构成“复合路段”,统称为“路段”;(3)本研究所研究路段平均速度指单位时间内通过“基本路段”的所有车辆平均行程速度。图 1为包括K个节点和K-1个基本路段的高速公路示意图,si, j即为高速公路路段,当i+1=j时,表示基本路段。
![]() |
图 1 高速公路基本路段示意图 Fig. 1 Schematic diagram of basic sections of expressway |
|
1.2 基于收费数据的路段平均速度估计方法
高速公路收费数据详细记录了车辆进出口收费站的编号和时间等信息,如表 1所示,可通过算法计算出路段平均速度。
入口编号 | 入口日期 | 入口时间 | 出口编号 | 出口日期 | 出口时间 |
1022 | 160701 | 14:05 | 2002 | 160701 | 15:30 |
1104 | 160701 | 12:22 | 2002 | 160701 | 15:30 |
1101 | 160701 | 13:01 | 2002 | 160701 | 15:31 |
1027 | 160701 | 13:55 | 2002 | 160701 | 15:33 |
3015 | 160701 | 15:02 | 2002 | 160701 | 15:40 |
本研究采取基于轨迹法的修正算法[2]求取基本路段速度,处理步骤简要叙述如下。
(1)计算基本路段平均行程时间
经过数据有效性处理后,获得从时间区间p内出发,在路段si, j上行驶的车辆平均行程时间
![]() |
(1) |
式中,i, j分别为高速公路入口和出口;ti, j, np, fee为从时间区间p出发的车辆n在i, j之间的收费系统记录行程时间;Ni, jfee为筛选后的对应时间和出入口行驶的车辆数。
(2) 获取行程时间二维表
将一天划分为P个时段,同一个时间区间p(p=1, 2, …, P)的路段行程时间按优先级排序方法排列成一个一维列向量,其中入口i的优先级大于出口j的优先级,即
T1 | T2 | ⋯ | Tp | ⋯ | TP | |
(1, 2) | ![]() |
![]() |
⋯ | ![]() |
⋯ | ![]() |
(1, 3) | ![]() |
![]() |
⋯ | ![]() |
⋯ | ![]() |
⋮ | ⋮ | ⋮ | ⋯ | ⋮ | ⋯ | ⋮ |
(k-1, k) | ![]() |
![]() |
⋯ | ![]() |
⋯ | ![]() |
⋮ | ⋮ | ⋮ | ⋯ | ⋮ | ⋯ | ⋮ |
(K-1, K) | ![]() |
![]() |
⋯ | ![]() |
⋯ | ![]() |
(3) 计算基本路段的修正行程时间
利用收费数据计算得到的路段行程时间也包括了在收费站排队和通过的延误时间,这部分实际上不是车辆基本路段行程时间的一部分。为减少这部分时间带来的计算误差,引入“修正权重”的概念,每一个行程时间对应一个修正权重。经过简单分析可以得知,车辆实际行驶距离越长,在基本路段行驶的距离也越长,相应计算出的行程时间中车辆在基本路段上实际行驶时间的比例越大,计算得出的行程时间越接近实际的行程时间。
从节点k到节点k+1的基本路段sk, k+1旅程时间修正算法如下:
① 当k=1时,
![]() |
(2) |
式中,p为车辆从节点1出发时所处的时间区间;X为车辆从节点1于时间区间p出发达到节点2时所处的时间区间,可根据表 2中的数据获得;li, j为高速公路路段si, j对应的长度;
![]() |
(3) |
② 当2≤k≤K-2时,
![]() |
(4) |
式中,p为车辆从当前节点k出发时所处的时间区间;ri(i=1, 2, …, k-1)为从节点上游k-1个节点出发的车辆出发时间区间,表示由时间区间ri上游i节点出发的车辆行驶到节点k时所处的时间区间恰为p,而q为由时间区间p从节点k出发的车辆到达下游节点k+1时所处的时间区间;与W1, 2一致,Wk, k+1为车辆行驶的路程之和,通过下式计算:
![]() |
(5) |
③ 当k=K-1时,
![]() |
(6) |
式中,p为车辆从当前节点K-1出发的时间区间;ri(i=1, 2, …, K-1)为K-1节点的上游K-2个节点出发的车辆出发时间区间,表示由时间区间ri上游i节点出发的车辆行驶到节点K-1时所处的时间区间恰为p;WK-1, K为车辆行驶的路程之和,通过下式计算:
![]() |
(7) |
(4) 计算路段平均速度
通过上述修正行程时间,可计算出路段sk, k+1的平均速度
![]() |
(8) |
式中,lk, k+1为基本路段sk, k+1的长度。
收费数据能收集所有OD对行程时间和绝大多数车辆的运行状况,所获得的路段平均速度可靠性高,但因为收费数据需车辆驶离高速公路时才能收集,因此具有滞后性。此外,车辆进出高速时需要经过匝道,因此收费数据所记录的行驶时间较实际主线行驶时间更长。为弥补上述两个缺陷,需引入路段上的实时数据作为第二数据源,共同确定路段平均速度,以减小因收费数据本身缺陷而产生的误差。
1.3 基于浮动车数据的路段平均速度估计方法将在高速公路上行驶的“两客一危”车辆作为浮动车,利用其北斗卫星定位系统数据(简称“BDS”数据),一方面可获取较高的浮动车比例,保证路段平均速度的估计精度,另一方面具有数据来源成本低,覆盖程度高等优点。本研究利用速度-时间积分模型[7]对单车行程速度进行估计,再对单一浮动车作加权平均获得路段平均速度。
(1)单一浮动车路段行程速度
本研究采用速度-时间积分法[3],计算单一浮动车路段行程速度。图 2为时间区间p内研究路段sk, k+1上的浮动车数据返回点分布情况,1和M分别为浮动车q在路段sk, k+1上的第一个和最后一个定位点编号。
![]() |
图 2 路段sk, k+1上的浮动车定位点分布 Fig. 2 Distribution of location points of floating car on section sk, k+1 |
|
定义:lk, k+1, qp, probe为p时间区间内浮动车q在路段sk, k+1上行驶的有效定位距离;时间序列tk, k+1, qp, probe(1), …tk, k+1, qp, probe(M)和速度序列vk, k+1, qp, probe(1), …,vk, k+1, qp, probe(M)分别为浮动车q在路段sk, k+1上的对应定位点的时间和速度信息。则lk, k+1, qp, probe的计算公式为:
![]() |
(9) |
则浮动车q在路段sk, k+1上行驶的平均行程速度
![]() |
(10) |
(2) 路段平均速度
将时间区间p内路段sk, k+1上各浮动车的平均行程速度
![]() |
(11) |
![]() |
(12) |
![]() |
(13) |
式中,αk, k+1, qp为浮动车q在研究路段sk, k+1上行驶的有效距离lk, k+1, qp, probe与路段长度lk, k+1的比值;ωk, k+1, qp为浮动车q的归一化权重;Nk, k+1probe为研究时段p内经过路段sk, k+1的浮动车数量。
值得注意的是,本研究数据来源是广东省广乐高速公路,该高速公路实现了对“两客一危”车辆的全程监控,覆盖范围广,数据成本低,且能够实时获取车辆的位置、速度、行驶方向等信息,这些信息可以良好地反映对应路段的区间速度,因此将“两客一危”数据替代小汽车数据,计算路段的区间平均速度。
2 路段平均速度融合方法设计 2.1 融合方法选取基于收费数据的路段平均速度推算方法具有滞后性,而基于“两客一危”BDS的浮动车推算方法仅能获取“两客一危”大型车的行程速度,因此本研究提出使用融合算法对这两类单一数据源处理出来的结果进行融合。现有融合算法中,卡尔曼滤波法可能出现滤波不稳定等问题,并需要指定初始状态;D-S证据推理法计算的复杂度增长过快,而且是非精确的推理算法;Bayes方法依赖于先验概率和条件概率,获取困难;人工神经网络方法需要大量学习样本,而且也容易陷入局部最优。与它们相比,支持向量回归[13](Support Vector Regression,SVR)具有以下优点:(1)SVR是专门针对小样本问题提出的,可以在有限样本的情况下获得最优解,而“两客一危”车辆相比小汽车,样本量相对较少,这使得SVR具有更明显的优势;(2)SVR算法最终将转化为一个二次规划问题,可以解决传统神经网络无法避免局部最优的问题;(3)SVR的拓扑结构由支持向量决定,避免了传统神经网络需要反复试凑确定网络结构的问题;(4)SVR利用非线性变换将原始变量映射到高维特征空间,可保证模型具有良好的泛化能力,同时解决“维数灾难”。
2.2 支持向量回归基本原理SVR方法是Vapnik等[16]人在支持向量机分类的基础上引入不敏感瞬时函数得到的回归方法,其基本思想是:通过事先定义的非线性映射ϕ:Rn→Rm(m≥n),把输入空间的数据x映射到一个高维特征空间,然后在该空间中做线性回归,寻找一个最优分类面使得所有训练样本离该最优分类面的误差最小,从而找到原问题的支持向量,实现高维空间中的线性回归,完成预测。
图 3为SVR的结构,从中可以看出其结构与神经网络的结构较为相似,其输出是中间节点的线性组合,每一个中间节点对应一个支持向量。K(xi, x)=φ(xi)φ(x)称为核函数。
![]() |
图 3 SVR结构示意图 Fig. 3 Schematic diagram of SVR structure |
|
2.3 融合方法设计
本研究采用SVR进行数据融合,将基于收费数据和基于浮动车获得的路段平均速度作为模型的输入,输出融合后的路段平均速度,处理收费系统中的收费数据[17],将其作为基础路段平均速度真值,用以模型的训练与评价,具体步骤如图 4所示。
![]() |
图 4 基于支持向量回归的融合方法建模流程图 Fig. 4 Flowchart of fusion method based on support vector regression |
|
数据预处理后,在现有样本集中,随机产生训练集和测试集,采用较为经典的径向基函数(Radial Basis Function, RBF)作为核函数[18],利用交叉验证方法寻找最佳的参数(惩罚因子和RBF核函数中的方差);再将测试集中的两类路段平均速度输入向量机中,将预测值与真实值进行比较,计算均方误差(E)和决定系数(R2)两项评价指标,以评判模型的估计准确性。具体计算公式如下所示:
![]() |
(14) |
![]() |
(15) |
式中,l为测试集样本个数;yi(i=1, 2, …, l)为第i个样本的真实值;
为验证模型有效性,本研究使用广东省广乐高速南行方向共18个基本路段,2016年11月6日8:00—21:00的收费数据和“两客一危”卫星定位数据,其中收费数据共计3 712条,卫星定位数据5.6万条。按照1.2节和1.3节的方法对数据进行预处理,以30 min间隔,共处理出路段平均速度468组,随机选择400组数据作为模型的训练样本集,剩余68组数据作为测试样本集。
采用本研究所提出的融合模型,对路段平均速度进行预测时,确定RBF函数参数方差σ和惩罚因子C在范围[-10, 10]内寻优,不敏感损失系数ε=5。
3.2 模型结果和效果评价本研究利用Matlab 2014 a软件实现数据融合。经过400组数据的模型训练后,创建SVR模型,并输出测试集的融合结果,拟合结果如图 5所示,均方误差E=0.003 5,可决系数R2=0.977,表明模型融合结果与实际数据拟合程度高,模型效果良好。表 3为部分测试集的数据与相应真实值对比后得到的平均相对误差,从中可以看出,与单一数据源的估计速度相比,融合后的速度具有更小的相对误差,即融合结果更接近真实值。
![]() |
图 5 测试集结果对比 Fig. 5 Comparison of test set results |
|
序号 | 收费数据计算出 的路段平均速度 相对误差/% | 浮动车数据计算出 的路段平均速度 相对误差/% |
SVR融合后的路段 平均速度相对 误差/% |
1 | 0.40 | 0.26 | 0.11 |
2 | 13.31 | 5.18 | 0.43 |
3 | 13.72 | 5.07 | 0.64 |
4 | 8.98 | 5.98 | 1.40 |
5 | 29.96 | 12.84 | 0.18 |
6 | 8.82 | 3.95 | 0.00 |
7 | 25.69 | 12.66 | 1.22 |
8 | 9.19 | 3.06 | 0.75 |
9 | 4.39 | 1.79 | 0.18 |
10 | 15.76 | 4.19 | 1.86 |
⋯ | ⋯ | ⋯ | ⋯ |
均值 | 17.71 | 7.45 | 1.30 |
本研究还分别以15,45 min和60 min作为统计间隔,使用上述融合方法进行路段平均速度估计,结果见表 4。可见模型估计效果与统计间隔大小有关,时间间隔越大,误差越大,当统计间隔为30 min以下时,估计结果更为精确。
统计间隔/ min |
训练集 大小/组 |
测试集 大小/组 |
均方误差 E |
可决系数 R2 |
相对误差 均值/% |
15 | 800 | 136 | 0.003 5 | 0.975 | 1.60 |
30 | 400 | 68 | 0.003 5 | 0.977 | 2.30 |
45 | 260 | 46 | 0.008 3 | 0.884 | 2.91 |
60 | 200 | 34 | 0.021 8 | 0.846 | 3.20 |
4 结论
实时、精确的高速公路路段平均速度估计能为高速公路出行者路径选择及管理部门掌握系统运行状态提供有力的支撑,提高高速公路系统的效率。本研究在前人研究的基础上,利用收费数据和浮动车数据,提出了基于多源数据融合的高速公路路段平均速度估计方法,实现路段和节点两个维度对路段平均速度进行估计,弥补了单一数据源自身存在的缺陷,提高估计精度。实例分析证明,本研究建立的支持向量回归融合模型是可行且有效的,能够起到提高路段平均速度估计精度的作用。
[1] |
翁剑成, 刘力力, 杜博. 基于ETC电子收费数据的信息提取技术研究[J]. 交通运输系统工程与信息, 2010, 10(2): 57-63. WENG Jian-cheng, LIU Li-li, DU Bo. ETC Data Based Traffic Information Mining Techniques[J]. Journal of Transportation Systems Engineering and Information Technology, 2010, 10(2): 57-63. |
[2] |
沈旅欧, 庄岩浩, 刘伟铭, 等. 基于修正算法的高速公路路段旅行时间估计[J]. 华南理工大学学报:自然科学版, 2015(4): 20-27. SHEN Lü-ou, ZHUANG Yan-hao, LIU Wei-ming, et al. Estimation of Expressway Section Travel Time Based on Correction Algorithm[J]. Journal of South China University of Technology:Natural Science Edition, 2015(4): 20-27. |
[3] |
沈强. 基于高速公路收费数据的路网运行状态评价[J]. 公路交通科技, 2012, 29(8): 118-126. SHEN Qiang. Road Network Mobility Performance Evaluation Based on Freeway Toll Data[J]. Journal of Highway and Transportation Research and Development, 2012, 29(8): 118-126. |
[4] |
QUIROGA C A, BULLOCK D. Travel Time Studies with Global Positioning and Geographic Information Systems:An Integrated Methodology[J]. Transportation Research Part C:Emerging Technologies, 1998, 6(1/2): 101-127. |
[5] |
WANG R, NAKAMURA H, GOTO M. Validation of All Improved Method to Estimate Expressway Travel Time by the Combination of Detector and Probe Data[J]. Journal of the Eastern Asia Society for Transportation Studies, 2003, 5: 2003-2014. |
[6] |
LEE S H, LEE B W, YANG Y K. Estimation of Link Speed Using Pattern Classification of GPS Probe Car Data[C]//International Conference on Computational Science and ITS Applications. Glasgow: ICCSA, 2006: 495-504. https://www.researchgate.net/publication/221433640_Estimation_of_Link_Speed_Using_Pattern_Classification_of_GPS_Probe_Car_Data
|
[7] |
何兆成, 卢瑞琪, 聂佩林. 基于浮动车定位数据的高速公路区间平均速度估计[J]. 公路交通科技, 2011, 28(6): 128-135. HE Zhao-cheng, LU Rui-qi, NIE Pei-lin. Estimation on Freeway Segment Average Speed Based on Probe Vehicle Data[J]. Journal of Highway and Transportation Research and Development, 2011, 28(6): 128-135. |
[8] |
廖孝勇.浮动车交通参数检测及在道路交通状态分析中的应用研究[D].重庆: 重庆大学, 2011. LIAO Xiao-yong. Analysis on Floating Car Traffic Parameter Detection and Its Application in Road Traffic Condition[D].Chongqing: Chongqing University, 2011. http://cdmd.cnki.com.cn/article/cdmd-10611-1012008662.htm |
[9] |
唐克双, 梅雨, 李克平. 基于浮动车数据的交通状态估计精度仿真评价[J]. 同济大学学报:自然科学版, 2014, 42(9): 1347-1351, 1407. TANG Ke-shuang, MEI Yu, LI Ke-ping. A Simulation-based Evaluation of Traffic State Estimation Accuracy by Using Floating Car Data in Complex Road Networks[J]. Journal of Tongji University:Natural Science Edition, 2014, 42(9): 1347-1351, 1407. |
[10] |
KONG Q J, LI Z, CHEN Y, et al. An Approach to Urban Traffic State Estimation by Fusing Multisource Information[J]. IEEE Transactions on Intelligent Transportation Systems, 2009, 10(3): 499-511. |
[11] |
解少博, 蒋晓君, 魏朗. 基于模糊线性回归的小轿车运行车速区间预测[J]. 公路交通科技, 2014, 31(8): 126-130. XIE Shao-bo, JIANG Xiao-jun, WEI Lang. Prediction of Driving Speed Interval of Passenger Car Based on Fuzzy Linear Regression[J]. Journal of Highway and Transportation Research and Development, 2014, 31(8): 126-130. |
[12] |
李慧兵, 杨晓光. 面向行程时间预测准确度评价的数据融合方法[J]. 同济大学学报:自然科学版, 2013, 41(1): 60-65. LI Hui-bing, YANG Xiao-guang. Data Fusion Method for Accuracy Evaluation of Travel Time Forecast[J]. Journal of Tongji University:Natural Science, 2013, 41(1): 60-65. |
[13] |
LI R M, MA W. Fusion Method of Road Section Average Speed Based on BP Neural Network and D-S Evidence Theory[J]. Journal of Traffic & Transportation Engineering, 2014, 14(5): 111-118. |
[14] |
丁宏飞, 秦政, 刘博, 等. 基于AF-SVR的城市快速路多源交通信息融合研究[J]. 计算机工程与应用, 2017, 53(5): 266-270. DING Hong-fei, QIN Zheng, LIU Bo, et al. Study on Urban Expressways' Multi-source Traffic Data Fusion Technology Based on AF-SVR Model[J]. Computer Engineering and Applications, 2017, 53(5): 266-270. |
[15] |
尹春娥, 宋小娜, 刘海朝. 基于混合粒子滤波的高速公路交通参数自适应估计方法[J]. 公路交通科技, 2015, 32(5): 141-146. YIN Chun-e, SONG Xiao-na, LIU Hai-chao. A Method of Expressway Traffic Parameter Self-adaptive Estimation Based on Hybrid Particle Filtering[J]. Journal of Highway and Transportation Research and Development, 2015, 32(5): 141-146. |
[16] |
VAPNIK V. The Nature of Statistical Learning Theory[M]. New York: Springer, 1995.
|
[17] |
杨庆芳, 马明辉, 梁士栋, 等. 基于收费数据的高速公路交通状态判别方法[J]. 华南理工大学学报:自然科学版, 2014, 42(12): 51-57, 76. YANG Qing-fang, MA Ming-hui, LIANG Shi-dong, et al. Freeway Traffic State Identification Based on Toll Data[J]. Journal of South China University of Technology:Natural Science Edition, 2014, 42(12): 51-57, 76. |
[18] |
GUO Y, LI X, BAI G, et al. Time Series Prediction Method Based on LS-SVR with Modified Gaussian RBF[C]//Neural Information Processing. Berlin: Springer, 2012: 9-17. https://www.researchgate.net/publication/262331846_Time_series_prediction_method_based_on_LS-SVR_with_modified_gaussian_RBF
|