2. 现代城市测绘国家测绘地理信息局重点实验室,北京 100044
随着社会经济的发展,机动车数量急剧增加,城市交通面临着巨大的挑战。优先发展公共交通、实现智能公交,既是解决城市交通问题的有效途径,也是发展智能交通系统的重要内容。公交到站时间是指沿公交线路运行的公交车辆当前位置相距目标站点的行程时间[1]。公交到站时间预测是智能公交的核心之一,它能够为智能调度和公众出行服务提供核心技术支持。一方面,大众出行者对能够有效分配出行时间有着强烈的需求,从主观上急需公交到站时间预测的能力;另一方面,实现公交调度的精细化、智能化,提高公交管理的效率和效能,其中不可缺少的重要依据便是公交到站时间的预测能力。因此,研究和开发高性能的公交车辆到达时间预测技术,对实现公交系统在管理和服务的智能化、提高城市公共交通的管理和服务水平具有重要意义[2]。
本文基于公交GPS轨迹数据,通过对公交车辆GPS轨迹数据进行空间关系和时空分布上的分析与处理,开展对公交车辆到站时间预测的研究。
一、常见预测模型研究综述公交到站时间预测模型有很多,如基于历史数据的预测模型[3]、回归预测模型[4-5]、基于平均速度的预测模型[2]、基于离散傅里叶变换和车辆延误的预测模型[6]等。这里主要介绍3种较常见也较多使用的预测模型。
1. 时间序列预测模型时间序列模型主要是利用交通流的时间变化规律获取交通数据具有周期性和局部特性变化特征,进而通过当前与历史交通状况的对比,预测出车辆到站时间。因此,这种模型的预测精度主要取决于对比结果的相似度。相似度较高的,对应的预测精度也相对较高;但对于对比结果存在很大差异的,预测结果会很不理想[7]。
2. 卡尔曼滤波预测模型卡尔曼滤波预测模型是一种滚动并实时修正的模式,既包括通过历史状态(通常是前一步状态)预测当前状态,又包括利用当前实际观测状态修正预测结果。因此它既考虑了历史数据的影响,又兼顾了当前突发事件的反馈,具有很高的实时性能和较高的预测精度。但是这种滚动预测模式导致了多步预测的性能和精度的下降[6]。
3. 人工神经网络预测模型神经网络预测模型通过神经元网络寻找交通数据与到站时间数据间的关系,具有分布式存储、并行处理、自组织、自学习、非线性逼近等优点[8]。目前绝大多数采用BP 算法,并以样本的方差和作为训练的收敛条件。神经网络模型能很好地拟合历史数据,但其精度主要取决于训练时间的长短,因而预测的实时性较差。
二、基于公交GPS轨迹数据的到站时间预测研究现有的大多公交车辆到站时间预测模型都基于海量的交通记录,侧重于在数学上建立解算和参数方程组,来预测目标对象的到站时间等相关数据。然而,这种模式虽然具有众多优势,却较少关注从公交GPS轨迹数据在空间关系和时空分布的层面上来分析和处理数据。本文即从以上层面进行研究,进而提高预测精度。
1. 基础数据分析处理鉴于从轨迹数据空间关系和时空分布的角度分析数据的研究目的,基础数据主要分为两个方面:轨迹数据和矢量数据。其中,轨迹数据包括上线的公交车车载GPS模块所记录的数据,以及部分公交系统业务数据;矢量数据包括公交站点、公交线路、城市路网,以及分析和处理过程中的临时地图图层等。具体内容见表 1。
车载GPS记录 | 业务数据 | 基础图层 | 临时图层 |
线路ID | 驾驶员信息 | 城市路网 | 线路匹配路网 |
车辆ID | 行车日期 | 公交线路 | 站点匹配线路 |
行车记录ID | 发车时间 | 公交站点 | 轨迹点临时图层 |
行车日期 | 进入场站时间 | 车辆轨迹点 | 轨迹点匹配线路 |
GPS记录时间 | 早高峰 | 公交场站缓冲区 | |
系统更新时间 | 上低峰 | 途经站点缓冲区 | |
经度 | 下低峰 | | |
纬度 | 晚高峰 | ||
车辆速度 | 晚二次 | ||
| |
对基础数据除了进行常规处理,如去噪、数据融合、格式化、建表入库、索引、关联等,更需要从地理信息系统的专业角度分析数据的空间和属性特征。
1) 去除GPS漂移点。轨迹数据的经纬度坐标是最重要的基础数据,但由于GPS模块定位过程中受到大型建筑物的遮挡,以及其他事物的干扰,会出现很多漂移点。而对于严重偏离所属线路的情况,会对预测精度造成重大影响,因此必须去除。但是,传统的预测模型在去噪过程中的灵活度和性能相对较低。本文通过建立临时轨迹点图层,在地图上非常直观地表现出了车辆行驶轨迹偏离所属线路的程度,从而通过设置可变的阈值,严格控制了轨迹数据中坐标的精度。
2) 匹配。公交数据的路网匹配规则相对简单,即主要采用最短距离法,因为除了应对突发事件或小规模线路调整之外,公交线路和公交站点非常稳定。公交线路数据的来源或处理方式有两种:一是通过地图矢量化或对其他已有数据的格式转换;二是通过高密度分布于线路的点数据自动生成。但无论哪种方式,公交线路都要进行坐标系的统一和路网匹配,从而确保后续处理和空间分析,以及最终预测到站时间的精度。同样,公交站点和车辆轨迹点也要对应地匹配到所属的线路上,特别是当区分线路上行和下行的时候。
3) 线路分段。公交线路的分段方式也是反映数据处理精度的重要因素。本文主要按照公交GPS轨迹点与路段进行空间关系判别的具体需求,分别采用了5种分段方式,见表 2。
序号 | 分段方式 | 说明 |
1 | 按实时路况 | 按实时路况信息的线路单元划分 |
2 | 按公交站点 | 按公交线路上站点分布划分 |
3 | 按缓冲区 | 按公交场站区域、站点停靠区域划分 |
4 | 按距离 | 按指定公交线路上的相同或不同距离划分 |
5 | 按时间单元 | 为车辆轨迹点对应的时间指定时间单元,进行划分 |
另外,在分析处理和系统展示时,还需要对地图数据进行投影坐标系和地理坐标系的统一定义。
2. 空间关系和时空分布本文基于公交轨迹数据建立了时空数据模型(如图 1所示)。考虑任何一条公交线路Route在时间范围T内都有N条同在这条线路上运行的BusCount辆公交车的轨迹记录,而每条轨迹记录都是一个包含某车空间信息、时间信息和属性信息的数组。首先,根据时间信息判断它的时间归属并获取时间归属ID,即属于工作日(work)或休息日(rest)的哪个时段(五峰、全天)。第二,根据空间信息判断它的路段归属并获取路段归属ID,即属于线路Route的哪个动态分段区间(常用站点或站点停靠缓冲区来分段)。第三,分析它的空间关系和时空分布特征:如果与站点缓冲区相离,便可视为行驶点,可以根据历史平均总时间和距离即将到达的站点距离得出初步预测时间,再用相应的路况信息等属性信息进行修正,得出最终预测结果,并接着分析下条记录;如果与站点缓冲区相交,便可视为站点停靠待选点。如此滚动,便可得到一个停靠待选点集合,但集合中仍包含该线路车队的m辆公交车的不同次数的轨迹点,因而就要使用属性信息确定相应的归属,再利用空间关系找出停靠待选点集合中离站点最近,且速度符合指定阈值的轨迹点。路段归属ID属于前后两站的轨迹点时间差便是对应路段的单车单次到站总时间,将其加入到历史平均总时间再次平均便可实现历史平均数据的更新。
预测处于行驶点的公交车的到站时间,以公交车的当前位置所在的行车路段为当前行车路段,则当前位置到达最近的公交站点的预测时间T为
式中,Pi为当前位置到最近的公交站点的距离di与当前行车路段的总距离Di的比值;Ti为当前行车路段的平均行程时间。再用此路段的路况信息等属性信息进行修正,得出最终预测结果。
三、实例研究本文选取北京市300路内环(简称300内)公交线作为研究对象,包含终点在内共有34站,线路总长48.065 km。
接着选取2011年4月共2 515 783条轨迹数据,结合ArcGIS Engine进行二次开发,建立了一个应用上述处理和计算流程的系统。如图 2所示。
在菜单“数据”中,主要进行线路生成和分段工作,按照300内公交站点对线路进行分段。在菜单“匹配”中,主要完成300内公交线路的路网匹配,以及该月所有GPS轨迹数据和公交站点的匹配线路工作。在菜单“计算”中,主要完成:①对所有处理过的GPS轨迹数据按照分段结果计算得出该路段平均到站总时间;②选取工作日抽样点,进行到站时间预测;③选取休息日抽样点,进行到站时间预测。
系统可以分别按日期、时段、车辆来进行相应设置的计算。这里对该月该车队所有车辆的GPS轨迹数据,分别计算出了300内33个站间路段的平均到站总时间,如图 3所示。
最后,分别抽样选取了工作日和休息日的公交GPS轨迹数据,利用路段平均到站总时间与当前车辆位置和速度,预测到达下一站所需要的时间。
通过分别选取2011年5月3日(星期二,49个抽样轨迹点)和2011年5月8日(星期日,31个抽样轨迹点)代表工作日和休息日进行实例验证,证明了本方法可以得到稳定且可参考的数据,预测精度可以达到87.6%。这种方法对处理轨迹数据和计算路段平均到站总时间具有较好的性能和效果,而预测结果在较少出现突发事件的情况下也呈现出较高的精度。
四、结语和展望公交到站时间作为公共交通出行者最为关注的重要信息,以及公交系统智能调度的核心依据,其精确预测不仅能提高公交信息服务的质量和体验,也推动了城市公交系统的智能化。
本文首先详细讨论了基于公交GPS轨迹数据进行到站时间预测的基础数据组成,以及各自在分析处理和判断计算过程中的作用;然后从公交GPS轨迹数据与公交线路矢量数据的空间关系和时空分布的角度出发,详细论述了利用空间信息、时间信息、属性信息的关联性进行公交车辆到站时间预测的过程和方法;最后对实际采集的2 515 783条公交GPS轨迹数据进行了实例研究,并利用应用结果对抽样点数据进行了实例验证,最后针对预测的性能和效果作出了评价。下一步本研究将尝试引入卡尔曼滤波模型,在车辆实时位置和速度、到达站点的距离的基础上,重点考虑车辆所处路段的路况信息、途经路段道路类型、周边人口密集区的权重分配,以及对预测精度的影响。
[1] | 陈国俊, 杨晓光, 刘好德,等. 基于动态百分位行程时间的公交到站时间预测模型[J]. 公路交通科技, 2009(S1):102-106. |
[2] | 罗虹. 基于GPS的公交车辆到达时间预测技术研究[D]. 重庆:重庆大学, 2007. |
[3] | OJILI S R. A Prototype Bus Arrival Prediction System Using Automatic Vehicle Location Data[D]. State of Texas:Texas A&M University, 1999. |
[4] | ALFA A S, MENZIES W B, PURCHA J, et al. A Regression Model for Bus Running Times in Suburban Areas of Winnipeg[J]. Journal of Advanced Transportation, 1988, 21(3): 227-237. |
[5] | ABDELFATTAH A, KHAN A. Models for Predicting Bus Delays[J]. Transportation Research Record: Journal of the Transportation Research Board, 1998(1623): 8-15. |
[6] | 张堂贤, 郭中天. 公交车到站时间暨复合路线旅行时间预估模式的研究[J]. 土木工程学报, 2005(12):115-123. |
[7] | CHIEN I J, DING Y, WEI C. Dynamic Bus Arrival Time Prediction with Artificial Neural Networks[J]. Journal of Transportation Engineering, 2014, 128(5):429-438. |
[8] | CHIEN I J, DING Y, WEI C. Dynamic Bus Arrival Time Prediction with Artificial Neural Networks[J]. Journal of Transportation Engineering, 2014, 128(5):429-438. |
[9] | 陈圣兵, 李正茂, 王晓峰. 智能公交中基于条件映射的到站时间预测算法[J]. 计算机工程, 2012, 38(11):147-149. |
[10] | 李福双. 智能公交车辆到站时间预测研究[D]. 北京:北京交通大学, 2009. |
[11] | 陈鹏. 基于BP神经网络的公交智能实时调度模型研究及系统实现[D]. 北京:北京交通大学, 2008. |
[12] | 晏磊, 苗李莉, 刘岳峰. 关于GPS技术在智能交通系统中的应用分析[J]. 测绘通报, 2005(8):26-28. |
[13] | 王美玲, 程林. 浮动车地图匹配算法研究[J]. 测绘学报, 2012, 41(1):133-138. |
[14] | 曾喆, 李清泉, 邹海翔,等. 曲率积分约束的GPS浮动车地图匹配方法[J]. 测绘学报, 2015,44(10):1167-1176. |
[15] | 罗跃军, 宋向勃, 郑莉. 一种基于空间语义特征的浮动车轨迹匹配技术[J]. 测绘通报, 2015(3):108-110. |