一种利用GNSS数据进行城市交通状况变化探测的方法 | ![]() |
传统的探测道路交通状况的方法是通过固定式的传感器进行探测,例如交通摄像头、感应线圈检测器和红外传感器等,该类方法在获取详细的时间和空间分辨率数据以及深度研究交通状况变化规律等方面具有一定困难[1]。相比于固定传感器的交通流量数据,全球导航卫星系统(global navigation satellite system,GNSS)的导航数据中包含了更大量、更丰富的车辆轨迹数据,包括一系列的位置坐标记录点以及时间信息[2]。同时,智能手机等导航数据来源成本更低,并且安装了导航设备的车辆可以提供更加详细的城市路网信息。
各种GNSS导航设备(如手机、车载导航等)可以采集大量的时间、空间数据,这些时空数据可被用于研究交通状况变化、车辆流动规律及日常活动等[3, 4]。李昊明等[5]通过分析城市出租车数据,利用谱聚类对道路网进行分割,从而建立城市交通小区识别道路拥堵状态;杜胜兰等[6]根据GPS腕表采集到的数据,采用具有噪声的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法,对个体和群体的日常活动进行提取分析。该研究的用户样本数量较少,用户分布较为集中,因此研究结果无法展现更全面的行为特征。叶文娟等[7]针对复杂的轨迹数据,采用结构化查询语言对兴趣轨迹进行检索及可视化;杨杰等[8]利用城市交通违法信息数据,通过统计分析、可视分析、层次聚类等方法分析了城市中交通违法行为的空间分布和时间分布特征;Thakuriah等[9]通过整合社交媒体数据、Foursquare数据和GPS数据来探测城市中的时空结构。
在轨迹数据的筛选方面,郭庚麒等[10]利用出租车采集GNSS数据,从而得到道路状况,对定位点静止时段内计价器不在工作状态的数据进行了剔除;Siła-Nowicka等[3]利用GNSS数据分析人们的日常活动,对原地停留时长超过2 min的用户进行了过滤,但没有考虑到轨迹数据过短、目的地与出发地相同等问题;李昊明等[5]对城市拥堵情况进行研究时,采用的数据采样间隔为15 min,采样间隔较大,道路拥堵状况的细节容易丢失。
目前道路交通状况探测方法主要有4种:公式预测法、基于模型的预测法、基于交通流量的探测法和计算智能探测法[11]。Hawas[12]通过使用模糊算法对交通事故进行了预测;熊振华等[13]通过融合天气、空气质量和时间属性等多个特征建立双向深度学习框架,对道路速度进行了预测。计算智能探测法的代表方法是神经网络法,其特点是具有较高的探测成功率,但是模型训练有一定难度。公式预测法通常被应用于交通预测方面。基于模型的预测法根据历史数据建立交通模型进行预测,其特点是从宏观层面探测交通变化。基于交通流量的探测法的数据来源通常为固定式的交通监测设备,通过比较道路上下游的变化来探测交通状况变化。为此,针对大规模轨迹数据存在的明显的点位漂移至对向车道的现象,本文参考文献[3]中的思路,提出了改进的轨迹数据筛选原则和方法,根据研究城市的特点,通过使用车载GNSS导航数据来按照道路等级、时间段等条件确定路段的正常交通状态,将探测的导航轨迹数据与正常交通状态进行比较,从而得到当前交通状况,并参考路政部门发布的数据来验证探测结果。
1 交通状况变化的探测方法 1.1 研究区域的确定为了降低数据冗余度,提高数据分析的效率,在收集到原始数据后,根据研究区域所在的经纬度对原始数据进行初步剔除和筛选:首先在地图上确定研究城市各个方向最远端的经纬度;然后根据经纬度和城市形状设定多边形区域;最后将轨迹数据的经纬度与多边形区域进行比较,当移动轨迹超出研究区域时,该条轨迹在研究区域之外的数据将被剔除。
1.2 轨迹数据的处理在确定研究区域后,仍要精简探测道路交通状况所需的数据和信息,如用户ID、经纬度、日期和时间等。初步剔除无关数据后,发现短于50 m或者小于2 min的轨迹数据多数没有任何活动规律,如存在明显的点位漂移至对向车道的现象,既对交通状况探测有一定干扰,又占用了数据存储空间、降低了运算效率。因此,为了得到可靠的轨迹数据,本文将筛选出轨迹距离100 m以上且导航时间在5 min以上的轨迹数据。为了找到这些无效轨迹,分析每条导航轨迹数据的导航开始(时刻和坐标)、导航阶段(轨迹的距离)和导航结束(时刻和坐标)3个阶段的数据,按照图 1所示的流程识别并剔除无效数据。
![]() |
图 1 识别并剔除无效数据的流程 Fig.1 Flow Chart of Identifying and Eliminating Invalid Data |
1.3 研究区域轨迹数据的确定
为了实现通过GNSS的轨迹数据统计某段道路的交通数据,进而探测交通状况变化的目标,要将轨迹数据与相关的道路进行匹配[14-16]。首先,参考文献[11]中的分割路段的方法,以500 m作为道路的距离阈值将其分割成若干部分,运用隐马尔可夫模型以及维特比算法[17, 18],在将GNSS误差纳入考虑的同时,找到道路与轨迹点重合的最或然值,从而完成轨迹点与道路地图匹配的过程。
1.4 道路拥堵等级和道路状况变化的分类在探测交通状况前,要对不同的交通状态进行分类。图 2为道路拥堵等级和道路状况变化的分类流程。不同类型道路的预期车流速度和车流量不同;同一种类型的道路在不同时段的预期车流量也不同。因此,在建立预期交通模型时,要考虑道路类型和时段因素的影响,才能准确地探测出某段道路在某个时段内的交通状况是否发生变化。道路类型主要包括高速公路、主干道、次级干道、乡村路等不同等级。将每周分成工作日和周末休息日,将工作日分为早高峰、晚高峰和非高峰时段。将周末休息日分为活跃时段和非活跃时段。
![]() |
图 2 道路拥堵等级和道路状况变化的分类流程 Fig.2 Classification Process of Road Congestion Level and Road Condition Change |
采用车流速和车流量两个参数来评价某段道路的某个时段中的交通状况,并把交通状况分为空闲、畅通、缓慢、非常缓慢、堵塞5个类别,本文使用文献[2]中的交通状况分类方法进行分类。在某个时段的某段道路上,设车速的中位数为
在初步确定道路交通状况的基础上,进一步把道路状态分为正常、临时性变化和永久性变化3种类型。其中,正常是与预期的交通模型相符合的状态;临时性变化分为无规划和有规划,无规划指的是如交通事故、交通堵塞等持续时间短的事件;有规划是与交通管理相关的事件,如交通管制、道路维修等规划的持续时间长的事件;永久性变化是指如开设新道路等长期变化的交通事件。
1.5 交通状况变化的探测在建立每段路在各个时段的正常的交通状况模型后,将需要探测的轨迹数据与预期的交通状况进行比较,探测出可能发生的交通事件或非正常状况。以高峰时段的交通状况为例,其探测过程如下:①提取高峰时段的轨迹数据,以10 min为一个时间段,同时将每条道路以500 m为一个路段进行分割;②在每个时间段内,计算每个路段的平均车流速和车流量,判断当前道路的真实交通状况;③将真实交通状况与预期的交通状况进行对比:如果该路段的真实交通状况等于或高于预期的交通状况,则不被标记,否则该路段将被标记为相应的数字和颜色,并且计算实际车流速与预期车流速的差值百分比,从而确定真实交通状况与预期的交通状况的差异程度。
1.6 路政部门数据的验证为了对探测到的交通状况进行验证,将探测结果与路政部门发布的数据进行对比。路政部门的数据既包括有规划交通事件发生的位置和时间,也包括无规划交通事件发生的位置和时间。通过与真实的数据进行对比,来评价探测的结果。
2 交通状态分类及交通状况变化探测 2.1 实验数据本文使用的GNSS轨迹原始数据来自澳大利亚用户使用的手机导航应用Sygic(http://www.sygic.com/gps-navigation),时间段为2016-04-24—2016-05-08。导航数据的坐标系为1984年世界大地坐标系(world geodetic system 1984,WGS84),研究城市为墨尔本城区和郊区。验证数据来自2016年澳大利亚维多利亚路政局(Vicroads)的历史记录。数据存储在PostreSQL/PostGIS数据库中,访问数据和处理数据的工具为Python和QGIS。
2.2 数据筛选与预期交通状态的分类本次实验剔除了研究城市以外的数据,即保留37.420 9°S~38.507 2°S,144.566 0°E~145.505 4°E的数据。由于原始数据过大、内容过多,为了提高数据处理效率和减少存储空间,只保留了时间、坐标和用户ID等信息。时间和坐标用于计算车辆速度,用户ID用于计算车流量。轨迹数据的处理过程主要剔除了导航时间小于5 min的轨迹或轨迹长度小于100 m的数据。表 1展示了轨迹数据提取后数据的可用率,可以看出,可用率在20% 左右,可用数据的文件占用空间也明显减小。
表 1 轨迹数据提取后数据的可用率及文件大小(部分) Tab.1 Data Availability and File Size After Track Data Extraction(Part) |
![]() |
统计每个小时的用户数量,如图 3所示。可以看出,工作日存在两个交通高峰时段,而周末较工作日而言,用户数量变化曲线较为平缓,并无明显的交通高峰。因此,本文将工作日分成早高峰(06:00~ 12:00)、晚高峰(15:00~20:00)以及非高峰时段(00:00~6:00;12:00~15:00;20:00~24:00);将周末分成交通活跃时段(11:00~18:00)和非活跃时段(00:00~11:00;18:00~24:00)。
![]() |
图 3 用户数量变化曲线图 Fig.3 Chart of Changes in the Number of Users |
按照道路等级(或道路类型)对数据进行分组,并计算各段时间内可匹配的路段数量。表 2给出了晚高峰时段与地图可以匹配的道路结果。图 4展示了晚高峰可匹配和不可匹配的路段的空间分布情况。
表 2 晚高峰时段可以地图匹配的路段 Tab.2 Map-Matchable Road Sections During the Evening Peak Hours |
![]() |
![]() |
图 4 晚高峰可匹配和不可匹配的路段的空间分布情况 Fig.4 Spatial Distribution of Matched and Unmatched Road Sections During the Evening Peak Hours |
由表 2、图 4可知:该城市的可匹配的路段空间分布并不均匀,城市远郊的不可匹配路段数量高于城区。表 3和表 4展示了工作日的晚高峰和非高峰时段各类道路的车流速度。非高峰时段的速度中位数大,晚高峰的速度中位数小。
表 3 晚高峰时段各类道路车流速情况 Tab.3 Vehicle Flow Rates on Various Road Types During the Evening Peak Hours |
![]() |
表 4 非高峰时段各类道路车流速情况 Tab.4 Vehicle Flow Rates on Various Road Types During the Off-Peak Hours |
![]() |
根据研究区域每个时间段中每段匹配的路段流速中位数和交通流量(用户ID数量),按照前文所述方法可以构建研究区域的预期交通模型。图 5展示了工作日晚高峰的预期交通状态。
![]() |
图 5 工作日晚高峰预期交通状态 Fig.5 Expected Traffic Condition During Weekday Evening Peak Hours |
2.3 交通状况变化探测与验证
为了检验本文方法通过轨迹数据探测交通状况变化的能力,选用2016年5月6日星期五的早高峰数据进行分析,检验数据为当地路政部门的历史记录。研究对象城市当日早高峰发生了14起较严重的交通事故,有170个道路作业点。此外,为了更形象地展示异常的交通状况的地理位置,为使用者提供更详细的交通状况信息,本文结合路网地图对探测结果进行了视觉化处理。
图 6展示了交通状况发生变化的探测结果。探测出的市区拥堵路段有232处,其中9个路段与突发交通事件有关,43个路段与道路作业有关。此外,该城市交通的拥堵情况主要发生在城市中央商务区、机场附近和城市东南近郊的居民区附近的道路,连接市中心与市郊的主干路虽然车流速有所下降,但是拥堵现象较少。
![]() |
图 6 5月6日早高峰的交通状况探测结果 Fig.6 Traffic Condition Detection Results During the Morning Peak on 6 May 2016 |
图 7展示了城区早高峰的交通状况探测结果;图 8展示了早高峰的交通状况探测结果细节。由图 7和图 8可以看出:市中心(图 7中的左侧区域)当天早高峰时段的拥堵较为严重,其中个别街道的交汇处很可能出现了轻微交通事故或违章现象。本文探测结果可以为判断潜在交通事故路段提供参考依据。
![]() |
图 7 城区早高峰的交通状况探测结果 Fig.7 Traffic Condition Detection Results During the Morning Peak in the City |
![]() |
图 8 早高峰的交通状况探测结果细节 Fig.8 Details of Traffic Condition Detection Results During the Morning Peak |
3 结束语
本文首先提出了改进的轨迹数据筛选的处理方法,通过对导航轨迹距离和导航时长的筛选,提取得到的有效轨迹数据为原始数据的20% 左右,为数据的存储和运算节省了空间。同时,本文根据不同道路类型和不同时段的交通状况,建立了一套符合预期的交通状况模型,为交通状况的探测提供了评判标准。从探测结果来看,本文方法可以探测出某个时段或连续几周交通状况异常的路段,因此在确定突发交通事故路段、分析道路施工对路段的影响程度方面具有一定参考意义,进而为城市发展规划、交通规划提供参考依据。
本文的不足之处是仅探测出了交通状况异常的路段,但是交通异常的路段数量远多于路政部门提供的验证记录的数量,并且无法提供发生交通事故的准确位置,这是在今后的交通状况探测过程中需要实现的功能。
[1] |
Sheikh M S, Regan A. A Complex Network Analysis Approach for Estimation and Detection of Traffic Incidents Based on Independent Component Analysis[J]. Physica A: Statistical Mechanics and Its Applications, 2022, 586: 126504. DOI:10.1016/j.physa.2021.126504 |
[2] |
d'Andrea E, Marcelloni F. Detection of Traffic Congestion and Incidents from GPS Trace Analysis[J]. Expert Systems With Applications, 2017, 73: 43-56. DOI:10.1016/j.eswa.2016.12.018 |
[3] |
Siła-Nowicka K, Vandrol J, Oshan T, et al. Analysis of Human Mobility Patterns from GPS Trajectories and Contextual Information[J]. International Journal of Geographical Information Science, 2016, 30(5): 881-906. DOI:10.1080/13658816.2015.1100731 |
[4] |
林锐, 吴瑞涵, 黄雅婷. 手机导航大数据对缓解城市交通拥堵的作用[J]. 中国统计, 2019(5): 16-17. |
[5] |
李昊明, 蔡忠亮. 土地利用紧凑性与城市交通拥堵关联研究[J]. 测绘地理信息, 2021, 46(S1): 20-24. |
[6] |
杜胜兰, 李枫, 黄长青, 等. 基于轨迹数据的武汉大学学生行为规律分析[J]. 测绘地理信息, 2017, 42(1): 91-95. |
[7] |
叶文娟, 艾廷华. 多维度轨迹数据的SQL时空查询方法[J]. 测绘地理信息, 2017, 42(6): 16-20. |
[8] |
杨杰, 邬群勇. 福州市交通违法行为时空特征分析[J]. 测绘地理信息, 2020, 45(4): 11-15. |
[9] |
Thakuriah P, Sila-Nowicka K, Paule J G. Sensing Spatiotemporal Patterns in Urban Areas: Analytics and Visualizations Using the Integrated Multimedia City Data Platform[J]. Built Environment, 2016, 42(3): 415-429. |
[10] |
郭庚麒, 曹成涛, 徐建闽. 城市道路状况概率神经网络判别方法[J]. 计算机工程与应用, 2009, 45(13): 214-216. |
[11] |
Kamran S, Haas O. A Multilevel Traffic Incidents Detection Approach: Identifying Traffic Patterns and Vehicle Behaviours Using Real-Time GPS Data[C]. 2007 IEEE Intelligent Vehicles Symposium, Istanbul, Turkey, 2007
|
[12] |
Hawas Y E. A Fuzzy-Based System for Incident Detection in Urban Street Networks[J]. Transportation Research Part C: Emerging Technologies, 2007, 15(2): 69-95. |
[13] |
熊振华, 李恒凯. 融合多特征神经网络的城市道路速度预测研究[J]. 测绘科学, 2021, 46(9): 168-177. |
[14] |
Chandio A A, Tziritas N, Zhang F, et al. Towards Adaptable and Tunable Cloud-Based Map-Matching Strategy for GPS Trajectories[J]. Frontiers of Information Technology & Electronic Engineering, 2016, 17(12): 1305-1319. |
[15] |
魏红. 基于GPS的地图匹配算法研究[D]. 上海: 上海交通大学, 2014
|
[16] |
张校慧, 孙凯, 职保平, 等. 针对复杂道路网络的车辆轨迹地图匹配算法[J]. 测绘科学, 2018, 43(8): 110-115. |
[17] |
吴刚, 邱煜晶, 王国仁. 基于隐马尔可夫模型和遗传算法的地图匹配算法[J]. 东北大学学报(自然科学版), 2017, 38(4): 472-475. |
[18] |
陆健, 王鹏. 隐马尔可夫模型路网匹配的MapReduce实现[J]. 计算机应用与软件, 2018, 35(2): 7-15. |