福州市交通违法行为时空特征分析 | ![]() |
2. 福州大学空间数据挖掘与信息共享教育部重点实验室,福建 福州,350116
2. Key Laboratory of Spatial Data Mining and Information Sharing of Ministry of Education, Fuzhou University, Fuzhou 350116, China
随着中国经济社会的不断发展,人民生活水平逐步提高,城市汽车保有量迅速增长,城市交通违法问题日益突出。交通违法行为扰乱正常交通秩序,容易引发交通事故。对交通违法行为进行分析,对于交通管理部门了解道路交通违法情况,采取科学的交通违法治理措施,维护城市交通秩序,具有现实意义。
目前,已有一些关于交通违法行为的研究。有些学者利用道路交通事故数据[1],或是从道路交通参与者的角度[2],分析了道路交通安全方面存在的问题,并提出了一些解决问题的建议。杨春风等[3]利用皮尔逊相关系数对影响道路交通事故的机动车驾驶员各违法行为与道路交通事故等4项指标的相关性进行了分析。郭晓魁等[4]利用地理信息系统(geographic information system, GIS)和数理统计方法研究了太原城郊公路交通事故的时空分布规律。一些学者也利用图像处理、计算机视觉、视频处理等技术,设计了各种交通违法监控系统[5-6]。
综上所述,目前对交通违法行为的研究主要包括交通违法调查研究、交通违法行为分析、交通违法管理系统设计等。由于交通违法行为数据难以被获取利用,目前还没有利用真实的交通违法数据对某一地区的交通违法行为进行时空分析的案例。因此,本文利用福州市2016年交通违法数据,结合GIS空间分析方法,在不同时间尺度下,对福州交通违法行为的时空分布特征及规律进行了分析。
1 研究区数据源及预处理福州是福建省省会,是福建省的政治、文化、交通中心。福州下辖13个区县,主城区包括仓山、鼓楼、台江、晋安、马尾5区。
本研究所用的交通违法数据为表格形式,表格字段包括驾驶证号、违法地址、违法内容、处理时间、交款办结、违法时间、违法编号。福州市2016年交通违法记录一共230余万条。为了对交通违法行为进行空间分析,需要对违法地址进行地理编码,获得空间坐标信息。上述230余万条违法记录包含的违法地址近13 000个。每个违法地址对应一定数量的违法记录,其中违法记录最多的地址有28 000余条违法记录,最少的有1条。
2 交通违法密度分析密度分析是基于空间平滑及空间内插技术的统计分析过程,它可以对空间分布的特征进行挖掘与表达。常用的点密度分析方法有样方密度法、基于Voronoi图的密度法和核密度法,前两种方法存在两个问题:一是要求各单元内密度均匀,忽略了不同位置点聚集程度的差别;二是单元交界处的密度变化大,忽略了空间现象发生的连续性[7]。而核密度方法基于地理学第一定律,即距离越近的事物相关性越大[8]。由于不同交通违法地点的违法数量不同,即点的强度有差异,因此本文采用核密度估计法分析交通违法行为的空间分布特征。
2.1 基于核密度估计的全年交通违法空间分布核密度估计是一种非参数密度函数估计方法,核密度方程中有两个重要参数,即核函数K和窗宽h。研究表明,函数K对点模式分布结果影响不大,而窗宽h是影响结果的重要因素。窗宽h的设置主要考虑分析尺度及点要素的特点,较小的h值适合于表示要素密度分布的局部特征,而较大的h值则可以表示较大范围的密度分布特征[7]。本文使用ArcGIS中的核密度工具,核函数以Silverman著作中描述的二次核函数为基础。其中population字段的值用于确定点被计数的次数,这里选择交通违法地点的违法数量值。
由福州市各区县的交通违法数量可知,主城区占比超过80%,因此对主城区范围内交通违法分布进行核密度估计,窗宽选择默认值1 486 m,输出栅格宽度178 m,估算效果良好。如图 1所示,福州市2016年的交通违法行为在二环内大量分布,二环外则在一些热点区域比较集中,例如, 浦上大道冠浦路口。而且交通违法呈现沿地铁一号线聚集分布的特征,这可能是因为目前福州只开通了一条地铁线路,且地铁一号线经过的地方有的为市中心繁华路段,有的则是因为地铁的开通对周围交通环境产生了影响。
![]() |
图 1 福州主城区2016年交通违法核密度估计 Fig.1 Kernel Density Estimation of Traffic Violations in Main Districts of Fuzhou (2016) |
2.2 各月份交通违法空间分布
分析了福州市主城区全年的交通违法空间分布状况后,然后分析不同月份的交通违法空间分布特征。选取1月、6月、10月3个月份展示结果,如图 2所示,与全年分布类似,各月份交通违法主要分布在二环以内,且沿地铁一号线聚集分布,但是在二环内各月份的聚集形态不同,且不同月份存在不同的交通违法热点区域。
![]() |
图 2 不同月份交通违法核密度估计 Fig.2 Kernel Density Estimation of Traffic Violations in Different Months |
3 交通违法时间分布分析 3.1 交通违法月际变化分析
依据违法内容字段将交通违法行为分成机动车、非机动车、行人及乘车人、高速公路、其他几类违法行为,统计福州市2016年每个月的交通违法数量及机动车类交通违法占比。如图 3所示,福州2016年1月-12月的交通违法数量存在较大波动,3月、5月、6月、7月数量较多,9月、10月、11月数量较少。而机动车类交通违法行为所占比例,1月-10月均超过90%,其中违法数量最多的6月,机动车类违法比例也最高,达到97.88%;而11月、12月机动车类违法占比显著减少,11月占比67.66%,12月则只有48.79%。
![]() |
图 3 交通违法各月数量及机动车类违法占比 Fig.3 Monthly Number of Traffic Violations and the Proportion of Motor Traffic Violations |
3.2 交通违法周内变化分析
统计2016年福州市交通违法行为在一周内的数量,每天的数量以平均值计。如图 4所示,交通违法数量在一周内呈现一定的规律性,9月稍有例外,其他每个月都是周一到周五数量存在小幅波动,周六、周日数量显著减少,这表明福州市交通违法数量呈现工作日比双休日多的规律。
![]() |
图 4 交通违法数量周内统计 Fig.4 Traffic Violations in a Week |
3.3 交通违法逐日变化可视分析
按日统计福州市2016年每一天的交通违法数量,得到2016年福州市交通违法数量日历图如图 5所示。2016年交通违法最多的一天(03-14)有10 967条违法记录,最少的一天(09-28)有561条。从图 5中可以看出,通常节假日比非节假日交通违法数量少,表现得尤其明显的是春节假期(2016-02-07- 02-13)及国庆黄金周。造成这一现象的原因可能是春节期间大量流动人口回家过年,假期人们交通出行减少,而非节假日各行各业正常上班,交通繁忙,交通违法数量也更多。
![]() |
图 5 交通违法数量日历图(2016) Fig.5 Calendar Chart of Traffic Violations(2016) |
4 基于Gini指数的主要交通违法行为的月变化特征
由图 3可知,交通违法行为中机动车类占绝大部分,而将机动车类违法行为依据违法内容进一步分类,统计各类别数量,找出其中数量较多的主要交通违法行为,主要交通违法行为数量及每个月总数如图 6所示。主要交通违法行为有违反交通标志、违规停放、不按规定车道通行、违反交通信号灯、违规逆行、超速6类。
![]() |
图 6 主要交通违法行为数量及各月总数图 Fig.6 Monthly Numbers of Main Traffic Violations and Total Traffic Violations |
为了对这6类交通违法行为的发生特征进行描述,采用Gini指数来考察它们在一年中不同月份的分布情况。为方便计算,对6类主要交通违法行为不同月份的数量进行归一化处理,即计算各月份不同类型交通违法行为的发生率:
$ {X_i} = \frac{{{Y_i}}}{{\sum\limits_{i = 1}^{12} Y_i }} $ | (1) |
式中,Xi表示某个月某种类型交通违法行为发生率;Yi表示各月份这种类型交通违法数量;i表示月份。
Gini指数是反映数据集中程度的指标,本文通过Gini指数来研究交通违法行为在不同月份分布的聚集情况。假设有一个时间序列x1,x2,…,xn; n为序列长度; dij表示序列中事件i与事件j的距离,即xi与xj的差值;d表示时间序列的均值。令sij为:
$ {s_{ij}} = \frac{1}{{1 + {d_{ij}}/\bar d}} $ | (2) |
定义该序列中两个事件的Gini指数为:
$ {g_{ij}} = 4{s_{ij}}\left( {1 - {s_{ij}}} \right) $ | (3) |
对于包含n个事件的序列,则平均Gini指数表现为[9]:
$ {I_g} = \frac{{2\sum\limits_{i = 1}^{n - 1} {\sum\limits_{j = i + 1}^n {{g_{ij}}} } }}{{n\left( {n - 1} \right)}} $ | (4) |
Gini指数的取值范围为[0, 1],值越接近0说明数据分布越均匀,值越接近1说明数据分布越集中[10]。按式(1)计算不同类型交通违法行为的发生率,结果如表 1所示。
表 1 主要交通违法行为在一年内各月的发生率 Tab.1 Monthly Occurrence Rates of Main Traffic Violations |
![]() |
按式(1)~式(4)分别计算不同类型交通违法行为的Ig值,结果如表 2所示,6类主要违法行为的Gini指数均超过了0.6,说明这6类违法行为在一年中分布的集中程度都较高。从表 1中也可以看出,6类违法行为都在某些月份发生率较高。例如,违反交通标志类违法行为集中在3月、5月、6月和7月,这4个月的总数占全年的42.9%;超速类违法行为则集中在5月至9月,这5个月的总发生率为69.4%。
表 2 主要交通违法行为Gini指数 Tab.2 Gini Indices of Main Traffic Violations |
![]() |
5 主要交通违法行为发生时间的聚类分析
为了对6种主要交通违法行为一年内的发生率分布规律进行研究,采用聚类分析对其进行处理。
常见的聚类分析有层次聚类和k-means聚类。层次聚类是将每一个观测值看成一类,将这些类两两合并,直到所有观测值被聚为一类为止。而在k-means聚类中,观测值被随机分成K类,然后通过多次迭代计算达到最优分类结果。层次聚类通常用于较小样本,而k-means聚类能处理更大的数据量,但需要事先指定聚类的个数,这个通常很难确定。因此本文选择层次聚类方法分析主要交通违法行为的时间分布。
本文层次聚类的步骤为:
1) 选择变量:确定n个用于分类的观测值,每一个观测值包含一组数据。这里选择6类主要交通违法行为。
2) 标准化:将每一个变量标准化为均值为0,标准差为1的变量。
3) 聚类:按照样本距离(最初是欧氏距离),选取两个最邻近的类。
4) 更新:步骤3)中两类合并成一类,类的个数更新为n-1,距离矩阵也被更新。
5) 迭代:执行n-1次步骤3)和步骤4)。
6) 完成:当所有类别被合并成一类时,聚类完成。
使用R语言进行层次聚类。度量类别之间的距离时,第一次用欧氏距离,当第一次完成后出现包含多个样本的类别时,采用离差平方和法(ward法)。聚类的树状图如图 7所示,1、2、3、4、5、6分别表示违反交通标志、违规停放、不按规定车道通行、违反交通信号灯、违规逆行、超速。
![]() |
图 7 主要交通违法行为发生时间聚类分析树状图 Fig.7 Cluster Dendrogram of Main Traffic Violations |
从树状图来看,根据6种主要交通违法行为一年内的分布规律,可将它们分成3类。第1类是1、2、3即违反交通标志、违规停放、不按规定车道通行;第2类是4、5即违反交通信号灯、违规逆行;第3类是超速。3类交通违法行为的发生率如图 8所示。从发生率来看,第1类交通违法行为发生率先总体上升,然后总体下降;第2类交通违法行为发生率先总体下降到4月的最低值,而后迅速上升到5月的最高值,然后呈不断下降趋势;第3类交通违法行为发生率先总体上升,然后又快速下降,发生率曲线近似呈左右对称的形态。
![]() |
图 8 3类交通违法行为发生率分布 Fig.8 Occurrence Rates of Three Types of Traffic Violations |
6 结束语
本文利用福州市2016年的交通违法数据,研究了交通违法行为的空间分布特征,并在不同时间尺度下分析了交通违法行为的变化规律。研究表明:①交通违法行为在市区二环内呈明显聚集分布,而且存在交通违法的热点区域,且不同月份交通违法行为的聚集状态和热点区域存在差异。②不同月份的交通违法数量存在波动,一周内工作日平均交通违法数量比双休日多,且通常节假日比非节假日交通违法数量少。③通过Gini指数分析,6种主要交通违法行为在一年中各月份分布的集中程度均较高,且根据分布规律的相似性,可将它们分成3类。
本文分析了交通违法行为的空间和时间分布特征,但交通违法行为的发生与很多因素有关,结合具体路段,分析不同类型交通违法行为的影响因素,还有待进一步研究。
[1] |
庞丽微.石家庄市道路交通违法状况调查研究[D].石家庄: 河北师范大学, 2014 http://cdmd.cnki.com.cn/Article/CDMD-10094-1014259849.htm
|
[2] |
许洪国, 周立, 鲁光泉. 中国道路交通安全现状、成因及其对策[J]. 中国安全科学学报, 2004, 14(8): 34. DOI:10.3969/j.issn.1003-3033.2004.08.009 |
[3] |
杨春风, 庄摇灿, 孙吉书, 等. 道路交通事故多因素分析[J]. 重庆交通大学学报(自然科学版), 2018, 37(4): 87-95. DOI:10.3969/j.issn.1674-0696.2018.04.14 |
[4] |
郭晓魁, 李瑞, 陈罗刚, 等. 基于GIS的城郊公路交通事故时空分布研究[J]. 河北工业大学学报, 2017, 46(5): 62-67. |
[5] |
姚敏.基于DSP交通违章监控系统的设计[D].淮南: 安徽理工大学, 2014 http://cdmd.cnki.com.cn/article/cdmd-10361-1014384853.htm
|
[6] |
勉斌.基于Linux的智能交通违章识别系统[D].成都: 西南交通大学, 2013 http://cdmd.cnki.com.cn/Article/CDMD-10613-1013251379.htm
|
[7] |
禹文豪, 艾廷华. 核密度估计法支持下的网络空间POI点可视化与分析[J]. 测绘学报, 2015, 44(1): 82-90. |
[8] |
Borruso G. Network Density Estimation:A GIS Approach for Analysing Point Patterns in a Network Space[J]. Transactions in GIS, 2008, 12(3): 377-402. DOI:10.1111/j.1467-9671.2008.01107.x |
[9] |
Liu H, Brown D E. Criminal Incident Prediction Using a Point-Pattern-Based Density Model[J]. International Journal of Forecasting, 2003, 19(4): 603-622. DOI:10.1016/S0169-2070(03)00094-3 |
[10] |
叶玲, 陈楠. 案事件时空格局演变分析[J]. 微型机与应用, 2015, 34(3): 78-81. DOI:10.3969/j.issn.1674-7720.2015.03.026 |