2. 清华大学 计算机科学与技术系, 北京 100084
2. Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China
理解用户行为在普适计算、场景感知中有着重要的意义,识别交通模式,如步行、乘火车、乘车等是其中一项重要的研究课题。用户的交通模式从一个侧面反映了用户的生活方式,对基于位置的服务应用以及交通管理等有着重要的参考价值[1-2]。
随着嵌入GPS定位功能的便携设备,如手机、PDA的普及,为采集用户轨迹数据提供了便利条件。常见的GPS数据由时间、经度、维度组成。基于不同交通模式具有不同轨迹特征的设想,研究者借助领域知识,设计了多种人工特征,如:速度、加速度、行驶方向变化率、速度变化率、停顿率等,并在此基础上,对标注交通模式的轨迹历史数据进行分析,建立、训练分类模型,实现交通模式识别[3-6]。
目前,交通模式识别主要依靠研究者人为设计高区分度特征,需要研究者有相当的专业技术背景、主观性较强,特征设计的好坏具有很大的经验成分。但由于交通行为的复杂性,如:交通拥堵时,步行与乘车具有相同的速度等,人工设计特征并不能非常好地发挥作用。为了克服上述不足,基于深度学习理论,利用卷积神经网络自动学习深层交通模式特征,然后利用深层神经网络,将自动学习的深度特征与人工特征共同用于交通模式识别。深度特征具有较强的交通模式区分度,深度神经网络能有效地对两类特征进行融合,从而提高交通模式识别率。
针对交通模式识别研究,Zheng[7]对轨迹数据研究进行了总结,指出交通模式识别的重要性与常见研究方法,从使用的数据源上可分为两类:轨迹数据结合外部信息识别与单纯轨迹数据识别。文献[3, 8-9]提出了结合地图等外部信息的、轨迹数据交通模式识别方法,可以进行交通模式,如步行、乘车等的识别。这种方法采用了除轨迹数据外的信息,现实中,这些外部信息的获取存在难度、应用范围受限。因此,重点研究仅基于轨迹数据进行交通模式识别。郑宇等[4]针对特征定义和识别算法进行了研究。实验证明了设计特征的有效性;识别算法方面,提出了基于图论的后期加工算法,根据实际生活常识和典型用户行为,推断交通模式概率,用于对初步识别结果进行再判断。郑宇等[6, 10]提出基于监督学习方法的用户交通模式自动推测系统,该系统由切换点的轨迹段分割法、推断模型以及基于图论的后期加工算法组成。
针对深度特征学习研究,文献[11-12]提出了利用自动编码器进行特征特征学习的方法;文献[13]讨论了如何利用神经网络进行数据降维;文献[14]讨论了如何利用深度神经网络从原始图像中自动学习特征并指出这种特征学习方法能明显地提高识别准确率;文献[15]通过卷积核提取可见层不同的特征,提高模型局部特征学习能力。
以上研究中,交通模式识别主要以人工特征为主,区分度和客观性受到限制,本文基于深度学习理论,建立基于卷积神经网络的特征自动学习模型,融合深度与人工特征共同用于交通模式识别。
1 深度特征学习 1.1 深度特征学习模型深度特征学习模型图 1所示,整个框架大体上由4部分组成。移动端采集的GPS数据,通过简单计算后,获得基本人工特征(BHF),如速度(v)、转角(h)、时间间隔(t)和距离(d)。卷积神经网络对基本人工特征进一步处理,提取深度特征。最终,将深度特征与人工特征共同输入分类器,实现交通模式识别。
Download:
|
|
来自一条轨迹片段的采样点按时序关系组成一个基本人工特征时间序列,卷积神经网络分两步对该特征序列进行卷积池化,首先利用2-D卷积网络进行序列特征映射并利用池化层进行压缩,接下来在压缩的序列上,进行1-D卷积并再次池化,得到1-D深度特征。卷积操作如图 2所示。
Download:
|
|
池化是卷积神经网络处理中的另一个重要操作,它可以对卷积后生成的特征映射进行压缩,常用的池化策略有最大和平均2种。使用最大池化策略,激活单元中的最大值用作池化输出;使用平均池化策略,激活单元的平均值将被作为输出。实验中对两种池化策略均进行了测试。
1.3 深度特征学习算法首先计算轨迹片段的基本人工特征(BHF),既速度,角度、时间、距离;再利用卷积神经网络在(BHF)的基础上学习轨迹片段的深度特征,最后算法返回深度特征用于进一步处理,算法为:
输入:轨迹片段p={p1, p2, …, pn}, 其中pi={lat, lon, t};
轨迹片段交通模式S;
阈值α控制优化次数
输出:DF。
begin
S. BHF={p1.BHF, p2.BHF, …, pn.BHF}←Calcuate({p1, p2, …, pn});
i←0;
while i < α do
DF←CNN.Learning(S.BHF);
i++;
end
return DF;
end
2 分类器设计将经过上述步骤得到的深度特征与人工特征一起,共同用于交通模式识别。至此,交通模式识别问题转化为分类问题。
由于深度特征维度较高,传统的分类器无法有效地发挥其分类潜力,因此,选择深度神经网络作为交通模式分类器,将深度特征与人工特征作为分类器输入,交通模式标记作为输出,进行监督式学习,网络结构如图 3所示。
Download:
|
|
除输入层外,该网络包含2层全连接的隐藏层,均为256个神经元,五分类的softmax作为输出层,采用relu为激活函数,利用动量梯度下降法对网络进行训练。
softmax分类模型是logistic模型是在多分类问题上的推广,五类softmax函数记为:
$ \begin{array}{l} {\mathit{\boldsymbol{h}}_\theta }\left( {{\mathit{\boldsymbol{x}}^{\left( i \right)}}} \right) = \left[\begin{array}{l} p\left( {{y^{\left( 1 \right)}} = 1|{\mathit{\boldsymbol{x}}^{\left( i \right)}};\mathit{\boldsymbol{\theta }}} \right)\\ p\left( {{y^{\left( 2 \right)}} = 2|{\mathit{\boldsymbol{x}}^{\left( i \right)}};\mathit{\boldsymbol{\theta }}} \right)\\ p\left( {{y^{\left( 3 \right)}} = 3|{\mathit{\boldsymbol{x}}^{\left( i \right)}};\mathit{\boldsymbol{\theta }}} \right)\\ p\left( {{y^{\left( 4 \right)}} = 4|{\mathit{\boldsymbol{x}}^{\left( i \right)}};\mathit{\boldsymbol{\theta }}} \right)\\ p\left( {{y^{\left( 5 \right)}} = 5|{\mathit{\boldsymbol{x}}^{\left( i \right)}};\mathit{\boldsymbol{\theta }}} \right) \end{array} \right] = \\ \;\;\;\;\;\;\;\;\;\;\frac{1}{{\sum\limits_{j = 1}^5 {{\mathit{\boldsymbol{e}}^{\mathit{\boldsymbol{\theta }}_j^{\rm{T}}{\mathit{\boldsymbol{x}}^{\left( i \right)}}}}} }}\left[\begin{array}{l} \mathit{\boldsymbol{\theta }}_1^{\rm{T}}{\mathit{\boldsymbol{x}}^{\left( i \right)}}\\ \mathit{\boldsymbol{\theta }}_2^{\rm{T}}\mathit{\boldsymbol{x}}^{\left( i \right)}\\ \mathit{\boldsymbol{\theta }}_3^{\rm{T}}\mathit{\boldsymbol{x}}^{\left( i \right)}\\ \mathit{\boldsymbol{\theta }}_4^{\rm{T}}\mathit{\boldsymbol{x}}^{\left( i \right)}\\ \mathit{\boldsymbol{\theta }}_5^{\rm{T}}\mathit{\boldsymbol{x}}^{\left( i \right)} \end{array} \right] \end{array} $ |
式中:hθ(x(i))是一个5维列向量,表示在模型参数为θ的情况下,输入x属于不同分类的概率;1/
其代价函数为
$ J\left( \mathit{\boldsymbol{\theta }} \right) = - \frac{1}{m}\left[{\sum\limits_{i = 1}^m {\sum\limits_{j = 1}^5 {1\left\{ {{y^{\left( i \right)}} = j} \right\}\log } } \frac{{{\mathit{\boldsymbol{e}}^{_j^{\rm{T}}{\mathit{\boldsymbol{x}}^{\left( i \right)}}}}}}{{\sum\limits_{j = 1}^5 {{\mathit{\boldsymbol{e}}^{_j^{\rm{T}}{\mathit{\boldsymbol{x}}^{\left( i \right)}}}}} }}} \right] $ |
式中:J(θ)表示代价函数;θ表示模型参数;m为训练集数据的大小;1{f(·)}中表达式f(·)为真时,值为1;1/
基于微软GeoLife数据集[17-19]对模型进行验证。该数据集记录了182名用户5年间的17 621条移动轨迹。轨迹利用GPS记录仪或GPS手机进行采集,由一系列连续的轨迹点组成,每个轨迹点包含了时间、精度、维度、高度信息,91.5%的轨迹点采样间隔为5~10 s。其中73名用户标注了交通模式,如:走路、乘车、汽车等。不同交通模式的总距离、总时间如表 1所示。
综合考虑不同模式下GPS数据量、准确度、采样间隔度等问题,选取了67名用户,5种模式的数据用于模型验证,分别为步行、自行车、小汽车(含出租)、公交车、火车。
利用滑动窗口技术对轨迹进行分片,如图 4所示。每一个分片包含500个采样点。相邻的分片可以共享采样点。分片的交通模式根据交通模式标注文件确定。
Download:
|
|
为了验证深度特征的有效性,针对特征设计了以下实验。
高级人工特征(AHF):模型训练和测试过程中,仅涉及高级人工特征。测试结果用作比较基准。
深度特征(DF):模型训练和测试过程中,仅采用深度特征。测试结果用于验证深度特征的有效性。
融合特征(AHF+DF):高级人工特征和深度特征(DF)共同用于模型训练与测试。
3.2.2 分类方法逻辑回归(LR):是一种线性模型,可用于分类问题,以sigmod函数为核心,通过计算数据属于某个类的概率,来实现数据分类,其扩展softmax常用于多分类问题。
支持向量机(SVM):是一个有监督学习模型,常用于分类问题,该模型通过学习训练数据,查找一个能将样本分类,且具有最大间隔的分类面,支持核函数,能通过高维映射,将非线性问题转化为线性问题进行解决。采用RBHF核函数处理非线性数据。
决策树(DT):决策树是一个有监督学习模型,可以被认为是一种if-then规则的集合。决策树由节点和有向边组成,内部节点代表了特征特征,外部节点(叶子节点)代表了类别。其本质利用if-then规则将特征分开,最小化度量标准(信息熵、基尼不纯度)。
深度神经网络(DNN):可以简单看做是一种含有多个隐藏层的神经网络,通过逐层预学习与反向微调,实现对训练数据的建模。神经网络模型对数据的拟合度好,能更好的学习数据内部关系,常用于分类与特征学习问题。
3.2.3 实验评价指标选用准确率对模型识别效果进行评价,准确率即模型识别的交通模式与实际交通模式相符的轨迹段在整个轨迹段集合中所占的比例。
3.3 实验结果分析实验进行了10次随机实验,均采用5折交叉验证方式。实验环境为ubunt14.04,cuda7.5,tensorflow。
3.3.1 特征影响分析表 2的结果为不同特征组合所取得的最高准确率,均采用DNN分类器和最大池化策略,现分析如下:
不同特征组合影响分析:DF特征好于AHF特征,证明了卷积神经网络模型从基本人工特征中提取深度特征的有效性。DF+AHF融合特征相比于单一特征识别率提高2%~4%,说明同时使用2种特征,有利于提高识别准确率。
池化策略影响分析:由于AHF的计算与卷积神经网络无关,所以AHF不受池化影响,识别准确率相同。DF特征受池化策略影响明显,相比于平均池化策略准确率(0.65),最大池化下识别准确率提高近5%,达到0.702。AHF+DF融合特征中,由于AHF特征的加入,减轻了池化策略影响,准确率较接近,分别为最大池化(0.721)和平均池化(0.708)。
3.3.2 检测方法影响分析不同特征组合影响分析:如表 3所示,单纯使用AHF特征时,最大值0.683在DNN方法下取得,最小值0.607在SVM下取得;使用DF特征时,最大值0.702在DNN方法(最大池化策略)下取得,最小值0.232在SVM(平均池化策略)下取得;AHF+DF时,最大正确率0.721在DNN(最大策略)时取得,最小正确率0.261在SVM(平均池化策略)下取得。说明DNN方法能更好地提取特征间内在关系, SVM在特征利用方面相对较弱。
池化策略影响分析:如表 3所示,平均池化策略下,最大值0.708出现在DNN方法(AHF+DF)时,最小值0.232出现在SVM方法(DF)时,其中SVM方法受影响明显,准确率大幅下降。最大池化策略下,正确率0.721出现在DNN方法(AHF+DF)时,最小值0.491出现在SVM(DF)时。说明,DNN方法对池化策略鲁棒性强,稳定性良好,SVM方法受池化策略影响明显。
4 结论1) 卷积神经网络能有效地从轨迹数据中学习高区分度深度特征,且特征分类效果稳定,具有一定的普适性。除SVM外的多种分类器(LR,DT,DNN),在加入深度特征后,交通模式识别准确率均得到不同程度的提升。
2) 特征融合有利于提高交通模式识别准确率,融合深度特征与人工特征的分类器在识别准确率方面均高于使用单一特征。
3) 卷积神经网络的池化策略对学习特征有重要影响,最大池化策略更有利于特征学习。
深度特征与交通模式的关联关系尚不明确,有待进一步分析深度特征所表达的意义。
[1] |
陈娜.基于位置信息的北京市出行模式研究[D].北京: 北京交通大学, 2016. CHEN Na. Position-based resident travel pattern of BeiJing[D]. Beijing: Beijing Jiaotong University, 2016. http://cdmd.cnki.com.cn/Article/CDMD-10004-1016074379.htm (0) |
[2] |
隋雪芹.基于社会媒体的用户移动轨迹挖掘及其在朋友推荐中的应用研究[D].济南: 山东大学, 2016. SUI Xueqin. Research on movement trajectory detection and application in friend recommendation based on social media[D]. Ji'nan: Shandong University, 2016. http://cdmd.cnki.com.cn/Article/CDMD-10422-1016164208.htm (0) |
[3] |
PATTERSON D J, LIAO lin, FOX D, et al. Inferring high-level behavior from low-level sensors[C]//Proceedings of the 5th International Conference on Ubiquitous Computing. Seattle, WA, USA, 2003: 73-89. http://www.springerlink.com/content/k3x004g773qj80kg
(0)
|
[4] |
ZHENG Yu, LI Quannan, CHEN Yukun, et al. Understanding mobility based on GPS data[C]//Proceedings of the 10th International Conference on Ubiquitous Computing. Seoul, Korea, 2008: 312-321. https://www.mendeley.com/catalogue/understanding-mobility-based-gps-data/
(0)
|
[5] |
REDDY S, MUN M, BURKE J, et al. Using mobile phones to determine transportation modes[J]. ACM transactions on sensor networks (TOSN), 2010, 6(2): 13. (0)
|
[6] |
ZHENG Yu, LIU Like, WANG Longhao, et al. Learning transportation mode from raw gps data for geographic applications on the web[C]//Proceedings of the 17th International Conference on World Wide Web. Beijing, 2008: 247-256. Learning transportation mode from raw gps data for geographic applications on the web[
(0)
|
[7] |
ZHENG Yu. Trajectory data mining:an overview[J]. ACM transactions on intelligent systems and technology, 2015, 6(3): 29. (0)
|
[8] |
LIAO Lin, PATTERSON D J, FOX D, et al. Learning and inferring transportation routines[J]. Artificial intelligence, 2007, 171(5): 311-331. (0)
|
[9] |
SHAH R C, WAN C Y, LU Hong, et al. Classifying the mode of transportation on mobile phones using GIS information[C]//Proceedings of the 2014 ACM International Joint Conference on Pervasive and Ubiquitous Computing. Seattle, Washington, 2014: 225-229. http://dx.doi.org/10.1145/2632048.2632109
(0)
|
[10] |
ZHENG Yu, CHEN Yukun, LI Quannan, et al. Understanding transportation modes based on GPS data for web applications[J]. ACM transactions on the web (TWEB), 2010, 4(1): 1. (0)
|
[11] |
VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders[C]//Proceedings of the 25th International Conference on Machine Learning. Helsinki, Finland, 2008: 1096-1103. http://www.mendeley.com/research/extracting-composing-robust-features-denoising-autoencoders
(0)
|
[12] |
VINCENT P, LAROCHELLE H, LAJOIE I, et al. Stacked denoising autoencoders:Learning useful representations in a deep network with a local denoising criterion[J]. The journal of machine learning research, 2010, 11: 3371-3408. (0)
|
[13] |
HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507. DOI:10.1126/science.1127647 (0)
|
[14] |
KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks[C]//Proceedings of the 25th International Conference on Neural Information Processing Systems. Lake Tahoe, Nevada, 2012: 1097-1105. http://www.mendeley.com/catalog/imagenet-classification-deep-convolutional-neural-networks/
(0)
|
[15] |
毕晓君, 冯雪赟. 基于改进深度学习模型C-GRBM的人体行为识别[J]. 哈尔滨工程大学学报, 2018, 39(1): 156-162. BI Xiaojun, FENG Xueyun. Human action recognition based on improved depth learning model C-GRBM[J]. Journal of Harbin Engineering University, 2018, 39(1): 156-162. (0) |
[16] |
ZHENG Yu, ZHANG Lizhu, XIE Xing, et al. Mining interesting locations and travel sequences from GPS trajectories[C]//Proceedings of the 18th International Conference on World Wide Web. Madrid, Spain, 2009: 791-800.
(0)
|
[17] |
ZHENG Yu, XIE Xing, MA Weiying. GeoLife:A collaborative social networking service among user, location and trajectory[J]. IEEE data(base) engineering bulletin, 2010, 32(2): 32-39. (0)
|