情景路网约束下基于序列到序列的轨迹恢复方法

孟祥福; 葛檄文; 杨雨卓

doi:10.11992/tis.202506009

情景路网约束下基于序列到序列的轨迹恢复方法

doi: 10.11992/tis.202506009

辽宁工程技术大学电子与信息工程学院, 辽宁葫芦岛 125105

详细信息

作者简介:
孟祥福，教授，博士，中国计算机学会高级会员。主要研究方向为自主分布式二维地图引擎、时序数据智能分析和预测、数字病理医学影像智能分析。发表学术论文27篇。E-mail：marxi@126.com;

葛檄文，硕士研究生，主要研究方向为轨迹数据恢复和轨迹挖掘。E-mail：19397275071@163.com;

杨雨卓，硕士研究生，主要研究方向为大数据分析与轨迹可视化。E-mail：lambfishnab@163.com.

通讯作者:
孟祥福. E-mail：marxi@126.com.

中图分类号: TP183
出版历程
- 收稿日期: 2025-06-11
- 网络出版日期: 2026-02-05

A seq2seq based trajectory recovery method under the constraint of scenario road network

School of Electronic and Information Engineering, Liaoning Technical University, Huludao 125105, China

摘要

摘要:
在真实世界中，轨迹数据日益激增却又稀疏，轨迹恢复对下游轨迹挖掘任务具有重大意义。路网约束下端到端的轨迹恢复方法大多通过静态路网和轨迹坐标描述轨迹并嵌入向量，既忽视道路动态流量变化，又未考虑驾驶者出行模式与区域、路段功能的关联，而这些特征难以从稀疏轨迹时空特征和道路建设语义特征中提取。为此，本文提出一种情景路网约束下基于序列到序列的轨迹恢复方法(road network-constrained scenario-based trajectory recovery, CSTrajRec)，该方法将轨迹输入傅里叶编码层提取其时空特征，强化对整体模式的表达。在编码器中，用路段所在位置的兴趣点文本、道路种类和时间段内的区域流量建模每个路段，然后用路段描述轨迹序列以反映个体的出行模式和偏好。在解码器中，设计一种新颖的融合距离和道路情景的路段推理模块用于指导轨迹的恢复。通过在3个真实轨迹数据集上构建的不同采样间隔稀疏轨迹的实验，充分验证了本文所提出模型的优越性。
- 路网约束 /
- 出行模式 /
- 稀疏轨迹 /
- 轨迹恢复 /
- 序列到序列 /
- 情景路网 /
- 时空特征提取 /
- 路段推理
Abstract:
In the real world, trajectory data grows exponentially yet remains sparse, making trajectory recovery crucial for downstream mining tasks. Most existing end-to-end trajectory recovery methods under road network constraints embed static road networks and coordinates into vectors. However, they overlook dynamic road traffic flow and neglect links between drivers' travel patterns and the functions of regions/road segments, which are hard to extract from sparse trajectory spatio-temporal features and road semantic features. This paper proposes a road network-constrained scenario-based sequence-to-sequence trajectory recovery method (CSTrajRec). It inputs trajectories into a Fourier encoding layer to extract spatio-temporal features and enhance overall pattern representation. In the encoder, each road segment is modeled with text-based points of interest, road type, and regional traffic, which are then used to describe the trajectory sequence for individual travel patterns. In the decoder, a novel segment inference module fusing distance and road scenario information is designed for trajectory recovery. Experiments on three real datasets with sparsely sampled trajectories at varying intervals validate the model's superiority.
- road network constraint /
- travel pattern /
- sparse trajectory /
- trajectory recovery /
- sequence-to-sequence /
- scenario road network /
- spatiotemporal feature extraction /
- road segment inference

HTML全文

车辆轨迹是车辆在地理空间随时间移动形成的路径连续曲线，反映不同时刻位置信息。因定位技术(如全球定位系统(global positioning system, GPS)、传感器等)无法连续记录，车辆轨迹数据(以下简称轨迹)多为离散采样所得。受设备内存与采样机制限制，轨迹记录普遍具稀疏性，如Gowalla数据集用户签到数据稀疏度超98%^[1]，这导致车辆轨迹信息大量丢失。而挖掘轨迹数据对于理解车辆的出行模式以及支持各种下游智能导航应用至关重要，例如交通流量预测^[2–4]、车辆轨迹预测^[5–7]、轨迹相似度计算^[8-9]和旅行时间估算^[10-11]。因此稀疏轨迹恢复是当前研究的根本任务。

早期研究聚焦无路网轨迹恢复，使用固定位置而非道路网络结构。通过将问题转述为优化问题，预测起始和终点位置之间的位置序列^[12]，利用预定义的校准锚点^[13]，或采用马尔可夫模型^[14]。然而，这些方法仅考虑低阶转换模式，无法捕捉具有长期依赖性的空间和时间上下文。Li等^[15]使用历史轨迹中每个时间间隔访问最频繁的地点来进行恢复，Xia等^[16]注重对轨迹长时间历史模式和移动模式的捕捉。近年来，研究者意识到路网拓扑结构对地图约束的轨迹恢复具有高价值，Wang等^[14]提出两阶段解决方案，首先恢复高采样轨迹，然后使用地图匹配算法^[17]恢复实际GPS位置。Ren等^[18]首先将seq2seq架构引入轨迹恢复，发现它在两阶段技术中表现更优，才广泛应用于后续的轨迹恢复研究。Wang等^[14]先通过该架构恢复轨迹的GPS点，再使用卡尔曼滤波减少恢复不确定性。Chen等^[19]借助网格图神经网络学习道路段特征，并利用GPSFormer分析详细轨迹。这些组件使多任务解码器能够高效地利用编码器输出重建缺失的GPS点。Liu等^[20]则首先以图为核心捕捉轨迹间、路段间和轨迹−道路间的相关性，降低RNN（recurrent neural network）解码器无法充分利用预测道路片段之间的相关性导致的误差。Wei等^[21]的图编码器对路口和道路描述GPS点的明确绝对信息及其隐含相对信息，对微观语义进行建模。模型的图解码器则通过建模共享出行偏好和交通状况，捕捉宏观语义，指导轨迹恢复。Zhao等^[22]则着重轨迹与道路网络的交互性进行轨迹恢复，提出了一种具备轨迹感知能力的图表示法，用于高级道路嵌入，并引入了结合注意力增强型Transformer和特征差异感知解码器的时空区间感知模块。

用于轨迹恢复的seq2seq框架中，包括一个负责生成输入轨迹表示的编码器模型和一个负责逐点恢复轨迹的解码器模型。著名的有MTrajRec (map-constrained trajectory recovery framework)^[18]，RNTrajRec (road network enhanced trajectory recovery framework)^[22]以及GRFTrajRec (graph-based representation framework for trajectory recovery)^[23]。MTrajRec提出利用路段标识符(identifier, ID)和移动比例来确定每个轨迹点的位置以避免误差累积，但其忽视路网对轨迹恢复任务的显著作用，仅采用门控递归单元(gated recurrent unit, GRU)对轨迹进行表征，导致时空特征提取能力欠佳。RNTrajRec方法则注意到丰富的路网拓扑结构对稀疏轨迹恢复的影响，通过在编码器中使用道路网络表示学习和轨迹表示学习，能有效地捕捉轨迹中每个GPS点的时空特征。GRFTrajRec加强道路与轨迹表示整合，从多视角上提取轨迹的时空文本信息，解码时，该方法兼顾了路段的距离和轨迹记录时间，遗憾的是，未注意轨迹分布与路段动态情景关联。轨迹恢复进展显著，但地图约束轨迹恢复仍面临挑战。

1) 现有研究普遍忽视轨迹模式的整体表示。构建向量时过于聚焦单个轨迹点，使得轨迹整体模式表示被忽略。目前缺乏有效手段捕捉单个轨迹整体特征、潜在语义及精准编码个性化模式。

2) 动态情景下，宏观流量与轨迹的协同作用常被忽视。轨迹停留受路网和宏观流量共同影响，但现有研究在处理轨迹数据时，常假定空间近的轨迹点嵌入向量相似，忽略该时刻宏观流量，导致模型反映真实交通与轨迹行为能力欠缺。

3) 路网文本特征对出行模式的影响常被忽视。轨迹途径的兴趣点(point of interest, POI)和道路都有文本信息，但现有研究未充分挖掘文本特征在轨迹分析与出行模式中的潜在价值。

为了应对上述挑战并实现准确的地图约束轨迹恢复，本文的贡献如下：

1) 将Transformer模型的嵌入向量与车辆轨迹对齐，从道路属性、流量和POI视角描述轨迹。

2) 引入了路段情景感知器，该模块由两种卷积结构组成，分别从时间角度和空间角度提取地图中轨迹的流量特征，再将流量特征嵌入到每个路段上。

3) 为增强轨迹解码能力，在多任务轨迹解码器中加入新颖的路段推理模块，相对于仅基于距离推理轨迹点所属路段的方法，还考虑了路段情景。

1. 相关定义和问题描述

1.1 定义

定义1（车辆轨迹）　车辆轨迹$ T $被定义为一个轨迹点序列：$ T=\langle {p}_{1},{p}_{2},\cdot \cdot \cdot ,{p}_{n}\rangle $，其中$ n $是点的数量。每个点$ {p}_{i}=({\lambda }_{i},{\varphi }_{i},{t}_{i}) $由经度$ {\lambda }_{i} $、纬度$ {\varphi }_{i} $和时间戳$ {t}_{i} $组成，代表车辆在特定时间的位置。

定义2（道路网络）　道路网络被定义为有向图G = (V, E)，其中V是节点的集合，代表路段之间的交叉路口，且每个节点都有纬度和经度属性。E是边的集合，代表连接两个节点的路段。一条边$ e\in $E由一个起始交叉路口$ {e}^{\text{start}}\in $V和一个结束交叉路口$ {e}^{\text{end}}\in $V所确定。

定义3（兴趣点）　兴趣点(POI)是指具有文化、环境或经济价值的地点$ {l}_{i}=({\lambda }_{i},{\varphi }_{i},d_{i}^{\text{POI}}) $，其中，$ {\lambda }_{i} $和$ {\varphi }_{i} $表示兴趣点的坐标，而$ d_{i}^{\text{POI}} $包含了兴趣点的名称、类型和地址等详细信息。

定义 4 (地图匹配轨迹)　每个在原始轨迹序列$ {\tau }^{*}=\left\langle p_{1}^{*},p_{2}^{*},\cdot \cdot \cdot ,p_{n}^{*}\right\rangle $中的轨迹点$ {p}^{*} $经过地图匹配后投影到道路上并生成唯一投影点$ p=\langle e,r,t\rangle $。其中$ e $表示投影点所在位置的道路信息，$ r $表示移动比例，$ t $表示该投影点对应原始轨迹点的时间戳。如图1所示，通过投影点$ p $在道路上已经移动的距离与边$ e $长度的比率计算得出。具体的转化函数为

图 1 地图约束下轨迹恢复、道路段和移动比率的示例

Fig. 1 Examples of trajectory recovery under map constraints, road segments and movement ratios

下载: 全尺寸图片

$$ \begin{cases} {p}_{\lambda }=e_{\lambda }^{\text{start}}+(e_{\lambda }^{\text{end}}-e_{\lambda }^{\text{start}})\cdot r\\ {p}_{\varphi }=e_{\varphi }^{\text{start}}+(e_{\varphi }^{\text{end}}-e_{\varphi }^{\text{start}})\cdot r\\ {p}_{t}=p_{t}^{*} \end{cases} $$

1.2 问题定义

给定一个低采样率轨迹$ \tau =\langle {p}_{1},{p}_{2},\cdot \cdot \cdot ,{p}_{n}\rangle $以及一个目标采样率$ \epsilon $，本文目标是恢复出真实的经地图匹配后的$ \epsilon $采样率轨迹$ \tilde{\tau }=\left\langle {a}_{1},{a}_{2},\cdot \cdot \cdot ,{a}_{m}\right\rangle $。对于每条低采样率轨迹，将同时推断出其缺失的点，并将其进行地图匹配到道路网络上。

2. CSTrajRec方法

轨迹恢复方法(road network-constrained scenario-based trajectory recovery, CSTrajRec)整体模型框架如图2所示。其涵盖3个关键模块：(a)时空特征编码模块，用于提取稀疏轨迹的时空特征，并对其进行编码处理。(b)轨迹编码器，将编码器中的情景路网表示，包括路网拓扑结构、地图流量分布以及POI文本等信息，融入稀疏轨迹表示。(c)多任务解码器，采用了新颖的候选路段推理方式，并基于GRU完成轨迹恢复。

图 2 CSTrajRec的框架

Fig. 2 Framework of CSTrajRec

下载: 全尺寸图片

2.1 时空特征嵌入

受Zhao等^[22]工作的启发，如图2(a)表示轨迹的时空特征编码方式，由于原始轨迹包含大量的坐标点且每个轨迹点都具有坐标信息。将轨迹网格化，即划分地图为$ H\text{×}W $个边长相等的网格单元，以减少数据维度。

本文将低采样率的匹配轨迹$ {p}_{i} $坐标转化为网格坐标$ ({x}_{i},{y}_{i},{s}_{i}) $来捕获轨迹的空间特征，这里$ {x}_{i} $和$ {y}_{i} $表示$ {p}_{i} $所在网格单元的索引，$ {s}_{i} $表示在最终获得恢复轨迹中的时间索引。计算方法为

$$ {s}_{i}=\frac{t(i)-t(0)}{\varepsilon } $$

式中：$ \varepsilon $表示期望恢复轨迹的采样率，$ t(i) $是低采样率轨迹中的第$ i $个点的时间戳。

为捕获轨迹T的时间特征，将低采样轨迹的时间戳序列$ ({t}_{1},{t}_{2},\cdot \cdot \cdot ,{t}_{n}) $中提取日期、时、分钟和是否为节假日的特征向量，这4个特征通过可学习的傅里叶编码层^[24]编码为嵌入向量$ {\boldsymbol{t}}_{{i}}\in {\mathbb{R}}^{4} $，并采用非线性变换将原始边特征投影到$ {d}_{\text{traj}} $维。因此，轨迹的时空特征$ {\boldsymbol{z}}_{i} $表示为

$$ \begin{gathered}\text{Fourier}(\boldsymbol{t}_{i}^{k})=\frac{1}{\sqrt{{d}_{\text{traj}}}}[\sin (\boldsymbol{t}_{i}^{k}{\boldsymbol{W}}_{{\mathrm{r}}})||\cos (\boldsymbol{t}_{i}^{k}{\boldsymbol{W}}_{{\mathrm{r}}})]\\ {\boldsymbol{z}}_{i}={f}_{\text{c}}\left(\underset{k=1}{\overset{4}{\| } }\text{Fourier}(\boldsymbol{t}_{i}^{k})||({x}_{i},{y}_{\mathrm{i}},{s}_{i})\right) \end{gathered} $$

式中：$ {f}_{\text{c}}(\cdot ) $是全连接层的映射函数；$ \cdot ||\cdot $表示向量拼接操作；$ {\boldsymbol{W}}_{{\mathrm{r}}}\in {\mathbb{R}}^{4\times {{d}_{\text{traj}}}/2} $是可学习参数，定义了傅里叶特征的方向和波长，在这里，用于轨迹时间特征编码。通过聚合时间特征和空间特征，获得轨迹的潜在表示：

$$ {\boldsymbol{Z}}^{\tau }=\langle {\boldsymbol{z}}_{1},{\boldsymbol{z}}_{2},\cdot \cdot \cdot ,{\boldsymbol{z}}_{n}\rangle \in {\mathbb{R}}^{n\times {{d}_{\text{traj}}}} $$

2.2 POI文本特征嵌入

车辆轨迹的出行模式与其经过的道路和POI的类型和功能密切相关，本文将轨迹的部分出行信息解释为轨迹所经过的POI文本。给定轨迹序列$ T=\langle {p}_{1},{p}_{2},\cdot \cdot \cdot ,{p}_{n}\rangle $，轨迹点$ {p}_{i} $所在的网格单元存在$ k $个POI点$ {L}_{i}= \langle {l}_{1},{l}_{2},\cdot \cdot \cdot ,{l}_{k} \rangle $，将$ {L}_{i} $中每个POI的类型和文本映射为独热编码，随后经过全连接神经网络将这些表示转化为嵌入向量$ {\boldsymbol{z}}_{{{l}_{i}}}\in {\mathbb{R}}^{{{d}_{\text{POI}}}} $。$ {\boldsymbol{z}}_{{{L}_{i}}}\in {\mathbb{R}}^{{{d}_{\text{POI}}}} $是$ {\boldsymbol{z}}_{{{l}_{i}}} $的线性叠加，代表该网格单元的整体POI特征。具体转化函数为

$$ \begin{gathered}{\boldsymbol{z}}_{{{l}_{i}}}={f}_{\text{c}}(\text{POITypeEmbed}({l}_{i}))+{f}_{\text{c}}\text{(TextEmbed}({d}_{{i}}^{\text{POI}}))\\ {\boldsymbol{z}}_{{{L}_{j}}}=\sum\limits_{k}{\boldsymbol{z}}_{{{l}_{j}}} \end{gathered} $$

式中：全连接神经网络的映射函数记为$ {f}_{\text{c}} $；POITypeEmbed层根据POI类型(如餐厅、超市、停车场等)将$ {l}_{i} $映射为嵌入向量；而TextEmbed层将轨迹点周围POI的长文本描述$ d_{i}^{\text{POI}} $映射为嵌入向量，例如对停车场的描述，是否有节假日，是否收费，是否开放以及停车场的规模。因此，整条轨迹$ \tau $的文本特征表示为

$$ \boldsymbol{z}_{\tau }^{\text{POI}}=\left\langle {\boldsymbol{z}}_{{{L}_{1}}},{\boldsymbol{z}}_{{{L}_{2}}},\cdot \cdot \cdot ,{\boldsymbol{z}}_{{{L}_{n}}}\right\rangle \in {\mathbb{R}}^{n\times {{d}_{\text{POI}}}} $$

2.3 情境路况表示

由于路网拓扑结构影响车辆轨迹的形成，轨迹表征研究融入静态道路网络编码的空间语义分析已成为重要方向。利用图神经网络捕捉道路及路网特征，结合注意力机制依邻接关系分配节点权重，从而有效提取道路网络特征。

然而，仅考虑融入静态路网编码的轨迹表征方式存在缺陷。实际驾驶场景中，道路车流量处于动态变化状态，道路周边区域的POI设施情况复杂多变，这些因素都会对驾驶员的决策和驾驶行为产生重要影响。例如，驾驶员会实时关注车流量，流量过大时可能会促使其改道以节约时间。此外，如学校、医院、商场等特定区域不同时段人流量差异大，也会使驾驶员调整轨迹。

有别于仅依赖静态路网编码，本文提出一种考虑情景路网的轨迹表征方式。如图3所示，将地图划分为$ H\text{×}W $的网格，再进一步将网格划分为时间切片$ T\text{×}H\text{×}W $，根据低采样轨迹的离散分布计算网格单元的流量，再将网格流量的分布调整到[0, 1]范围内，这样即可获得各个时间段下地图中网格$ i $在时间段$ {t}_{i} $的流量分布$ \boldsymbol{F}\in {\mathbb{R}}^{N\times {{T}_{\text{in}}}\times H\times W} $，$ N $表示为批量大小，$ {T}_{\text{in}} $为通道数，$ H $和$ W $分别为特征图的高度和宽度。

图 3 情景路况特征提取模块

Fig. 3 Scenario traffic condition feature extraction module.

下载: 全尺寸图片

然后，在二维空间上引入坐标注意力模块^[25]，该模块分别从水平方向和垂直方向做全局平均池化并拼接，具体操作为

$$ \begin{cases} \boldsymbol{F}_{{\text{spatial}}_{{t}}}^{h}(h)=\dfrac{1}{W}\displaystyle\sum\limits_{0\leq i \lt W}{x}_{t}(h,i)\\ \boldsymbol{F}_{{\text{spatial}}_{{t}}}^{w}(w)=\dfrac{1}{H}\displaystyle\sum\limits_{0\leq j \lt H}{x}_{t}(j,w) \end{cases} $$

再经过二维卷积降维到$ {T}_{\text{out}} $，得到的空间域特征$ {\boldsymbol{F}}_{\text{spatial}}\in {\mathbb{R}}^{N\times {{T}_{\text{out}}}\times H\times W} $，其中$ {T}_{\text{out}} $是输出通道数。在时间维度上使用一维卷积，结果为$ {\boldsymbol{F}}_{\text{temporal}}\in {\mathbb{R}}^{N\times {{T}_{\text{out}}}\times H\times W} $，具体操作为

$$ \boldsymbol{F}_{\text{tempoal}}^{n,t,h,w}=\sigma \left(\sum\limits_{t=1}^{T}\sum\limits_{i=0}^{k-1}{\boldsymbol{K}}_{{{t}_{\text{out}}},t,i}\cdot {\boldsymbol{X}}_{t+i-\left\lfloor \frac{k}{2}\right\rfloor ,w,h}+{\boldsymbol{b}}_{{{{t}}_{\text{out}}}}\right) $$

式中：$ {\boldsymbol{K}}_{{{t}_{\text{out}}},t,i} $是卷积核中第$ {t}_{\text{out}} $个输出通道、第$ t $个输入通道、第$ i $个位置的元素，$ {\boldsymbol{b}}_{{{t}_{\text{out}}}} $是偏置，$ \sigma $可表示为sigmoid激活函数。然后，将空间特征$ {\boldsymbol{F}}_{\text{spatial}} $和时间特征$ {\boldsymbol{F}}_{\text{temporal}} $融合获得融合时空特征$ {\boldsymbol{F}}_{\text{out}} $。

道路具有许多固有属性，且轨迹形成受路网连通性约束，因此路网的表征至关重要。本文用道路段经过的一系列网格表示路网的拓扑结构，对于每段路段，综合考虑流量、道路种类、POI分布、形状等特征并拼接。

特定POI点多的地区流量通常较大，流量和POI分布对轨迹的产生具有类似贡献。因此，将地图的流量时空特征和POI分布特征聚合到道路上。对于每个路段$ {e}_{i}\in V $，假设$ {S}_{i}=\left\langle g_{i}^{1},g_{i}^{2},\cdot \cdot \cdot , g_{i}^{{\varphi }_{i}}\right\rangle $为路段$ {e}_{i} $所经过的$ {\varphi }_{i} $个网格组成的序列。类似4.2节提到的轨迹文本特征处理方法，将轨迹点所在网格替换成道路所在网格，可获得每个路段周围的POI分布特征$ {\boldsymbol{P}}_{\text{out}} $。情景路况聚合计算方法为

$$ {\boldsymbol{D}}_{i}=\frac{1}{{\varphi }_{i}}\sum\nolimits_{j=1}^{{\varphi }_{i}}[{\boldsymbol{F}}_{\text{spatial}}(g_{i}^{j})+{\boldsymbol{F}}_{\text{temporal}}({{t}}_{i},g_{i}^{j})+{\boldsymbol{P}}_{\text{out}}(g_{i}^{j})] $$

式中：时空特征$ {\boldsymbol{F}}_{\text{out}}(\cdot ) $由两部分组成，$ {\boldsymbol{F}}_{\text{spatial}}(\cdot ) $表示网格$ g_{i}^{j} $的空间特征，$ {\boldsymbol{F}}_{\text{temporal}}(\cdot ,\cdot ) $表示网格$ g_{i}^{j} $在时间为$ t_{i}^{j} $的时间特征；而$ {\boldsymbol{P}}_{\text{out}}(\cdot ) $表示网格$ g_{i}^{j} $的POI分布特征。拼接$ {\varphi }_{i} $个网格内的小路段，形成不同时间段下的每个路段$ {e}_{i} $的情景状况表示$ {\boldsymbol{D}}_{i}\in {\mathbb{R}}^{|V|\times d} $。而道路的静态特征$ \boldsymbol{S} $则需要从道路路段长度和出入度上获取，对于道路网络G = (V, E)，构建路段嵌入表$ \boldsymbol{S}\in {\mathbb{R}}^{|V|\times m} $，其中|V|是道路网络中路段的总数，$ m $是路段静态特征的维度。引入权重矩阵$ {\boldsymbol{W}}_{\text{r}}\in {\mathbb{R}}^{m\times d} $实现维度统一，然后将道路的静态特征和动态特征融合，其具体过程为

$$ \begin{cases} \boldsymbol{R}=(1-\theta )\cdot \boldsymbol{D}+\theta \cdot \boldsymbol{S}\\ \theta =\dfrac{{e}^{\alpha \cdot \| \boldsymbol{D}{{\| }_{2}}}}{{e}^{\alpha \cdot \| \boldsymbol{D}{{\| }_{2}}}+{e}^{\alpha \cdot \| \boldsymbol{S}{{\| }_{2}}}} \end{cases} $$

(1)

式(1)采用自适应动态权重$ \theta $平衡道路的两种特征，其中$ \alpha \in [0,1] $是可训练的温度系数，事实上，$ ||\boldsymbol{D}|{|}_{2} \lt ||\boldsymbol{S}|{|}_{2} $是普遍的，即静态路网拓扑结构是无法忽视的，本文将$ \alpha $初值设置为1。训练中，模型将部分注意力转向路网情景状态，逐渐融合动态情景信息与静态拓扑结构信息。最后，将道路特征$ \boldsymbol{R}\in {\mathbb{R}}^{|V|\times d} $逐步输入到图注意力网络(graph attention network，GAT)^[26]中，以获得道路的地理表示。另外，$ {\boldsymbol{W}}_{{R}}={\boldsymbol{R}}^{(0)} $作为可训练权重的初值，GAT网络先将路段特征映射到符合模型形状的空间，然后计算节点间的注意力系数以获得复杂的动态特征，其具体计算方法为

$$ \begin{gathered}\boldsymbol{\alpha }_{i,j,k}^{(l)}=\frac{\exp \left({f}_{\text{r}}\left({\boldsymbol{a}}^{k}\left[{\widehat{\boldsymbol{W}}}^{k}\boldsymbol{R}_{i}^{(l-1)}||{\widehat{\boldsymbol{W}}}^{k}\boldsymbol{R}_{j}^{(l-1)}\right]\right)\right)}{\displaystyle\sum\limits_{n\in |{N}_{{{\tau }_{i}}}|}\exp \left({f}_{\text{r}}\left({\boldsymbol{a}}^{k}\left[{\widehat{\boldsymbol{W}}}^{k}\boldsymbol{R}_{i}^{(l-1)}||{\widehat{\boldsymbol{W}}}^{k}\boldsymbol{R}_{n}^{(l-1)}\right]\right)\right)}\\ {\boldsymbol{R}}^{\prime}=\underset{k=1}{\overset{h}{\| } }{f}_{\text{r}}\left(\sum\limits_{j\in {N}_{v}}\boldsymbol{\alpha }_{i,j,k}^{(l)}{\boldsymbol{W}}^{k}\boldsymbol{R}_{j}^{(l-1)}\right) \end{gathered} $$

对于第1个等式，左边表示路段$ {v}_{i} $与其邻居路段$ {v}_{j} $之间的第$ k $个注意力系数$ \boldsymbol{\alpha }_{i,j,k}^{(l)} $，其中$ l\in \{1,2, $$ \cdot \cdot \cdot , L\} $表示网络层数。等式右边，$ \cdot ||\cdot $表示拼接操作，$ {f}_{\text{r}}(\cdot ) $表示LeakyReLU函数，$ {\boldsymbol{a}}^{k}、\hat{\boldsymbol{W}}^{k}、{\boldsymbol{W}}^{k} $表示GAT网络的可训练权重参数。第2个等式$ {\boldsymbol{R}^{\prime}}\in {\mathbb{R}}^{|V|\times {{d}_{\text{RF}}}} $表示情景路况表示的最后一层GAT输出，$ {N}_{v} $表示节点$ v $的邻居节点集合。每个注意力头独立地对节点的邻居特征进行加权聚合，最后将$ h $个注意力头的结果拼接起来。

2.4 轨迹编码器

本文使用基于Transformer的seq2seq框架，该框架利用自注意力机制来捕捉序列中的长距离依赖关系。通过聚合轨迹情景表示来提取轨迹的上下文关系，它能够动态地整合不同时间点上的位置信息和行为特征。如图2(b)所示，在获取路段的表征后，构建轨迹的图表征，图的节点对应每个轨迹点，而边则对应每个轨迹点之间的隐式关系，将道路的表征融入轨迹表征，然后将轨迹的图表示输入图神经网络实现轨迹的嵌入。

时空轨迹的图表示　给定低采样的轨迹$ \tau = $$ \langle {p}_{1},{p}_{2},\cdot \cdot \cdot ,{p}_{N}\rangle $对于轨迹$ \tau $，本文对时空表示$ \boldsymbol{z}_{\tau }^{\text{traj}} $、文本表示$ \boldsymbol{z}_{\tau }^{\text{POI}} $、情景道路特征$ \boldsymbol{R}\in {\mathbb{R}}^{n\times {{d}_{\text{RF}}}} $、路段ID$ \boldsymbol{r}\in {\mathbb{R}}^{n\times 1} $以及轨迹的网格坐标进行拼接，最终形成轨迹$ \tau $的完整表示，即$ {\boldsymbol{G}}_{{{S}_{\tau }}}\in {\mathbb{R}}^{n\times ({{d}_{\text{traj}}}+{{d}_{\text{POI}}}+{{d}_{\text{RF}}}+3)} $。

时空感知的自注意力模块　将$ {\boldsymbol{G}}_{{{S}_{\tau }}} $输入全连接层转变成模型可接受的形状$ {\boldsymbol{Z}}^{\tau }\in {\mathbb{R}}^{\text{hid}} $，通过自注意力机制获得轨迹表示$ \tilde{\boldsymbol{Z}}^{\tau }=\left\langle \tilde{\boldsymbol{Z}}^{{{\tau }_{1}}},\tilde{\boldsymbol{Z}}^{{{\tau }_{2}}},\cdot \cdot \cdot ,\tilde{\boldsymbol{Z}}^{{{\tau }_{n}}}\right\rangle $，模块将$ {\boldsymbol{Z}}^{\tau } $分别与可学习的权重矩阵$ \boldsymbol{A}_{\text{Q}}^{(l)},\boldsymbol{A}_{\text{K}}^{(l)},\boldsymbol{A}_{\text{V}}^{(l)} $相乘，得到查询矩阵$ {\boldsymbol{Q}}^{(l)} $，键矩阵$ {\boldsymbol{K}}^{(l)} $和值矩阵$ {\boldsymbol{V}}^{(l)} $，然后通过计算查询矩阵$ {\boldsymbol{Q}}^{(l)} $和键矩阵$ {\boldsymbol{K}}^{(l)} $转置的点积，并除以$ d $，再经过softmax函数将其转化为概率分布，最后与值矩阵$ {\boldsymbol{V}}^{(l)} $相乘，得到自注意力机制的输出$ \tilde{\boldsymbol{Z}}^{\tau } $。具体计算方法为

$$ \begin{gathered} {\boldsymbol{Z}}^{\tau }\boldsymbol{A}_{\text{Q}}^{(l)}\triangleq {\boldsymbol{Q}}^{(l)},{\boldsymbol{Z}}^{\tau }\boldsymbol{A}_{\text{K}}^{(l)}\triangleq {\boldsymbol{K}}^{(l)},{\boldsymbol{Z}}^{\tau }\boldsymbol{A}_{\text{V}}^{(l)}\triangleq {\boldsymbol{V}}^{(l)}\\ \tilde{\boldsymbol{Z}}^{\tau } =\text{attention}({\boldsymbol{Q}}^{(l)},{\boldsymbol{K}}^{(l)},{\boldsymbol{V}}^{(l)})=\\ \text{softmax}\left(\frac{{\boldsymbol{Q}}^{(l)}({\boldsymbol{K}}^{(l)}){}^{\text{T}}}{\sqrt{d}}\right){\boldsymbol{V}}^{(l)} \end{gathered} $$

门控循环单元　完成情景路况表征并嵌入地图特征至轨迹点，随后将提取轨迹数据隐含的时空依赖关系。鉴于轨迹数据中包含的动态时间特征以及RNN在处理长序列数据时的局限性，如图2(b)所示，本文借鉴MTrajRec的解码器架构，采用门控循环单元(GRU)来提取时间依赖关系。GRU通过使用重置门和更新门来调节信息的流动，避免了梯度问题并且赋予了模型自适应学习不同时间尺度特征的能力。

对于时间戳$ t $，GRU根据以下传播规则处理输入轨迹数据$ \tilde{\boldsymbol{E}}_{t}\in {\mathbb{R}}^{1\times H} $并生成隐藏单元$ \tilde{\boldsymbol{S}}_{t} $：

$$ \begin{gathered}{\boldsymbol{u}}_{t}=\sigma \left({\boldsymbol{W}}_{\text{z}}[\tilde{\boldsymbol{E}}_{t},\tilde{\boldsymbol{S}}_{t-1}]+{\boldsymbol{b}}_{\text{u}}\right)\\ {\boldsymbol{r}}_{t}=\sigma \left({\boldsymbol{W}}_{\text{r}}[\tilde{\boldsymbol{E}}_{t},\tilde{\boldsymbol{S}}_{t-1}]+{\boldsymbol{b}}_{\text{r}}\right)\\ {\boldsymbol{c}}_{t}=\tanh \left(\boldsymbol{W}[\tilde{\boldsymbol{E}}_{t},{\boldsymbol{r}}_{t}\odot \tilde{\boldsymbol{S}}_{t-1}]+{\boldsymbol{b}}_{\text{c}}\right)\\ \tilde{\boldsymbol{S}}_{t}={\boldsymbol{u}}_{t}\odot \tilde{\boldsymbol{S}}_{t-1}+(1-{\boldsymbol{u}}_{t})\odot {\boldsymbol{c}}_{t} \end{gathered} $$

式中：$ \tilde{\boldsymbol{E}}_{t} $是将$ \tilde{\boldsymbol{Z}}^{\tau } $输入到Transformer编码层后的输出，$ {\boldsymbol{u}}_{t} $和$ {\boldsymbol{r}}_{t} $是更新门和重置门，$ \boldsymbol{W}\in {\mathbb{R}}^{(H+F)\times F} $和$ \boldsymbol{b}\in $$ {\mathbb{R}}^{1\times F} $是可训练的模型参数，$ \odot $表示逐元素相乘。将嵌入数据输入到$ L $层的GRU模块后，可以得到隐藏状态序列$ \tilde{\boldsymbol{S}}=\{\tilde{\boldsymbol{S}}_{1},\tilde{\boldsymbol{S}}_{2},\cdot \cdot \cdot , \tilde{\boldsymbol{S}}_{m}\}\in {\mathbb{R}}^{m\times F} $。通过按序处理数据，GRU 模型能从轨迹表示中提取时间依赖关系，最后一个隐藏状态$ \tilde{\boldsymbol{S}} $会被传递到解码器模块。

2.5 多任务解码器

在解码器中，选择GRU作为基本组件完成解码任务，对于每个时间步$ t $，获取上一步的隐藏层状态$ {\boldsymbol{S}}_{t-1} $、路段嵌入$ {\boldsymbol{E}}_{t-1} $和移动比率$ {\hat{r}}_{t-1} $。本文加入了注意力机制，该机制会获取编码器中GRU的最后一个状态，多任务解码器中GRU的第一个隐藏状态$ {\boldsymbol{S}}_{0} $由该状态嵌入初始化，再根据轨迹点和上一步解码状态得到当前时间步$ t $的状态。具体计算方法为

$$ \begin{gathered}{\boldsymbol{S}}_{t}=\text{GRU}({\boldsymbol{S}}_{t-1},{\boldsymbol{E}}_{t-1}||{\boldsymbol{r}}_{t-1}||{\boldsymbol{a}}_{t})\\ {\boldsymbol{a}}_{t}=\sum\limits_{i=1}^{N}{\boldsymbol{a}}_{{t},i}\hat{\boldsymbol{h}}_{i}\\ {\boldsymbol{a}}_{t,i}=\frac{\exp ({\boldsymbol{V}}^{\mathrm{T }}\tanh ({\boldsymbol{W}}_{\text{s}}{\boldsymbol{S}}_{t-1}+{\boldsymbol{W}}_{\text{h}}\hat{\boldsymbol{h}}_{i'}))}{\displaystyle\sum\limits_{i'=1}^{N}\exp ({\boldsymbol{V}}^{\mathrm{T }}\tanh ({\boldsymbol{W}}_{\text{s}}{\boldsymbol{S}}_{t-1}+{\boldsymbol{W}}_{\text{h}}\hat{\boldsymbol{h}}_{i'}))} \end{gathered} $$

(2)

式中：$ \boldsymbol{V}\in {\mathbb{R}}^{d\times 1} $，$ {\boldsymbol{V}}^{\mathrm{T }} $是$ \boldsymbol{V} $的转置，$ {\boldsymbol{W}}_{\text{s}},{\boldsymbol{W}}_{\text{h}}\in {\mathbb{R}}^{d\times d} $是可学习的参数。GRU为时间步$ t $生成隐藏状态$ {\boldsymbol{S}}_{t} $。

轨迹点道路推导的最直接方法是将所有路段都视为候选，然后进行多分类。但这样会增加筛选范围从而引起不必要的计算。实际上，轨迹记录往往反映出人类个性化的驾驶行为，如短途旅行中，拥堵时段车辆移动慢，造成单位时间采集的轨迹点更多，但人类又普遍具有躲避拥堵路段的倾向。因此，轨迹生成也应该遵循这样的规则。

给定轨迹点$ {p}_{t-1} $元组表示为$ \langle{\lambda }_{t-1},{\varphi }_{t-1},t-1 \rangle $，通过距离选择路段候选以减少搜索空间，借助R树^[27-28]定位与节点$ n $的曼哈顿距离不超过$ \delta $的路段。其中$ \delta $是一个超参数，其作用在于控制对道路节点的感受野范围。通过上述方法可获得粗候选路段。但需要指出的是，仅根据距离推断预测轨迹点p_t的路段ID和移动比率是不合理的，原因在本节开始已经提出。受到Wang等^[28]的工作启发，设计了一种情景路段掩码推理模块，兼顾轨迹点和路段之间的距离，以及道路情景，如图4所示。

图 4 候选路段筛选

Fig. 4 Candidate road segment screening

下载: 全尺寸图片

首先构建一个粗粒度的掩码矩阵，再根据道路的情景路况构建第二个细粒度的掩码矩阵，最后整合两张矩阵得到最终的掩码矩阵。受文献[29]的启发，考虑到路段对轨迹点的影响具有不确定性和复杂性，难以用传统的参数化模型准确描述，为了更灵活地捕捉这种影响，使用核密度函数来建模路段对给定轨迹点的影响，计算方法为

$$ w(e,p)=\begin{cases} 1-\dfrac{1}{{\gamma }^{2}}\text{dist}{(e,p)}^{2},\quad 0 \lt \text{dist}(e,p) \lt \gamma \\ 0, \quad 其他 \end{cases} $$

式中：$ \text{dist}(e,p) $表示路段节点$ e $与轨迹点$ p $之间的欧氏距离，$ \gamma $是一个关于道路网络的超参数。至此，得到了该轨迹点的候选路段加权矩阵$ \boldsymbol{W}_{p}^{\text{dist}} $。时间戳为$ t $的粗粒度掩码矩阵则体现预期恢复轨迹点与路段$ e $之间的相关性，其具体计算方法为

$$ \boldsymbol{W}_{p,{t}}^{\text{dist}}(e)=\begin{cases} 1, & w(e,p) \gt 0\\ 0, & 其他 \end{cases} $$

式中：$ {\boldsymbol{W}}^{\text{dist}} $是基于距离构建的掩码矩阵，这对候选路段初步约束，但其筛选能力较弱。为弥补该缺陷，设计第二张掩码矩阵$ {\boldsymbol{W}}^{\text{rf}} $，反映驾驶者的驾驶偏好，选用路段动态流量描述驾驶者对该路段的偏好，$ \sigma (\cdot ) $表示sigmoid函数，其具体计算方法为

$$ \boldsymbol{W}_{p,t}^{\text{rf}}(e)=\sigma (\text{Mean}(\boldsymbol{D})) $$

式中：D是区域内路段的动态特征。综合考虑距离和道路的情景，将距离掩码$ {\boldsymbol{W}}^{\text{dist}} $和路段情景掩码$ {\boldsymbol{W}}^{\text{rf}} $用以下方式整合，以生成最终的掩码矩阵$ \boldsymbol{W} $。

$$ \boldsymbol{W}=\lambda \boldsymbol{W}_{}^{\text{dist}}+(1-\lambda )\boldsymbol{W}_{}^{\text{rf}} $$

式中$ \lambda $为超参数。最后，将道路的掩码矩阵$ \boldsymbol{W}\in {\mathbb{R}}^{|V|\times 1} $和隐藏状态$ {\boldsymbol{S}}_{t} $，通过带有SoftMax激活函数的全连接层生成路段推断结果，具体计算方法为

$$ P(q)=\frac{\exp ({\boldsymbol{S}}_{t}\cdot {\boldsymbol{M}}_{q}+{\boldsymbol{B}}_{q})\cdot \boldsymbol{W}_{}^{q}}{\displaystyle\sum\limits_{k=1}^{|E|}\exp ({\boldsymbol{S}}_{t}\cdot {\boldsymbol{M}}_{k}+{\boldsymbol{B}}_{k})\cdot \boldsymbol{W}_{}^{k}} $$

式中：P(q)表示轨迹点位于路段e_q上的概率，$ \boldsymbol{M}\in {\mathbb{R}}^{F\times |E|} $和$ \boldsymbol{B}\in {\mathbb{R}}^{1\times |E|} $是可学习参数。缩小候选集对每个候选路段进行自适应加权。道路$ {\hat{e}}_{t} $由所在候选对象中选择概率$ P $最高的对象确定，随后，将GRU的隐藏状态$ {\boldsymbol{S}}_{t} $和$ {\hat{e}}_{t} $的嵌入输入到一个配备sigmoid激活函数的两层多层感知机中，移动比例$ {\hat{r}}_{t} $的具体计算方法为

$$ {\hat{r}}_{t}=\sigma ({\boldsymbol{W}}_{\text{r}}{\boldsymbol{S}}_{t}+{\boldsymbol{b}}_{\text{r}}) $$

式中：$ {\boldsymbol{W}}_{\text{r}}\in {\mathbb{R}}^{F\times 1} $和$ {\boldsymbol{b}}_{\text{r}} $为权重，$ \sigma (\cdot ) $表示sigmoid函数。

3. 实验

3.1 实验设置

3.1.1 数据集

使用从葡萄牙波尔图(Porto)、中国西安(Xian)和成都(Chengdu)收集的轨迹数据集对模型进行训练，数据集的具体信息见表1。道路网络和地图POI数据均来自OpenStreetMap。Porto数据集描述了葡萄牙波尔图市运营的所有442辆出租车从2013年7月1日到2014年6月30日的轨迹数据，采样间隔为15 s。Xian数据集和Chengdu数据集来源于滴滴出行的盖亚数据开放计划。Xian数据集记录了792辆出租车在2018年6月期间收集的轨迹数据，而Chengdu数据集则记录了1 668辆出租车在2018年9月期间收集的轨迹数据，两个数据集的初始采样间隔为10 s。对于每份数据集，按照7∶2∶1的比例区分为训练集、验证集和测试集。

表 1 数据集描述

Table 1 Dataset description

属性	Porto	Xian	Chengdu
时间跨度	2013.07—2014.06	2018.06	2018.09
采样间隔	15 s	10 s	10 s
轨迹	999 082	3 272 687	6 637 561
平均轨迹长度	3 805	4 132	3 979
纬度范围	(41.132, 41.157)	(34.211, 34.267)	(30.497, 30.565)
经度范围	(−8.637, −8.615)	(108.882, 108.987)	(104.008, 104.083)
兴趣点	3 952	1 213	560
路段	487	1 125	1 485

从OpenStreetMap获取的道路网络数据，在训练过程中，采取与Chen等^[19]同样的处理方法，选取了允许车辆通行的路段。相较于整个城市路网而言，所选区域面积小得多，训练仅考虑经过该区域的轨迹数据。为了得到高采样的地图匹配轨迹，对原始的GPS轨迹运用了隐马尔可夫模型(hidden Markov model, HMM)算法，随后进行线性插值。

为了获取每份数据集中的兴趣点(POI)信息，本文借助OSMNx库^[30]，从OpenStreetMap平台下载相关数据。

3.1.2 评价指标

轨迹恢复的任务是将离散轨迹点投影到受道路网络约束的轨迹序列，利用路段推断的准确性和轨迹点的移动比率误差评判本文模型和基线模型的性能，用到的评价指标有平均绝对误差(mean absolute error, MAE)和(root mean square error, RMSE)，MAE是真实值和恢复值之间的平均绝对误差，而RMSE是真实值和恢复值之间的均方根误差，这两个值越小，模型越佳。对于已地图匹配的预测轨迹序列$ \hat{\rho }=\left\langle ({\hat{e}}_{1},{\hat{r}}_{1},{\hat{t}}_{1}),({\hat{e}}_{2},{\hat{r}}_{2},{\hat{t}}_{2}),\cdot \cdot \cdot , ({\hat{e}}_{n},{\hat{r}}_{n},{\hat{t}}_{n})\right\rangle $,真实轨迹序列$ \rho =\langle ({e}_{1},{r}_{1},{t}_{1}),({e}_{2},{r}_{2},{t}_{2}),\cdot \cdot \cdot , ({e}_{n},{r}_{n},{t}_{n})\rangle $，根据预测轨迹点$ \hat{p}\in \hat{\rho } $和真实的轨迹点$ p\in \rho $的所在位置获取匹配路段和移动比率。因此MAE和RMSE的计算方法为

$$ {I}_{\text{MAE}}=\frac{1}{n}\sum\limits_{j=1}^{n}\left| \text{dist}({p}_{j},{\hat{p}}_{j})\right| $$

$$ {I}_{\text{RMSE}}=\sqrt{\frac{1}{n}\sum\limits_{j=1}^{n}{\left| \text{dist}({p}_{j},{\hat{p}}_{j})\right| }^{2}} $$

采用准确率(accuracy, Acc)，召回率(Recall)，精确率(Precision)得分评价模型的精度。这3个指标的具体计算方法为

$$ \begin{gathered}{I}_{\text{Acc}}=\frac{1}{n}\sum\limits_{j=1}^{n}{\mathbf{1}}_{A}({e}_{j},{\hat{e}}_{j})\times 100\text{%}\\ {I}_{\text{Recall}}=\frac{|{E}_{\rho }\cap {\hat{E}}_{\rho }|}{|{E}_{\rho }|}\times 100\text{%}\\ {I}_{\text{Precision}}=\frac{|{E}_{\rho }\cap {\hat{\hat{E}}}_{\rho }|}{|{\hat{\hat{E}}}_{\rho }|}\times 100\text{%} \end{gathered} $$

与MAE和RMSE不同，这3个值越趋近1，模型的效果越佳。其中$ {\mathbf{1}}_{A}(\cdot ) $是指示函数，若$ {e}_{j}={\hat{e}}_{j} $，则$ {\mathbf{1}}_{A}({e}_{j},{\hat{e}}_{j}) $等于1，否则等于0。

3.1.3 基线模型

为了评估本文所提出模型的有效性，对比了7个近期经典基线。

Linear+HMM^[31]：首次使用线性插值法获取高采样轨迹，然后利用HMM算法获取地图匹配的$ \epsilon $-采样率的轨迹。

DHTR+HMM^[14]：基于seq2seq模型和卡尔曼滤波器恢复轨迹，然后使用HMM进行地图匹配过程。

AttnMove^[16]：提出了一种基于注意力神经网络的模型，通过在细粒度的空间时间分辨率下恢复未观察到的位置来密集化个体轨迹。

MTrajRec^[18]：一个端到端的方法，用于轨迹恢复任务。基于RNN的seq2seq框架用于捕捉时空特征的道路网络导向车辆轨迹恢复的开创性工作。

T3S^[32]：一种用于轨迹相似性计算的深度学习模型，采用注意力机制捕捉空间特征，并利用长短期记忆网络(long short-term memory, LSTM)捕捉时间特征。

GTS^[33]：基于图神经网络模型的轨迹相似性计算方法。学习轨迹的序列信息和空间拓扑结构，聚集道路网络中每个兴趣点的信息，并使用LSTM模型捕捉轨迹中的序列信息。

RNTrajRec^[19]：面向道路网络的基于车辆轨迹恢复的最新技术，增强对道路网络时空特征的提取，使用基于Transformer的编码器以及基于RNN的解码器实现轨迹恢复。

3.1.4 参数设置

本文使用Python的PyTorch框架实现了模型CSTrajRec以及其他的基线模型。为获取稀疏轨迹，本文对密集的原始轨迹开展重采样操作，构建出两种不同类型的稀疏轨迹。对于Porto数据集，原始轨迹的采样间隔为15 s，本文使用固定时间间隔的抽样方法，分别以240 s和120 s作为时间间隔对原始轨迹进行重采样，所得到的稀疏轨迹分别对应原始密集轨迹的1/16和1/8；Xian和Chengdu数据集，原始轨迹的采样间隔为10 s，本文设置80 s的时间间隔进行重采样，所得到的稀疏轨迹为对应密集轨迹的1/8。

使用Adam优化器并将模型的训练epoch设置为30，批量大小设置为64，学习率设置为0.001，丢弃率为0.1。模型的隐藏层维度为512。式(1)为道路特征的调节方法，其温度系数$ \alpha $初始设置为1。式(2)中，设置单个轨迹点的候选路段感受野的半径$ \delta $为400 m，节点的权重参数$ \gamma $为30 m。所有实验均在配备NVIDIA GeForce RTX 3090 GPU的机器上进行。

3.2 实验结果

如表2所示，与其他基线模型相比，在Porto数据集、Xian数据集和Chengdu数据集上，本文模型都取得了不错的性能。

表 2 在不同数据集上的性能比较

Table 2 Performance comparison on different datasets

方法	Porto (μ = 120 s, ϵ = 15 s, 12.5%)					Porto (μ = 240 s, ϵ =15 s, 6.25%)
方法	Acc	Recall	Precision	MAE	RMSE	Acc	Recall	Precision	MAE	RMSE
Linear+HMM	0.3612	0.3923	0.4858	358.5	582.4	0.2947	0.2634	0.3581	573.9	649.8
DHTR+HMM	0.3897	0.5832	0.5721	275.1	432.8	0.3100	0.4638	0.4328	419.2	537.9
AttnMove	0.5189	0.6320	0.7336	189.4	302.7	0.4589	0.5678	0.6923	342.8	499.0
MTrajRec	0.5216	0.6556	0.7358	175.6	283.1	0.4831	0.6231	0.7251	253.0	456.1
T3S	0.5221	0.6387	0.7369	169.2	275.4	0.5001	0.6328	0.7278	231.4	384.9
GTS	0.5439	0.6414	0.7440	154.8	248.8	0.4712	0.6451	0.7230	201.5	348.8
RNTrajRec	0.5804	0.6518	0.7687	125.3	199.5	0.5373	0.6642	0.7442	175.5	250.0
CSTrajRec	0.5893	0.6663	0.7749	118.6	188.2	0.5408	0.6553	0.7506	169.4	244.1

方法	Xian (μ = 80 s, ϵ = 10 s, 12.5%)					Chengdu (μ = 80 s, ϵ =10 s, 12.5%)
方法	Acc	Recall	Precision	MAE	RMSE	Acc	Recall	Precision	MAE	RMSE
Linear+HMM	0.3440	0.4020	0.3862	535.4	842.7	0.3221	0.4339	0.4235	489.7	739.3
DHTR+HMM	0.4167	0.4518	0.5385	340.2	585.0	0.3829	0.4630	0.5627	310.2	552.4
AttnMove	0.6205	0.6557	0.7246	278.7	345.7	0.5730	0.6838	0.7632	248.9	329.5
MTrajRec	0.6424	0.6634	0.7508	256.3	312.0	0.6032	0.6721	0.7973	221.5	274.2
T3S	0.6820	0.6748	0.7634	257.9	306.6	0.5849	0.7023	0.7845	196.4	258.5
GTS	0.6548	0.6704	0.7602	246.8	319.3	0.5937	0.6938	0.8234	179.2	264.0
RNTrajRec	0.6790	0.6769	0.7835	193.7	288.6	0.6267	0.7234	0.8204	161.7	238.2
CSTrajRec	0.6881	0.6904	0.7776	183.4	291.1	0.6391	0.7328	0.8341	182.2	224.1
注：加粗表示最优值，下划线表示次优值。

这些方法中，Linear+HMM和DHTR+HMM是两阶段方法，而其他的是端到端方法，Linear+HMM在所有数据集上表现最差，随着采样间隔的增加，其性能显著下降。而DHTR是一种深度学习方法，处理复杂模式的能力更强，能够自动学习轨迹数据中的复杂模式和非线性关系。

AttnMove基于注意力神经网络对路段之间的关联建模，忽视了GPS点的建模，MTrajRec是一种端到端的方法，专门设计了模块用于提取时空特征来恢复轨迹，但对路网约束的考虑较弱，而T3S和GTS优于MTrajRec模型，是因为这两个模型都考虑GPS点的历史和未来时间的依赖性。

得益于对轨迹中每个GPS点周围道路网络信息和结构的充分关注，RNTrajRec在所有数据集的性能上表现都不错，该模型能够学习给定轨迹的丰富空间和时间特征。表3给出了Porto区域的t检验结果，本文模型相较于RNTrajRec模型的性能提升具有统计显著性(p<0.05)。相比该模型，本文模型在轨迹恢复方面是有效的，主要原因是情景路段感知模块、编码器中路段推理掩码以及包含POI点的轨迹编码方式的提出。模型将注意力集中在路段的描述，因为轨迹的特征本质上与路段信息紧密相连。通过情景路段感知模块，模型能够精准捕捉不同情景下路段的独特属性。例如，在工作日的早晚高峰时段，城市的主干道往往会出现严重的拥堵，而这些拥堵信息对于准确恢复车辆或行人的轨迹至关重要。情景路段感知模块可以动态地感知路段的实时状态，为轨迹恢复提供更贴合实际的基础信息。包含POI点的轨迹编码方式为模型注入了丰富的语义信息，这些POI点蕴含着大量关于轨迹行为的潜在信息。通过将POI点信息融入轨迹编码中，模型能够更好地理解轨迹的目的和意图，为轨迹恢复提供了POI视角。

表 3 数据集在RMSE上的t检验结果

Table 3 t-test results of datasets on RMSE

t检验	Porto(μ=120 s)	Porto(μ=240 s)
RNTrajRec	199.5	250.0
CSTrajRec	188.2	244.1
差异	11.3	5.9
t统计量	−2.36	−1.82
p值	0.009	0.034
显著性($ \alpha $=0.05)	显著	显著

3.3 消融分析

为验证论文所提模块的有效性，构建了该模型的6种变体，并采用Porto数据集开展实验。此实验在稀疏轨迹为原始轨迹1/8的条件下进行。

w/o POI表示在预训练过程中，移除网格内的POI分布情况。

w/o F表示移除地图中整体流量分布矩阵，使模型无法按照时间分布指导轨迹恢复。

w/o GAT表示移除路网的图注意力机制，模型将平等对待所有道路节点。

w/o CR表示移除解码器中的路段情景矩阵，即矩阵填充为1，仅从距离上推断轨迹点的候选路段。

w/o FE表示在轨迹时间特征提取中移除傅里叶编码层，将原来的4种时间特征简单拼接。

w/o DM表示移除解码器中的距离矩阵，距离矩阵被填充为1。

Full表示完整的、未进行任何移除的完整模型。

如表4所示，本文模型CSTrajRec相比移除各组件的变体，在预测误差上取得了显著降低（MAE与RMSE分别减少约3.8%和4.2%），而分类指标准确率、召回率和精确率整体保持稳定，部分变体间波动微弱。这一结果与图5所示趋势一致，其中，POI点的编码有助于模型的性能提升，是因为与轨迹点处于同一网格的POI点类型会影响用户的驾驶偏好，能指导轨迹恢复。移除F也会使模型的性能降低，是由于轨迹的表示不仅要捕捉细节特征，还要提取轨迹分布的整体特征。移除图注意力机制GAT，模型的性能会降低，证明轨迹学习路网的静态拓扑结构并结合路网的动态情景变化。移除FE使模型性能降低，说明提取轨迹的时间特征对轨迹恢复具有价值。填充路段情景矩阵CR为1和填充距离矩阵DM为1都会使模型性能降低，说明解码需要轨迹到路段距离信息和道路动态情景。

表 4 模型组件分析

Table 4 Analysis of model components

变体	Acc	Recall	Precision	MAE	RMSE
w/o POI	0.5879	0.6643	0.7752	119.0	188.9
w/o F	0.5899	0.6658	0.7689	122.7	192.3
w/o GAT	0.5842	0.6618	0.7734	119.4	194.1
w/o CR	0.5878	0.6632	0.7728	118.7	191.7
w/o FE	0.5837	0.6651	0.7720	120.8	193.6
w/o DM	0.5823	0.6613	0.7635	123.3	196.5
Full	0.5893	0.6663	0.7749	118.6	188.2
注：加粗表示最优结果。

图 5 模型组件分析可视化(基于表4)

Fig. 5 Visualization of model component analysis (from Table 4)

下载: 全尺寸图片

3.4 超参数实验

针对Porto数据集，选取了12.5%的抽样率。如图6所示，通过改变测试模型学习率、模型中隐藏层的维度、编码器中网格大小、道路整体流量变化的时间间隔，反映其对模型性能的影响。

图 6 在成都数据集上进行的超参数实验

Fig. 6 Hyperparameter experiments conducted on the Chengdu dataset

下载: 全尺寸图片

学习率　学习率是机器学习和深度学习优化算法中的一个重要超参数，对实验效果有着显著影响。由于CSTrajRec模型采用了Adam优化器，Adam推荐的学习率0.001，本文参考并设置学习率分布为0.000 5、0.001、0.005和0.01。

隐藏层维度大小　隐藏层维度大小控制模型的容量，较大的隐藏层维度可捕捉轨迹的内在模式，提高轨迹恢复的效果，但需要消耗计算资源。较小维度则具有计算高效，但学习能力受限。为平衡效率和性能，本文设置不同的维度64、128、256和512。

网格大小　为构建基于图网络的编码器，本文将感兴趣区域划分为网格，以提高训练的可靠性。较小的网格单元能够更准确地捕捉空间信息。然而，这会增加网格的数量，并引入模型的复杂性。较大的网格单元又会简化模型，牺牲了空间信息的准确性。为研究准确性和复杂性之间的权衡关系，本文将网格大小设置为20、50、100和200 m。

网格切片时间间隔设置　表示道路情况在不同时间尺度上的流量变化，有利于模型从历史轨迹数据中推断出轨迹的分布。以较短的时间间隔进行网格切片，能够敏锐地捕捉到道路在短时间内的突发流量变化，如交通事故、临时交通管制等情况导致的局部交通拥堵或流量激增都能及时被察觉；而以较长的时间间隔进行切片，则有助于把握道路流量的长期变化趋势，比如工作日和休息日的流量差异、一天中不同时段的高峰低谷分布等。因此设置时间间隔分布为0.5、1、24和48 h。

3.5 模型效率

如表5所示，本文分析了模型的复杂度，$ d $表示特征数量，$ |E| $表示路段数量，$ |V| $表示连接路段的边数量，$ N $是稀疏轨迹的长度，$ M $是恢复轨迹的长度，$ l $是RNTrajRec模型中GPSFormer的层数，参数数量(10⁶)和推理时间(ms)。

表 5 数据集Porto的效率分析($ \mu $ = 120 s)

Table 5 Efficiency analysis of the Porto dataset ($ \mu $= 120 s)

方法	参数数量/10⁶	时间复杂度	时间/ ms
MTrajRec	14.26	$ O(N{d}^{2}+M{d}^{2}+M\|E\|) $	42.34
RNTrajRec	31.71	$ O(\|E\|{d}^{2}+N\|E\|+l{N}^{2}d $+ $N{d}^{2}+M\|E\|) $	51.23
本文方法	35.45	$ O(kN+N{d}^{2}+\|E\|{d}^{2} $+ $M\|V\|d+M\|E\|) $	43.54

轨迹编码的时间复杂度为$ O(N{d}^{2}) $，情景道路编码层时间复杂度$ O(|E|{d}^{2}) $主要受到道路静态特征提取影响，而该过程主要是受GAT网络影响。然后将轨迹所经过的POI文本转化为网格单元整体POI特征过程的时间复杂度为$ O(kN) $，坐标注意力机制的复杂度是轻量级的，解码器模块的时间复杂度为$ O(M|V|d) $，道路掩码层的时间复杂度为$ O(M|E|) $。本文模型与最先进的方法RNTrajeRec相比，复杂度大小关系取决于$ N $的大小，当需要恢复的稀疏轨迹长度$ N $较大时，本文模型的时间复杂度低。除了评估不同方法的复杂性外，本文还从两个不同方面比较其效率，即推理阶段恢复轨迹所需的时间。

4. 结束语

本文设计了一种用于轨迹恢复的编码器−解码器框架，专门用于地图约束下的轨迹恢复。该模型拥有路段情景感知模块，此模块能够对路网的静态拓扑结构以及动态流量变化进行编码，将路段的情景表示与轨迹的时空表示进行聚合，进而实现对轨迹的编码。编码得到的轨迹隐藏层表示随后被输入解码器，以恢复缺失的轨迹点。为增强解码器的性能，本文提出了基于路网情景状态的掩码矩阵，该掩码矩阵在解码时为路段推理和移动比率计算提供关键指导。实验结果表明，相较于当前最先进的基线方法，模型CSTrajRec展现出了更为优越的性能。该模型具有良好的可扩展性，在行人轨迹恢复中，可通过适配行人路网拓扑、行人密度实现场景迁移；在交通异常检测中，可利用恢复轨迹作为正常基线，通过偏差分析识别异常拥堵。未来可收集多源数据（如天气、交通灯）进行情景融合，也可结合车辆历史轨迹调整权重，进一步优化模型的泛化能力与推理精度。

图 1 地图约束下轨迹恢复、道路段和移动比率的示例

Fig. 1 Examples of trajectory recovery under map constraints, road segments and movement ratios

下载: 全尺寸图片

图 2 CSTrajRec的框架

Fig. 2 Framework of CSTrajRec

下载: 全尺寸图片

图 3 情景路况特征提取模块

Fig. 3 Scenario traffic condition feature extraction module.

下载: 全尺寸图片

图 4 候选路段筛选

Fig. 4 Candidate road segment screening

下载: 全尺寸图片

图 5 模型组件分析可视化(基于表4)

Fig. 5 Visualization of model component analysis (from Table 4)

下载: 全尺寸图片

图 6 在成都数据集上进行的超参数实验

Fig. 6 Hyperparameter experiments conducted on the Chengdu dataset

下载: 全尺寸图片

表 1 数据集描述

Table 1 Dataset description

属性	Porto	Xian	Chengdu
时间跨度	2013.07—2014.06	2018.06	2018.09
采样间隔	15 s	10 s	10 s
轨迹	999 082	3 272 687	6 637 561
平均轨迹长度	3 805	4 132	3 979
纬度范围	(41.132, 41.157)	(34.211, 34.267)	(30.497, 30.565)
经度范围	(−8.637, −8.615)	(108.882, 108.987)	(104.008, 104.083)
兴趣点	3 952	1 213	560
路段	487	1 125	1 485

表 2 在不同数据集上的性能比较

Table 2 Performance comparison on different datasets

方法	Porto (μ = 120 s, ϵ = 15 s, 12.5%)					Porto (μ = 240 s, ϵ =15 s, 6.25%)
方法	Acc	Recall	Precision	MAE	RMSE	Acc	Recall	Precision	MAE	RMSE
Linear+HMM	0.3612	0.3923	0.4858	358.5	582.4	0.2947	0.2634	0.3581	573.9	649.8
DHTR+HMM	0.3897	0.5832	0.5721	275.1	432.8	0.3100	0.4638	0.4328	419.2	537.9
AttnMove	0.5189	0.6320	0.7336	189.4	302.7	0.4589	0.5678	0.6923	342.8	499.0
MTrajRec	0.5216	0.6556	0.7358	175.6	283.1	0.4831	0.6231	0.7251	253.0	456.1
T3S	0.5221	0.6387	0.7369	169.2	275.4	0.5001	0.6328	0.7278	231.4	384.9
GTS	0.5439	0.6414	0.7440	154.8	248.8	0.4712	0.6451	0.7230	201.5	348.8
RNTrajRec	0.5804	0.6518	0.7687	125.3	199.5	0.5373	0.6642	0.7442	175.5	250.0
CSTrajRec	0.5893	0.6663	0.7749	118.6	188.2	0.5408	0.6553	0.7506	169.4	244.1

方法	Xian (μ = 80 s, ϵ = 10 s, 12.5%)					Chengdu (μ = 80 s, ϵ =10 s, 12.5%)
方法	Acc	Recall	Precision	MAE	RMSE	Acc	Recall	Precision	MAE	RMSE
Linear+HMM	0.3440	0.4020	0.3862	535.4	842.7	0.3221	0.4339	0.4235	489.7	739.3
DHTR+HMM	0.4167	0.4518	0.5385	340.2	585.0	0.3829	0.4630	0.5627	310.2	552.4
AttnMove	0.6205	0.6557	0.7246	278.7	345.7	0.5730	0.6838	0.7632	248.9	329.5
MTrajRec	0.6424	0.6634	0.7508	256.3	312.0	0.6032	0.6721	0.7973	221.5	274.2
T3S	0.6820	0.6748	0.7634	257.9	306.6	0.5849	0.7023	0.7845	196.4	258.5
GTS	0.6548	0.6704	0.7602	246.8	319.3	0.5937	0.6938	0.8234	179.2	264.0
RNTrajRec	0.6790	0.6769	0.7835	193.7	288.6	0.6267	0.7234	0.8204	161.7	238.2
CSTrajRec	0.6881	0.6904	0.7776	183.4	291.1	0.6391	0.7328	0.8341	182.2	224.1
注：加粗表示最优值，下划线表示次优值。

表 3 数据集在RMSE上的t检验结果

Table 3 t-test results of datasets on RMSE

t检验	Porto(μ=120 s)	Porto(μ=240 s)
RNTrajRec	199.5	250.0
CSTrajRec	188.2	244.1
差异	11.3	5.9
t统计量	−2.36	−1.82
p值	0.009	0.034
显著性($ \alpha $=0.05)	显著	显著

表 4 模型组件分析

Table 4 Analysis of model components

变体	Acc	Recall	Precision	MAE	RMSE
w/o POI	0.5879	0.6643	0.7752	119.0	188.9
w/o F	0.5899	0.6658	0.7689	122.7	192.3
w/o GAT	0.5842	0.6618	0.7734	119.4	194.1
w/o CR	0.5878	0.6632	0.7728	118.7	191.7
w/o FE	0.5837	0.6651	0.7720	120.8	193.6
w/o DM	0.5823	0.6613	0.7635	123.3	196.5
Full	0.5893	0.6663	0.7749	118.6	188.2
注：加粗表示最优结果。

表 5 数据集Porto的效率分析($ \mu $ = 120 s)

Table 5 Efficiency analysis of the Porto dataset ($ \mu $= 120 s)

方法	参数数量/10⁶	时间复杂度	时间/ ms
MTrajRec	14.26	$ O(N{d}^{2}+M{d}^{2}+M\|E\|) $	42.34
RNTrajRec	31.71	$ O(\|E\|{d}^{2}+N\|E\|+l{N}^{2}d $+ $N{d}^{2}+M\|E\|) $	51.23
本文方法	35.45	$ O(kN+N{d}^{2}+\|E\|{d}^{2} $+ $M\|V\|d+M\|E\|) $	43.54

参考文献(33)

[1]	DANG Weizhen, WANG Haibo, PAN Shirui, et al. Predicting human mobility via graph convolutional dual-attentive networks[C]//Proceedings of the Fifteenth ACM International Conference on Web Search and Data Mining. Virtual Event: ACM, 2022: 192−200.
[2]	BAGHBANI A, RAHMANI S, BOUGUILA N, et al. Predicting passenger flow using graph neural networks with scheduled sampling on bus networks[C]//2023 IEEE 26th International Conference on Intelligent Transportation Systems. Bilbao: IEEE, 2024: 3073−3078.
[3]	孟祥福, 谢伟鹏, 崔江燕. 基于时空动态图的交通流量预测方法研究[J]. 智能系统学报, 2025, 20(4): 776−786. doi: 10.11992/tis.202402012 MENG Xiangfu, XIE Weipeng, CUI Jiangyan. Research on traffic flow prediction method based on spatial-temporal dynamic graph convolutional network[J]. CAAI transactions on intelligent systems, 2025, 20(4): 776−786. doi: 10.11992/tis.202402012
[4]	孟祥福, 徐永杰, 翁雪. 时空交叉注意力特征融合的交通流量预测模型[J]. 计算机科学与探索, 2025, 19(7): 1931−1944. MENG Xiangfu, XU Yongjie, WENG Xue. Spatio-temporal cross-attention feature fusion model for traffic flow prediction[J]. Journal of frontiers of computer science & technology, 2025, 19(7): 1931−1944.
[5]	陈文强, 王东丹, 朱文英, 等. 基于时空图注意力网络的车辆多模态轨迹预测模型[J]. 浙江大学学报(工学版), 2025, 59(3): 443−450. CHEN Wenqiang, WANG Dongdan, ZHU Wenying, et al. Vehicle multimodal trajectory prediction model based on spatio-temporal graph attention network[J]. Journal of Zhejiang University (engineering science), 2025, 59(3): 443−450.
[6]	宋绍剑, 徐佳敏, 李刚, 等. 联合TCN和时空多头注意机制的车辆轨迹预测模型[J]. 计算机工程与应用, 2025, 61(12): 352−358. doi: 10.3778/j.issn.1002-8331.2405-0015 SONG Shaojian, XU Jiamin, LI Gang, et al. Vehicle trajectory prediction model with TCN and spatial-temporal multi-head attention mechanism[J]. Computer engineering and applications, 2025, 61(12): 352−358. doi: 10.3778/j.issn.1002-8331.2405-0015
[7]	TANG Xiaolong, KAN Meina, SHAN Shiguang, et al. HPNet: dynamic trajectory forecasting with historical prediction attention[C]//2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle: IEEE, 2024: 15261−15270.
[8]	孟祥福, 师光启, 张霄雁, 等. 基于深度学习的轨迹相似性度量方法研究综述[J]. 计算机科学与探索, 2025, 19(3): 623−644. doi: 10.3778/j.issn.1673-9418.2404006 MENG Xiangfu, SHI Guangqi, ZHANG Xiaoyan, et al. Survey on deep learning based trajectory similarity measurement approaches[J]. Journal of frontiers of computer science and technology, 2025, 19(3): 623−644. doi: 10.3778/j.issn.1673-9418.2404006
[9]	HE Huajun, LI Ruiyuan, RUAN Sijie, et al. TraSS: efficient trajectory similarity search based on key-value data stores[C]//2022 IEEE 38th International Conference on Data Engineering. Kuala Lumpur: IEEE, 2022: 2306−2318.
[10]	孟祥福, 崔江燕, 邓敏超. 基于图卷积神经网络的最短路径距离估计方法[J]. 智能系统学报, 2024, 19(6): 1518−1527. doi: 10.11992/tis.202309006 MENG Xiangfu, CUI Jiangyan, DENG Minchao. Road network shortest distance estimation method based on graph convolutional networks[J]. CAAI transactions on intelligent systems, 2024, 19(6): 1518−1527. doi: 10.11992/tis.202309006
[11]	LIAO Tianxi, HAN Liangzhe, XU Yi, et al. Multi-faceted route representation learning for travel time estimation[J]. IEEE transactions on intelligent transportation systems, 2024, 25(9): 11782−11793. doi: 10.1109/TITS.2024.3371071
[12]	LI Xiucheng, ZHAO Kaiqi, CONG Gao, et al. Deep representation learning for trajectory similarity computation[C]//2018 IEEE 34th International Conference on Data Engineering. Paris: IEEE, 2018: 617−628.
[13]	WU Chenhao, XIANG Longgang, CHEN Libiao, et al. Learning universal trajectory representation via a Siamese geography-aware transformer[J]. ISPRS international journal of geo-information, 2024, 13(3): 64. doi: 10.3390/ijgi13030064
[14]	WANG Jingyuan, WU Ning, LU Xinxi, et al. Deep trajectory recovery with fine-grained calibration using Kalman filter[J]. IEEE transactions on knowledge and data engineering, 2021, 33(3): 921−934. doi: 10.1109/tkde.2019.2940950
[15]	LI Mingxiao, GAO Song, LU Feng, et al. Reconstruction of human movement trajectories from large-scale low-frequency mobile phone data[J]. Computers, environment and urban systems, 2019, 77: 101346. doi: 10.1016/j.compenvurbsys.2019.101346
[16]	XIA Tong, QI Yunhan, FENG Jie, et al. AttnMove: history enhanced trajectory recovery via attentional network[J]. Proceedings of the AAAI conference on artificial intelligence, 2021, 35(5): 4494−4502. doi: 10.1609/aaai.v35i5.16577
[17]	NEWSON P, KRUMM J. Hidden Markov map matching through noise and sparseness[C]//Proceedings of the 17th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems. Seattle: ACM, 2009: 336−343.
[18]	REN Huimin, RUAN Sijie, LI Yanhua, et al. MTrajRec: map-constrained trajectory recovery via Seq2Seq multi-task learning[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. Virtual Event: ACM, 2021: 1410−1419.
[19]	CHEN Yuqi, ZHANG Hanyuan, SUN Weiwei, et al. RNTrajRec: road network enhanced trajectory recovery with spatial-temporal transformer[C]//2023 IEEE 39th International Conference on Data Engineering. Anaheim: IEEE, 2023: 829−842.
[20]	LIU Yu, GE Qian, LUO Wei, et al. GraphMM: graph-based vehicular map matching by leveraging trajectory and road correlations[J]. IEEE transactions on knowledge and data engineering, 2024, 36(1): 184−198. doi: 10.1109/TKDE.2023.3287739
[21]	WEI Tonglong, LIN Youfang, LIN Yan, et al. Micro-macro spatial-temporal graph-based encoder-decoder for map-constrained trajectory recovery[J]. IEEE transactions on knowledge and data engineering, 2024, 36(11): 6574−6587. doi: 10.1109/TKDE.2024.3396158
[22]	ZHAO Yaya, ZHAO Kaiqi, CHEN Zhiqian, et al. A graph-based representation framework for trajectory recovery via spatiotemporal interval-informed Seq2Seq[C]//Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence. Jeju: IJCAI, 2024: 2588−2597.
[23]	TANCIK M, SRINIVASAN P P, MILDENHALL B, et al. Fourier features let networks learn high frequency functions in low dimensional domains[C]//34th Conference on Neural Information Processing Systems. Vancouver: Curran Associates Inc. , 2020: 1−11.
[24]	HOU Qibin, ZHOU Daquan, FENG Jiashi. Coordinate attention for efficient mobile network design[C]//2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Nashville: IEEE, 2021: 13708−13717.
[25]	VELIČKOVIĆ P, CUCURULL G, CASANOVA A, et al. Graph attention networks[EB/OL]. (2017−10−30)[2025−06−11]. https://arxiv.org/abs/1710.10903.
[26]	HADJIELEFTHERIOU M, MANOLOPOULOS Y, THEODORIDIS Y, et al. R-trees: a dynamic index structure for spatial searching[M]//Encyclopedia of GIS. Cham: Springer International Publishing, 2017: 1805−1817.
[27]	刘帅, 乔颖, 罗雄飞, 等. 时序数据库关键技术综述[J]. 计算机研究与发展, 2024, 61(3): 614−638. doi: 10.7544/issn1000-1239.202330536 LIU Shuai, QIAO Ying, LUO Xiongfei, et al. Key techniques of time series databases: a survey[J]. Journal of computer research and development, 2024, 61(3): 614−638. doi: 10.7544/issn1000-1239.202330536
[28]	WANG Chenxing, ZHAO Fang, LUO Haiyong, et al. Towards effective transportation mode-aware trajectory recovery: heterogeneity, personalization and efficiency[J]. IEEE transactions on mobile computing, 2025, 24(4): 2832−2846. doi: 10.1109/TMC.2024.3501280
[29]	CHAN T N, IP P L, LEONG HOU U, et al. KDV-explorer: a near real-time kernel density visualization system for spatial analysis[J]. Proceedings of the VLDB endowment, 2021, 14(12): 2655−2658. doi: 10.14778/3476311.3476312
[30]	BOEING G. OSMnx: a Python package to work with graph-theoretic OpenStreetMap street networks[J]. The journal of open source software, 2017, 2(12): 215. doi: 10.21105/joss.00215
[31]	HOTEIT S, SECCI S, SOBOLEVSKY S, et al. Estimating human trajectories and hotspots through mobile phone data[J]. Computer networks, 2014, 64: 296−307. doi: 10.1016/j.comnet.2014.02.011
[32]	YANG Peilun, WANG Hanchen, ZHANG Ying, et al. T3S: effective representation learning for trajectory similarity computation[C]//2021 IEEE 37th International Conference on Data Engineering. Chania: IEEE, 2021: 2183−2188.
[33]	HAN Peng, WANG Jin, YAO Di, et al. A graph-based approach for trajectory similarity computation in spatial networks[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. Virtual Event: ACM, 2021: 556−564.

点击查看大图

图(6) / 表(5)

摘要

情景路网约束下基于序列到序列的轨迹恢复方法

doi: 10.11992/tis.202506009

通讯作者: 孟祥福. E-mail：marxi@126.com.

出版历程

A seq2seq based trajectory recovery method under the constraint of scenario road network

1. 相关定义和问题描述

1.1 定义

1.2 问题定义

2. CSTrajRec方法

2.1 时空特征嵌入

2.2 POI文本特征嵌入

2.3 情境路况表示

2.4 轨迹编码器

2.5 多任务解码器

3. 实验

3.1 实验设置

3.1.1 数据集

3.1.2 评价指标

3.1.3 基线模型

3.1.4 参数设置

3.2 实验结果

3.3 消融分析

3.4 超参数实验

3.5 模型效率

4. 结束语

出版历程

目录

通讯作者:
孟祥福. E-mail：marxi@126.com.