郑州大学学报(理学版)  2025, Vol. 57 Issue (6): 8-15  DOI: 10.13705/j.issn.1671-6841.2024099

引用本文  

申泽楷, 郭晟楠, 毛潇苇, 等. 融合不确定性建模的行程时间与置信区间估计[J]. 郑州大学学报(理学版), 2025, 57(6): 8-15.
SHEN Zekai, GUO Shengnan, MAO Xiaowei, et al. Estimation of Travel Time and Confidence Interval with Uncertainty Modeling[J]. Journal of Zhengzhou University(Natural Science Edition), 2025, 57(6): 8-15.

基金项目

国家自然科学基金青年基金项目(62202043)

通信作者

郭晟楠(1992—),女,副教授,主要从事时空数据挖掘研究,E-mail: guoshn@bjtu.edu.cn

作者简介

申泽楷(2000—),男,硕士研究生,主要从事时空数据挖掘研究,E-mail: zkshen@bjtu.edu.cn

文章历史

收稿日期:2024-05-27
融合不确定性建模的行程时间与置信区间估计
申泽楷1,2, 郭晟楠1,2, 毛潇苇1,2, 吕聪康1, 贾宇欣1,2, 林友芳1,2, 万怀宇1,2    
1. 北京交通大学 计算机科学与技术学院 北京 100044;
2. 北京交通大学 交通数据分析与挖掘北京市重点实验室 北京 100044
摘要:针对智能交通系统中行程时间估计的不确定性量化的难题,提出一种全局-局部不确定性感知行程时间估计方法(global and local uncertainty-aware travel time estimation, GLUTTE)。首先,通过多任务学习策略建模整体路线与各局部路段的行程时间关系及其不确定性。其次,采用多粒度分位数回归方法,综合考虑全局和局部特征,提供准确的置信区间估计。实验结果表明,所提方法能够有效量化不确定性,同时保证准确性并提供可靠的置信区间,从而提升结果的可用性和可信度。
关键词行程时间估计    不确定性量化    置信区间    时空数据挖掘    
Estimation of Travel Time and Confidence Interval with Uncertainty Modeling
SHEN Zekai1,2, GUO Shengnan1,2, MAO Xiaowei1,2, LYU Congkang1, JIA Yuxin1,2, LIN Youfang1,2, WAN Huaiyu1,2    
1. School of Computer Science and Technology, Beijing Jiaotong University, Beijing 100044, China;
2. Beijing Key Laboratory of Traffic Data Analysis and Mining, Beijing Jiaotong University, Beijing 100044, China
Abstract: In response to the difficulty of uncertainty quantification for travel time estimation in intelligent transportation systems, a global and local uncertainty-aware travel time estimation (GLUTTE) method was proposed. Firstly, a multi-task learning strategy was employed to model the travel time relationship between overall routes and each local segment, as well as their uncertainties. Secondly, a multi-granularity quantile regression approach was adopted, considering both global and local features to provide accurate confidence interval estimation. The experimental results demonstrated that the proposed method could effectively quantify uncertainties while ensuring accuracy and offering reliable confidence intervals, thereby enhancing the usability and credibility of the results.
Key words: travel time estimation    uncertainty quantification    confidence interval    spatial-temporal data mining    
0 引言

行程时间估计(travel time estimation, TTE)任务是根据给定路线和出发时刻预测行程时间。作为智能交通系统的重要组成部分,准确的行程时间估计对于优化用户体验和提高系统效能具有决定性作用,已广泛应用于路线规划、导航和网约车等服务领域。例如滴滴等网约车平台,其服务在很大程度上依赖于精确的行程时间估计[1]。近年来,深度学习技术也被广泛应用于行程时间估计,例如基于循环神经网络的方法[2]、基于注意力机制的方法[3]以及基于图神经网络的方法[4-6]等。虽然这些方法提高了行程时间估计的精度,但它们都只专注于行程时间预测的点估计。点估计旨在使用样本数据来计算一个最佳估计作为预测值,在行程时间估计中,点估计专注于预测一个具体的行程时间值。仅依赖点估计的方法无法捕捉预测的不确定性,降低了预测结果的可用性和可信度[7],无法满足实际需求,尤其是在需要高准确性的紧急情况下。例如,对救护车到达现场的时间估计,考虑了两条不同的救援路线,其行程时间点估计分别为t1t2,若t1时间短,但置信区间宽,表明不确定性较高,可能错过关键的救援时机。相反,若t2时间较长,但置信区间窄,则即使在最慢的预期情况下也能够及时到达救援现场。综合考虑,选择t2对应的路线更安全。因此,行程时间的置信区间估计尤为重要。

置信区间估计[8]是一种为预测结果提供不确定性量化的有效途径。对预测结果进行置信区间估计,是指明确输出预测结果的上下界,即定义出预测值的合理波动范围。有效的置信区间估计不仅增强了预测的可信度,为服务商在资源分配和服务质量保障方面提供了重要支持,还有助于用户出行规划和决策[7]。目前,同时解决行程时间估计和置信区间估计两个问题的研究较少。在现实场景中,准确的行程时间估计和可靠的不确定性量化主要面临如下挑战:①行程时间估计受到多种复杂因素的影响而导致结果的不确定性,例如驾驶员的行为偏好、节假日等都会导致行程时间估计的不确定性。②完整的路线由多个路段组成,每个路段的通行时间因路线和路况的不同而呈现动态变化。某个路段的行程时间不确定性大,这种不确定性沿着路线累积,会导致整个路线的行程时间不确定性大。路段级别的通行时间估计对于全局路线行程时间估计的准确性具有决定性影响。

为了应对上述挑战,本文提出了全局-局部不确定性感知行程时间估计方法(global and local uncertainty-aware travel time estimation, GLUTTE)。该方法旨在同时学习全局路线的行程时间及其不确定性,以及局部各路段的通行时间和相应的不确定性,采用分位数回归方法分别对全局路线和局部各路段的不确定性进行量化,最后将两者融合,得到一个综合的行程时间及其置信区间。主要贡献如下:

1) 提出了针对行程时间估计的不确定性量化框架,能够同时进行行程时间点估计和置信区间估计,有效提高了预测结果的可用性。

2) 设计了时空学习模块,用于深入分析各种复杂因素对行程时间估计的影响。并且提出了一种新颖的多粒度分位数回归方法,通过多任务学习策略,同时预测全局路线及其局部路段的行程时间并量化不确定性,提升了行程时间估计的准确性和可信度。

3) 通过在两个真实的轨迹数据集上的实验,验证了所提方法在行程时间估计和不确定性量化方面的先进性和优越性。

1 相关工作 1.1 行程时间估计

行程时间估计的工作主要分为两类:基于起止点的行程时间估计与基于路线的行程时间估计。

基于起止点的行程时间估计是指只提供行程的起点、终点和出发时刻,而不提供实际的行驶路线来估计行程时间的方法。Li等[9]提出一种多任务学习框架MURAT,利用道路的拓扑结果和时空先验知识来进行基于起止点的行程时间估计。Lin等[10]提出基于扩散模型的DOT框架,通过挖掘历史轨迹和像素化轨迹的关联性,辅以掩码视觉Transformer,实现了对基于起止点行程时间的高效且精准的预估。

基于路线的行程时间估计是通过给定行驶路线和出发时刻来估计行程时间的方法,正是本文探索的核心议题。受到自然语言处理的启发,Wang等[2]提出WDR方法,该方法同时训练广度神经网络、深度神经网络以及循环神经网络,将每条路线视作一个句子,每个路段及其关系视作单词;通过广度模型洞察路线全局统计特性,利用深度模型挖掘深层次结构,循环模型则用于精准捕捉路段动态变化,成功实现了行程时间的高精度预测。Derrow-Pinion等[6]在谷歌地图上采用图神经网络的方法进行行程时间估计,显著提高了其准确性。Chen等[3]提出的HierETA方法利用Transformer序列建模能力,通过多视图建模,分别从短路段、长路段和交叉路口进行时间估计,有效提高了行程时间估计的准确性。

无论是基于起止点的行程时间估计还是基于路线的行程时间估计都在点估计上取得了显著进展,然而这些方法普遍忽视了对估计结果的可信度评估,缺少对结果的置信区间估计,从而限制了这些方法在实际应用中的可用性和可信度。

1.2 不确定性量化

现有的不确定性量化方法可以分为基于贝叶斯的方法和非贝叶斯方法两类[11]

贝叶斯方法基于贝叶斯公式,为模型参数指定先验分布,然后推断网络参数的后验分布,对模型不确定性进行量化。贝叶斯方法的困难是后验分布难以直接计算,只能通过近似方法来推断,例如变分推断和马尔可夫链蒙特卡罗方法。这些方法通常计算复杂度较高、耗时较长。为了解决这一问题,Gal等[12]提出了蒙特卡罗Dropout方法,该方法的核心思想是假设神经网络的每一层参数服从伯努利分布,从而控制隐藏层神经元的丢弃概率。

非贝叶斯方法在处理不确定性方面通常比贝叶斯方法更为灵活。例如,分位数回归[13]和平均间隔分数[14]将不确定性度量纳入损失函数中。分位数回归通过对不同条件分位数进行建模,揭示数据分布的不同方面,包括中位数及其他任意分位数(如25%或75%分位数),通过最小分位数和最大分位数可以构建置信区间。平均间隔分数则通过最小化预测区间的平均宽度,同时惩罚未能覆盖实际观测值的预测区间。此外,共形预测(conformal prediction, CP)[15]是一种利用历史数据来估计新样本预测不确定性的技术,它为每个预测结果提供了一个置信区间,这种方法与模型设计无关,并在理论上保证了预测结果置信度的可靠性和透明度。

综上所述,不同方法各有优势,但分位数回归能够直接估计出不同分位数下的结果,从而为预测结果的置信区间提供了直观的理解。因此,本文采用了分位数回归的理论框架。

2 基本定义和问题定义

本节将对所涉及的基本概念以及要解决的问题进行形式化定义。

2.1 基本定义

定义1   路网:交通路网定义为一个有向图G=〈S, E〉,其中S是路段集合,E是边集。sS表示路网中的一个路段,eijE表示路段si和路段sj之间的连接关系。

定义2   路线:一条路线r是一个路段序列,即r=[s1, s2, …, sM], M表示一条路线包含路段的个数。

定义3   请求:为出发时间d和路线r的组合req=(r, d)。行程时间估计是输入一个查询req,估计行程时间y

2.2 问题定义

本研究旨在解决两个关键问题:一是多任务的行程时间估计;二是行程时间的置信区间估计。

问题1   多任务的行程时间估计:对于给定的请求req,同时估计路线r的整体通行时间$ \hat{y}$,以及每个路段si的通行时间$ \hat{y}_{s_i}$

问题2   行程时间的置信区间估计:在给定置信水平下,输出区间[l, u],即行程时间估计的下界(最短时间)l和上界(最长时间)u

3 全局-局部不确定性感知行程时间估计方法(GLUTTE)

GLUTTE的模型结构如图 1所示,包括时空学习模块与多任务不确定性感知模块。时空学习模块有效建模了复杂因素对行程时间估计的影响,并充分融合了路线的时空特征。多任务不确定性感知模块旨在综合学习全局路线行程时间和局部路段通行时间,利用一种新颖的多粒度分位数回归方法,分别对全局路线和局部路段的不确定性进行量化。通过结合学习到的时空特征,输出行程时间$ \hat{y}$和置信区间估计[l, u],从而提高了行程时间估计的可用性和可信度。

图 1 GLUTTE的模型结构 Fig. 1 The model structure of GLUTTE
3.1 时空学习模块

时空学习模块分为时空特征学习组件和时空序列学习组件。时空特征学习组件旨在有效学习行程时间估计中的各种复杂因素,包括驾驶员行为偏好和出发时刻等,分别学习时空的密集特征和稀疏特征。密集特征代表数值信息,涵盖路线的行驶距离、路段数量以及路口数目;稀疏特征表示分类信息,包括驾驶员ID和出发时刻所在的时间段。为深入了解并有效利用行程时间预测中密集特征与稀疏特征的复杂关联,采用神经因子分解机(neural factorization machine,NFM)[16]有效捕获到高阶和非线性的特征交互。对于稀疏特征,通过多层感知机来提取非线性关系,增强模型的泛化能力。密集特征和稀疏特征的输出向量表示分别为

$ \boldsymbol{H}_{\mathrm{den}}=N F M\left(\boldsymbol{X}_{\mathrm{den}}\right), $ (1)
$ \boldsymbol{H}_{\mathrm{spa}}=\sigma\left(\boldsymbol{X}_{\mathrm{spa}}\right), $ (2)

其中:σ代表多层感知机;XdenXspa分别代表密集特征和稀疏特征的嵌入向量;$ \boldsymbol{H}_{\mathrm{den}}, \boldsymbol{H}_{\mathrm{spa}} \in \mathbf{R}^{d_h}, d_h$为输入特征的维度。

时空序列学习组件旨在有效学习全局路线的时空序列特征与局部路段之间的时间相关性,从而实现行程时间的精准预测。该组件采用了双分支结构,同时对全局路线的行程时间和局部路段的通行时间进行估计。具体设计了两个独立的LSTM,即全局LSTM和局部LSTM。全局LSTM对粗粒度的全局行程时间进行建模,以反映整体路径的通行状况。而局部LSTM专注于细粒度的局部路段分析,逐个预测路段的通行时间,从而揭示出路段间微妙的时间相关性,为行程时间预测提供更为细腻的微观视角。输入的时空序列特征是路段序列(作为空间特征)以及根据历史统计的每个路段平均通行时间(作为时间特征),将最后一个隐藏态$ \boldsymbol{H}_{\mathrm{seq}} \in \mathbf{R}^{d_h}$作为全局路线的时间表示,

$ \boldsymbol{H}_{\mathrm{seq}}={globalLSTM}\left(\boldsymbol{X}_{\mathrm{seq}}\right), $ (3)

其中:$ \boldsymbol{X}_{\mathrm{seq}} \in \mathbf{R}^{M \times d_{i n}+1}$为路段序列嵌入和路段平均通行时间的组合嵌入向量,din为输入特征的维度。对局部路段的通行时间估计为

$ \boldsymbol{H}_s=localLSTM\left(\boldsymbol{X}_{\mathrm{seq}}\right), $ (4)

其中:输出层$ \boldsymbol{H}_s \in \mathbf{R}^{M \times d_h}$为各路段通行时间表示。

3.2 多任务不确定性感知模块

多任务预测组件设计的目的是充分考虑全面的上下文信息,同时有效地考虑局部路段对全局路线的影响,高效学习整个路线的特性(如交通状况、路段长度和可能的延迟等)。将上述时空特征学习组件和时空序列学习组件结合起来,建立整体模型估计行程时间。该模型有效地利用了密集特征、稀疏特征和序列特征,并通过多层感知机输出全局路线的行程时间,即

$ \hat{y}_R=\sigma\left(\boldsymbol{H}_{\mathrm{den}}\left\|\boldsymbol{H}_{\mathrm{spa}}\right\| \boldsymbol{H}_{\mathrm{seq}}\right), $ (5)

其中:$ \hat{y}_R$为全局路线的预测时间;‖表示连接操作。而每个局部路段的通行时间表示为

$ \hat{y}_{s_i}=\sigma\left(\boldsymbol{H}_{s_i}\right), $ (6)

其中:$\hat{y}_{s_i} $表示一条路线中第i个路段的预测通行时间;$ \boldsymbol{H}_{s_i} \in \mathbf{R}^{d_h}$为一条路线中第i个路段的通行时间表示。最终的行程时间$ \hat{y}$由两者组合而成,即

$ \hat{y}=\lambda \hat{y}_R+(1-\lambda) \sum\limits_i^m \hat{y}_{s_i} \text {, } $ (7)

其中:λ为线性平衡全局粗粒度和局部细粒度的权重参数。利用λ,模型能够在保留粗粒度的全局路线信息的同时也能有效关注更细粒度的路段特征。

多粒度分位数回归的目的是提供可靠的置信区间估计,量化预测结果的不确定性。分位数回归[13]提供了一个有效量化不确定性的解决方案,它不对数据分布形式做任何假设,而是直接优化分位数损失函数。该损失函数特别针对预测值与实际观测值之间的偏差进行量化,基本形式为

$ L_{\text {qua }}=\mathbb{I}_{\hat{y} \geqslant y} \rho|y-\hat{y}|+\mathbb{I}_{\hat{y} <y}(1-\rho)|y-\hat{y}|, $ (8)

其中:$ \mathbb{I}$表示选择函数。该损失函数考虑了预测值与实际值之间的关系,分为预测值不小于实际值$ (\hat{y} \geqslant y)$和预测值小于实际值$ (\hat{y} <y)$两种情况,并对这两种情况分别赋予不同的权重ρ。权重的选择取决于目标分位数,通过调整ρ值,分位数回归损失函数能够针对不同预设分位点的预测进行不同程度的惩罚调整,从而构建出反映预测不确定性的置信区间。

在分位数回归的理论基础上,提出了多粒度分位数回归(multi-granularity quantile regression,MGQR)方法。该方法分别针对粗粒度的全局路线行程时间和细粒度的局部路段通行时间的不确定性进行量化,以提供相应的置信区间。粗粒度的全局分位数损失和细粒度的局部分位数损失分别表示为

$ \begin{aligned} & L_{\text {global }}=\sum\limits_{k=1}^P \mathbb{I}_{\hat{y} \geqslant y} \rho_k\left|y-\hat{y}_R^k\right|+ \\ & \mathbb{I}_{\hat{y} <y}\left(1-\rho_k\right)\left|y-\hat{y}_R^k\right|, \end{aligned} $ (9)
$ \begin{aligned} & L_{\text {local }}=\sum\limits_{k=1}^P \sum\limits_{i=1}^M \mathbb{I}_{\hat{y}_{s_i} \geqslant y_i} \boldsymbol{\rho}_k\left|y_{s_i}-\hat{y}_{s_i}^k\right|+ \\ & \mathbb{I}_{\hat{y}_{s_i} <y_i}\left(1-\boldsymbol{\rho}_k\right)\left|y_{s_i}-\hat{y}_{s_i}^k\right| 。\end{aligned} $ (10)

设定P=3,分别对应3个预测值:上界u、均值$ \hat{y}$和下界l。这3个预测值对应ρ的不同取值,以保证满足$ u \geqslant \hat{y} \geqslant l$不等式关系,使得全局分位数回归能够监督整条路线的行程时间,并提供可靠的置信区间估计。同时,局部分位数回归对各路段的通行时间提供精确的点估计,并保证局部路段通行时间的置信区间估计。通过多粒度分位数回归方法,模型有效地融合了全局路线的综合时空特性和局部路段的实时动态信息。

3.3 损失函数

模型的损失函数有三部分:多粒度分位数损失、L1损失函数和平均预测间隔宽度(mean prediction interval width, MPIW)[8]

MPIW即置信区间的宽度,计算公式为

$ M P I W=\frac{1}{N} \sum\limits_{i=1}^N\left|u_i-l_i\right|, $ (11)

其中:N代表样本数量。

L1损失函数为

$ L_1=\frac{1}{N} \sum\limits_{i=1}^N\left|y_i-\hat{y}_i\right| \text { 。} $ (12)

最终的损失函数为

$ L=\lambda L_{\text {global }}+(1-\lambda) L_{\text {local }}+L_1+\alpha \cdot M P I W 。$ (13)

多粒度分位数回归旨在同时量化全局和局部的不确定性,并估计置信区间。L1损失函数用于提高点估计的准确性,而MPIW则确保置信区间尽可能紧致。λ同上述公式(7),平衡粗粒度的全局分位数损失和细粒度的局部损失。α为区间宽度约束系数,控制置信区间的紧致度,以在点估计的准确性和置信区间的宽度之间找到最优平衡。

4 实验

本节验证所提GLUTTE模型的性能。首先,通过与多个基准模型的比较,评估GLUTTE模型性能并证明其优势。其次,通过消融实验来验证模型各组件的有效性。最后,通过超参数分析,深入探讨模型性能与关键参数设置之间的关系。

4.1 实验数据集

使用了两个真实的轨迹数据集,分别来自葡萄牙波尔图市和中国西安市的出租车轨迹数据,数据集信息见表 1。波尔图数据集:记录了2013年7月1日至2014年6月30日在波尔图市收集的出租车轨迹数据。西安数据集:记录了2018年10月1日至10月15日在西安市收集的出租车轨迹数据。为了确保数据质量并避免异常路线的影响,对原始轨迹数据进行了筛选。去除以下数据:非常短的行程时间(少于60 s),路线中包含路段数过少(少于6个)以及路线行驶距离过短(少于500 m)。

表 1 数据集信息 Tab. 1 Dataset information

按照6∶2∶2的比例划分为训练集、验证集和测试集。为了方便表示出发时刻,一天24 h被划分为288个时间段,每个时间段为5 min。针对公式(9)、(10),置信度设定为90%,l$ \hat{y}$u对应的ρ的取值分别为[0.05, 0.5, 0.95]。

4.2 评价指标

评价指标分为两类,分别衡量点估计和不确定性量化的性能。

1) 点估计评价指标

使用平均绝对误差(mean absolute error,MAE)、平均绝对百分比误差(mean absolute percentage error,MAPE)和满意度(satisfaction rate,SR)衡量点估计性能,其中满意度是指误差不大于10%的行程的比例。具体公式为

$ M A E=\frac{1}{N} \sum\limits_{i=1}^N\left|y_i-\hat{y}_i\right|, $ (14)
$ M A P E=\frac{100 \%}{N} \sum\limits_{i=1}^N\left|\frac{y_i-\hat{y}_i}{y_i}\right|, $ (15)
$ S R=\frac{1}{N} \sum\limits_{i=1}^N\left(\left|\frac{y_i-\hat{y}_i}{y_i}\right| \leqslant 10 \%\right) \times 100 \%, $ (16)

其中:yi代表真实值;$ \hat{y}_i$代表预测值。MAEMAPE值越小越好,SR值越大越好。

2) 置信区间估计评价指标

使用预测区间覆盖率(prediction interval coverage probability,PICP)[7]表示真实值落入置信区间的概率,其计算公式为

$ P I C P=\frac{100 \%}{N} \sum\limits_{i=1}^N \mathbb{I}\left\{l_i \leqslant y_i \leqslant u_i\right\}_{\circ} $ (17)

PICP值越大越好,但置信区间过大会缺乏实际意义。为了有效平衡区间紧致度和区间覆盖率的关系,引入平均间隔分数(mean interval score,MIS),其计算公式为

$ \begin{aligned} & \text { MIS }=\frac{1}{N} \sum\limits_{i=1}^N\left\{\left(u_i-l_i\right)+\frac{2}{\gamma}\left(y_i-u_i\right) \mathbb{I}\left\{y_i>u_i\right\}+\right. \\ & \left.\frac{2}{\gamma}\left(l_i-y_i\right) \mathbb{I}\left\{l_i \geqslant y_i\right\}\right\}, \end{aligned} $ (18)

其中:γ=0.10。MIS综合反映了区间上界低于真值和区间下界高于真值的情况,其值越小越好。

4.3 基准模型

为了衡量所提GLUTTE模型在点估计与不确定性量化方面的水平,选择了以下两类基准模型。

第一类为行程时间估计基准模型,具体如下。

1) HA模型:为历史平均模型,统计了城市每个路段的平均通行时间,累加求和得到行程时间。

2) MLP模型:应用多层感知机来估计行程时间,网络层数为10,激活函数为ReLU,隐藏层大小固定为256。

3) LSTM模型:利用LSTM直接处理路段序列,序列维数为256,然后通过多层感知机获得行程时间估计。

4) WDR[2]模型:为基础的广度深循环模型,分别处理密集、稀疏和连续特征,隐藏层设置为256。

5) WDR-LC[17]模型:在WDR的基础上综合考虑路段和路口的影响,将两者联合建模。

第二类为不确定性量化基准模型,具体如下。

1) MC Dropout[12]模型:为蒙特卡罗Dropout方法,将Dropout解释为高斯过程的贝叶斯近似,并在训练和测试阶段都启用Dropout。

2) MIS[14]模型:通过MIS的损失函数来优化模型。

3) Quantile[13]模型:使用分位数损失函数来生成固定置信水平的预测。

4) CP[15]模型:利用历史数据计算不合格分数来估计新样本的不确定性,利用不合格分数为每个预测提供一个置信区间。

4.4 实验结果分析

1) 与行程时间估计基准模型的比较

在波尔图和西安数据集上的点估计性能对比结果见表 2。可以看出,基于传统统计方法的HA模型性能不佳,相比之下,深度模型MLP和LSTM的性能显著提升。WDR和WDR-LC采用了广度深循环结构,模型更复杂,具有更强的学习能力,进一步提高了性能。所提模型GLUTTE有效结合了全局整体特征和局部细粒度特征,因而在两个数据集上均实现了最佳的点估计性能。

表 2 在波尔图和西安数据集上的点估计性能对比 Tab. 2 Comparison of the point estimation performance on the Porto and Xi′an datasets

2) 与不确定性量化基准模型的比较

在波尔图和西安数据集上的不确定性量化性能对比结果见表 3。可以看出,在不确定性量化方面MC Dropout模型表现不佳,其置信区间估计不能有效覆盖真值。而MC Dropout模型的点估计性能表现为次优,是由于其集成学习的思想可以有效提高回归结果的精确度。Quantile模型在不确定性量化方面表现为次优,能够较为有效地量化不确定性。GLUTTE模型采用多粒度分位数回归,充分考虑了全局路线和局部路段的不确定性,其PICPMIS指标均优于其他基准模型,这表明GLUTTE模型在置信区间估计方面有显著优势。

表 3 在波尔图和西安数据集上的不确定性量化性能对比 Tab. 3 Comparison of the uncertainity quantification performance on the Porto and Xi′an datasets
4.5 消融实验

本节通过消融实验证明GLUTTE模型各组件的有效性,分为以下3个变体进行比较。

1) No STF:移除时空特征学习组件,仅保留循环结构。

2) No Local:移除对局部路段的融合处理。

3) No MPIW&L1:移除MPIW和L1损失函数。

消融实验结果见表 4。可以看出,移除时空特征学习组件,点估计性能明显下降,说明密集特征和稀疏特征都对点估计预测结果有重要辅助作用。同时,移除对于区间宽度和L1损失的约束,点估计性能下降,虽然PICP指标略有提升,但MIS显著增大,反映出置信区间的紧致度降低。因此,L1损失和MPIW的结合能有效平衡点估计和置信区间估计。

表 4 消融实验结果 Tab. 4 Results of ablation experiment

此外,移除局部路段特征监督融合,仅保留全局路线监督,将降低点估计效果。这表明局部路段信息通过提供更细致的特征,有助于捕捉到影响整个路线行程时间的微观因素,其对提高预测准确性具有显著作用。而置信区间性能的显著降低,进一步证明了局部特征融合在确保置信区间可靠性方面的重要性,并验证了多粒度分位数回归对点估计和置信区间估计的有效性。

4.6 超参数分析

本节对损失函数的两个重要超参数进行分析:全局和局部的平衡系数λ和区间宽度约束系数α。固定α=0.5,分别设置不同的λ进行实验,分析结果如图 2所示,其中λ=0.7时综合性能最佳。在该过程中,全局信息的权重增大可以有效缓解局部路段所带来的误差累积。然而,当λ=1.0时,即完全依赖全局路线信息,点估计和置信区间估计性能都显著下降,说明了局部特征和全局信息融合的重要性。

图 2 超参数λ分析 Fig. 2 Aanalysis of hyper-parameter λ

固定λ=0.7,分别设置不同的α进行实验,分析结果如图 3所示,其中α=0.5时性能最佳。然而,当α>0.5时,对区间宽度的过度约束会导致置信区间估计性能的下降,同时也影响了点估计的性能。严格的区间宽度约束,一方面可能使置信区间的界限过于狭窄,无法有效覆盖真实值,降低置信区间估计的准确性。另一方面,可能削弱了分位数回归的效果,从而影响点估计的精度。

图 3 超参数α分析 Fig. 3 Aanalysis of hyper-parameter α
5 结语

本文提出了全局-局部不确定性感知行程时间估计方法GLUTTE,在提高预测精度的同时,为行程时间估计提供了可靠的置信区间。该模型有效学习并融合了全局路线的时空特征以及局部路段的实时动态信息,通过采用多任务学习策略,同时对全局和局部的不确定性进行量化,并利用一种新颖的多粒度分位数回归方法,实现了准确可靠的置信区间估计。在未来工作中,将探索其他方法对行程时间估计的不确定性量化。

参考文献
[1]
HU X Y, BINAYKIYA T, FRANK E, et al. DeeprETA: an ETA post-processing system at scale[EB/OL]. (2022-06-05)[2024-03-21]. https://doi.org/10.48550/arXiv.2206.02127. (0)
[2]
WANG Z, FU K, YE J P. Learning to estimate the travel time[C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2018: 858-866. (0)
[3]
CHEN Z B, XIAO X L, GONG Y J, et al. Interpreting trajectories from multiple views: a hierarchical self-attention network for estimating the time of arrival[C]//Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2022: 2771-2779. (0)
[4]
陈俊彦, 黄雪锋, 韦俊宇, 等. 基于多图时空注意力的轨道交通客流预测模型[J]. 郑州大学学报(理学版), 2023, 55(4): 39-45.
CHEN J Y, HUANG X F, WEI J Y, et al. A prediction method of rail transit passenger flow based on multi-graph spatial and temporal attention[J]. Journal of Zhengzhou university (natural science edition), 2023, 55(4): 39-45. DOI:10.13705/j.issn.1671-6841.2022179 (0)
[5]
刘玉强, 顾晶晶, 孙明, 等. 基于城市区域多模态融合的人群流量预测[J]. 郑州大学学报(理学版), 2022, 54(1): 25-31.
LIU Y Q, GU J J, SUN M, et al. Exploring the multimodal fusion of urban regions for crowd flow prediction[J]. Journal of Zhengzhou university (natural science edition), 2022, 54(1): 25-31. DOI:10.13705/j.issn.1671-6841.2021081 (0)
[6]
DERROW-PINION A, SHE J, WONG D, et al. ETA prediction with graph neural networks in google maps[C]// Proceedings of the 30th ACM International Conference on Information & Knowledge Management. New York: ACM Press, 2021: 3767-3776. (0)
[7]
WANG B, LU J, YAN Z, et al. Deep uncertainty quantification: a machine learning approach for weather forecasting[C]//Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2019: 2087-2095. (0)
[8]
PEARCE T, ZAKI M, BRINTRUP A, et al. High-quality prediction intervals for deep learning: a distribution-free, ensembled approach[EB/OL]. (2018-06-15)[2024-03-21]. https://doi.org/10.48550/arXiv.1802.07167. (0)
[9]
LI Y G, FU K, WANG Z, et al. Multi-task representation learning for travel time estimation[C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2018: 1695-1704. (0)
[10]
LIN Y, WAN H Y, HU J L, et al. Origin-destination travel time oracle for map-based services[J]. Proceedings of the ACM on management of data, 2023, 1(3): 1-27. (0)
[11]
ABDAR M, POURPANAH F, HUSSAIN S, et al. A review of uncertainty quantification in deep learning: techniques, applications and challenges[J]. Information fusion, 2021, 76: 243-297. (0)
[12]
GAL Y, GHAHRAMANI Z. Dropout as a Bayesian approximation: representing model uncertainty in deep learning[C]//Proceedings of the 33rd International Conference on Machine Learning. New York: ACM Press, 2016: 1651-1660. (0)
[13]
HAO L X, NAIMAN D Q. Quantile regression[M]. Los Angeles: Sage Publications, 2007. (0)
[14]
WU D X, GAO L Y, CHINAZZI M, et al. Quantifying uncertainty in deep spatiotemporal forecasting[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2021: 1841-1851. (0)
[15]
SHAFER G, VOVK V. A tutorial on conformal prediction[J]. Journal of machine learning research, 2008, 9: 371-421. (0)
[16]
HE X N, CHUA T S. Neural factorization machines for sparse predictive analytics[C]//Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM Press, 2017: 355-364. (0)
[17]
MAO X W, CAI T Y, PENG W C, et al. Estimated time of arrival prediction via modeling the spatial-temporal interactions between links and crosses[C]//Proceedings of the 29th International Conference on Advances in Geographic Information Systems. New York: ACM Press, 2021: 658-661. (0)