Spatial intelligence: a living map in driving situation
-
摘要:
本文研究随车而动的驾驶员眼中的活地图在无人驾驶过程中的实时生成技术,即驾驶空间智能。在线生成并持续更新车辆当前路权的地理空间表征,乃是机器驾驶脑中驾驶决策的基础数据,对无人驾驶车辆的认知工程实现具有基础性意义。以变粒度对数极坐标栅格为统一形式化语言,给出活地图系统生成框架;能从传统意义的静态地图问题提升为随车而动的地理空间的状态估计问题,并被持续更新与估计;能承载多源异构的道路传感器感知与先验知识的融合,以贝叶斯滤波为核心机制维护其后验分布;用瞬时记忆—工作记忆—长时记忆维持地图的连续性,并用实时规划实现驾驶活地图的认知闭环。如果路上没有任何其他移动障碍物,活地图就可以让车在不同路段以不同速度从出发地自主驾驶到达目的地。
Abstract:This paper examines the real-time generation technology of the live map from the driver’s perspective, who follows the car during the process of autonomous driving, known as driving space intelligence. Online generation and continuous updating of the geospatial representation of the vehicle’s current road right is the basic data of driving decision-making in the machine driver’s mind, which is of fundamental significance to the realization of cognitive engineering of unmanned vehicles. Taking a variable granularity logarithmic polar grid as a unified formal language, the generation framework of the active map system is given. It can be upgraded from the traditional static map problem to the state estimation problem of the geographical space that moves with the car, and it can be continuously updated and estimated; It can carry the fusion of multi-source heterogeneous road sensor perception and prior knowledge, and maintain posterior distribution with Bayesian filtering as the core mechanism; Instantaneous memory-working memory-long-term memory is used to maintain the continuity of the map, and real-time planning is used to realize the cognitive closed loop of the driving map. If there are no other moving obstacles on the road, the mobile map can enable the car to drive from the starting point to the destination at varying speeds on different sections.
-
随着自动驾驶系统向认知闭环发展,地图的作用正在由静态先验支撑转向面向驾驶任务的动态空间表征。高精度地图可提供道路几何、车道拓扑与规则语义等稳定信息,占据栅格、语义建图和概率融合等方法为局部环境感知与更新提供了基础。然而,在遮挡、稀疏观测、临时施工、路权变化及多源信息冲突等真实交通场景下,单纯依赖静态地图或单帧感知结果,难以持续稳定地支撑驾驶决策,易导致空间表征滞后、拓扑关系不连续和规划输入不稳定。为此,本文面向驾驶态势中的空间智能问题,提出一种随车而动的活地图框架,将地图重构为以驾驶员中心坐标系组织的动态空间置信状态;采用变粒度对数极坐标栅格作为统一形式化语言,融合先验地图与多源实时观测,并结合贝叶斯递归更新、分层记忆与遗忘机制,实现活地图的持续生成与在线维护,为自动驾驶系统在动态环境中的稳定决策提供支撑。
1. 从高精度地图到随车而动的活地图
城市优秀出租车司机,常常是这个城市的活地图,对这个城市的地理空间特征有着鲜活的记忆。无人驾驶车辆里的机器驾驶脑也必须有同样丰富的、实时的空间智能。驾驶脑依赖互联网等提供的离线制作的高精度地图(high definition map, HD Map)[1],可获得稳定、精确的几何基准、车道拓扑与规则语义;也可以通过道路传感器获得局部地理环境诸要素,用于即时决策与控制[2]。在真实交通中,遮挡、稀疏观测、环境动态变化与传感器不完美是常态,单纯依赖静态地图与单帧感知串接的方式会暴露结构性不足。一方面,高频局部变化,例如施工占道、临时标志、封路改道、拥堵导致的可通行区域变化等会使静态地图的正确性在当前时刻失效;另一方面,长尾遮挡与稀疏观测使关键要素短时不可见,但驾驶决策必须连续一致;同时,多源观测冲突与定位漂移会把误差直接注入规划输入,导致策略不稳定乃至安全裕度下降[3]。因此,本文提出随车而动的活地图(如图1),它将地图从外部输出文件重新定位为认知系统内部的可推理空间记忆体,它不以一次性制图为目标,而以闭环驾驶过程中的空间置信为对象,持续估计、持续更新,并不断遗忘陈旧与无价值信息的累积。
从认知物理学视角看[4],活地图的本质是无人驾驶系统中承载空间认知的软构体,以传感器与计算单元等硬构体为物理载体,在物质(传感器)、能量(计算资源与行动代价)、结构(空间表征与拓扑约束)、时间(记忆与遗忘的时序机制)四要素协同作用下实现认知状态的动态演化[5]。与传统地图不同,活地图的“随车而动”主要体现在3方面。第一,在参考系层面,活地图始终以车辆驾驶员位视角为原点,其地图窗口随车辆运动实时平移与旋转,使局部空间表征与当前驾驶任务保持同一坐标基准。第二,在内容维护层面,活地图进行在线状态估计,任意空间对象的有效性与置信度随时间衰减,可被新观测持续修正或覆盖,从而实现对动态环境与不完美观测的自适应;遗忘机制体现在长期记忆层,当对象被判定为低价值、低稳定或长期缺乏重复验证时,会从长期沉淀的先验与结构记忆中被剔除,避免陈旧或噪声信息进入可学习先验并影响长期行为。第三,在目标定位层面,活地图并不追求全局一致的制图完备性,而是面向驾驶态势与路权计算而存在。图2给出了传统高精度地图的典型形态:它擅长提供长期稳定结构,但难以独立承担动态环境下的连续性维护。
为使活地图从概念走向可验证的工程系统,本文将问题重定义为:在车辆驾驶员中心坐标系下,对与驾驶决策强相关的空间状态进行递归的状态估计与持续修正。该重定义强调3项可检验属性。第一,中心性:地图始终以驾驶员为中心组织空间信息,避免全局坐标漂移对局部决策的放大;第二,递归性:地图状态以先验与观测的递归更新为核心机制,避免单帧噪声直接驱动结构突变;第三,生命周期:地图必须内置信息的出生、维持、衰减与遗忘,使记忆与遗忘共同构成系统稳定性基础。由此,地图、感知、决策被统一到同一状态空间框架中:感知产生观测,地图维护置信度,规划利用置信并反向影响注意与观测分配,从而形成认知−行动耦合闭环[6]。从各种各样静态地图和传感器获得的空间信息,形成的驾驶脑中的活地图,比驾驶员头脑中的活地图,更新鲜。
在此基础上,本文将“空间智能”在驾驶态势图中的能力边界明确为4项,并作为全文的方法组织原则。
1)空间表征:如何在统一形式化语言下表达道路几何、车道拓扑、交通语义、规则约束及其不确定性,使空间状态可存储、可更新、可计算;
2)空间推理:如何由不完美观测推断隐含结构与可通行性,包括连通关系、路口拓扑、让行关系、路权边界与规则一致性;
3)空间记忆:如何以瞬时−工作−长时分层记忆稳定地图状态,跨越遮挡、稀疏观测与长期运行的误信息累积,并通过遗忘抑制信息垃圾[7];
4)空间交互与行动耦合:规划控制如何反向驱动注意力与主动感知,使系统实现为了驾驶而制图的资源分配与认知优化。
围绕上述主线,本文后续章节按先统一表征语言,再定义生产流程,再形成闭环耦合,最后通过可退化范式验证的顺序展开。第二章提出以变粒度对数极坐标栅格作为统一形式化语言;第三章给出活地图由先验投影、实时观测写入、贝叶斯递归融合、分层记忆与遗忘沉淀构成的生产与更新流程,结合规划控制反向驱动注意与认知和行动耦合机制;第四章以“三个三分之一”工程范式与园博园实验对活地图的实时性、一致性与闭环收益进行验证。
2. 统一形式化语言:变粒度对数极坐标栅格
活地图面临形式化难题,无人驾驶环境广域且多变,空间表征并非越精确越好,而需要在描述精度、计算复杂度与实时稳定性之间取得可控平衡。传统笛卡尔等粒度栅格在驾驶场景中存在两类典型矛盾:其一,近场决策与控制需要细粒度表征,但等粒度会把同样的细粒度强加到远场,造成计算与存储浪费[8];其二,远场信息对决策往往只需粗略结构,但等粒度难以在不改变表示的前提下实现近细远粗的自适应。与此同时,车载传感器在参考平面上的投影天然不均匀:毫米波雷达接近极坐标采样,相机逆投影呈梯形覆盖,近场密集,远场稀疏,如图3。因此,本文采用以车辆驾驶员为中心的变粒度对数极坐标栅格(log-polar variable-resolution grid)作为驾驶态势图中的统一形式化语言[9],用于承载先验地图信息与多源实时观测,并为后续的递归融合、记忆管理与规划控制提供一致的计算基座。
2.1 驾驶员中心坐标系与对数极坐标栅格定义
设驾驶员中心为原点$ {O} $,车辆正前方为极轴,地面参考平面上的任一点用极坐标$ {(r,\theta )} $描述。角向将前方关注视野划分为等角度扇区,$ \theta \in [{{\theta }}_{\min }{,}{{\theta }}_{\max }{]} $,分为$ {{N}}_{{\theta }} $段,每段宽度$ {\Delta \theta } $固定;径向采用指数规律分层以实现近细远粗,定义半径序列
$$ {{r}}_{{k}}={{r}}_{{0}}{ \cdot }{{a}}^{{k}}{,k=0,1, \cdots ,}{{N}}_{{r}} $$ 式中:$ {{r}}_{{0}} $为最小半径尺度,$ {a>1} $为增长因子。由此得到的二维索引$ {(k,i)} $与物理空间$ {(r,\theta )} $一一映射,天然满足:靠近车辆的栅格更小、分辨率更高,远离车辆的栅格更大、分辨率更低,从而与驾驶控制对近场敏感、对远场结构性依赖的需求一致[10]。
该对数极坐标栅格具备3个特点。第一,可裁剪:结合道路结构化特征与车辆运动学约束,可对左右区域、后向区域进行裁剪,仅保留与可行驶走廊相关的扇区范围,显著减少栅格数量与更新负载。第二,可时变:栅格参数$ {(}{{N}}_{{\theta }}{,}{{N}}_{{r}}{,a)} $可随车速、场景复杂度与即将执行的机动动态调整,例如高速场景适当降低角向分辨率、扩大径向覆盖,城市低速场景提高近场角向分辨率以服务变道与行人交互。第三,投影一致:Log-Polar 的组织方式更接近雷达与视觉投影的自然分布形态[11],使从感知投影到融合更新到规划搜索的算子在同一索引空间中协同工作,减少跨表示转换造成的时延与误差放大。
2.2 栅格承载的状态设计
活地图不是要素列表,而是对空间状态的可递归维护。为此,每个栅格单元不仅需要表达是否占据,还应表达与驾驶相关的多维属性及其置信度。本文将每个栅格单元视为一个可扩展的结构体,其最小充分字段包括:
1)状态变量。占据/可通行性概率、车道线/路缘/护栏等静态结构概率,动态目标的速度场与方向统计,必要时包含连续物理量(如速度、加速度)或离散语义(如施工区、停止线、斑马线)标签。
2)不确定性表达。对上述变量维护置信度或概率分布参数,使其可在贝叶斯框架下进行递归更新与校准。
3)时间戳与来源。记录最近一次被观测或被强化的时间、信息来源类型(先验/相机/雷达/融合推理等),用于生命周期衰减与冲突消解。
4)记忆层级标识。标记该信息当前处于瞬时/工作/长时哪一层,以支持不同时间尺度的维护策略与遗忘规则。
设定车辆坐标系$ {V} $:原点取车辆驾驶员为中心,$ {x} $轴指向车前方,$ {y} $轴指向左侧,$ { \textit{z} } $轴指向上方。相机坐标系为$ {C} $,雷达坐标系为$ {R} $。相机外参:$ {{{{{\boldsymbol{T}}}}_{{V \leftarrow C}}{=[}{{R}}_{{VC}}{,}{{t}}_{{VC}}{]} }}$,$ {{{{{\boldsymbol{T}}}}_{{V \leftarrow R}}{=[}{{R}}_{{VR}}{,}{{t}}_{{VR}}{]}}} $。相机内参:$ {{\boldsymbol{K}}} $。将道路参考平面在车辆坐标系表示为$ {{\pi}}_{{V}}{:\boldsymbol{n}}_{{V}}^{\rm{T}}{{\boldsymbol{X}}}_{{V}}{+}{{{\boldsymbol{d}}}}_{{V}}{=0} $。其中$ {{\boldsymbol{n}}}_{{V}} $为单位法向量,$ {{{\boldsymbol{d}}}}_{{V}} $为到原点的有符号距离。平整道路常用近似$ {{{\boldsymbol{n}}}}_{{V}}{=[0,0,1}{{]}}^{\rm{T}} $,并由标定给定$ {{{\boldsymbol{d}}}}_{{V}} $。以车辆系统时钟为准,每条观测携带时间戳$ {{t}}_{{s}} $。活地图以固定周期$ {\Delta T} $在参考时刻$ {{t}}_{{k}} $更新。为处理不同频率与链路时延,引入有效时间戳$ {t}_{{s}}^{\rm{eff}}{=}{{t}}_{{s}}{-}{{L}}_{{s}} $,其中$ {{L}}_{{s}} $为传感器算法链路延迟估计。
对任意位于地面参考面的点$ {{{\boldsymbol{p}}}}_{{V}}{=[x,y,0}{{]}}^{\rm{T}} $,其极坐标为$ {r=}\sqrt{{{x}}^{{2}}{+}{{y}}^{{2}}} $与$ {\theta ={\mathrm{atan}}2(y,x)} $。设关注视域$ {\theta \in [}{{\theta }}_{\min }{,}{{\theta }}_{\max }{]} $,分段数$ {{N}}_{{\theta }} $,步长$ {\Delta \theta =}\dfrac{{{\theta }}_{\max }{-}{{\theta }}_{\min }}{{{N}}_{{\theta }}} $,角向索引为
$$ {i=}\left\lfloor \dfrac{{\theta -}{{\theta }}_{\min }}{{\Delta \theta }}\right\rfloor {,i \in 0, \cdots ,}{{N}}_{{\theta }}{-1} $$ 设最小半径$ {{r}}_{{0}}{>0} $,增长因子$ {a>1} $,径向层数为$ {{N}}_{{r}} $,径向边界为
$$ {{r}}_{{k}}={{r}}_{{0}}{{a}}^{{k}}{,k=0,1, \cdots ,}{{N}}_{{r}} $$ 对$ {r \in [}{{r}}_{{0}}{,}{{r}}_{{{{N}}_{{r}}}}{)} $,径向索引为
$$ {k=}\left\lfloor \dfrac{{\ln (r/}{{r}}_{{0}}{)}}{\ln {a}}\right\rfloor {,k \in 0, \cdots ,}{{N}}_{{r}}{-1} $$ 定义栅格映射算子$ {I(}{{{\boldsymbol{p}}}}_{{V}}{)=(k,i)} $。若$ {\theta } $或$ {r} $越界,则丢弃或写入裁剪区。该表征天然实现近细远粗,并可随车速与场景动态调整$ {(}{{N}}_{{\theta }}{,}{{N}}_{{r}}{,a)} $以实现算力自适应。
在实现上,考虑到不同栅格内的信息类型差异较大,同一栅格可能同时包含标线置信度、占据概率、速度方向矢量等,采用定长主字段和变长扩展字段结合的组织方式:主字段存放占据与通行等核心概率,扩展字段按需存放语义与矢量属性,兼顾存储效率与表达能力。这样,活地图既能承载静态先验(标线、路缘、拓扑与规则),也能承载动态观测(目标、交通流、临时变化),并在统一索引空间中支持邻接关系计算、碰撞检查与可行驶走廊提取,为后续规划控制提供直接可用的数据结构。
多传感器存在不同频率、处理时延与时间戳不一致。活地图在每次更新参考时刻$ {{t}}_{{k}} $进行融合时,需将来自不同时间$ {{t}}_{{s}} $的观测统一到同一时刻,核心包括自运动补偿[12]与动态目标预测[13]两类对齐。
设定位系统给出车辆在世界坐标系$ {W} $的位姿$ {{{\boldsymbol{T}}}}_{{W \leftarrow V}}{(t)} $。从观测时刻$ {{t}}_{{s}} $到参考时刻$ {{t}}_{{k}} $的相对运动为
$$ {{{{{\boldsymbol{T}}}}_{{V(}{{{t}}_{{k}}}{) \leftarrow V(}{{{t}}_{{s}}}{)}}={{{\boldsymbol{T}}}}_{{V \leftarrow W}}{(}{{t}}_{{k}}{)\cdot}{{{\boldsymbol{T}}}}_{{W \leftarrow V}}{(}{{t}}_{{s}}{)}}} $$ 任一点在当时车辆坐标系为$ {{{\boldsymbol{X}}}}_{{V(}{{{t}}_{{s}}}{)}} $(来自相机逆投影或雷达转换),补偿到$ {{t}}_{{k}} $:
$$ {{{\boldsymbol{X}}}}_{{V(}{{{t}}_{{k}}}{)}}={{{\boldsymbol{T}}}}_{{V(}{{{t}}_{{k}}}{) \leftarrow V(}{{{t}}_{{s}}}{)}}\cdot {{{\boldsymbol{X}}}}_{{V(}{{{t}}_{{s}}}{)}}{} $$ 补偿后的点再映射到 Log-Polar 栅格,确保多源写入在同一参考时刻下的一致性。
对动态障碍物,通常由跟踪器输出状态$ {{\boldsymbol{x}}(t)} $(位置、速度、航向等)及协方差$ {{\boldsymbol{P}}(t)} $。为写入$ {{t}}_{{k}} $,以常用匀速模型预测:
$$ {{\boldsymbol{x}}(}{{t}}_{{k}}{)={\boldsymbol{F}}(\Delta t){\boldsymbol{x}}(}{{t}}_{{s}}{), \Delta t=}{{t}}_{{k}}{-t}_{{s}}^{\rm{eff}}{} $$ $$ {{\boldsymbol{P}}(}{{t}}_{{k}}{)={\boldsymbol{F \cdot P}}(}{{t}}_{{s}}{)}\cdot {{{\boldsymbol{F}}}}^{\rm{T}}{+{\boldsymbol{Q}}} $$ 随后将预测得到的2D footprint和3D box的地面投影栅格化,写入占据层、语义层以及速度场层。
2.3 驾驶认知CT图:可视化与调试的最小充分集
多源信息在同一栅格叠加会迅速提升可视化复杂度,影响调试与可解释性。为此,引入驾驶认知CT(cognitive tomography)图的工程化组织方式[14],如图4:将活地图按信息类别拆分为若干可叠加、可单独查看的二维切片,例如标线CT图、路缘/护栏CT图、占据CT图、速度场CT图、规则/路权CT图等;每一类切片对应一组状态变量与置信度,支持独立更新与独立评测。在系统开发与评测中,驾驶认知CT图作为可视化与调试的最小充分集,既能定位误差来源,包括先验投影偏差、观测写入错误、融合冲突、衰减遗忘不当等,也便于把指标,如跨帧一致性、置信校准、规划失败率等映射回具体地图层,形成可迭代的工程闭环。
2.3.1 占据可通行CT层:对数似然(Log-odds)递归更新
对每个栅格单元$ {c} $,维护占据概率$ p_t(c)= P(\mathrm{\mathit{o}_{cc}}|\cdot) $,采用 Log-odds 表示[15]:
$$ {{L}}_{{t}}{(c)=\log}\dfrac{{{p}}_{{t}}{(c)}}{{1-}{{p}}_{{t}}{(c)}} $$ 设融合前先验为$ {{L}}_{{{{t}}^{{-}}}}{(c)} $,传感器$ {s} $对该栅格提供增量对数似然$ {{l}}_{{s}}{(c)} $。在参考时刻$ {{t}}_{{k}} $的多源更新可写为
$$ {{L}}_{{t}}{(c)=}{{L}}_{{{{t}}^{-}}}{(c)+}\sum \limits_{{s \in }{{S}}_{{k}}}\,{{w}}_{{s}}{(\Delta t)}{{l}}_{{s}}{(c)} $$ 式中$ {{S}}_{{k}} $为本周期参与更新的来源集合。概率由 sigmoid 恢复:
$$ {{p}}_{{t}}({c})=\sigma ({{L}}_{{t}}({c}))=\dfrac{1}{1+{\exp}(-{{L}}_{{t}}({c}))} $$ 为防止数值饱和与异常观测放大,可作裁剪:
$$ {{L}}_{{t}}{(c) \leftarrow {\mathrm{clip}}(}{{L}}_{{t}}{(c),}{{L}}_{\min }{,}{{L}}_{\max }{)} $$ 逆传感器模型[16]示例:
雷达命中栅格 $ {{l}}_{{R}}{=+}{{\lambda }}_{{{\mathrm{hit}}}} $;射线穿越区间写入自由证据:$ {{l}}_{{R}}{=-}{{\lambda }}_{{{\mathrm{free}}}} $。
视觉可通行分割 在可通行区域给予负占据证据,在障碍不可通行区域给予正占据证据,幅值随分割置信度调节。
2.3.2 语义CT层(标线/施工/停止线等):类别分布的乘性更新
对每个栅格维护类别分布$ {{p}}_{{t}}{(c) \in }{\mathbb{R}}^{{K}} $,并满足$ \displaystyle\sum \limits_{{k}}\,{p}_{{t}}^{{k}}{=1} $。先验为$ {{p}}_{{{{t}}^{-}}}{(c)} $。来源$ {s} $提供类别似然$ {{l}}_{{s}}{(c)} $(由 softmax 输出和规则模型构造),则
$$ {\tilde{{p}}}_{{t}}({c})={{p}}_{{{{t}}^-}}({c})\odot \prod \limits_{{s}\in {\mathcal{S}}_{{k}}}\,{\left({{l}}_{{s}}({c})\right)}^{{{{w}}_{{s}}}(\Delta {t})} $$ $$ {{p}}_{{t}}({c})=\dfrac{{\tilde{{p}}}_{{t}}\left({c}\right)}{\displaystyle\sum _{{t}}\tilde{{p}}_{{t}}^{{k}}\left({c}\right)} $$ 该形式对应“先验$ { \times } $似然”的离散贝叶斯更新,并显式体现时间衰减权重。
2.3.3 速度场CT层:栅格内统计融合(均值−方差递推)
对速度场维护均值$ {{{\boldsymbol{\mu}} }}_{{v}}{(c)} $与协方差$ {\boldsymbol{\varSigma }}_{{v}}{(c)} $。每次写入速度观测$ {{\boldsymbol{v}}} $(来自跟踪器或雷达多普勒融合估计),以加权递推更新。先定义$ {\alpha =}{{\alpha }}_{{0}}{ \cdot }{{w}}_{{s}}{(\Delta t)} $,则
$$ {{{\boldsymbol{\mu}} }}_{{v}}{ \leftarrow (1-\alpha )}{{{\boldsymbol{\mu}} }}_{{v}}{+\alpha {\boldsymbol{v}}} $$ $$ {\boldsymbol{\varSigma }} _{{v}}{ \leftarrow (1-\alpha )}{\boldsymbol{\varSigma }} _{{v}}{+\alpha ({\boldsymbol{v}}-}{{{\boldsymbol{\mu}} }}_{{v}}{)({\boldsymbol{v}}-}{{{\boldsymbol{\mu}} }}_{{v}}{{)}}^{\rm{T}}{} $$ 当需要表达多峰速度分布时,可扩展为直方图或粒子集合,但核心仍是同索引空间的递归维护。
2.4 状态估计与记忆遗忘
由于观测的新鲜度影响可信度,引入时间衰减权重[17]:
$$ {{w}}_{{s}}{(\Delta t)=\exp(-}{{\beta }}_{{s}}{\Delta t), \;\;\; \Delta t=}{{t}}_{{k}}{-t}_{{s}}^{\rm{eff}} $$ 式中$ {{\beta }}_{{s}} $可按传感器类型、场景与链路稳定性配置,该权重在后续写入与融合中用于调节不同来源的贡献。
为防止陈旧信息长期占据决策,活地图对每个栅格维护最近更新时间$ {{t}}_{{{\mathrm{last}}}}{(c)} $。在每次融合前先作衰减,使状态向默认先验或长时记忆先验回归。
以 Log-odds 为例,定义
$$ {\gamma =\exp(-\lambda (}{{t}}_{{k}}-{{t}}_{{{\mathrm{last}}}}{(c)))} $$ 则融合前先验更新为
$$ {{L}}_{{{{t}}^{-}}}{(c)=\gamma }{{L}}_{{{{t}}_{{{\mathrm{last}}}}}}{(c)+(1-\gamma )}{{L}}_{{0}}{(c)} $$ 式中$ {{L}}_{{0}}{(c)} $为默认先验(未知占据$ p=0.5 \Rightarrow {{L}}_{{0}}{=0} $)或来自长时记忆的稳定先验。对语义层同理,可用
$$ {{p}}_{{{{t}}^-}}{(c)=\gamma }{{p}}_{{{{t}}_{{{\mathrm{last}}}}}}{(c)+(1-\gamma )}{{p}}_{0}{(c)} $$ 当$ |{{L}}_{{t}}{(c)-}{{L}}_{{0}}{(c)}| $足够小且持续时间超过阈值,或语义分布回归到未知或者低置信并长期不再影响规划,则触发遗忘:删除扩展字段,仅保留必要摘要或恢复默认状态,从而实现信息生命周期管理。
综上,变粒度对数极坐标栅格以车辆驾驶员为中心、近细远粗、可裁剪可时变为核心特性,把空间表征与驾驶任务的实时性需求绑定在同一形式化语言中。更重要的是,它为活地图生产流程提供了统一的状态空间:先验信息和实时观测可被一致投影到栅格形成工作记忆,多源信息可在栅格层面以概率与置信表达进行递归融合,最终通过分层记忆与遗忘机制沉淀可学习的稳定结构,形成统一形式化语言,并进一步完成活地图的生产与更新步骤,将随车而动落实为可实现、可验证、可退化的流程。
3. 随车而动的活地图的生产与更新
本章给出驾驶态势图中的活地图从先验初始化到在线更新、再到分层沉淀与遗忘的完整算法流程。全流程围绕第二章中变粒度对数极坐标栅格的统一形式化语言展开,按先验投影、实时写入、贝叶斯递归、分层记忆的顺序组织,使活地图成为可推理、可校准、可退化的空间置信状态[18](belief),而非要素列表的静态拼接。
3.1 流程总览与状态定义
设活地图在参考时刻$ {{t}}_{{k}} $的核心状态为栅格集合上的置信$ {{b}}_{{{{t}}_{{k}}}} $,其最小充分集可表示为
$$ {{b}}_{{{{t}}_{{k}}}}={\begin{matrix}\{{{L}}_{{{{t}}_{{k}}}}({c}),{{p}}_{{{{t}}_{{k}}}}({c}),{{\boldsymbol{\mu}} }_{{v},{{{t}}_{{k}}}}({c}),{{\boldsymbol{\varSigma}} }_{{v},{{{t}}_{{k}}}}({c}),{\tau }_{{{{t}}_{{k}}}}({c}),{{s}}_{{{{t}}_{{k}}}}({c})\} \end{matrix}},\;\;{{c \in G}} $$ 其中$ {G} $为 Log-Polar 栅格集合,$ {{L}}_{{{{t}}_{{k}}}}{(c)} $为占据/可通行层的 Log-odds,$ {{p}}_{{{{t}}_{{k}}}}({c}) $为语义层类别分布,$ {{\boldsymbol{\mu}} }_{{v},{{{t}}_{{k}}}}({c}), {{\boldsymbol{\varSigma}} }_{{v},{{{t}}_{{k}}}}({c}) $为速度场统计量,$ {\tau }_{{{{t}}_{{k}}}}({c}) $为最近更新时间戳,$ {{s}}_{{{{t}}_{{k}}}}({c}) $为记忆层级标识(瞬时/工作/长时)。
活地图的生产与更新由4个步骤组成。
先验投影与工作记忆构建 将高精度地图中的标线、静态障碍、拓扑与规则、先验轨迹等信息投影到车辆驾驶员中心栅格,形成先验与工作记忆基底。
实时观测投影与瞬时记忆写入 将多源感知(检测、跟踪、预测)、道路变化(施工封路等)、交通流与事件(信号灯、拥堵事故等)以统一投影规则写入瞬时记忆。
贝叶斯滤波递归融合 以先验为预测项,以观测为似然项,进行时间更新与观测更新,维护不确定性并抑制单帧噪声引发的结构跳变。
分层记忆与生命周期管理 按秒/分钟/小时/天的时间尺度,将信息在瞬时−工作−长时层级中迁移、衰减与遗忘,沉淀稳定拓扑与规则先验。
3.2 先验投影与工作记忆构建
先验信息来自高精度地图(HD Map)与历史沉淀的长时记忆先验,主要包括:车道线与路缘几何、车道拓扑连通、停止线与斑马线、限速与让行规则、静态障碍物、推荐轨迹与可行驶区域等。先验不以矢量文件形式直接供规划使用,而是被转换为栅格上的概率状态,以便与实时观测在同一状态空间内递归融合。
定义先验对每个栅格单元$ {c} $的占据先验为$ {{p}}_{{0}}{(c)} $,对应 Log-odds 为
$$ {{L}}_{0}({c})={\log} \dfrac{{{p}}_{0}({c})}{1-{{p}}_{0}({c})} $$ 语义先验为类别分布$ {{p}}_{{0}}{(c)} $,由 HD Map 的几何对象与规则对象投影后生成。
设 HD Map 中的几何点或折线在世界坐标系$ {W} $下为$ {{{\boldsymbol{p}}}}_{{W}},{车辆在}{{t}}_{{k}} $时刻的位姿为$ {{{\boldsymbol{T}}}}_{{V}\leftarrow {W}}({{t}}_{{k}}) $,则点变换到车辆系为
$$ {{{\boldsymbol{p}}}}_{{V}}={{{\boldsymbol{T}}}}_{{V}\leftarrow {W}}({{t}}_{{k}})\cdot {{{\boldsymbol{p}}}}_{{W}} $$ 对位于地面参考面的点,取$ {{{\boldsymbol{p}}}}_{{V}}{=[x,y,0}{{]}}^{\rm{T}} $并映射到栅格索引$ {(k,i)=I(}{{{\boldsymbol{p}}}}_{{V}}{)} $。对折线多边形对象,采用采样−投影−栅格化策略:
1) 对折线按弧长采样得到$ {{\boldsymbol{p}}}_{{W}}^{{j}} $,逐点变换并写入相应栅格;
2) 对面域对象(导流区、斑马线等)先变换得到车辆系多边形,再进行栅格填充写入规则路权层;
3) 对拓扑与规则(车道连通、让行关系、限速区间)在栅格层对应为约束场,例如在栅格上维护允许转向集合、路权优先级或限速上界等。
工作记忆用于支撑跨帧一致性与短时回放。定义工作记忆窗口长度为$ {{T}}_{{W}} $(秒级到十秒级),在每次更新时保留最近$ {{N}}_{{W}}=\left\lceil {{T}}_{{W}}{/ \Delta T}\right\rceil $张活地图切片:
$$ {\mathcal{M}}_{{W}}({{t}}_{{k}})=\{{{b}}_{{{{t}}_{{k}-{j}}}}\mid {j}=0{,}1,\cdots ,{{N}}_{{W}}-1\} $$ 先验投影得到的基底状态$ {b}_{{{t}}_{{k}}}^{{{\mathrm{prior}}}} $与工作记忆共同构成可对齐的参考系,使后续实时观测在同一栅格索引空间内被写入、被比较、被融合。
3.3 实时观测投影与瞬时记忆写入
将来自不同感知模块的输出统一封装为观测包$ {{Z}}_{{{{t}}_{{k}}}} $,每条观测记录最小字段为:时间戳$ {{t}}_{{s}} $、有效时间戳$ {t}_{{s}}^{\rm{eff}} $、来源$ {s} $、观测类型、几何描述(点/线/面/目标 footprint)、置信度与不确定性参数。形式化表示为
$$ {\mathcal{Z}}_{{{{t}}_{{k}}}}=\{{{ \textit{z} }}_{{s},{n}}\mid {t}_{{s}}^{\rm{eff}}\in [{{t}}_{{k}}-\Delta {W},{{t}}_{{k}}]\} $$ 其中$ {\Delta W} $为采样窗口长度,用于覆盖不同频率与时延。
对任一观测$ {{ \textit{z} }}_{{s,n}} $,其原始生成时刻为$ {{t}}_{{s}} $,有效时间戳为$ {t}_{{s}}^{\rm{eff}}{=}{{t}}_{{s}}{-}{{L}}_{{s}} $。为将观测统一到参考时刻$ {{t}}_{{k}} $,使用车辆自运动补偿矩阵
$$ {{{\boldsymbol{T}}}}_{{V}\left({{{t}}_{{k}}}\right)\leftarrow {V}{({t}_{{s}}^{\rm{eff}})}}={{{\boldsymbol{T}}}}_{{V}\leftarrow {W}}({{t}}_{{k}})\cdot {{{\boldsymbol{T}}}}_{{W}\leftarrow {V}}({t}_{{s}}^{\rm{eff}}) $$ 若观测几何在其生成时刻车辆系坐标为$ {{{\boldsymbol{X}}}}_{{V(}{{t}_{{s}}^{\rm{eff}}}{)}} $,则补偿到$ {{t}}_{{k}} $为
$$ {{{\boldsymbol{X}}}}_{{V}({{{t}}_{{k}}})}={{{\boldsymbol{T}}}}_{{V}\left({{{t}}_{{k}}}\right)\leftarrow {V}({{t}_{{s}}^{\rm{eff}}})}\cdot {{{\boldsymbol{X}}}}_{{V}({{t}_{{s}}^{\rm{eff}}})} $$ 引入新鲜度权重以反映观测时延对可信度的影响:
$$ {{w}}_{{s}}(\Delta {t})={\exp} (-{\beta }_{{s}}\Delta {t}),~\Delta {t}={{t}}_{{k}}-{t}_{{s}}^{\rm{eff}} $$ 1)动态障碍物写入规则(检测/跟踪/预测)
对每个目标轨迹状态$ {x(t}_{{s}}^{\rm{eff}}{)} $,先预测到$ {{t}}_{{k}} $:
$$ {{\boldsymbol{x}}(}{{t}}_{{k}}{)={\boldsymbol{F}}(\Delta t){\boldsymbol{x}}(t}_{{s}}^{\rm{eff}}{)} $$ 并可更新协方差
$$ {{\boldsymbol{P}}(}{{t}}_{{k}}{)={\boldsymbol{F}}\cdot {\boldsymbol{P}}(t}_{{s}}^{\rm{eff}}{)}\cdot {{{\boldsymbol{F}}}}^{\rm{T}}{+{\boldsymbol{Q}}} $$ 由预测状态生成目标地面 footprint,栅格化写入占据层与语义层;目标速度向量写入速度场层的统计量更新。
2)道路变化要素写入规则(施工、封路改道、临时标线)
对施工区域、锥桶、临时路障等,优先使用面域或者线域几何写入,避免仅用点写入导致稀疏与孔洞。写入时把变化要素视为对先验的修正证据,并设置更短的生命周期时间常数,以便在变化消失后快速衰减与遗忘。
3)交通流与事件写入规则(信号灯、拥堵、事故)
信号灯状态可写入规则路权层的离散状态变量,例如红灯时在停止线前栅格施加不可通行约束。拥堵与事故可写入可通行性层的概率修正或风险层的额外代价场,使规划直接读取可执行走廊与风险约束。
3.4 贝叶斯滤波递归融合与跨帧一致性维护
活地图的核心价值不在于单帧看见了什么,而在于跨时间相信什么,相信到什么程度,何时改变相信。因此使用贝叶斯滤波维护栅格状态的递归后验,并在融合中显式抑制跨帧跳变[19]。
对抽象状态变量$ {{x}}_{{t}} $与观测$ {{ \textit{z} }}_{{t}} $,贝叶斯滤波的时间更新为
$$ {p(}{{x}}_{{t}}{|}{{ \textit{z} }}_{{1:t-1}}{)=}\int {p(}{{x}}_{{t}}{|}{{x}}_{{t-1}}{,}{{u}}_{{t}}{)p(}{{x}}_{{t-1}}{|}{{ \textit{z} }}_{{1:t-1}}{){\mathrm{d}}}{{x}}_{{t-1}} $$ 观测更新为
$$ {p(}{{x}}_{{t}}{|}{{ \textit{z} }}_{{1:t}}{){∝}p(}{{ \textit{z} }}_{{t}}{|}{{x}}_{{t}}{)p(}{{x}}_{{t}}{|}{{ \textit{z} }}_{{1:t-1}}{)} $$ 在栅格化实现中,采用每栅格独立近似,把$ {{x}}_{{t}} $视为每个栅格单元$ {c} $的状态$ {{x}}_{{t}}{(c)} $,并在$ {c} $上执行递归更新。
在多源观测条件下,对同一时刻的多传感器观测集合$ {{ \textit{z} }}_{{s,t}} $,在条件独立近似下可写为
$$ {p(}{{ \textit{z} }}_{{t}}{|}{{x}}_{{t}}{)=}\prod \limits_{{s \in S*t}}\,{p(}{\mathrm{ \textit{z} }}_{\mathrm{s},\mathrm{t}}{|}{{x}}_{{t}}{{)}}^{{{{w}}_{{s}}}{(\Delta t)}} $$ 其中$ {{w}}_{{s}}{(\Delta t)} $为新鲜度权重。进一步地,将 HD Map 先验也作为一种观测参与融合,使其既能提供结构稳定性,又能在观测冲突时被修正。即在实现上把先验项视为额外来源$ {s={\mathrm{prior}}} $,其似然项与权重可按场景自适应配置[20]。
对占据层采用Log-odds表示$ L_t(c)=\log \dfrac{p(c)} {1-p_t(c)} $。融合前先验为$ {{L}}_{{{{t}}^{{-}}}}{(c)} $,来自来源$ {s} $的增量对数似然为$ {{l}}_{{s}}{(c)} $,则在$ {{t}}_{{k}} $的更新为
$$ {{L}}_{{{{t}}_{{k}}}}{(c)=}{{L}}_{{{t}_{{k}}^{-}}}{(c)+}\sum \limits_{{s \in }{{S}}_{{k}}}\,{{w}}_{{s}}{(\Delta t)}{{l}}_{{s}}{(c)} $$ 概率可由 sigmoid 恢复:
$$ {{p}}_{{{{t}}_{{k}}}}({c})=\dfrac{1}{1+{\exp} (-{{L}}_{{{{t}}_{{k}}}}({c}))} $$ 为防止单源异常与跨源冲突放大,对$ {{L}}_{{{{t}}_{{k}}}}{(c)} $作裁剪:
$$ {{L}}_{{{{t}}_{{k}}}}{(c) \leftarrow {\mathrm{clip}}(}{{L}}_{{{{t}}_{{k}}}}{(c),}{{L}}_{\min }{,}{{L}}_{\max }{)} $$ 冲突消解可采用置信门控和一致性优先策略:当两来源对同一栅格给出相反证据且差异超过阈值时,优先使用更高置信且更新鲜的来源,同时把冲突事件写入诊断字段以供后续评测与回放定位。
对语义层,每个栅格维护类别分布$ {{p}}_{{t}}({c})\in {\mathbb{R}}^{{K}} $。设融合前先验为$ {{p}}_{{{{t}}^{-}}}({c}) $,来源$ {s} $给出类别似然$ {{l}}_{{s}}({c}) $,则更新为
$$ {\tilde{{p}}}_{{{{t}}_{{k}}}}({c})={{p}}_{{{t}_{{k}}^-}}({c})\odot \prod \limits_{{s}\in {\mathcal{S}}_{{k}}}\,{\left({{l}}_{{s}}({c})\right)}^{{{{w}}_{{s}}}(\Delta {t})} $$ 对速度场维护均值$ {{\boldsymbol{\mu}} }_{{v},{t}}({c}) $与协方差$ {{\boldsymbol{\varSigma}} }_{{v},{t}}({c}) $。每次写入速度观测$ {{\boldsymbol{v}}} $时,令$ \alpha ={\alpha }_{0}\cdot {{w}}_{{s}}(\Delta {t}) $,递推为
$$ {{\boldsymbol{\mu}} }_{{v},{{{t}}_{{k}}}}({c})\leftarrow (1-\alpha ){{\boldsymbol{\mu}} }_{{v},{{t}_{{k}}^-}}({c})+\alpha {{\boldsymbol{v}}} $$ $$ {{\boldsymbol{\varSigma}} }_{{v},{{{t}}_{{k}}}}({c})\leftarrow (1-\alpha ){{\boldsymbol{\varSigma}} }_{{v},{{t}_{{k}}^-}}({c})+\alpha ({{\boldsymbol{v}}}-{{\boldsymbol{\mu}} }_{{v},{{{t}}_{{k}}}}({c}))({{\boldsymbol{v}}}-{{\boldsymbol{\mu}} }_{{v},{{{t}}_{{k}}}}({c}){)}^{{{\mathrm{T}} }} $$ 当速度场呈多峰,例如交汇口多方向流时,可将单峰统计扩展为多模态表示,但仍遵循栅格内递归维护以及权重衰减的统一原则。
仅靠上述逐栅格更新仍可能在遮挡与稀疏观测下出现拓扑跳变。为此在融合中加入跨帧一致性约束,核心思想是,若当前观测不足以推翻既有置信,则后验应更多继承历史状态,通过两类机制实现:1) 时间更新的显式继承。将上帧后验作为本帧融合前先验的主要来源,即$ {{L}}_{{{t}_{{k}}^{{-}}}}{(c)} $与$ {{p}}_{{{t}_{{k}}^{{-}}}}{(c)} $由上一时刻衰减后得到。2) 结构化一致性门控。当观测导致的更新会引起车道连通断裂、规则突变等结构不连续时,触发门控:降低该观测的有效权重或延迟生效,直到在工作记忆窗口内被重复验证。
3.5 瞬时−工作−长时分区记忆与生命周期管理
活地图要长期稳定运行,必须把记忆与遗忘机制内置到地图状态的维护中。本节给出分层记忆结构与生命周期算子,使系统既能跨遮挡维持连续性,又能抑制陈旧信息与噪声累积。
定义3层记忆及其典型时间尺度:
瞬时记忆 $ {{M}}_{{S}} $(秒级) 当前栅格状态与不确定性,直接供规划控制闭环使用。
工作记忆 $ {{M}}_{{M}} $(分钟级) 用于跨遮挡与局部回环一致性,维持拓扑稳定与规则连续。
长时记忆 $ {{M}}_{{L}} $(小时/天级) 沉淀稳定拓扑结构、常驻规则与可学习先验,遗忘大部分无价值细节。
在实现上,瞬时记忆对应当前后验$ {{b}}_{{{{t}}_{{k}}}} $与记忆窗口$ {{M}}_{{W}}{(}{{t}}_{{k}}{)} $;工作记忆维护结构摘要,例如稳定车道拓扑骨架与规则图;长时记忆维护可迁移的先验场$ {{L}}_{{L}}{(c)} $与$ {{p}}_{{L}}{(c)} $。
对每个栅格维护最近更新时间$ {{t}}_{{{\mathrm{last}}}}{(c)} $。在每次融合前执行衰减,使状态向默认先验或长时先验回归。
对占据层,定义衰减因子
$$ \gamma (c)=\exp(-\lambda( t_{{k}}-{{t}}_{{{\mathrm{last}}}}(c))) $$ 融合前先验为
$$ {{L}}_{{{t}_{{k}}^{-}}}{(c)=\gamma (c)}~{{L}}_{{{{t}}_{{{\mathrm{last}}}}}}{(c)+(1-\gamma (c))}~{{L}}_{{0}}{(c)} $$ 其中$ {{L}}_{{0}}{(c)} $可取默认未知先验($ {p=0.5} $时$ {{L}}_{{0}}{=0} $)或长时记忆先验$ {{L}}_{{L}}{(c)} $。对语义层同理:
$$ {{p}}_{{{t}_{{k}}^-}}({c})=\gamma ({c}){{p}}_{{{{t}}_{{{\mathrm{last}}}}}}({c})+(1-\gamma ({c})){{p}}_{0}({c}) $$ 该机制使信息越久未被观测确认,其影响越应衰减,从而将遗忘机制前置到每次融合的起点。
并非所有信息都值得沉淀。定义稳定性−价值评分$ {U(o)} $用于决定对象$ {o} $是否从短时记忆晋升至工作或长时:
$$ U(o)=\alpha\cdot {\mathrm{Impact}}(o)+\beta \cdot{\mathrm{Persistence}}(o)- $$ $$ {\gamma \cdot{\mathrm{Uncertainty}}(o)-\delta\cdot {\mathrm{Conflict}}(o)} $$ 式中:$ {{\mathrm{Impact}}(o)} $衡量对规划路权与可通行走廊的影响,$ {{\mathrm{Persistence}}(o)} $衡量在窗口内被重复观测验证的持续性,$ {{\mathrm{Uncertainty}}(o)} $可由方差或熵度量,$ {{\mathrm{Conflict}}(o)} $衡量与其他来源/先验冲突频率。
当$ {U(o) \geqslant}{{U}}_{{M}} $且在窗口内满足重复验证次数$ {N(o) \geqslant}{{N}}_{{M}} $时,将对象摘要写入工作记忆;当$ {U(o) \geqslant}{{U}}_{{L}} $ 且跨多次回放/多天运行保持稳定时,才写入长时记忆,形成可学习先验。
长时先验的更新可采用慢更新和强遗忘组合的策略,避免短期异常污染长期结构。以占据层先验为例,可用指数滑动更新:
$$ {L}_{{L}}^{{{\mathrm{new}}}}{(c)=(1-\eta )~L}_{{L}}^{{{\mathrm{old}}}}{(c)+\eta ~}\overline{{L}}{(c)} $$ 式中:$ \overline{{L}}{(c)} $为在工作窗口内统计得到的稳定Log-odds 估计,$ {\eta } $取很小值以体现长时慢学习。
遗忘不仅是衰减到无影响,更是结构体与存储的释放。触发遗忘的典型条件包括:
置信度回归,$ |{{L}}_{{{{t}}_{{k}}}}{(c)-}{{L}}_{{0}}{(c)}|{ \leqslant }{{\epsilon }}_{{L}} $且持续时间超过阈值$ {{T}}_{{F}} $;
语义不确定,$ \underset{{j}}{\max }\,{p}_{{{t}}_{{k}}}^{{j}}{(c) \leqslant }{{\epsilon }}_{{P}} $且长期不影响规划约束;
价值不足,对象评分$ {U(o)<}{{U}}_{{F}} $且在工作记忆窗口内不再被观测确认;
冲突频繁,长期与高置信先验冲突且无法被重复验证,判为噪声源并清除。
遗忘执行时删除扩展字段,仅保留必要摘要,例如此处曾出现施工但已消失的事件计数,以便后续统计与系统诊断,但不再进入规划输入。
3.6 随车而动的地图生产更新总结
综上,本章给出了活地图生产与更新的可落地流程。先验投影把 HD Map 与历史先验转换为车辆驾驶员中心栅格上的工作记忆基底;实时观测以统一投影、时间对齐与自运动补偿写入瞬时记忆;贝叶斯滤波以先验似然的递归机制维护不确定性与跨帧一致性;分层记忆与生命周期管理把信息在瞬时−工作−长时尺度中迁移、衰减与遗忘,形成可学习的稳定先验与可持续运行的认知空间记忆体,从而实现为了驾驶而制图的认知−行动耦合闭环。
4. “三个三分之一”工程范式与实验评测
为验证活地图的可替代性与可退化性,我们采用了“三个三分之一”的对照实验划分:纯视觉、纯雷达、纯定位,结合先验高精地图3条路径分别独立跑通闭环,再在此基础上逐步融合。如果路上没有任何其他移动障碍物,活地图就可以让车自主驾驶到目的地,不同路段不同速度。通过这一范式,系统能够明确每类信息源对活地图状态估计的边际贡献,量化不同硬构体(传感器类型)对软构体(空间认知)的支撑作用,为故障退化、降级策略提供可量化依据,让系统在工程上具备可解释的冗余。
4.1 实验方法
针对上文提出的活地图的表征方法,以及选择性注意的交互算法,在北京市园博园进行了以路权驾驶态势图为主的无人驾驶认知的算法测试。图5给出了整个园博园区域的地图,选取全程中的一个路口进行活地图的表征,如图6所示,本章选取园博园西二路路口进行对数极坐标表征。
图6中各种颜色含义如下。
金黄色:车道一次规划精细轨迹线;
红色:车道边界线(包含路牙和栅栏);
蓝色:车辆行驶轨迹虚拟边界线;
白色:车道线;
红色圈:红绿灯灯头位置。
在“三个三分之一”对照实验中,评价场景为结构化、半结构化、高风险长尾混合,每个场景闭环重复n≥5次,报告全场景汇总的中位数与关键分位。
为突出本文对数极坐标变粒度与分层记忆的贡献,设定3类基线。B1:静态地图与即时感知串接,不维护跨时置信,仅对当前帧做融合与规则解析。B2:笛卡尔等粒度占据栅格图,维护占据概率,但无变粒度与主动关注焦点更新;拓扑规则以附加模块实现。B3:向量化局部地图,拓扑表达强,但对动态占据与概率融合需额外假设或近似。实现公平性:所有方法共享同一感知输入,包括检测、跟踪、车道线、信号灯等与同一规划控制器,仅替换地图表示与更新机制;并在同一硬件与同一回放日志上评测。
4.2 评测指标定义
为系统评价活地图在跨时间稳定性、概率可信性、闭环任务完成能力、安全裕度与实时性方面的综合表现,本文采用跳变帧比例(jump rate, JumpRate)、图编辑距离(graph edit distance, GED)、期望校准误差(expected calibration error, ECE)、任务成功率(success rate, SR)、最小碰撞时间(minimum time to collision, minTTC)和端到端时延(end-to-end delay, Delay)作为主要评价指标。
JumpRate用于衡量相邻时刻活地图结构发生显著跳变的频率,记第$ {t} $帧活地图为$ {{G}}_{{t}} $,当相邻两帧差异度$ {D(}{{G}}_{{t}}{,}{{G}}_{{t-1}}{)} $超过阈值$ {\delta } $时记为一次跳变,则有
$$ J_{\mathrm{umpRate}}=\dfrac{{1}}{{T-1}}\sum \limits_{{t=2}}^{{T}}\,{{\bf{1}}}\left({D(}{{G}}_{{t}}{,}{{G}}_{{t-1}}{)>\delta }\right){ \times 100} $$ 式中:$ {{\bf{1}}( \cdot )} $为示性函数,$ {T} $为总帧数。
GED用于度量系统输出图$ {\hat{{G}}}_{{t}} $与参考图$ {{G}}_{{t}} $之间的结构差异,定义为将$ {\hat{{G}}}_{{t}} $变换为$ {{G}}_{{t}} $所需最小编辑代价,即
$$ G_{\mathrm{ED}}({{G}}_{{t}}{,}{\hat{{G}}}_{{t}}{)=}\underset{{\gamma \in \varGamma (}{{G}}_{{t}}{,}\hat{{G}}{{*}}{{)}}}{\min }\,\sum \limits_{{o \in \gamma }}\,{c(o)} $$ 式中:$ {\varGamma (}{{G}}_{{t}}{,}{\hat{{G}}}_{{t}}{)} $为所有可行编辑操作序列集合,$ {c(o)} $为操作$ {o} $的代价。
ECE用于衡量概率输出的校准性,将样本按置信度划分为$ {M} $个分箱后可写为
$$ E_{\mathrm{CE}}=\sum \limits_{{m=1}}^{{M}}\,\dfrac{|{{B}}_{{m}}|}{{n}}\left| {{\mathrm{acc}}(}{{B}}_{{m}}{)-{\mathrm{conf}}(}{{B}}_{{m}}{)}\right| $$ 式中:$ {{B}}_{{m}} $为第$ {m} $个分箱,$ |{{B}}_{{m}}| $为该箱样本数,$ {n} $为总样本数,$ {{\mathrm{acc}}(}{{B}}_{{m}}{)} $与$ {{\mathrm{conf}}(}{{B}}_{{m}}{)} $分别表示该分箱中的实际准确率与平均预测置信度。
SR用于衡量闭环驾驶任务完成能力,定义为成功完成任务次数占总测试次数的比例,即
$$ S_{\mathrm{R}}=\dfrac{{{N}}_{{{\mathrm{success}}}}}{{{N}}_{{{\mathrm{total}}}}}{ \times 100} $$ 式中:$ {{N}}_{{{\mathrm{success}}}} $为满足无碰撞、无违规或无人工接管条件下成功到达目标的任务次数,$ {{N}}_{{{\mathrm{total}}}} $为总测试次数。
minTTC用于表征测试过程中最小安全裕度,定义为全时域碰撞时间的最小值,即
$$ m_{\mathrm{inTTC}}=\underset{{t \in [0,T]}}{\min }\,{{\mathrm{TTC}}(t)} $$ 其中,在相对距离为$ {d(t)} $、闭合速度为$ {{v}}_{{{\mathrm{rel}}}}{(t)} $时,碰撞时间可写为
$$ {{\mathrm{TTC}}(t)=}\begin{cases} \dfrac{{d(t)}}{{{v}}_{{{\mathrm{rel}}}}{(t)}}{,} ~~ {{v}}_{{{\mathrm{rel}}}}{(t)>0}\\ {+\infty ,} ~~ {{v}}_{{{\mathrm{rel}}}}{(t) \leqslant 0}\\ \end{cases} $$ Delay用于衡量系统端到端实时性,表示从输入感知到输出规划控制结果的总耗时,其平均值可定义为
$$ D_{\mathrm{elay}}=\dfrac{{1}}{{N}}\sum \limits_{{i=1}}^{{N}}\,\left({t}_{{{\mathrm{out}}}}^{{(i)}}{-t}_{{{\mathrm{in}}}}^{{(i)}}\right) $$ 式中:$ {t}_{{{\mathrm{in}}}}^{{(i)}} $为第$ {i} $次输入到达时刻,$ {t}_{{{\mathrm{out}}}}^{{(i)}} $为对应输出产生时刻,$ {N} $为统计样本数。上述指标分别从结构一致性、概率可信性、闭环有效性、安全性与实时性5个维度对活地图方法进行综合评估。
4.3 实验结果
实验结果显示,一致性(JumpRate、GED)显著改善,主要来自分层记忆与生命周期管理,可以减少跨帧跳变,减少拓扑重连抖动,验证了认知物理学“记忆智能支撑认知稳定性”的正确性;校准(ECE)改善来自显式概率更新与置信度维护,印证了认知可概率化的可行性;闭环收益(SR、minTTC)改善来自更稳定的可行驶走廊与规则约束输入规划,减少误触发急刹与失败重规划;实时性(delay)改善来自对数极坐标近细远粗与主动ROI(region of interest)带来的降低搜索节点与更新负载,体现了认知物理学“表征与任务匹配提升认知效率”的核心思想。
针对消融实验设计,命名完整方法为 Ours,每次仅去掉一项。A1:LogPolar,去对数极坐标,改为等粒度,验证实时性与近场精度、搜索节点数的权衡。A2:Memory,去分层记忆,仅当前帧,验证遮挡和掉帧时 SR、JumpRate、TTC 的变化。A3:Lifecycle,去衰减和遗忘,验证长时间运行误信息累积导致的拓扑不稳定与规则漂移。A4:Prior-as-Sensor,不把先验当观测,验证结构化道路场景拓扑稳定性与规则层一致性。A5:Active ROI,固定 ROI 与分辨率,验证高负载场景表征延时、规划失败率与急刹次数变化。
表1对比了3类基线(B1/B2/B3)与本文方法(Ours)在一致性、校准、闭环收益与实时性4个维度的综合表现。整体结果表明,Ours在所有关键指标上均取得最优或并列最优,并且优势集中在跨时间稳定性、可信确定性与端到端实时性3个与活地图定位高度一致的方面。一致性增益主要来自两点,其一是活地图以概率状态维护置信,避免单帧观测噪声直接驱动地图结构突变;其二是分层记忆与生命周期管理对短时遮挡与间歇观测提供了持续性支撑,从而显著降低跳变和拓扑重构频率。表2用于定位各模块对最终性能的贡献,可以看到对数极坐标和主动关注区域主要影响实时性尾延迟,分层记忆和生命周期主要影响一致性与闭环鲁棒性,先验作为观测主要提升结构化道路拓扑与规则稳定性。
表 1 主实验对照结果Table 1 Control results of main experiments方法 JumpRate↓/% GED↓/(次/min) ECE↓/% SR↑/% minTTC↑/s Delay(e2e)↓/ms B1 12.0 8.0 9.0 90.0 1.30 120 B2 8.0 6.5 7.0 92.0 1.40 170 B3 6.0 5.0 8.0 93.0 1.45 140 Ours 3.0 2.5 3.5 96.5 1.65 90 注:JumpRate为跳变帧比例,GED为图编辑距离[21],ECE为期望校准误差,SR为任务成功率,minTTC为最小 TTC,Delay为端到端延时,加粗表示最优结果。 表 2 消融实验Table 2 Ablation experiment变体 JumpRate↓/% GED↓/(次/min) ECE↓/% SR↑/% minTTC↑/s Delay(e2e)↓/ms Ours(完整) 3.0 2.5 3.5 96.5 1.65 90 A1 4.5 3.2 3.8 95.5 1.60 160 A2 9.0 6.0 4.2 92.0 1.45 95 A3 6.5 5.5 4.0 93.5 1.50 92 A4 3.8 3.8 3.6 95.8 1.60 90 A5 3.2 2.7 3.5 96.2 1.63 125 注:加粗表示最优结果。 实验可以看出,活地图的核心优势不在于单帧精度,而在于跨时间稳定性与可信确定性。Ours将JumpRate降至3.0%、GED降至2.5 次/min,同时将ECE降至3.5%,证明以概率状态与记忆遗忘维护的活地图能够提供更稳定、更可信的规划输入,从而提升闭环成功率与安全裕度(SR为96.5%,minTTC为1.65 s)。变粒度对数极坐标是压制无人驾驶端到端延迟的决定性组合,相较基线,Ours的Delay(e2e)为90 ms最优;消融 A1/A5 显示去除变粒度或主动ROI会显著恶化尾延迟(160 ms/125 ms),表明该组合是实现工程可部署性的关键。
5. 结束语
本文围绕空间智能提出驾驶态势图中的活地图框架,将地图从静态制图产物重构为闭环驾驶中的空间置信状态(软构体),并给出一条可工程落地的实现路径。核心结论可归纳为5点:第一,问题重定义,活地图的本质是在线状态估计与持续修正,而非离线静态地图,体现“认知即状态演化”的思想;第二,统一形式化语言,对数极坐标变粒度栅格在近场精细−远场粗略的任务需求下实现表征与计算一致,可同时承载几何、语义、规则与不确定性,体现了“认知表征与物理约束、任务需求相匹配”的设计;第三,概率更新与不确定性管理,以贝叶斯滤波为核心,使系统具备可信的置信表达,支持风险约束与降级策略,践行了认知物理学“认知可量化、可概率化”的方法;第四,分层记忆与生命周期管理,瞬时记忆−工作−长时的分层组织与出生、维持、衰减、遗忘机制,解决遮挡、稀疏观测与长期运行的误信息累积问题,记忆智能是认知稳定性的核心;第五,行动耦合与主动制图,规划控制反向驱动ROI与感知优先级,使活地图服务于驾驶任务本身,形成为了驾驶而制图的认知闭环,体现了认知−行动耦合协同演化的范式。
本文将地图从静态制图产物重构为可推理的空间置信状态;以变粒度对数极坐标栅格作为统一形式化语言,承载几何、拓扑、语义、规则与不确定性;以贝叶斯滤波实现多源融合与递归更新;以分层记忆与遗忘机制保障长期运行稳定;并通过规划控制反向驱动注意力与主动感知,形成为了驾驶而制图的空间认知闭环。在工程落地上,本文建议采用“三个三分之一”的对照实验范式,使活地图具备可验证的冗余、可解释的退化与可量化的闭环收益。
千人一面、千篇一律的地图的时代结束了。当车载传感器把乘客对目的地的位置、时间、环境、路径、偏好、任务这些需求,变换成活地图的时候,空间智能就可以完成对一辆无人驾驶车辆有执行力的实时导航。
-
表 1 主实验对照结果
Table 1 Control results of main experiments
方法 JumpRate↓/% GED↓/(次/min) ECE↓/% SR↑/% minTTC↑/s Delay(e2e)↓/ms B1 12.0 8.0 9.0 90.0 1.30 120 B2 8.0 6.5 7.0 92.0 1.40 170 B3 6.0 5.0 8.0 93.0 1.45 140 Ours 3.0 2.5 3.5 96.5 1.65 90 注:JumpRate为跳变帧比例,GED为图编辑距离[21],ECE为期望校准误差,SR为任务成功率,minTTC为最小 TTC,Delay为端到端延时,加粗表示最优结果。 表 2 消融实验
Table 2 Ablation experiment
变体 JumpRate↓/% GED↓/(次/min) ECE↓/% SR↑/% minTTC↑/s Delay(e2e)↓/ms Ours(完整) 3.0 2.5 3.5 96.5 1.65 90 A1 4.5 3.2 3.8 95.5 1.60 160 A2 9.0 6.0 4.2 92.0 1.45 95 A3 6.5 5.5 4.0 93.5 1.50 92 A4 3.8 3.8 3.6 95.8 1.60 90 A5 3.2 2.7 3.5 96.2 1.63 125 注:加粗表示最优结果。 -
[1] ASRAT K T, CHO H J. A comprehensive survey on high-definition map generation and maintenance[J]. ISPRS international journal of geo-information, 2024, 13(7): 232. doi: 10.3390/ijgi13070232 [2] 李德毅, 张天雷, 韩威, 等. 认知机器的结构和激活[J]. 智能系统学报, 2024, 19(6): 1604−1613. doi: 10.11992/tis.202409024 LI Deyi, ZHANG Tianlei, HAN Wei, et al. Structure and activation of cognitive machines[J]. CAAI transactions on intelligent systems, 2024, 19(6): 1604−1613. doi: 10.11992/tis.202409024 [3] LI Qi, WANG Yue, WANG Yilun, et al. HDMapNet: an online HD map construction and evaluation framework[EB/OL]. (2021−07−13)[2026−01−18]. https://arxiv.org/abs/2107.06307. [4] 李德毅. 认知物理学导引[J]. 智能系统学报, 2024, 19(3): 493. LI Deyi. Introduction to cognitive physics[J]. CAAI transactions on intelligent systems, 2024, 19(3): 493. [5] 李德毅, 殷嘉伦, 张天雷, 等. 机器认知四要素说[J]. 中国基础科学, 2023, 25(3): 1−10,22. doi: 10.11992/tis.202506028 LI Deyi, YIN Jialun, ZHANG Tianlei, et al. Four most basic elements in machine cognition[J]. China basic science, 2023, 25(3): 1−10,22. doi: 10.11992/tis.202506028 [6] LI Deyi, LIU Changyu, GAN Wenyan. A new cognitive model: Cloud model[J]. International journal of intelligent systems, 2009, 24(3): 357−375. doi: 10.1002/int.20340 [7] ATKINSON R C, SHIFFRIN R M. Human memory: a proposed system and its control processes[M]//SPENCE K W, SPENCE J T, eds. Psychology of Learning and Motivation. New York: Academic Press, 1968: 89−195. [8] BADDELEY A D, HITCH G. Working memory[M]//BOWER G H, ed. Psychology of Learning and Motivation. New York: Academic Press, 1974: 47−89. [9] SANDØY S S, HEGDE J, SCHJØLBERG I, et al. Polar map: a digital representation of closed structures for underwater robotic inspection[J]. Aquacultural engineering, 2020, 89: 102039. doi: 10.1016/j.aquaeng.2019.102039 [10] GENG Junyi, LANGELAAN J W. A quasi polar local occupancy grid approach for vision-based obstacle avoidance[C]//AIAA Guidance, Navigation, and Control Conference. Grapevine: AIAA, 2017: 1-25. [11] QIU Wenzhao, Pang Shanmin, Zhang Hao, et al. HeightMapNet: explicit height modeling for end-to-end HD map learning[EB/OL]. (2021−07−13)[2026−01−18]. https://arxiv.org/abs/2107.06307. [12] FOX D, BURGARD W, THRUN S. Markov localization for mobile robots in dynamic environments[J]. Journal of artificial intelligence research, 1999, 11: 391−427. doi: 10.1613/jair.616 [13] KALMAN R E. A new approach to linear filtering and prediction problems[J]. Journal of basic engineering, 1960, 82(1): 35−45. doi: 10.1109/9780470544334.ch9 [14] ASGHARIVASKASI A, ATANASOV N. Active Bayesian multi-class mapping from range and semantic segmentation observations[C]//2021 IEEE International Conference on Robotics and Automation. Xi’an: IEEE, 2021: 1−7. [15] MORAVEC H, ELFES A. High resolution maps from wide angle sonar[C]//Proceedings of 1985 IEEE International Conference on Robotics and Automation. St. Louis: IEEE, 2003: 116−121. [16] ELFES A. Using occupancy grids for mobile robot perception and navigation[J]. Computer, 1989, 22(6): 46−57. doi: 10.1109/2.30720 [17] NARAYANA M, KOLLING A, NARDELLI L, et al. Lifelong update of semantic maps in dynamic environments[EB/OL]. (2020−10−17)[2026−01−18]. https://arxiv.org/abs/2010.08846. [18] THRUN S, BURGARD W, FOX D. Probabilistic robotics[M]. Cambridge, Mass.: MIT Press, 2006. [19] DOUCET A, FREITAS N, GORDON N. Sequential Monte Carlo methods in practice[M]. New York: Springer, 2001. [20] 李德毅, 刘常昱. 论正态云模型的普适性[J]. 中国工程科学, 2004, 6(8): 28−34. doi: 10.3969/j.issn.1009-1742.2004.08.006 LI Deyi, LIU Changyu. Study on the universality of the normal cloud model[J]. Strategic study of CAE, 2004, 6(8): 28−34. doi: 10.3969/j.issn.1009-1742.2004.08.006 [21] SANFELIU A, FU K S. A distance measure between attributed relational graphs for pattern recognition[J]. IEEE transactions on systems, man, and cybernetics, 1983, 13(3): 353−362. doi: 10.1109/tsmc.1983.6313167
下载: