速度功能双双暴跌!间接BEV特色减速在线建图和行为预测
了解路线几何结构是智能驾驶车辆(AV)技术堆栈中的关键组成部分。虽然高精(HD)地图可以轻松提供此类消息,但它们存在高标注和保养老本。因此,许多最新的钻研提出了从传感器数据中在线预计高精地图的方法。绝大少数的最新方法将多相机观测结果编码成两边示意,例如 BEV 网格,并经过解码器生成矢量地图元素。虽然这种架构功能优越,但它会消耗掉两边示意中编码的少量消息,阻碍下游义务(例如行为预测)应用这些消息。在这项上班中,本文提出了露出在线地图预计方法的丰盛外部特色,并展现了它们如何更严密地将在线地图构建与轨迹预测相结合。经过这样做,本文发现间接访问外部BEV特色可以使推理速度提高多达73%,并使在实在环球nuScenes数据集上的预测准确性提高多达29%。
感知智能驾驶车辆(AV)周围的静态环境是智能驾驶中的关键义务,它为下游的行为预测和静止规划模块提供几何消息(例如,路线规划)。传统上,高精(HD)地图不时是了解这些消息的基础,提供厘米级的路线边界、车道分隔线、车道核心线、人行横道、交通标志、路线标志等几何数据。它们在增强AV情境感知和下游预测义务中的导航判别方面起到了无法或缺的作用。但是,虽然HD地图的适用性不容否定,搜集和保养这些地图却是休息密集型且老本高昂的,这限度了它们的可裁减性。
近年来,在线高精(HD)地图预计方法作为一种代替打算产生,旨在间接从传感器观测中预测HD地图消息。以(多)相机图像和可选的LiDAR点云为终点,最先进的HD地图预计方法通常驳回编码器-解码器神经网络架构(如图1所示)。编码器首先将传感器观测转换为 BEV 特色网格。而后,解码器从BEV特色中预测地图元素的位置和语义类型。生成的路线几何结构通常按地图元素类型(例如,路线边界、车道分隔线、人行横道)以多段线和多边形的组合方式构建。这些在线预计的地图作为离线HD地图的适用代替品,为下游义务(如行为预测和静止规划)提供必要的场景高低文。例如,最近的钻研[13]展现了将各种地图预计方法与现有预测框架相结合的成功,突显了它们在减速端到端智能驾驶技术堆栈开发中的后劲。
虽然这种编码器-解码器方法能够生成准确的高精(HD)地图,但正如本文将在第4节中展现的那样,解码环节中经常使用的留意力机制计算老本高(占据了模型运转期间的大部分),并且不会生成带无关系不确定性的输入,这限度了下游模块解决不确定性的才干。此外,这种架构阻止了下游义务应用编码器在透视视角到俯瞰视角(PV2BEV)转换环节中生成的丰盛两边特色,造成无法形容为点集的消息被消耗掉。
为此,本文引入了三种陈腐的场景编码战略,这些战略应用外部 BEV 特色来优化功能并减速在线地图构建和行为预测系统的运转期间。经过间接应用BEV特色,本文提出的方法在地图预计和行为预测框架之间成功了更严密的集成,在实在环球的nuScenes数据集上,系统推理速度提高了多达73%,下游预测准确性提高了多达29%。
如第2节所述,绝大少数最先进的在线矢量化地图预计模型在外部驳回 BEV 网格,以几何坚持的方式对周围环境启动特色化。本文的方法并重于经过间接访问这些外部BEV示意来启动轨迹预测。经过这样做,本文改善了从地图构建到预测的消息流动,甚至可以经过齐全跳过地图解码来减速整个系统的运转期间(取决于预测器对车道消息的需求)。
图1:在线地图预计方法关键将多相机观测结果编码为规范的 BEV 特色网格,而后再解码为矢量化的地图元素。在这项上班中,本文提出经过间接访问在线地图预计方法的丰盛BEV特色,将在线地图构建与下游义务深度集成。
图2:将BEV特色融入行为预测的三种不同战略。左:部分区域留意力编码代理与地图的交互;中:用BEV特色增强车道顶点;右:用期间序列BEV特色交流代理轨迹。
图3:本文的集成BEV预测方法在一切场景规模(代理数量和地图元素数量)和地图模型上运转速度都比解耦基线方法更快。
图4:经常使用第3.1节中的战略结合StreamMapNet [37]和HiVT [40]。经过用期间序列BEV特色交流车道消息,HiVT能够使其预测轨迹坚持在车道上,与GT轨迹严密对齐。
图5:经常使用第3.2节中的战略结合MapTR [22]和DenseTNT [12]。本文经过用BEV特色增强地图顶点,使DenseTNT能够生成十分准确的轨迹,防止了在基线和增强不确定性[13]设置中产生的路线边界入侵疑问。
图6:经常使用第3.3节中的战略结合StreamMapNet [37]和DenseTNT [12]。经过用BEV特色交流代理轨迹消息,DenseTNT能够预测出在斑马线前停下的轨迹,相比于基线和增强不确定性[13]方法中的预测无余和适度疑问。
表1:在nuScenes [1]数据集上,简直每种地图构建和预测的组合都能从间接应用抢先BEV特色中受益,某些组合的功能优化甚至到达25%或更多。百分比值示意本文的方法在预测功能上所成功的相对优化。
表2:对BEV patch 大小的探求标明, patch 过小(消息捕捉无余)或过大(细粒度消息失落)都会带来不利影响,最佳功能是在 patch 大小为20×20(对应于事实环球中的6米×6米)时成功的。
在这项上班中,本文提出了三种不同的战略,以在下游义务(如行为预测)中应用在线地图预计模型中的两边BEV特色。本文系统地评价了不同BEV编码战略的长处,并展现了在下游行为预测中融入BEV特色如何清楚优化功能和运转期间。详细而言,结合各种在线地图构建和预测方法,在间接经常使用两边BEV特色时,成功了推理期间快达73%,并且在多种评价目的上预测准确性提高了多达29%。