【技术实现步骤摘要】
本专利技术涉及自动驾驶领域,尤其是涉及基于三维视觉语言预训练的端到端自动驾驶规划方法。
技术介绍
1、自动驾驶是一项具有挑战性的任务,需要深入了解自动驾驶汽车的周围环境,以确保安全和高效的现实部署。一个优秀的自动驾驶系统必须具备全面感知驾驶环境并根据道路信息精准做出规划决策的能力。最近,通过利用传感器数据理解驾驶场景并输出规划决策,提出了几种端到端自动驾驶框架并取得了可喜的结果。此外,自动驾驶任务在现实世界中具有广泛的应用前景和商业价值,例如帮助减少人为驾驶失误和降低交通事故率,支持智慧城市的整体规划,降低物流成本等。
2、自动驾驶任务需要解决三大难点:(1)深入理解多视角图像中蕴含的丰富信息,(2)高效且精准地进行推理和决策,(3)在多样化的实际场景中保持稳定表现。针对难点一,一些早期方法在未能透彻理解驾驶场景的情况下,直接生成规划轨迹,导致模型的可解释性较差且训练难以收敛。缺乏对场景深度理解的规划方法无法有效捕捉复杂环境中的关键特征。针对难点二,融合大语言模型(llm)的新兴自动驾驶模型借助其强大的推理能力表现优异。然而
...【技术保护点】
1.一种基于三维视觉语言预训练的端到端自动驾驶规划方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种基于三维视觉语言预训练的端到端自动驾驶规划方法,其特征在于,BEVformer中的Transformer结构的输出为:
3.根据权利要求2所述的一种基于三维视觉语言预训练的端到端自动驾驶规划方法,其特征在于,全局视觉特征为:
4.根据权利要求3所述的一种基于三维视觉语言预训练的端到端自动驾驶规划方法,其特征在于,检测文本表示Tdet、运动文本表示Tmotion、地图文本表示Tmap为:
5.根据权利要求
...【技术特征摘要】
1.一种基于三维视觉语言预训练的端到端自动驾驶规划方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种基于三维视觉语言预训练的端到端自动驾驶规划方法,其特征在于,bevformer中的transformer结构的输出为:
3.根据权利要求2所述的一种基于三维视觉语言预训练的端到端自动驾驶规划方法,其特征在于,全局视觉特征为:
4.根据权利要求3所述的一种基于三维视觉语言预训练的端到端自动驾驶规划方法,其特征在于,检测文本表示tdet、运动文本表示tmotion、地图文本表示tmap为:
5.根据权利要求4所述的一种基于三维视觉语言预训练的端到端自动驾驶规划方法,其特征在于,串联文本表示tglobal为:
6.根据权利要求5所述的一种基...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。