一种基于三重注意力机制的自动驾驶感知算法制造技术

技术编号:45094815 阅读:11 留言:0更新日期:2025-04-25 18:32
本发明专利技术属于深度学习技术领域,具体公开了一种基于三重注意力机制的自动驾驶感知算法,首先将激光雷达扫描到的场景原始点云数据输入到特征编码网络进行划分为一个个的pillars,将3维点云数据转换成2维的伪图像;然后将转变为2D的伪图输入到2DBackbone中进行特征提取,得到多尺度多维度的特征;最后进行上采样拼接后再送入到检测头进行检测任务。本发明专利技术提出的DSPE模块通过引入三重注意力机制,显著增强了对3D小目标检测中细粒度信息的提取能力。DSPE不仅改善了传统最大池化操作造成的特征信息丢失问题,还能有效捕捉每个支柱内点之间的空间相关性、通道间的特征交互以及体素间的上下文依赖关系,大幅提升系统的检测精度和速度。

【技术实现步骤摘要】

本专利技术属于深度学习,特别涉及一种基于三重注意力机制的自动驾驶感知算法


技术介绍

1、深度学习技术在各种应用场景中逐渐展现出其强大的能力,特别是在自动驾驶的感知环节,3d目标检测扮演了至关重要的角色。如何针对自动驾驶场景的实际需求,选择和使用最合适的算法是一个重大挑战。目前,主流的3d目标检测方法主要分为基于点云(point)方法、基于体素(voxel)方法、结合点和体素(point-voxel)方法和基于支柱(pillars)方法。

2、基于point和voxel的方法各自具有独特的优势,但同时也存在一定的局限性。例如,在采用voxel表示法时,尽管其规则化的网格结构有利于快速的邻居查找和简化了数据处理流程,然而这种方法会引入空间分辨率与计算资源之间的权衡问题。一方面,为了达到高精度的空间细节表达,需要使用更细密的voxel网格,这会导致显著增加的数据存储需求和计算复杂度;另一方面,对于稀疏分布的对象或场景,大部分voxel可能为空,造成存储和计算资源的浪费。基于point的方法直接操作离散点集,可以灵活适应不同密度的数据分布,并且避免了本文档来自技高网...

【技术保护点】

1.一种基于三重注意力机制的自动驾驶感知算法,其特征在于:包括特征编码网络、2Dbackbone以及检测头三个部分,包括以下步骤:

2.如权利要求1所述的一种基于三重注意力机制的自动驾驶感知算法,其特征在于:所述步骤一特征编码网络详细工作步骤为:

3.如权利要求2所述的一种基于三重注意力机制的自动驾驶感知算法,其特征在于:所述步骤二2Dbackbone进行特征提取详细工作步骤为:

4.如权利要求3所述的一种基于三重注意力机制的自动驾驶感知算法,其特征在于:所述步骤三使用SSD作为模型的检测头,使用候选框与ground truth的2D的IoU来进行分类...

【技术特征摘要】

1.一种基于三重注意力机制的自动驾驶感知算法,其特征在于:包括特征编码网络、2dbackbone以及检测头三个部分,包括以下步骤:

2.如权利要求1所述的一种基于三重注意力机制的自动驾驶感知算法,其特征在于:所述步骤一特征编码网络详细工作步骤为:

3.如权利要求2所述的一种基于三重注意力机制的自动驾驶感知算法,其特征在于:所述步骤二...

【专利技术属性】
技术研发人员:陈静施玲玲王铭鹏赵韦杭
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1