【技术实现步骤摘要】
一种端到端的三维目标稀疏检测方法
[0001]本专利技术属于计算机视觉和三维感知领域,提供一种基于激光雷达点云数据的三维目标检测方法,具体涉及一种适用于三维目标的稀疏预测方法,无需非极大值抑制之类的后处理,实现了真正的端到端检测,提高了检测的效率和鲁棒性。
技术介绍
[0002]三维目标检测是一种用于识别三维场景中关键目标的类别和位置的技术,在许多场景中都承担着关键作用,例如自动驾驶和增强现实。激光雷达扫描得到的点云,本质上是对真实三维世界中物体几何的低分辨率采样,因此具有对真实世界较好的表示能力,在三维感知领域取得了显著的成效。
[0003]对于基于点云数据的三维目标检测任务来说,目标是将一个输入场景点云中的关键目标以有向的三维包围盒来表示。为此,研究者们提出了多种有效的方法。
[0004]早期的稠密三维目标检测器主要采用基于锚的设计,需要人为地为每一个类别的目标设定锚的配置。典型的表示方法是VoxelNet(参考文献Yin Zhou and Oncel Tuzel.2018.Voxelnet:End />‑
to本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种端到端的三维目标稀疏检测方法,其步骤包括:将点云样本输入三维目标检测网络,得到所述点云样本的目标预测结果;利用损失函数计算模块计算目标预测结果与其对应的真实目标对之间损失值,通过降低损失函数的值对所述三维目标检测网络进行优化;其中所述三维目标检测网络包括体素化模块、三维特征提取模块、折叠到鸟瞰视角模块、特征对齐模块、稀疏检测模块;所述点云样本包括点云场景,该场景中每个目标的3D包围盒及其对应的类别标签;所述体素化模块用于将所述点云样本中的点云场景进行3D体素划分;所述三维特征提取模块根据所述点云样本的3D体素数据得到所述点云样本对应的分辨率降低而特征维度增加的三维特征图并输入所述折叠到鸟瞰视角模块;所述折叠到鸟瞰视角模块对输入的三维特征图在鸟瞰视角下进行折叠,得到伪二维特征图并输入所述特征对齐模块,得到一特征图列表;其中所述特征图列表包括多张相同维度不同分辨率的伪二维特征图;所述稀疏检测模块将所述特征图列表、N个初始化为整个输入点云场景大小的可学习建议包围盒及与其对应的随机初始化可学习建议特征作为输入,提取每个可学习建议包围盒的RoI特征,将所述RoI特征与其对应的可学习建议特征通过一个动态卷积模块进行交互过滤掉无效的包围盒,然后根据动态卷积模块输出的目标特征得到最终的目标预测结果;将待检测的点云场景输入训练优化后的三维目标检测网络,得到该待检测的点云场景中的目标预测结果。2.根据权利要求1所述的方法,其特征在于,所述损失函数计算模块通过两阶段计算所述损失值:第一阶段为N
‑
M匹配过程,目标是从所有N个预测中筛选出M个候选,然后采用基于匈牙利算法的二分匹配损失方法来计算逐对的匹配代价,确定出匹配对;第二阶段利用确定出的匹配对通过损失函数计算所述损失值;其中,是预测的分类结果和真实的类别标签之间的焦点损失,是归一化的预测包围盒和真实目标包围盒之间的L1损失,是将用于限制包围盒之间重叠程度的带有角度和高度信息的旋转三维DIoU损失;λ
cls
,λ
L1
和λ
IoU
是设定系数。3.根据权利要求2所述的方法,其特征在于,所述匹配代价为其中,代表真实目标的集合,代表N个预测结果,N>M;逐对的代价代表N个预测结果,N>M;逐对的代价为轴对齐的鸟瞰视角二维包围盒的IoU损失。4.根据权利要求1或2或3所述的方法,其特征在于,所述稀疏检测模块的具体实现方法为:4.1.采用N个可学习建议包围盒与其对应的可学习建议特征作为目...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。