【技术实现步骤摘要】
本专利技术涉及目标检测,尤其涉及一种基于鸟瞰图的显存高效的三维目标检测方法及装置。
技术介绍
1、随着自动驾驶行业的快速崛起,3d目标检测已成为研究的关键领域。3d物体目标的主要目标是在3d空间中识别和定位物体,同时对其进行准确分类。鸟瞰(bev)视角提供的空间和维度一致性极大地促进了基于bev的检测方法的成功。按输入可分为包含:lidar-bev,camera-bev和lidar-camera-bev。
2、其中图像到bev转换的一个核心挑战是视图转换过程。后向投影方法依赖于预定义的3d空间和相机参数,可提供更快的转换,但对变化的驾驶条件具有更高的敏感性。相比之下,前向投影方法明确估计深度,提供更准确的对象表示,但由于需要构建视锥体而增加了内存消耗且得到的bev特征较稀疏,并且后续许多方法采用了更大的主干网络来提取特征,使得显存需求大大提高。
技术实现思路
1、本专利技术目的在于针对现有技术的不足,提出一种基于鸟瞰图的显存高效的三维目标检测方法及装置。
2、本专利
...【技术保护点】
1.一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,该方法包括:将环视RGB图像预处理后输入到图像BEV特征提取网络,得到图像的BEV特征;将激光点云输入到点云BEV特征提取网络提取点云特征并投影到BEV平面,将图像和点云BEV特征通过BEV编码器拼接后进行特征提取,并通过BEV解码器获取三维物体的检测结果;
2.根据权利要求1所述的一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,所述将环视RGB图像预处理包括:通过缩放裁剪对输入图像进行初步变换,得到图像数据维度为:N×3×H×W,其中N为环视图像数量,3为RGB通道数,H和W分别为图像的
...【技术特征摘要】
1.一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,该方法包括:将环视rgb图像预处理后输入到图像bev特征提取网络,得到图像的bev特征;将激光点云输入到点云bev特征提取网络提取点云特征并投影到bev平面,将图像和点云bev特征通过bev编码器拼接后进行特征提取,并通过bev解码器获取三维物体的检测结果;
2.根据权利要求1所述的一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,所述将环视rgb图像预处理包括:通过缩放裁剪对输入图像进行初步变换,得到图像数据维度为:n×3×h×w,其中n为环视图像数量,3为rgb通道数,h和w分别为图像的高度和宽度;将图像分割成patch,以减少显存占用。
3.根据权利要求1所述的一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,所述可逆主干网络中,包括4个可逆块,每个可逆块均为双输入双输出的双残差模块,
4.根据权利要求1所述的一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,所述前向投影采用基于lss的方式进行bev特征提取,包括:
5.根据...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。