当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于鸟瞰图的显存高效的三维目标检测方法及装置制造方法及图纸

技术编号:44960037 阅读:29 留言:0更新日期:2025-04-12 01:29
本发明专利技术公开了一种基于鸟瞰图的显存高效的三维目标检测方法及装置,本发明专利技术基于可逆主干网络和前向后向视图转换模块组成图像BEV特征提取网络。可逆主干网络采用可逆架构,通过重新计算中间参数以最小化内存占用。前向后向视图转模块能够对前视图投影中提取的BEV特征进行精细化处理,生成更密集、更精确的BEV表示。将环视RGB图像输入到图像BEV特征提取网络,得到图像的BEV特征;将激光点云输入到点云BEV特征提取网络提取点云特征并投影到BEV平面,将图像和点云BEV特征通过BEV编码器拼接后进行特征提取,并通过BEV解码器获取三维物体的检测结果。

【技术实现步骤摘要】

本专利技术涉及目标检测,尤其涉及一种基于鸟瞰图的显存高效的三维目标检测方法及装置


技术介绍

1、随着自动驾驶行业的快速崛起,3d目标检测已成为研究的关键领域。3d物体目标的主要目标是在3d空间中识别和定位物体,同时对其进行准确分类。鸟瞰(bev)视角提供的空间和维度一致性极大地促进了基于bev的检测方法的成功。按输入可分为包含:lidar-bev,camera-bev和lidar-camera-bev。

2、其中图像到bev转换的一个核心挑战是视图转换过程。后向投影方法依赖于预定义的3d空间和相机参数,可提供更快的转换,但对变化的驾驶条件具有更高的敏感性。相比之下,前向投影方法明确估计深度,提供更准确的对象表示,但由于需要构建视锥体而增加了内存消耗且得到的bev特征较稀疏,并且后续许多方法采用了更大的主干网络来提取特征,使得显存需求大大提高。


技术实现思路

1、本专利技术目的在于针对现有技术的不足,提出一种基于鸟瞰图的显存高效的三维目标检测方法及装置。

2、本专利技术的目的是通过以下本文档来自技高网...

【技术保护点】

1.一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,该方法包括:将环视RGB图像预处理后输入到图像BEV特征提取网络,得到图像的BEV特征;将激光点云输入到点云BEV特征提取网络提取点云特征并投影到BEV平面,将图像和点云BEV特征通过BEV编码器拼接后进行特征提取,并通过BEV解码器获取三维物体的检测结果;

2.根据权利要求1所述的一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,所述将环视RGB图像预处理包括:通过缩放裁剪对输入图像进行初步变换,得到图像数据维度为:N×3×H×W,其中N为环视图像数量,3为RGB通道数,H和W分别为图像的高度和宽度;将图像分...

【技术特征摘要】

1.一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,该方法包括:将环视rgb图像预处理后输入到图像bev特征提取网络,得到图像的bev特征;将激光点云输入到点云bev特征提取网络提取点云特征并投影到bev平面,将图像和点云bev特征通过bev编码器拼接后进行特征提取,并通过bev解码器获取三维物体的检测结果;

2.根据权利要求1所述的一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,所述将环视rgb图像预处理包括:通过缩放裁剪对输入图像进行初步变换,得到图像数据维度为:n×3×h×w,其中n为环视图像数量,3为rgb通道数,h和w分别为图像的高度和宽度;将图像分割成patch,以减少显存占用。

3.根据权利要求1所述的一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,所述可逆主干网络中,包括4个可逆块,每个可逆块均为双输入双输出的双残差模块,

4.根据权利要求1所述的一种基于鸟瞰图的显存高效的三维目标检测方法,其特征在于,所述前向投影采用基于lss的方式进行bev特征提取,包括:

5.根据...

【专利技术属性】
技术研发人员:张宇潘雷雷
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1