3D视觉感知数据的标注方法及装置制造方法及图纸

技术编号:33733111 阅读:22 留言:0更新日期:2022-06-08 21:29
本申请公开了一种3D视觉感知数据的标注方法及装置,涉及自动驾驶技术领域,所述方法包括:获取第一RGB图像;将所述第一RGB图像的多帧图像分别输入第一3D视觉感知模型,获取所述第一3D视觉感知模型输出的第一训练数据;其中,所述第一3D视觉感知模型用于检测每帧图像中的目标物体并利用3D框对所述目标物体进行标注后输出所述第一训练数据。本申请的方案通过利用第一3D视觉感知模型获取第一训练数据,解决了依靠雷达点云数据标注3D框存在失真的问题,以及,纯人工标注无法获得大量标注数据的问题。的问题。的问题。

【技术实现步骤摘要】
3D视觉感知数据的标注方法及装置


[0001]本申请涉及自动驾驶
,尤其是涉及一种3D视觉感知数据的标注方法及装置。

技术介绍

[0002]在基于深度学习的自动驾驶系统领域,为了训练相关的感知模型(包括但不限于深度估计、目标检测等领域),需要准备大量的经过标注的训练数据。以3D物体检测为例,所需的训练数据应包含一定量的采集得到的红绿蓝(Red Green Blue,RGB)图像,以及标注好的物体(例如车辆、行人等)3D框。在自动驾驶领域,现有的技术主要利用激光雷达,在采集RGB图像的同时,同步获得雷达点云,再进行标注,然而,这种方式中,由于激光雷达的采集频率与RGB摄像头的采集频率往往不一致,故无法保证所匹配的点云与RGB图像是严格同步的,另外,由于激光雷达的环绕采集周期较长,如果车速较快,会出现被采集物体在采集周期内有较大位移,导致数据失真,从而导致仅仅依靠点云标注的3D框无法准确的投影到RGB图像上,例如,在点云空间标注的框是紧密的,但投射的RGB图像上看与实际物体位置存在一定位移。

技术实现思路

[0003]本申请的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种3D视觉感知数据的标注方法,其特征在于,包括:获取第一RGB图像;将所述第一RGB图像的多帧图像分别输入第一3D视觉感知模型,获取所述第一3D视觉感知模型输出的第一训练数据;其中,所述第一3D视觉感知模型用于检测每帧图像中的目标物体并利用3D框对所述目标物体进行标注后输出所述第一训练数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取第二RGB图像和雷达点云数据;在各帧所述雷达点云数据中标注点云3D框;将所述点云3D框投影至所述第二RGB图像中的目标帧图像上,获得第二训练数据,其中,所述目标帧图像为与所述点云3D框相关的帧图像;基于所述第二训练数据,对第二3D视觉感知模型进行训练,获得所述第一3D感知模型。3.根据权利要求2所述的方法,其特征在于,所述在各帧所述雷达点云数据中标注点云3D框,包括:基于对每帧所述雷达点云数据中的点云的聚类结果,在每帧所述雷达点云数据中标注所述点云3D框;或者,利用深度学习模型,在每帧所述雷达点云数据中标注所述点云3D框。4.根据权利要求2所述的方法,其特征在于,在所述基于所述第二训练数据,对第二3D视觉感知模型进行训练,获得所述第一3D感知模型的步骤之前,所述方法还包括:接收用户的第一操作;响应于所述第一操作,对映射到所述目标帧图像中的所述点云3D框进行校正。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用公开数据集对第二3D视觉感知模型进行训练,获得所述第...

【专利技术属性】
技术研发人员:杨天朱政黄冠都大龙
申请(专利权)人:北京鉴智机器人科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1