开放词汇的3D场景处理制造技术

技术编号:42780051 阅读:26 留言:0更新日期:2024-09-21 00:41
提出了一种用于检测3D场景中的对象的方法,包括获取检测模型,该检测模型描述了多个对象的多个基类与该多个对象的3D数据之间的关联关系。接收要在3D场景中检测的多个候选对象的多个开放类,该多个开放类包括多个基类和不在该多个基类中的至少一个新类。基于该检测模型和该多个开放类,在3D场景的3D数据中检测3D部分,该3D部分对应于该多个候选对象中的目标候选对象。通过这种方法,可以从3D数据检测到属于新类、在检测模型的训练数据中未被标注的对象。

【技术实现步骤摘要】

本公开总体上涉及三维(3d)场景处理,并且更具体地,涉及用于针对要在3d场景中被检测的对象基于开放词汇的3d场景处理的方法、设备和计算机程序产品。


技术介绍

1、如今,3d场景处理在各个领域中变得流行。例如,3d场景理解旨在检测(例如,识别和/或定位)3d场景中的(多个)对象。由于与3d场景相关的标注训练数据非常有限,在训练数据中仅标注了有限数目的封闭词汇中的对象,因此由训练数据训练的处理模型不可以有效地检测属于封闭词汇之外的新类的对象。在这时,如何以有效的方式检测开放词汇中的对象成为一个热点。


技术实现思路

1、在本公开的第一方面,提供了一种用于检测3d场景中的对象的方法。在该方法中,获取检测模型,这里检测模型描述了多个对象的多个基类与多个对象的3d数据之间的关联关系。接收要在3d场景中检测的多个候选对象的多个开放类,这里多个开放类包括多个基类和不被包括在多个基类中的至少一个新类。基于检测模型和多个开放类,在3d场景的3d数据中检测3d部分,这里的3d部分对应于多个候选对象中的目标候选对象,并且目标候选对象本文档来自技高网...

【技术保护点】

1.一种用于检测三维(3D)场景中的对象的方法,包括:

2.根据权利要求1所述的方法,其中检测所述3D部分包括:

3.根据权利要求2所述的方法,其中获取所述检测模型包括:

4.根据权利要求3所述的方法,其中获取所述参考3D数据包括:

5.根据权利要求4所述的方法,其中获得所述参考类包括:

6.根据权利要求4所述的方法,其中选择所述参考3D数据包括:响应于确定所述预先确定的准确度等级是场景等级,选择所述参考3D场景数据作为所述参考3D数据。

7.根据权利要求4所述的方法,其中选择所述参考3D数据包括

8....

【技术特征摘要】

1.一种用于检测三维(3d)场景中的对象的方法,包括:

2.根据权利要求1所述的方法,其中检测所述3d部分包括:

3.根据权利要求2所述的方法,其中获取所述检测模型包括:

4.根据权利要求3所述的方法,其中获取所述参考3d数据包括:

5.根据权利要求4所述的方法,其中获得所述参考类包括:

6.根据权利要求4所述的方法,其中选择所述参考3d数据包括:响应于确定所述预先确定的准确度等级是场景等级,选择所述参考3d场景数据作为所述参考3d数据。

7.根据权利要求4所述的方法,其中选择所述参考3d数据包括:

8.根据权利要求4所述的方法,其中所述至少一个参考图像包括多个参考图像,并且选择所述参考3d数据包括:响应于确定所述预先确定的准确度等级是实体等级,

9.根据权利要求8所述的方法,其中获得所述参考类包括:基于针对所述第一参考图像的至少一个文字说明与针对所述第二参考图像的至少一个文字说明的比较,确定所述参考类。

10.根据权利要求3所述的方法,其中训练所述检测模型包括:基于针对所述参考3d数据与所述参考类的比较损失,确定针对所述检测模型的损失函数。

11.根据权利要求10所述的方法,其中训练所述检测模型进一步包括:

<...

【专利技术属性】
技术研发人员:柏松丁润语杨霁晗薛楚慧张文庆齐晓娟
申请(专利权)人:脸萌有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1