一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法技术

技术编号:42222479 阅读:17 留言:0更新日期:2024-08-02 13:41
一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,它属于计算机视觉中的目标检测技术领域。本发明专利技术解决了现有基于封闭世界假设设计的目标检测方法会对真值标签不存在的未知新类别造成误检、漏检的问题。本发明专利技术基于基础模型Deformable‑DETR引入一个类别不可知的二分类头,并提出两阶段的模型训练方法。第一阶段,二分类头将所有预测输出二分类为前景或者背景;第二阶段,提出多视图自标注策略和一致性约束方法,基于当前已知类别的数据集微调模型的投影层、分类头和二分类头的参数,冻结其他类别不可知模块的参数。训练好的模型可以对已知类别的目标进行正确分类,并将未知类别的目标识别出来。本发明专利技术方法可以应用于开放世界目标检测。

【技术实现步骤摘要】

本专利技术属于计算机视觉中的目标检测,具体涉及一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法


技术介绍

1、计算机视觉(computer vision)是人工智能领域的一个备受关注的重要分支,旨在促使计算机能够模拟人类的视觉系统,从而理解、处理图像以及视频数据。

2、目标检测(object detection)是计算机视觉领域的一个重要研究方向,它通过区分图像或者视频中不同类别的目标并给出目标的定位边界框,从而实现了计算机对图像或者视频的更高级别的理解和处理。例如,在室外场景中,视觉系统需要实时检测道路中的目标,如车辆、行人和信号灯等,在室内场景中,视觉系统需要实时检测房间中的目标,如桌椅、盆栽和橱柜等,以便系统躲避障碍物、规划行动路线和检索特定目标等。随着深度学习技术的不断发展,目标检测技术也取得了突破性的进展。例如,区域卷积神经网络(r-cnn)系列方法和基于transformer编码器-解码器模型系列方法等新型技术的出现,极大地推动了目标检测技术的发展。这些方法可以通过端到端的训练目标检测模型,自动地提取图像或者视频的特征信本文档来自技高网...

【技术保护点】

1.一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述方法具体包括以下步骤:

2.根据权利要求1所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述预训练采用的损失函数为:

3.根据权利要求2所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述最佳匹配索引和的计算方法为:

4.根据权利要求3所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述对预训练好的模型进行训练时,训练标签的生成方法为:

5.根据权利要求4所述的一种基于两...

【技术特征摘要】

1.一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述方法具体包括以下步骤:

2.根据权利要求1所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述预训练采用的损失函数为:

3.根据权利要求2所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述最佳匹配索引和的计算方法为:

4.根据权利要求3所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述对预训练好的模型进行训练时,训练标签的生成方法为:

5.根据权利要求4所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述数据增强方法包括随机裁剪和调整图像大小。

6.根据权利要求5所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述伪...

【专利技术属性】
技术研发人员:董娜张永强张印丁明理田瑞朱月熠张子安张漫
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1