【技术实现步骤摘要】
本专利技术属于计算机视觉中的目标检测,具体涉及一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法。
技术介绍
1、计算机视觉(computer vision)是人工智能领域的一个备受关注的重要分支,旨在促使计算机能够模拟人类的视觉系统,从而理解、处理图像以及视频数据。
2、目标检测(object detection)是计算机视觉领域的一个重要研究方向,它通过区分图像或者视频中不同类别的目标并给出目标的定位边界框,从而实现了计算机对图像或者视频的更高级别的理解和处理。例如,在室外场景中,视觉系统需要实时检测道路中的目标,如车辆、行人和信号灯等,在室内场景中,视觉系统需要实时检测房间中的目标,如桌椅、盆栽和橱柜等,以便系统躲避障碍物、规划行动路线和检索特定目标等。随着深度学习技术的不断发展,目标检测技术也取得了突破性的进展。例如,区域卷积神经网络(r-cnn)系列方法和基于transformer编码器-解码器模型系列方法等新型技术的出现,极大地推动了目标检测技术的发展。这些方法可以通过端到端的训练目标检测模型,自动地提取
...【技术保护点】
1.一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述方法具体包括以下步骤:
2.根据权利要求1所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述预训练采用的损失函数为:
3.根据权利要求2所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述最佳匹配索引和的计算方法为:
4.根据权利要求3所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述对预训练好的模型进行训练时,训练标签的生成方法为:
5.根据权利要
...【技术特征摘要】
1.一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述方法具体包括以下步骤:
2.根据权利要求1所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述预训练采用的损失函数为:
3.根据权利要求2所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述最佳匹配索引和的计算方法为:
4.根据权利要求3所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述对预训练好的模型进行训练时,训练标签的生成方法为:
5.根据权利要求4所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述数据增强方法包括随机裁剪和调整图像大小。
6.根据权利要求5所述的一种基于两阶段训练和多视图自标注策略的开放世界目标检测方法,其特征在于,所述伪...
【专利技术属性】
技术研发人员:董娜,张永强,张印,丁明理,田瑞,朱月熠,张子安,张漫,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。