一种基于深度学习的零样本目标检测方法技术

技术编号:43872885 阅读:20 留言:0更新日期:2024-12-31 18:57
该发明专利技术公开了一种基于深度学习的零样本目标检测方法,涉及计算机视觉和机器学习领域。本发明专利技术的提出能够保证不增加训练开支的前提下,仅添加简单的模块就可以在现有的开放词汇目标检测模型的基础上提高基类的检测精度和对新类的泛化能力。通过对图像和文本描述进行编码和特征提取,利用全局分类评分模块对图像中的每个proposal的分类概率进行精炼,从而提高零样本目标检测的准确性和泛化能力。通过利用CLIP模型对图像的分类概率,对零样本目标检测分类器得到的每个区域候选的分类概率进行精炼,从而提高检测的准确性。

【技术实现步骤摘要】

本专利技术涉及计算机视觉和机器学习领域,尤其涉及一种基于深度学习的零样本目标检测系统。


技术介绍

1、随着深度学习技术的不断发展,目标检测已经取得了显著的进展。然而,传统的目标检测方法在处理新类别目标时,往往需要大量的标注数据进行训练,这限制了其在实际应用中的灵活性。为了解决这一问题,零样本目标检测(zero-shot object detection,zsd)应运而生,旨在检测未在训练集中出现的新类别目标。

2、现有的零样本目标检测方法主要分为基于嵌入学习的方法和基于生成对抗的方。zhou x,girdhar r,joulin a,et al.detecting twenty-thousand classes usingimage-level supervision[c]//european conference on computer vision.cham:springer nature switzerland,2022:350-368将图像级别的标签应用于区域候选(proposal)中最大尺寸的区域。这种方法不需要复杂的基于预测的标签分本文档来自技高网...

【技术保护点】

1.一种基于深度学习的零样本目标检测方法,该方法包括:

2.如权利要求1所述的一种基于深度学习的零样本目标检测方法,其特征在于,所述步骤1获取的数据要求为:设数据集的所有类别名称集合为其中元素总数为N,可见类的名称集合为不可见类的每次集合为可见类和不可见类没有交集所有类别刚好差分为可见类和不可见类目标类别的文本描述集合为{dij}i=1,2,…N;j=1,2,…m,其中dij表示第i个类别的第j种描述。

3.如权利要求1所述的一种基于深度学习的零样本目标检测方法,其特征在于,所述步骤2的具体方法为:

4.如权利要求1所述的一种基于深度学习的零样本目标检...

【技术特征摘要】

1.一种基于深度学习的零样本目标检测方法,该方法包括:

2.如权利要求1所述的一种基于深度学习的零样本目标检测方法,其特征在于,所述步骤1获取的数据要求为:设数据集的所有类别名称集合为其中元素总数为n,可见类的名称集合为不可见类的每次集合为可见类和不可见类没有交集所有类别刚好差分为可见类和不可见类目标类别的文本描述集合为{dij}i=1,2,…n;j=1,2,…m,其中dij表示第i个类别的第j种描述。

3.如权利要求1所述的一种基于深度学习的零样本目标检测...

【专利技术属性】
技术研发人员:孟凡满万粮陈雨坤贺驰原邱子欢李宏亮吴庆波潘力立许林峰
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1