基于多标签分类的开集目标检测方法、装置、设备和介质制造方法及图纸

技术编号:43804542 阅读:29 留言:0更新日期:2024-12-27 13:22
本发明专利技术提供一种基于多标签分类的开集目标检测方法、装置、设备和介质,其中方法包括:在开集目标检测模型的融合层的任意一层中嵌入多标签分类层;将多标签分类层和开集目标检测模型的前K层转换为第一推理层,将开集目标检测模型的后N‑K层转换为第二推理层;将目标图像和预设的M个目标类别文本输入至第一推理层,得到图像特征和M个文本特征,以及M个目标类别文本的置信度;基于M个目标类别文本的置信度,对M个文本特征进行过滤,得到过滤后的m个文本特征;在m值不为零的情况下,将过滤后的m个文本特征和图像特征输入至第二推理层,得到目标图像的分类结果。本发明专利技术推理加速效果好,无需额外训练成本,不影响定位准确率,通用性强。

【技术实现步骤摘要】

本专利技术涉及目标检测,尤其涉及一种基于多标签分类的开集目标检测方法、装置、设备和介质


技术介绍

1、随着城市治理、安防监控、智慧交通等场景日趋复杂化,如何在复杂场景下提高开集目标检测的推理速度,是开集目标检测模型亟待解决的关键问题。在现有技术中,采用模型蒸馏的方案进行推理加速,定位准确性下降,需要额外的训练成本;采用模型量化的方案进行推理加速,通用性较差;采用模型枝剪的方案进行推理加速,需要特定的设备。


技术实现思路

1、本专利技术提供一种基于多标签分类的开集目标检测方法、装置、设备和介质,用以解决现有技术中采用模型蒸馏的方案进行推理加速,定位准确性下降,需要额外的训练成本;采用模型量化的方案进行推理加速,通用性较差;采用模型枝剪的方案进行推理加速,需要特定的设备的缺陷。

2、第一方面,本专利技术提供一种基于多标签分类的开集目标检测方法,包括:

3、在开集目标检测模型的融合层的任意一层中嵌入多标签分类层,所述开集目标检测模型包括n层,n为大于等于1的自然数;p>

4、将所述本文档来自技高网...

【技术保护点】

1.一种基于多标签分类的开集目标检测方法,其特征在于,包括:

2.根据权利要求1所述的基于多标签分类的开集目标检测方法,其特征在于,所述将目标图像和预设的M个目标类别文本输入至所述第一推理层,得到所述第一推理层输出的所述目标图像对应的图像特征和M个文本特征,以及所述M个目标类别文本的置信度,包括:

3.根据权利要求1所述的基于多标签分类的开集目标检测方法,其特征在于,所述基于所述M个目标类别文本的置信度,对所述M个文本特征进行过滤,得到过滤后的m个文本特征,包括:

4.根据权利要求1所述的基于多标签分类的开集目标检测方法,其特征在于,所述得到过滤后的m...

【技术特征摘要】

1.一种基于多标签分类的开集目标检测方法,其特征在于,包括:

2.根据权利要求1所述的基于多标签分类的开集目标检测方法,其特征在于,所述将目标图像和预设的m个目标类别文本输入至所述第一推理层,得到所述第一推理层输出的所述目标图像对应的图像特征和m个文本特征,以及所述m个目标类别文本的置信度,包括:

3.根据权利要求1所述的基于多标签分类的开集目标检测方法,其特征在于,所述基于所述m个目标类别文本的置信度,对所述m个文本特征进行过滤,得到过滤后的m个文本特征,包括:

4.根据权利要求1所述的基于多标签分类的开集目标检测方法,其特征在于,所述得到过滤后的m个文本特征之后,还包括:

5.根据权利要求1所述的基于多标签分类的开集目标检测方法,其特征在于,所述开集目标检测模型的训练过程包括:

6.根据权利要求5所述的基于多标签分类的开集目标检测方法,其特征在于,所述初始开...

【专利技术属性】
技术研发人员:陈其博余立丛鹏宇严昱超金炜众厉舒畅刘梦迪葛建跃郭轩江
申请(专利权)人:中国移动通信集团浙江有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1