当前位置: 首页 > 专利查询>深圳大学专利>正文

一种基于类激活图引导的目标检测方法及装置制造方法及图纸

技术编号:41537695 阅读:26 留言:0更新日期:2024-06-03 23:16
本发明专利技术提供一种基于类激活图引导的目标检测方法及装置,所述方法包括构建并训练具有类激活图生成头的DETR网络模型,得到训练完毕的具有类激活图生成头的DETR网络模型;获取待进行目标检测的图像,将所述待进行目标检测的图像输入训练完毕的具有类激活图生成头的DETR网络模型,得到目标检测结果;其中,所述具有类激活图生成头的DETR网络模型包括依次相连的特征提取网络、编码器、解码器、预测头,以及与特征提取网络连接的类激活图生成头。本发明专利技术能够通过更有针对性的信息引导,改善DETR在解码阶段的性能,使其能够更快速、准确地定位和识别目标,从而实现更好的检测结果。

【技术实现步骤摘要】

本专利技术涉及图像检测领域,尤其涉及一种基于类激活图引导的目标检测方法及装置


技术介绍

1、近年来,transformer在计算机视觉和自然语言处理领域取得了显著的成功,主要得益于其卓越的全局建模能力。detr是一种基于transformer的端到端目标检测网络,采用了无锚框的设计,从而简化了传统目标检测流程。detr不再需要手动设计锚框或使用区域提议网络(rpn),也摆脱了后续的非极大值抑制(nms)。通过transformer的自注意力机制,detr能够捕捉图像中的全局上下文信息,并直接生成目标框的回归参数和预测类别。然而,由于transformer具有多层深度堆叠的结构和庞大的参数量,以及detr网络中解码器中object queries层设计的随机性,即由于object queries层的参数过于随机,导致了模型优化的困难和收敛速度较慢,从而导致了detr网络模型在训练过程中收敛缓慢,检测精度不高的问题。


技术实现思路

1、为解决上述技术问题,本专利技术提出了一种图像实例分割的方法及装置,所述方法及本文档来自技高网...

【技术保护点】

1.一种基于类激活图引导的目标检测方法,其特征在于,所述方法包括以下步骤:

2.如权利要求1所述的方法,其特征在于,所述线性层对所述特征图执行以下操作:

3.如权利要求1所述的方法,其特征在于,所述类激活图为:

4.如权利要求1所述的方法,其特征在于,所述线性层的损失函数BCELoss为:

5.一种基于类激活图引导的目标检测装置,其特征在于,所述装置包括:

6.一种电子设备,包括:

7.一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-4中任一项所述方法。

【技术特征摘要】

1.一种基于类激活图引导的目标检测方法,其特征在于,所述方法包括以下步骤:

2.如权利要求1所述的方法,其特征在于,所述线性层对所述特征图执行以下操作:

3.如权利要求1所述的方法,其特征在于,所述类激活图为:

4.如权利要求1所述的方法,其特征在于,所述线...

【专利技术属性】
技术研发人员:李岩山郑闳方
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1