【技术实现步骤摘要】
本专利技术涉及图像检测领域,尤其涉及一种基于类激活图引导的目标检测方法及装置。
技术介绍
1、近年来,transformer在计算机视觉和自然语言处理领域取得了显著的成功,主要得益于其卓越的全局建模能力。detr是一种基于transformer的端到端目标检测网络,采用了无锚框的设计,从而简化了传统目标检测流程。detr不再需要手动设计锚框或使用区域提议网络(rpn),也摆脱了后续的非极大值抑制(nms)。通过transformer的自注意力机制,detr能够捕捉图像中的全局上下文信息,并直接生成目标框的回归参数和预测类别。然而,由于transformer具有多层深度堆叠的结构和庞大的参数量,以及detr网络中解码器中object queries层设计的随机性,即由于object queries层的参数过于随机,导致了模型优化的困难和收敛速度较慢,从而导致了detr网络模型在训练过程中收敛缓慢,检测精度不高的问题。
技术实现思路
1、为解决上述技术问题,本专利技术提出了一种图像实例分割的方
...【技术保护点】
1.一种基于类激活图引导的目标检测方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的方法,其特征在于,所述线性层对所述特征图执行以下操作:
3.如权利要求1所述的方法,其特征在于,所述类激活图为:
4.如权利要求1所述的方法,其特征在于,所述线性层的损失函数BCELoss为:
5.一种基于类激活图引导的目标检测装置,其特征在于,所述装置包括:
6.一种电子设备,包括:
7.一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-4中任一项所述方法。
【技术特征摘要】
1.一种基于类激活图引导的目标检测方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的方法,其特征在于,所述线性层对所述特征图执行以下操作:
3.如权利要求1所述的方法,其特征在于,所述类激活图为:
4.如权利要求1所述的方法,其特征在于,所述线...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。