基于对抗擦除和背景抑制的弱监督目标定位方法技术

技术编号:36188615 阅读:29 留言:0更新日期:2022-12-31 20:58
本发明专利技术提供的基于对抗擦除和背景抑制的弱监督目标定位方法,包括以下步骤:使用卷积神经网络作为主干网络,将其末端的池化层和全连接层更换为全局平均池化层和全连接层,将训练集图像输入结构更换后的所述卷积神经网络,进行第一次前向传播,输出特征图F;计算得出类别激活图CAM,基于类别激活图CAM计算得到二维图CAM

【技术实现步骤摘要】
基于对抗擦除和背景抑制的弱监督目标定位方法


[0001]本专利技术属于目标定位领域,尤其涉及基于对抗擦除和背景抑制的弱监督目标定位方法。

技术介绍

[0002]目标检测和目标定位是计算机视觉领域的关键技术,广泛地应用在各种生活场景中,如对于人物、车辆、物品和工业产品缺陷等的检测与定位。近年来随着数据量和计算性能的提升,基于深度学习的目标检测和目标定位技术发展迅速,并在各个领域展现出色的效果。但是目标检测和定位的深度模型在训练过程中需要大量数据以及精确实例级标注,获取成本十分昂贵。实际应用过程中现有算法往往只能基于少量完全标注数据进行训练,无法达到理想效果。因此,研究人员提出弱监督目标定位技术,希望在仅使用低成本的图像级别标注情况下训练目标检测和定位模型。现有弱监督目标定位技术需要先通过图像类别标签训练一个深度分类卷积网络,然后从中获得类别激活图(CAM)后进行阈值分割。然而,类激活映射所需的定位图是从基于单类别损失函数监督训练的深度分类模型获取的,模型倾向于通过各类目标的显著空间特征来区分它们,这种方法得到的结果通常仅定位物体的显著部分(例如鸟本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于对抗擦除和背景抑制的弱监督目标定位方法,其特征在于,包括以下步骤:使用卷积神经网络作为主干网络,将其末端的池化层和全连接层更换为全局平均池化层和全连接层,网络最终直接输出为由各个类别的预测概率组成的向量;将训练集图像输入结构更换后的所述卷积神经网络,进行第一次前向传播,传播到最后一层卷积层后输出得到特征图F,其包含n个通道(f1~f
n
),f
n
为特征图F中的第n个通道,经过全局平均池化层后得到长度为n的一维特征值V(v1~v
n
),v
n
为第n个通道的通道值,每个特征值对应特征图F中的一个通道,一维特征值V输入全连接层后,得到一个长度为C的一维向量类别预测结果;设图像真实标签所对应全连接层中的参数为w,有n个取值(w1~w
n
),分别对应一维特征值V的n个取值和特征图F的n个通道,用参数w来评估特征图F中每个通道对正确类别的贡献程度,并计算得出类别激活图CAM,基于类别激活图CAM计算得到二维图CAM
norm
和擦除图M
e
;将所述擦除图M
e
与第一次前向传播得到的特征图F卷积神经网络的第l层中间特征F
l
进行擦除操作,将擦除后的特征输入卷积神经网络的l层之后的层继续进行第二次前向传播,得到第二个类别预测结果;分别取第一次前向传播和第二次前向传播在卷积神经网络中的第m层的中间特征(m>l),各自做通道平均池化并经过激活函数后得到各自的重要性图,记为基于总损失函数对卷积神经网络进行迭代训练,总损失函数包括背景抑制损失,得到训练后的卷积神经网络;将待检测图像输入训练后的卷积神经网络中,得到目标定位结果。2.根...

【专利技术属性】
技术研发人员:高英吴朝捷谢欣言李明阳蔡文天
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1