基于相关性引导的判别学习的弱监督细粒度图像分类算法制造技术

技术编号:23344793 阅读:54 留言:0更新日期:2020-02-15 04:21
本发明专利技术属于计算机视觉技术领域,提供了一种基于相关性引导的判别学习的弱监督细粒度图像分类算法。提出了一种端到端的相关性引导的判别学习模型,以充分挖掘和利用弱监督细粒度图像分类的相关性提升判别性。首先,提出了判别性区域分组子网络,该子网络首先在区域之间建立相关性,然后通过加权汇总来自其他区域的所有相关性来增强每个区域来引导网络去发现更具有判别性区域组。最后,提出了判别性特征增强子网络,以挖掘和学习每个patch的特征向量元素之间的内部空间相关性,通过联合地增强信息元素同时抑制无用元素来提高其局部的判别能力。大量实验证明了DRG和DFS有效性,并达到了最先进的性能。

Weakly supervised fine-grained image classification algorithm based on correlation guided discriminant learning

【技术实现步骤摘要】
基于相关性引导的判别学习的弱监督细粒度图像分类算法
本专利技术属于计算机视觉
,以提高细粒度图像分类准确性和效率为出发点,提出基于相关性引导的判别学习的弱监督细粒度图像分类算法。
技术介绍
与一般的图像分类不同,弱监督的细粒度图像分类(WFGIC)仅使用图像级标签来识别更详细的类别和粒度下的对象。由于其在图像理解和计算机视觉系统中的大量潜在应用,WFGIC引起了学术界和工业界的广泛关注。WFGIC是计算机视觉领域的一个开放问题,这有两个原因。首先,属于同一子类别的图像在大小,姿势,颜色和背景上有很大差异,而不同子类别的图像在这些方面可能非常相似。其次,除了目标或部位注释之外,WFGIC仅提供图像级标签,这给提取有效的判别性特征以区分子类别之间的细微差异带来了更大的困难,因为细粒度子类别图像之间的关键差异是细微的,且通常是局部的在对象的某些特定部分,最新的性能最佳的WFGIC系统致力于使用基于启发式方案或学习的方法查找局部判别性patch。首先使用显著性提取和共分割来定位对象,然后应用两个定义的空间约束从大量候选patch中选择可区本文档来自技高网...

【技术保护点】
1.一种基于相关性引导的判别学习的弱监督细粒度图像分类算法,其特征在于,两个子网络:/n(1)判别性区域分组DRG子网络/n在该子网络中提出一种新的方法去建立区域之间的联系;给定输入特征表示M

【技术特征摘要】
1.一种基于相关性引导的判别学习的弱监督细粒度图像分类算法,其特征在于,两个子网络:
(1)判别性区域分组DRG子网络
在该子网络中提出一种新的方法去建立区域之间的联系;给定输入特征表示MI∈RC×H×W,将输入的特征表示输入到判别区域分组模块F中:
MR=f(MI),(1)
其中,F由三个区域生成层、一个关系层和一个融合层组成;MR∈RC×H×W,其中W,H表示特征表示的宽度和高度,C表示通道数;
区域生成层是通过卷积运算和矩阵变换来计算的,如下所示:
MT=f(WI·MI+bT),(2)
其中,WT∈RC×1×1×C和bT分别是卷积层的学习权重参数和偏差向量;1×1是卷积核的大小;MT∈RC×H×W表示新特征图;具体来说,将1×1卷积滤波器视为小区域检测器;MT的固定空间位置处的通道上的每个VT∈RC×1×1向量代表原始图像中相应位置的一个小区域;
为了获得区域之间的相关权重系数,引入一个关系层去进行两个由区域生成层计算得来的特征图和的乘法域的比较;
两个位置的单个相关:将第一张特征图中的p1和第二张特征图的p2两个位置的相关性定义为



其中,V1和V2分别表示不同特征图中的区域特征向量;在实际操作中,对于第一张特征图中的每个位置p1,计算其与第二张地图中所有位置的相关性;
对于两个位置的每个组合,都获得一个相关值;具体来说,在通道中组织相对位移,并获得一个输出相关特征图MC∈RK×H×W,其中K=W×H是输入特征图的区域;然后,MC经过softmax层以生成判别性相关权重图R∈RK×H×W:



在正向传播的过程中,区域的判别性越高,它们之间的相关性就越大;对于反向传播,相应地针对每个bottomblob进行求导;当分类的概率值较低时,惩罚将被反向传播以降低两个区域的相关性权重,并且同时更新通过区域生成层计算出的特征表示;
接下来,将由第三个区域生成器层生成的特征向量和相关性权重图R输入融合层f中:






其中,是的wth行和whth列的向量,Rijk是第ith行第jth列第kth通道的权重系数;在MF中第ith行第jth列的向量通过将所有位置向量与相应的相关性系数进行组合来计算,其中特征图与相关性权重系数图R之间的索引映射关系是k=(w-1)×W+h;
提出残差学习:
MR=α·MF+MI,(7)
其中,α是自适应权重参数,并逐渐训练学习为判别性相关特征分配更多权重;α的范围是[0,1],初始化值为0;MR包含自适应判别性相关特征和原始输入特征,以挑选出更多判别性patch;
(2)挑选判别性patch
根据目标检测,从三个不同尺度的特征图生成默认patch;不同层的特征图具有不同的感受野RF;根据每个特征图的相应RF设计patch的尺度大小,缩放步长和纵横比,以使不同的特征图对不同大小的判别区域负责;
对于特征图MR,将残差特征MR输入评分层;具体来说,添加一个1×1×N卷积层和一个sigmoid函数σ来学习判别性概率图S∈RK×H×W,表明的是判别性区域对最终分类结果的影响;
S=σ(Ws·MR+bS),(8)
其中,WS∈RC×...

【专利技术属性】
技术研发人员:王智慧王世杰李豪杰唐涛
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1