【技术实现步骤摘要】
基于相关学习的图传播的弱监督细粒度图像分类算法
本专利技术属于计算机视觉
,以提高细粒度图像分类准确性和效率为出发点,提出基于相关学习的图传播的弱监督细粒度图像分类算法。
技术介绍
作为一个新兴的研究主题,弱监督细粒度图像分类(WFGIC)专注于判别性细微差异,其仅使用图像级标签来区分子类别的对象。由于同一子类别中的图像之间的差异细微,拥有几乎相同的整体几何形状和外观,因此区分细粒度图像仍然是一项艰巨的任务。在WFGIC中,学习如何从细粒度图像中定位判别性部分起着关键作用。最近的工作可以分为两组。第一组是基于启发式方案来定位判别性部分。启发式方案的局限性在于,它们很难保证所选区域具有足够的判别性。第二类是通过学习机制进行的端到端本地化分类方法。但是,所有先前的工作都试图独立地定位判别性区域/patch,而忽略了区域的局部空间上下文以及区域之间的相关性。利用局部空间上下文可以提高区域的判别能力,而且挖掘区域之间的相关性比单个区域更具判别性。这启发将区域的局部空间上下文和区域之间的相关性纳入判别性patch选择中。为此,提出了一个交叉图传播(CGP)子网络,以学习区域之间的相关性。具体而言,CGP以交叉方式迭代计算区域之间的相关性,然后通过对其他区域进行相关权重加权来增强每个区域。通过这种方式,每个区域的特征都是对全局图像级上下文进行编码,即整个图像中聚合区域和其他区域之间的所有相关性,以及局部空间上下文,即该区域越靠近聚合区域,交叉图传播期间的聚合频率越高。在CGP中通过学习各区域之间的相关性,可 ...
【技术保护点】
1.一种基于相关学习的图传播的弱监督细粒度图像分类算法,其特征在于下面四个方面:/n(1)交叉图传播CGP/nCGP模块的图传播过程包括两个阶段:第一阶段是CGP学习每两个区域之间的相关权重系数;第二阶段,该模型通过交叉加权求和运算组合其相邻区域的信息,以寻找真正的判别性区域;通过计算整个图像中每两个区域之间的相关性,将全局图像级上下文集成到CGP中,并通过迭代的交叉聚合操作对局部空间上下文信息进行编码;/n给定输入特征图M
【技术特征摘要】
1.一种基于相关学习的图传播的弱监督细粒度图像分类算法,其特征在于下面四个方面:
(1)交叉图传播CGP
CGP模块的图传播过程包括两个阶段:第一阶段是CGP学习每两个区域之间的相关权重系数;第二阶段,该模型通过交叉加权求和运算组合其相邻区域的信息,以寻找真正的判别性区域;通过计算整个图像中每两个区域之间的相关性,将全局图像级上下文集成到CGP中,并通过迭代的交叉聚合操作对局部空间上下文信息进行编码;
给定输入特征图Mo∈RC×H×W,其中W,H,C分别是特征图的宽,高和通道数,将它输入到CGP模块F:
Ms=F(Mo),(1)
其中F由节点表示,相邻矩阵计算和图更新组成;Ms∈RC×H×W是输出特征图;节点表示:节点表示是通过简单的卷积运算f来生成的:
MG=f(WT·Mo+bT),(2)
其中WT∈RC×1×1×C和bT分别是学习的权重参数和卷积层的偏差向量;MG∈RC×H×W表示节点特征图;具体来说,我们将1×1卷积核视为小区域检测器;在MG的固定空间位置上的通道的每个VT∈RC×1×1向量代表图像对应位置上的一个小区域;使用生成的小区域作为节点表示;值得注意,WT是随机初始化的,并且初始的三个节点特征图是通过三种不同的f计算获得的:
相邻矩阵计算:在特征图中获得带有C维向量的W×H个节点后,构造了一个相关图以计算节点之间的语义相关性;相关图的相邻矩阵中的每个元素反映节点之间的相关强度;通过在两个特征图和之间计算节点向量内积来获得相邻矩阵;
以相邻矩阵中两个位置的一个关联为例;中的p1和中的p2的两个位置的相关性定义如下:
其中和分别代表p1和p2的节点表示向量;p1和p2必须满足特定的空间限制,即p2只能位于p1的同一行或同一列上;然后我们获得了中每个节点的W+H-1相关值;组织通道中的相对位移,并获得输出相关矩阵Mc∈RK×H×W,其中K=W+H-1;然后Mc通过softmax层以生成相邻矩阵R∈RK×H×W:
其中Rijk是第i行,第j列和第k个通道的相关权重系数;
图更新:将由节点表示生成阶段生成的和相邻矩阵R馈入更新操作:
其中是中第w行第h列的节点,(w,h)在集合[(i,1),...,(i,H),(1,j),...,(W,j)]中;节点通过在其垂直和水平方向具有相应的相关权重系数Rijk来更新;
与ResNet类似,采用残差学习:
Ms=α·MU+MO(6)
其中,α是自适应权重参数,它逐渐学习为判别性相关特征分配更多权重;它的范围是[0,1],并初始化为接近0;Ms会汇总相关特征和原始输入特征以挑选出更多判别性patch;将Ms作为新输入输入到CGP的下一个迭代中;
(2)判别性patch的采样
根据目标检测中特征金字塔网络的启发,从三个不同尺度的特征图生成默认patch;
在获得聚合了相关特征和原始输入特征的残差特征图Ms后,将其馈入判别式响应层...
【专利技术属性】
技术研发人员:王智慧,王世杰,李豪杰,唐涛,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。