【技术实现步骤摘要】
基于特征比较的通道注意力机制的细粒度图像识别方法
本专利技术属于深度学习、计算机视觉及细粒度图像分类领域,具体涉及了一种基于特征比较的通道注意力机制的细粒度图像识别方法、系统及装置。
技术介绍
图像分类是计算机视觉中一个经典而重要的任务。近年来随着深度学习在计算机视觉中取得极大成功,图像分类任务取得了很大进展。在此基础上,越来越多的具体应用场景需要被特别研究。在一些场景下,相似物体之间的图像识别具有非常重要的应用价值。比如,在鸟类研究中,识别出鸟的种类往往是研究的第一步。如果能够准确且自动识别出具有相似外表但不同种类的鸟,则能够减少学者在鸟类识别上的精力投入,进而极大地方便后续研究。类似的细粒度图像识别还包括车辆识别、飞行器识别、花的识别和狗的识别等。细粒度图像识别对象的特点决定了该任务具有很大的挑战。由于其识别对象原则上属于同一大类下的不同子类,因此它们之间的差别非常细微,即具有较小的类间差;又由于物体形态本身的多样性,如鸟类的飞行、站立、划水等,以及拍摄场景的多样性,如拍摄天气、光照、角度、焦距等,即便属于同一子类的样本 ...
【技术保护点】
1.一种基于特征比较的通道注意力机制的细粒度图像识别方法,其特征在于,该细粒度图像识别方法包括:/n步骤S10,通过训练好的特征提取网络提取待识别细粒度图像的特征图;所述特征提取网络基于深度卷积神经网络构建;/n步骤S20,对所述特征图进行非线性映射,并对每个特征通道的特征进行平均池化,获得基本特征向量x
【技术特征摘要】
1.一种基于特征比较的通道注意力机制的细粒度图像识别方法,其特征在于,该细粒度图像识别方法包括:
步骤S10,通过训练好的特征提取网络提取待识别细粒度图像的特征图;所述特征提取网络基于深度卷积神经网络构建;
步骤S20,对所述特征图进行非线性映射,并对每个特征通道的特征进行平均池化,获得基本特征向量xi;其中,i=1,2,…,d为特征通道的标记,d为特征向量的维度;
步骤S30,将所述基本特征向量xi输入训练好的分类器,获取待识别细粒度图像的分类结果。
2.根据权利要求1所述的基于特征比较的通道注意力机制的细粒度图像识别方法,其特征在于,所述特征提取网络和所述分类器,其训练中引入基于特征比较的通道注意力机制,其训练方法为:
步骤A10,通过特征提取网络提取设定数量的一批训练样本的特征图,并进行非线性映射以及平均池化,获得基本特征向量集;获取所述一批训练样本的样本标签集;
步骤A20,将每一个基本特征向量按照对应的标签划入相应的类别,并分别计算每个类别的平均特征向量;
步骤A30,通过所述基于特征比较的通道注意力机制的特征比较模块进行每一个训练样本的基本特征向量与其所在类别的平均特征向量的比较,并采用符号函数进行编码,获得编码结果集合;通过所述基于特征比较的通道注意力机制的基础注意力权重生成模块计算每一个训练样本对应的基本特征向量的基础注意力权重;所述基础注意力权重生成模块包括两层全连接神经网络;
步骤A40,通过所述基于特征比较的通道注意力机制的权重融合模块将每一个基本特征向量对应的编码结果和基础注意力权重进行融合,并通过设定的单调函数对融合结果进行映射,获得最终的注意力权重;
步骤A50,将所述最终的注意力权重按位赋予其对应的基本特征向量的每个通道,获得加权特征向量集;
步骤A60,将所述加权特征向量集输入分类器,并计算分类器输出结果与对应的样本标签的损失函数值;
步骤A70,通过反向传播方法向所述损失函数值变小的方向更新所述特征提取网络、分类器以及基础注意力权重生成模块的参数,并跳转步骤A10进行迭代训练,直至在验证集上的正确率达到设定阈值或达到设定的训练迭代次数,获得训练好的特征提取网络和分类器。
3.根据权利要求2所述的基于特征比较的通道注意力机制的细粒度图像识别方法,其特征在于,步骤A20中“分别计算每个类别的平均特征向量”,其方法为:
其中,Nj为属于第j个类别的训练样本数量,Xi为该类别的平均特征向量,d为特征向量的维度,为该类别中第k个训练样本的基本特征向量在第i个通道上的数值。
4.根据权利要求2所述的基于特征比较的通道注意力机制的细粒度图像识别方法,其特征在于,步骤A30中“进行每一个训练样本的基本特征向量与其所在类别的平均特征向量的比较,并采用符号函数进行编码”,其方法为:
Si=Sign(xi-Xi)
其中,xi和Xi分别为训练样本对应的基本特征向量和平均特征向量,si为通过符号函数对xi和Xi的比较结果进行编码的结果,sign(·)为符号函数,若xi≥Xi,则si=1,若xi<Xi,则si=-1,i表示第i个通道。
5.根据权利要求2所述的基于特征比较的通道注意力机制的细粒度图像识别方法,其特征在于,步骤A30中“通过所述基于特征比较的通道注意力机制的基础注意力权重生成模块计算每一个训练样本对应的基本特征向量的基础注意力权重”,其方法为:
α=sigmoid(w2*tanh(w1*x+b1)+b2)
其中,α为待求的基础注意力权重,w1和b1分别为基础注意力权重生成模块第一层神经网络的权重和偏移量,w2和b2分别为基础注意力权重生成模块第二层神经网络的权重和偏移量,t...
【专利技术属性】
技术研发人员:赵鑫,贾书坤,张靖,白岩,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。