【技术实现步骤摘要】
一种基于特征修正的细粒度图像分类方法及系统
[0001]本专利技术涉及一种细粒度图像分类方法,特别是涉及一种基于特征修正的细粒度图像分类方法、一种基于特征修正的细粒度图像分类系统。
技术介绍
[0002]近些年来,随着深度学习的发展,卷积神经网络已经成为一种非常重要的特征提取的方法之一。目前,卷积神经网络已经在图像分类,自然语言处理,目标检测等领域得到了广泛的应用。
[0003]传统的图像分类倾向于对不同种类的物品(如,猫,狗等)进行分类,但是对于同一种类下的物种(如Black_footed_Albatross(黑脚信天翁),Canada_Warbler(加拿大威森莺)等)的分类结果相对较差,因此细粒度视觉分类应运而生,成为研究热点。细粒度视觉分类,是计算机视觉领域的一项极具有挑战的研究课题。简单地说,它的目的是对一些基本的大类(例如,鸟,车,飞机等)进行再分类。相较于传统的视觉分类,由于姿态、光照、遮挡、背景等因素的影响,细粒度图像的类间差距更小,类内差距却更大,这就使得细粒度视觉分类更加具有挑战。
[00 ...
【技术保护点】
【技术特征摘要】
1.一种基于特征修正的细粒度图像分类方法,其用于在细粒度图像分类中,通过增大类间方差、缩小类内方差,实现对待处理图像的精准分类;其特征在于,所述细粒度图像分类包括如下步骤:S1:对训练集中的每个图像进行预处理得到相应的预处理图像;S2:构建基于特征修正的网络模型,通过所述网络模型的骨干网络提取出所述预处理图像的第L阶段的特征F
L
和第L
‑
1阶段的特征F
L
‑1;S3:通过移除类间的公共相似特征增大类间方差,得到第一分类损失;增大类间方差的方法具体如下:S31:将特征F
L
‑1输入通道注意力模型生成通道注意力图;S32:将所述通道注意力图输入空间注意力模型生成空间注意力图;S33:提取出全部的所述预处理图像中所有类的公共原型;在所述公共原型中学习类间的公共相似特征F
comm
;S34:从所述空间注意力图中移除公共相似特征得到类间修正特征F;S35:将所述类间修正特征F输入一个卷积块得到鉴别特征F5;S36:将所述鉴别特征F5输入第一分类器中得到所述第一分类损失L
cls1
;所述第一分类损失L
cls1
表达为:L
cls1
=
‑
∑y
·
log[C1(GMP(F5))]式中,C1(.)表示用于分类的第一分类器,GMP(.)表示全局最大池化,y代表图像的真值标签;S4:采用中心损失缩小类内方差,得到第二分类损失;缩小类内方差的方法具体如下:S41:将特征F
L
输入一个注意力卷积块中得到一个注意力特征F
attention
;S42:将所述注意力特征F
attention
={f1,f2,f3,
…
,f
M
}与所述特征F
L
进行双线性融合得到双线性特征B;所述双线性特征B表达为:式中,g(.)表示全局最大池化或者全局平均池化,<.>表示concate操作,是双线性特征,M是注意力特征的通道数,C
L
是第L阶段的通道数;S43:采用中心损失最小化所述双线性特征B和类中心特征的差异,进而将所述双线性特征输入第二分类器中得到所述第二分类损失L
cls2
;其中,所述中心损失L
center
表达为:式中,N表示标签类别的总数,k={1,2,3,
……
,N},表示L2范数,表示第k个类的类中心特征向量,B
k
是第k个类的双线性特征;所述第二分类损失L
cls2
表达为:L
cls2
=
‑
Σy
·
log[C2(GMP(F
L
))]式中,C2(.)表示用于分类的第二分类器;
S5:对第一分类损失、第二分类损失和中心损失进行加权求和得到整体损失L
total
,利用反向传播的方法对所述网络模型进行训练;其中,所述整体损失L
total
表达为:L
total
=αL
cls1
+βL
cls2
+L
center
式中,α、β均为人工设置的超参数;S6:将细粒度数据集中的待分类图像输入训练后的网络模型,得到每个所述待处理图像对应的预测类别,进而根据所述预测类别对所述细粒度数据集进行分类;所述待分类图像的类别y
*
表示为:式中,argmax(.)为求参数最大值的函数。2.根据权利要求1所述的基于特征修正的细粒度图像分类方法,其特征在于,在步骤S31中,所述通道注意力图的生成方法具体如下:S311:对特征F
L
‑1分别进行全局平均池化和全局最大池化得到两个通道描述算子;S312:将两个所述通道描述算子输入一个多层感知机中得到对应的两个增强的通道描述算子;S313:将两个所述增强的通道描述算子采用逐元素相加的方式进行融合,经过激活函数得到通道权重A
c
;S314:将所述通道权重A
c
与特征F
L
‑1进行逐元...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。