【技术实现步骤摘要】
基于任务特定通道重构网络的细粒度小样本分类方法
[0001]本专利技术属于计算机视觉
,具体涉及一种基于任务特定通道重构网络的细粒度小样本分类方法。
技术介绍
[0002]与仅包含粗粒度类别的图像数据相比,细粒度视觉数据收集和标注的成本与难度更大,往往需要特定领域的专家级知识才能完成。对于细粒度分类任务而言,部分细粒度子类别可用的数据有限,例如:当一个物种的新细粒度子类别被发现时,其可用的数据样本往往非常稀缺。人类可以从少数带监督信息的样本中抽象出新的细粒度概念并快速分辨后续从属于相同类别的新样本,而当前深度学习下的细粒度分类方法仍需要大量带标注信息的样本进行训练,两者存在显著差异。受此启发,小样本方法成为解决细粒度任务面临的数据稀缺问题的重要手段。因此,近期有研究人员关注到细粒度小样本视觉分类方法,期望模型从数量受限的细粒度标注样本中(例如仅使用1个或5个细粒度的标注样本)学习在视觉上相似的细粒度类别的概念知识。
[0003]小样本学习领域相关技术飞速发展,为解决小样本设置下的细粒度问题提供了解决思路。然而细 ...
【技术保护点】
【技术特征摘要】
1.一种基于任务特定通道重构网络的细粒度小样本分类方法,其特征在于,包括以下步骤;步骤S1:获取细粒度小样本分类数据集进行数据预处理,并完成标签提取;将数据集划分为D
base
、D
val
和D
novel
三个部分,按照episode模式进行N
‑
way K
‑
shot小样本元任务采样,得到查询集图像和N个类别的支持集图像;步骤S2:通过多维度动态卷积构建多维度动态特征提取网络,将所有支持集图像和查询集图像输入多维度动态特征提取网络中,分别得到各个类别的支持集和查询集的特征,计算支持集各个类别的原型特征;步骤S3:构建权值生成块,并输入第ch_i类的支持集特征得到第ch_i类支持集初始权值,将查询集特征输入权值生成块得到查询集初始权值,将第ch_i类支持集初始权值和查询集初始权值进行自适应聚合得到第ch_i类任务特定通道注意力权值,利用任务特定通道注意力权值重构支持集特征和查询集特征,以得到第ch_i类的支持集重构特征与第ch_i类的查询集重构特征;步骤S4:利用距离度量进行相似度评分得到查询集图像所属类别:在多个采样元任务上按照指定训练参数进行迭代训练,通过优化组合损失更新模型参数,根据验证准确率不断保存最优模型,计算最优模型在元测试阶段所有随机采样的episode的平均分类准确率。2.根据权利要求1所述的基于任务特定通道重构网络的细粒度小样本分类方法,其特征在于:步骤S1具体包括以下步骤:步骤S11:采用公开的细粒度小样本分类数据集,进行数据预处理完成标签提取;步骤S12:对于给定细粒度图像数据集D,将其划分为基础数据集D
base
、验证数据集D
val
和新类数据集D
novel
三个部分,分别表示为D
base
={(x
base_i
,y
base_i
),y
base_i
∈Y
base
}、D
val
={(x
val_i
,y
val_i
),y
val_i
∈Y
val
}以及D
novel
={(x
novel_i
,y
novel_i
),y
novel_i
∈Y
novel
},其中Y
base
∪Y
val
∪Y
novel
=Y,Y表示原始数据集的标签空间,Y
base
表示基础数据集的标签空间,Y
val
表示验证数据集的标签空间,Y
novel
表示新类数据集的标签空间;各个部分的类别互不相交,即基础数据集D
base
中的每个类别包含的标签样本多于验证数据集D
val
和新类数据集D
novel
中包含的标签样本;步骤S13:构建N
‑
way K
‑
shot细粒度小样本分类设置,元任务均基于episode进行随机采样;每个episode由支持集S和查询集Q构成,共包含N个细粒度类别,每个类别包含K+M个样本;对于某一个类别而言,对应的支持集仅包含K个标签图像样本,查询集包含M个无标签图像样本;将每个episode中的支持集S和查询集Q分别定义为图像样本;将每个episode中的支持集S和查询集Q分别定义为以此得到查询集图像和N个类别的支持集图像。3.根据权利要求2所述的基于任务特定通道重构网络的细粒度小样本分类方法,其特征在于:步骤S2具体包括以下步骤:步骤S21:构建多维度动态卷积方式:对于输入特征图fea_x,经过多维度动态卷积ODConv提取后的输出特征图表示为fea_x',fea_x'的具体计算方式如下
fea_x
′
=(a
f
⊙
a
c
⊙
a
s
⊙
CONV_W)*fea_x其中,a
f
为卷积核输出通道的注意力权值,其对构成输出特征图通道数量的不同卷积核赋予不同的注意力权重,a
c
为卷积核输入通道的注意力权值,其对卷积核不同的通道赋予不同的权重以动态地提取输入特征图不同通道的特征,c
out
表示输出通道数,c
cin
表示输入通道数;a
s
为卷积核空间注意力权值,其对卷积核不同空间位置赋予不同的注意力权重,a
s
∈R...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。