【技术实现步骤摘要】
一种基于基类样本特征合成的小样本图像分类方法
[0001]本专利技术涉及小样本图像分类
,具体涉及一种基于基类样本特征合成的小样本图像分类方法。
技术介绍
[0002]图像分类是机器学习和计算机视觉领域中的一项非常重要的基础性课题,在诸如目标检测、行人重识别、目标跟踪等众多前沿研究领域中起着至关重要的作用。近年来,伴随着大量标签图像数据的出现,该领域利用深度学习技术取得突破性进展。但是只从少量图像数据中就快速形成并理解一个新的概念,对于深度神经网络来说仍然是一个非常巨大的挑战。小样本学习旨在标注数据非常少的情况下完成相关学习任务,是解决上述问题的主要方法。而在图像分类任务中,小样本学习技术利用少量的训练样本完成图像的分类决策。
[0003]小样本图像分类任务中存在的根本问题在于每类样本数量太少从而导致无法精确地刻画每类样本的分布。因而,在原图像空间对图像样本集进行扩充或者在特征空间进行增强是解决该问题的有效方式。目前,已经出现了若干基于数据增强的小样本图像分类方法。例如Chen等(Chen Z T,FuYW,Chen KY,Jiang Y G.Image block augmentation for one
‑
shot learning.[C]//Proceedings of the 34th AAAI Conference on Artificial Intelligence,Hawaii,USA,2019:3379
‑
3386.)通过将相似的无标签图像中某些小块代
【技术保护点】
【技术特征摘要】
1.一种基于基类样本特征合成的小样本图像分类方法,其特征在于,包括以下步骤:步骤1:对于给定的数据集D,确定待处理的基类数据集D
base
和新类数据集D
novel
;其中表示基类数据集中第c个类别数据样本集合,x
m
表示第m个基类图像样本,y
m
表示其对应的标签,C
b
表示基类数据集中的类别总数,N
c
为第c个类别基类数据样本的数目;在D
novel
上构建N
‑
way
‑
K
‑
shot分类任务,每个分类任务由支持样本集和查询样本集组成,其中x
s
表示第s个支持样本,y
s
表示对应的标签,x
q
表示第q个查询样本;步骤2:从基类数据集D
base
中随机抽取M个图像样本,使用图像增强技术将其扩充为2M个样本,然后将其输入到参数为α的编码器E(
α
)和参数为β的投影器P(
β
)中,得到由2M个数据特征组成的集合其中u
m
表示第m个图像样本的特征,y
m
为其对应的标签;假定集合中任意数据为锚点,并将其作为正例样本,将集合A(m)中与该锚点标签的所有样本视为正例样本,构建正例样本集合P(m),而集合A(m)中的所有剩余样本为负例样本,构建负例样本集合N(m);计算关于正例样本集合P(n)与负例样本集合N(n)之间的监督对比损失,计算该损失函数关于参数的梯度,并利用梯度下降算法对编码器E(
α
)中参数α和投影器P(
β
)中参数β进行优化;步骤3:将步骤2中预训练好的编码器E(
α
)作为特征提取器,对基类数据集中的所有样本提取特征,并计算每类样本的原型;假定基类数据集中所有类的原型集合为其中P
c
为基类数据集中第c个类别的原型;步骤4,将步骤2中预训练好的编码器E(
α
)作为特征提取器,对新类数据集中的支持图像样本提取特征,并计算每类支持样本的原型特征;假设第n个类别的原型表示为P
n
,利用cosine相似性计算其与基类原型数据集P
base
的L个近邻,然后在P
n
与其每个近邻基类原型之间线性合成产生新的样本特征;步骤5:利用增广后的支持样本数据集对逻辑回归分类器进行训练;步骤6:将步骤2中预训练好的编码器E(
α
)作为特征提取器,对新类数据集中的查询图像样本提取特征,利用训练好的逻辑回归分类器进行测试。2.根据权利要求1所述的一种基于基类样本特征合成的小样本图像分类方法,其特征在于,所述步骤1的具体步骤如下:将训练集D
train
作为基类数据集D
base
,测试集D
test
作为新类数据集D
novel
,在D
novel
数据集中随机抽取N个类别,每个类别中随机抽取K个样本,得到支持样本集其中x
s
表示第s个支持样本,y
s
表示对应的标签,再在N个类别中的剩余数据中抽取一批样本得到查询样本集其中x
q
表示第q个查询样本。3.根据权利要求1所述的一种基于基类样本特征合成的小样本图像分类方法,其特征在于,所述步骤2 中,基于监督对比损失函数的优化过程如下:(1)从D
train
抽取M个图像样本作为训练的批图像样本集D
M
,对于其中的第i个基类图像
样本x
i
,利用增强技术对其增强得到并将其添输入到编码器E(
α
)和投影器P(
β
)得到相...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。