【技术实现步骤摘要】
基于群表示特征的半监督学习图像分类方法
[0001]本专利技术属于计算机视觉中的半监督分类领域,提供了一种基于群表示特征的半监督学习分类方法。
技术介绍
[0002]深度学习模型已经成为计算机视觉应用的标准模型。它们的成功很大一部分取决于大型标注数据集的存在,比如,ImageNet,COCO等数据集提供了丰富的自然场景图片样本。根据经验来看,在较大的数据集上训练一般会得到性能更好地深度模型,深度学习通常通过有监督学习实现强大的性能,这就需要使用带有标签的数据。然而,对于有些任务来说,收集带标签数据是困难的,在进行人工标注的时候可能因为标志者的主观因素导致标注错误,或者标注数据需要专家知识,例如:医疗数据集,这会带来很大的成本消耗。相比之下,在大部分任务中,获取无标签数据是一件相对轻松的事情。
[0003]半监督学习就是一种不需要大量有标签数据就可以在大规模数据集上进行训练的有效方法,它通过允许模型学习未标记数据来大大减少对有标记数据的需求。许多半监督学习方法通常根据未标记数据对目标函数添加损失项,鼓励模型更好地归纳学习未标记数据的特征分布。目前,众多半监督学习方法中,一致性约束和伪标签是两种最常用的方法,同时也存在将两者相结合的方法。伪标签方法将模型对无标签数据的预测作为无标签数据的标签进行训练,而一致性约束方法将模型对无标签数据的预测分布作为标签进行训练。两种方法实现策略不同,但是从含义上都是对无标签数据生成人工标签进行训练。
[0004]在本项工作中,我们将沿用现有的SOTA方法的趋势,并结合基于 ...
【技术保护点】
【技术特征摘要】
1.基于群表示特征的半监督学习图像分类方法,其特征在于,步骤如下:步骤一:对图像数据集进行预处理;使用部分有标签图像,其余图像不使用标签;对每一张图片进行两种不同的数据增强方式,形成同一张图像的两种观察视角图像:(1)进行随机水平翻转,裁剪图像成32
×
32的尺寸并最后进行归一化处理,得到的图像称为弱增强图像;(2)进行随机水平翻转,裁剪图像成32
×
32的尺寸,随机图像增强策略并最后进行归一化处理,得到的图像称为强增强图像;有标签图像只使用弱增强图像,无标签数据使用弱增强图像和强增强图像;步骤二:构建两个相同的WiderResNet分类网络模型;分类网络模型的宽度和深度参数分别为10、28,其中一个分类网络模型作为基础模型P
base
,另一个分类网络模型作为经验模型P
exp
;使用不带Nesterov动量的SGD优化方法进行参数优化,初始学习率为1e
‑
2,权重衰减参数为1e
‑
3,并使用Cosine学习率衰减策略更新学习率;步骤三:计算有标签图像在基础模型上的分类误差;将有标签的弱增强图像I
L_w
输入基础模型P
base
得到对于输入图像的类别预测分布q
L_w
=P
base
(I
L_w
),根据标签P
b
,使用交叉熵损失H计算得到有标签数据的分类损失函数L
sup
:其中,B表示每一个batch的大小;步骤四:基础模型使用SGD优化器进行参数优化对于经验模型,根据基础模型P
base
的模型参数θ
t
,使用基于Momentum动量的加权平均方法更新经验模型P
exp
的参数θ
′
t
,下标t表示第t个迭代时,α为超参数:θ
′
t
=αθ
′
t
‑1+(1
‑
α)θ
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)步骤五:利用步骤四更新过后的经验模型,计算无标签数据部分的一致性约束损失L
consisteny
和伪标签损失L
pseudo
;将无标签弱增强图像I
uL_w
输入经验模型P
exp
得到经验特征F
uL_w
和对于输入图像的类别预测分布q
uL_w
=P
exp
(I
uL_w
),同时无标签强增强图像I
uL_s
输入基础模型P
base
得到基础特征F
uL_s
和对于输入图像的类别预测分布q
uL_s
=P
base
(I
uL_s
);其中,经验特征F
uL_w
和基础特征F
uL_s
是分类网络模型中最后...
【专利技术属性】
技术研发人员:孙俊,冒钟杰,吴豪,方伟,吴小俊,陈祺东,李超,
申请(专利权)人:匀熵科技无锡有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。