一种用于图像分类的半监督主动学习方法技术

技术编号:36855705 阅读:17 留言:0更新日期:2023-03-15 17:45
本发明专利技术公开了一种本发明专利技术提出了基于图像增强的半监督主动学习的分类方法及装置,其中该方法将一致性正则化与熵最小化结合应用到主动学习中,在计算一致性正则项的同时隐式地包含了熵最小化;并利用弱图像增强后的未标记样本获取伪标签,在获取伪标签的时利用温度锐化函数来使用熵最小化;并通过计算同一未标记样本在弱图像增强和强图像增强后的JS散度来挑选存在差异性较大的样本进行人工标注,通过新的样本图像集对模型进行训练,从而使得分类模型充分利用无标签样本的特征,提高模型的分类精度。类精度。类精度。

【技术实现步骤摘要】
一种用于图像分类的半监督主动学习方法


[0001]本专利技术属于图像处理
,尤其涉及一种用于图像分类的半监督主动学习方法。

技术介绍

[0002]目前,图像分类方法主要是基于深度特征学习的方法,基于深度特征学习的方法严重依赖于大规模样本,而构建大量标记样本的高成本在一定程度上限制了该方法的发展。目前,将主动学习应用到图像分类是缓解该问题的一个方法,使用经主动学习筛选出来的信息量丰富的样本进行图像分类,利用少的标记样本同样可以得到高的分类精度,与监督学习的方法相比,能显著降低样本数据集的标记成本,但存在着传统的主动学习仅使用标记样本进行训练,未标记的样本都被忽略的技术问题。
[0003]而半监督学习在训练模型的过程中只引入未标记样本,无法充分利用有标签样本的特征,存在着分类模型的精度低的技术问题。
[0004]为此,一种新的半监督与主动学习的方法有待提出,以解决上述半监督学习或者主动学习存在的技术问题。

技术实现思路

[0005]本专利技术的目的是提供一种用于图像分类的半监督主动学习方法,以解决现有技术中存在的无法充分利用无标签样本的特征,存在着分类模型的精度低的技术问题。
[0006]本专利技术采用以下技术方案:
[0007]本专利技术实施例一提供了一种用于图像分类的半监督主动学习方法,包括
[0008]获取第一标记样本图像集和第一未标记样本图像集;
[0009]对第一标记样本图像集进行强图像增强处理,得到第一处理样本图像集;
[0010]对第一未标记样本图像集进行弱图像增强处理,得到第二处理样本图像集;
[0011]对第一未标记样本图像集进行强图像增强处理,得到第三处理样本图像集;
[0012]对第一处理样本图像集进行预测,得到第一标签分布概率;
[0013]对第二处理样本图像集进行预测,得到第二标签分布概率;
[0014]对第三处理样本图像集进行预测,得到第三标签分布概率;
[0015]根据第一标签分布概率对第二标签分布概率进行标签分布对齐,得到对齐后的分布概率;
[0016]对对齐后的分布概率进行锐化,获取未标记样本的伪标签;
[0017]根据第一标签分布概率和样本标签计算第一损失,根据第一损失对分类模型进行训练,第一损失表征全监督损失;
[0018]根据伪标签和第三标签分布概率计算第二损失,根据第二损失对一致性正则化项进行训练,第二损失表征半监督损失。
[0019]可选地,根据伪标签和第三标签分布概率计算第二损失包括:
[0020]计算第三标签分布和伪标签的交叉熵,得到第二损失;
[0021]可选地,方法还包括:
[0022]计算第三标签分布概率和第二标签分布概率的JS散度。
[0023]可选地,该方法还包括:
[0024]根据JS散度,从第一未标记样本图像集中筛选出预设数量的未标记样本;
[0025]对未标记样本进行人工标注,获取第二标记样本图像集。
[0026]可选地,该方法还包括:
[0027]将第二标记样本图像集追加至第一标记样本图像集,组成新的标记样本图像集;
[0028]根据新的标记样本图像集对分类模型进行训练。
[0029]可选地,分类模型的总损失为第一损失和第二损失的加权。
[0030]本专利技术实施例二提供了一种半监督主动学习的分类装置,该装置包括:
[0031]图像获取模块:用于获取第一标记样本图像集、第二未标记样本图像集和第一未标记样本图像集;
[0032]第一强图像增强模块:用于对第一标记样本图像集进行强图像增强处理,得到第一处理样本图像集;
[0033]弱图像增强模块:用于对第一未标记样本图像集进行弱图像增强处理,得到第二处理样本图像集;
[0034]第二强图像增强模块:用于对第一未标记样本图像集进行强图像增强处理,得到第三处理样本图像集;
[0035]第一预测模块,用于对第一处理样本图像集进行预测,得到第一标签分布概率;
[0036]第二预测模块,用于对第二处理样本图像集进行预测,得到第二标签分布概率;
[0037]第三预测模块,用于对第三处理样本图像集进行预测,得到第三标签分布概率;
[0038]对齐模块:用于根据第一标签分布概率对第二标签分布概率进行标签分布对齐,得到对齐后的分布概率;
[0039]锐化模块:用于对对齐后的分布概率进行锐化,获取未标记样本的伪标签;
[0040]第一损失计算模块:用于根据第一标签分布概率计算第一损失,根据第一损失对分类模型进行训练,第一损失表征全监督损失;
[0041]第二损失计算模块,用于根据伪标签和第三标签分布概率计算第二损失,根据第二损失对一致性正则化项进行训练,第二损失表征半监督损失。
[0042]本专利技术实施例三提供了一种半监督主动学习的分类装置,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现如上述实施例一中任一项的一种基于图像增强的半监督主动学习的分类方法。
[0043]本专利技术的有益效果是:
[0044]本专利技术提出了一种基于图像增强的半监督主动学习框架,将一致性正则化与熵最小化结合应用到主动学习中,在计算一致性正则项的同时隐式地包含了熵最小化。其中利用弱图像增强后的未标记样本获取伪标签,在获取伪标签的时利用温度锐化函数来使用熵最小化;并通过计算同一未标记样本在弱图像增强和强图像增强后的JS散度来挑选存在差异性较大的样本进行人工标注,通过新的样本图像集对模型进行训练,从而使得分类模型充分利用无标签样本的特征,提高模型的分类精度。
附图说明
[0045]图1为本专利技术实施例一提供的一种用于图像分类的半监督主动学习方法步骤图;
[0046]图2为本专利技术实施例一提供的一种用于图像分类的半监督主动学习方法步骤图示意图;
[0047]图3为:本专利技术实施例二提供的一种基于图像增强的半监督主动学习装置图;
[0048]图4为:本专利技术实施例二提供的一种图像特征提取网络结构示意图;
[0049]图5为:本专利技术实施例三提供的一种基于图像增强的半监督主动学习装置图;
[0050]图6为:本专利技术实施例一提供的一种用于图像分类的半监督主动学习方法的仿真结果图。
具体实施方式
[0051]下面结合附图和具体实施方式对本专利技术进行详细说明。
[0052]结合图1,本专利技术实施例一提供了一种用于图像分类的半监督主动学习方法,包括:
[0053]步骤S101:获取第一标记样本图像集和第一未标记样本图像集;
[0054]需要说明的是,第一标记样本图像集为初始标记样本图像集,用于进行初次主动学习;第一未标记样本图像集为需要进行弱增强和强增强处理的未标记样本图像集。
[0055]在一种实施例中,在本专利技术中对基于图像增强的半监督主动本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于图像分类的半监督主动学习方法,其特征在于,包括获取第一标记样本图像集和第一未标记样本图像集;对所述第一标记样本图像集进行强图像增强处理,得到第一处理样本图像集;对所述第一未标记样本图像集进行弱图像增强处理,得到第二处理样本图像集;对所述第一未标记样本图像集进行强图像增强处理,得到第三处理样本图像集;对所述第一处理样本图像集进行预测,得到第一标签分布概率;对所述第二处理样本图像集进行预测,得到第二标签分布概率;对所述第三处理样本图像集进行预测,得到第三标签分布概率;根据所述第一标签分布概率对所述第二标签分布概率进行标签分布对齐,得到对齐后的分布概率;对所述对齐后的分布概率进行锐化,获取未标记样本的伪标签;根据所述第一标签分布概率计算第一损失,根据所述第一损失对所述分类模型进行训练,所述第一损失表征全监督损失;根据所述伪标签和所述第三标签分布概率计算第二损失,根据所述第二损失对所述一致性正则化项进行训练,所述第二损失表征半监督损失。2.如权利要求1所述的一种用于图像分类的半监督主动学习方法,其特征在于,根据所述伪标签和所述第三标签分布概率计算第二损失包括:计算所述第三标签分布概率和所述伪标签的交叉熵,得到所述第二损失。3.如权利要求1所述的一种用于图像分类的半监督主动学习方法,其特征在于,所述方法还包括:计算所述第三标签分布概率和所述第二标签分布概率的JS散度。4.如权利要求3所述的一种用于图像分类的半监督主动学习方法,其特征在于,该方法还包括:根据所述JS散度,从所述第一未标记样本图像集中筛选出预设数量的未标记样本;对所述未标记样本进行人工标注,获取第二标记样本图像集。5.如权利要求4所述的一种用于图像分类的半监督主动学习方法,其特征在于,该方法还包括:将所述第二标记样本图像集追加至所述第一标记样本图像集,组...

【专利技术属性】
技术研发人员:李旭王飞月卫保国李立欣
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1