一种用于图像分类的半监督主动学习方法技术

技术编号：36855705 阅读：17 留言：0更新日期：2023-03-15 17:45

本发明专利技术公开了一种本发明专利技术提出了基于图像增强的半监督主动学习的分类方法及装置，其中该方法将一致性正则化与熵最小化结合应用到主动学习中，在计算一致性正则项的同时隐式地包含了熵最小化；并利用弱图像增强后的未标记样本获取伪标签，在获取伪标签的时利用温度锐化函数来使用熵最小化；并通过计算同一未标记样本在弱图像增强和强图像增强后的JS散度来挑选存在差异性较大的样本进行人工标注，通过新的样本图像集对模型进行训练，从而使得分类模型充分利用无标签样本的特征，提高模型的分类精度。类精度。类精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于图像分类的半监督主动学习方法

[0001]本专利技术属于图像处理
，尤其涉及一种用于图像分类的半监督主动学习方法。

技术介绍

[0002]目前，图像分类方法主要是基于深度特征学习的方法，基于深度特征学习的方法严重依赖于大规模样本，而构建大量标记样本的高成本在一定程度上限制了该方法的发展。目前，将主动学习应用到图像分类是缓解该问题的一个方法，使用经主动学习筛选出来的信息量丰富的样本进行图像分类，利用少的标记样本同样可以得到高的分类精度，与监督学习的方法相比，能显著降低样本数据集的标记成本，但存在着传统的主动学习仅使用标记样本进行训练，未标记的样本都被忽略的技术问题。
[0003]而半监督学习在训练模型的过程中只引入未标记样本，无法充分利用有标签样本的特征，存在着分类模型的精度低的技术问题。
[0004]为此，一种新的半监督与主动学习的方法有待提出，以解决上述半监督学习或者主动学习存在的技术问题。

技术实现思路

[0005]本专利技术的目的是提供一种用于图像分类的半监督主动学习方法，以解决现有技术中存在的无法充分利用无标签样本的特征，存在着分类模型的精度低的技术问题。
[0006]本专利技术采用以下技术方案：
[0007]本专利技术实施例一提供了一种用于图像分类的半监督主动学习方法，包括
[0008]获取第一标记样本图像集和第一未标记样本图像集；
[0009]对第一标记样本图像集进行强图像增强处理，得到第一处理样本图像集；
[0010]...

【技术保护点】

【技术特征摘要】
1.一种用于图像分类的半监督主动学习方法，其特征在于，包括获取第一标记样本图像集和第一未标记样本图像集；对所述第一标记样本图像集进行强图像增强处理，得到第一处理样本图像集；对所述第一未标记样本图像集进行弱图像增强处理，得到第二处理样本图像集；对所述第一未标记样本图像集进行强图像增强处理，得到第三处理样本图像集；对所述第一处理样本图像集进行预测，得到第一标签分布概率；对所述第二处理样本图像集进行预测，得到第二标签分布概率；对所述第三处理样本图像集进行预测，得到第三标签分布概率；根据所述第一标签分布概率对所述第二标签分布概率进行标签分布对齐，得到对齐后的分布概率；对所述对齐后的分布概率进行锐化，获取未标记样本的伪标签；根据所述第一标签分布概率计算第一损失，根据所述第一损失对所述分类模型进行训练，所述第一损失表征全监督损失；根据所述伪标签和所述第三标签分布概率计算第二损失，根据所述第二损失对所述一致性正则化项进行训练，所述第二损失表征半监督损失。2.如权利要求1所述的一种用于图像分类的半监督主动学习方法，其特征在于，根据所述伪标签和所述第三标签分布概率计算第二损失包括：计算所述第三标签分布概率和所述伪标签的交叉熵，得到所述第二损失。3.如权利要求1所述的一种用于图像分类的半监督主动学习方法，其特征在于，所述方法还包括：计算所述第三标签分布概率和所述第二标签分布概率的JS散度。4.如权利要求3所述的一种用于图像分类的半监督主动学习方法，其特征在于，该方法还包括：根据所述JS散度，从所述第一未标记样本图像集中筛选出预设数量的未标记样本；对所述未标记样本进行人工标注，获取第二标记样本图像集。5.如权利要求4所述的一种用于图像分类的半监督主动学习方法，其特征在于，该方法还包括：将所述第二标记样本图像集追加至所述第一标记样本图像集，组...

【专利技术属性】
技术研发人员：李旭，王飞月，卫保国，李立欣，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人