一种基于近邻锚点标签纠正的含噪声标签图像分类方法技术

技术编号:44868383 阅读:27 留言:0更新日期:2025-04-08 00:10
本发明专利技术涉及一种基于近邻锚点标签纠正的含噪声标签图像分类方法包括:对图像分类模型预热训练;将带有噪声标签的图像数据集划分为干净子集与噪声子集,针对干净子集和噪声子集使用监督学习与半监督学习相结合的方式训练图像分类模型;计算干净子集中各类别样本的置信度;根据各类别样本的置信度从噪声子集中选取潜在可被纠正样本;从干净子集中选取潜在可被纠正样本的k个最近邻样本,并计算和其k个最近邻样本的mixup预测一致性;将预测一致的潜在可被纠正样本从噪声子集转移到干净子集;更新噪声子集和干净子集,对干净子集和噪声子集使用监督学习与半监督学习相结合的方式训练图像分类模型,重复执行上述步骤得到训练好的图像分类模型。

【技术实现步骤摘要】

本专利技术属于图像分类领域,特别是涉及一种基于近邻锚点标签纠正的含噪声标签图像分类方法


技术介绍

1、类模型的性能依赖于大规模准确标注的数据集,这限制了模型的发展。获取大量准确标注的图像数据是昂贵且耗时的,特别是在专业领域,需要领域专家进行标注,导致大规模准确标注的数据集难以获得。

2、为了解决这个问题,常用做法是通过众包方式让非专业人员进行标注,或从互联网搜索引擎等获取数据集。虽然这种方法解决了数据集难以获取、价格高昂的问题,但会导致数据中存在大量错误标注,即噪声标签。实验表明,深度神经网络甚至能够学习到完全随机生成的噪声数据。因此,含有噪声标签的数据集会影响模型学习到正确的类别边界,导致泛化性差,甚至在噪声率过高时会导致训练失败。

3、目前在噪声标签学习领域,基于样本选择的方法被认为是最有潜力的一种方案。通过样本选择方法,如小损失准则,将数据集划分为干净数据集与噪声数据集,并对两者采用不同的学习方式。然而,当前的方法对噪声数据子集的利用并不充分,单纯的半监督学习方式没有充分挖掘噪声标签的潜力,特别是在高噪声率下,模型由于缺乏足本文档来自技高网...

【技术保护点】

1.一种基于近邻锚点标签纠正的含噪声标签图像分类方法,其特征在于,包括:

2.根据权利要求1所述的一种基于近邻锚点标签纠正的含噪声标签图像分类方法,其特征在于,所述图像分类模型包括:特征提取器F(·)、特征投影器Hp(·)和分类器Hc(·);所述特征提取器F(·)用于对样本进行特征提取,所述分类器Hc(·)用于对特征提取器F(·)提取的特征进行分类,所述特征投影器Hp(·)用于对特征提取器F(·)提取的特征进行降维得到样本的低维特征。

3.根据权利要求2所述的一种基于近邻锚点标签纠正的含噪声标签图像分类方法,其特征在于,所述对图像分类模型进行预热训练包括:

...

【技术特征摘要】

1.一种基于近邻锚点标签纠正的含噪声标签图像分类方法,其特征在于,包括:

2.根据权利要求1所述的一种基于近邻锚点标签纠正的含噪声标签图像分类方法,其特征在于,所述图像分类模型包括:特征提取器f(·)、特征投影器hp(·)和分类器hc(·);所述特征提取器f(·)用于对样本进行特征提取,所述分类器hc(·)用于对特征提取器f(·)提取的特征进行分类,所述特征投影器hp(·)用于对特征提取器f(·)提取的特征进行降维得到样本的低维特征。

3.根据权利要求2所述的一种基于近邻锚点标签纠正的含噪声标签图像分类方法,其特征在于,所述对图像分类模型进行预热训练包括:

4.根据权利要求2所述的一种基于近邻锚点标签纠正的含噪声标签图像分类方法,其特征在于,所述利用无监督对比学习的方式对特征提取器f(·)和特征投影器hp(·...

【专利技术属性】
技术研发人员:孙开伟邹运生江操正田蜜
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1