System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于对比损失的两步骤带噪标签样本学习方法技术_技高网

一种基于对比损失的两步骤带噪标签样本学习方法技术

技术编号:41186467 阅读:4 留言:0更新日期:2024-05-07 22:18
本发明专利技术提出一种基于对比损失的两步骤带噪标签样本学习方法,该方法针对现有两步骤噪声样本学习方法LongReMix存在的问题,如类别数较多的噪声数据集表现较差,对噪声类型敏感等,首先引入鲁棒性损失函数预训练两个模型以减轻对噪声类别的敏感性,其次在两个步骤中均引入对比损失与SSL技术结合,使模型可以学习更多无标签样本的特征信息从而提高模型鲁棒性。

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域,具体涉及一种基于对比损失的两步骤带噪标签样本学习方法


技术介绍

1、深度神经网络(deep neural networks,dnn)在计算机视觉领域取得巨大成功的一部分关键因素可以归功于那些大规模且具有准确标注的数据集,然而这类数据集的收集耗资巨大,且不可避免的引入不干净标注(噪声标签,noisy labels)。现有训练方法易使dnn陷入过拟合,导致性能下降,因此噪声标签学习(learning with noisy labels,lnl)成为一个巨大挑战。

2、han等人(b.han,q.m.yao,x.r.yu,g.niu,m.xu,w.h.h,i.w.tsang,m.sugiyama,“co-teaching:robust training of deep neural networks with extremely noisylabels,”in proc.ieee conf.adv.neural inf.process.sys.,vol.31,2018.)从经验角度发现训练中损失小的样本更有可能含有干净标签,因此同时训练两个相同结构的模型根据样本损失互相筛选带有干净标签的样本,但其训练的模型测试性能较低。wei等人(h.x.wei,l.feng,x.y chen,b.an,″combating noisy labels by agreement:a jointtraining method with co-regularization,”in proc.ieee conf.on comput.vis.andpattern recognit.,2020.)引入联合正则化项来训练两个模型,使两个模型对于同一样本的输入趋于一致,从而提高模型测试性能,但是其在真实噪声数据集上表现较差。由于上述方法仅筛选出干净样本进行训练,对于剩余样本直接丢弃,因此模型不能学习足够的特征信息,导致性能的下降。因此li等人(j.li,r.socher,s.hoi,“dividemix:learning withnoisy labels as semi-supervised learning,”in proc.int.conf.onlearn.represent.,2020.)将筛选后的剩余样本的标签移除即无标签集合,然后引入现有的半监督学习方法(semi-supervised learning,ssl)对筛选后的两个子集(干净样本集及无标签集)进行训练,取得了较好的效果,但该方法在高噪声比率下表现较差,同时对于类别数较多的数据集也不太适用。li等人(s.k.li,x.b.xia,s.m.ge,t.l.liu,″selective-supervised contrastive learning with noisy labels,”in proc.ieee conf.oncomput.vis.and pattern recognit.,2022,pp.316-325,doi:10.1109/cvpr52688.2022.00041.)将对比学习引入到噪声标签学习领域,与ssl技术结合,取得了一定的成果,但是其需要调整较多参数,因此在实际中不太适用。盛猛猛等人(“基于类别平衡样本选择的含噪声标签图像识别方法及系统cn202311453720.9”)首先基于损失shaixu暗处干净样本子集,然后对子集中样本进行置信度增强从而获取一个增强子集进行训练,取得了一定的进展,但是该方法在高噪声比率下表现较差。程乐超等人(“一种基于类原型清洗去噪的图像分类方法及装置cn202311397429.4”)利用伪标签计算类别原型,并利用得到的类别原型对数据集进行划分,随后利用划分后的数据子集应用不同的损失进行训练以提高性能,然而考虑模型在高噪声比率下生成的伪标签通常不准确,因此该方法在实际应用中存在不足。此外,张迁等人(“一种基于类别均衡及交叉合并策略的噪声标签学习方法cn202311277266.6”)提出一种交叉合并训练策略,其在训练中周期性的将两个模型参数进行合并后重新分配给两个模型,可以显著提高模型精度,搭配类别均衡策略取得了不错的进展,但该方法训练时间较长。上述使用ssl技术进行训练的噪声学习方法均将样本选择和鲁棒性训练这两个优化目标在同一个迭代轮次(epoch)中进行求解,因此被称为一步骤框架。一步骤框架方法由于需要在同一epoch中求解两个优化目标,由于两个目标互相耦合,因此使模型训练过程复杂化且增加了优化难度。因此cordeiro等人(f.r.cordeiro,r.sachdeva,v.belagiannis,i.reid,g.carneiro,″longremix:robust learning withhigh confidence samples in a noisy label environment,″in pattern recognit.,vol.133,2023,doi:10.1016/j.patcog.2022.109013)将样本选择和鲁棒性训练解耦成两个单独的优化目标,分成两个步骤进行优化,该方法受到li等人的dividemix方法的启发,首先在第一个步骤中进行干净样本的最精细化筛选目标的求解,而在第二个步骤中通过对第一步取得的干净样本集合进行扩充,以提高模型鲁棒性和测试性能为目标,但该方法由于直接在dividemix基础上进行改进,因此继承了其对高噪声数据集和类别数较多数据集表现较差的问题。


技术实现思路

1、本专利技术针对现有技术中的不足,提供一种基于对比损失的两步骤带噪标签样本学习方法,该方法针对现有两步骤噪声样本学习方法longremix存在的问题,如类别数较多的噪声数据集表现较差,对噪声类型敏感等,首先引入鲁棒性损失函数预训练两个模型以减轻对噪声类别的敏感性,其次在两个步骤中均引入对比损失与ssl技术结合,使模型可以学习更多无标签样本的特征信息从而提高模型鲁棒性。

2、为实现上述目的,本专利技术采用以下技术方案:

3、一种基于对比损失的两步骤带噪标签样本学习方法,包括:

4、步骤1、选择相同结构的两个dnn模型,定义其为第一dnn模型和第二dnn模型;基于给定的初始噪声标签数据集对两个dnn模型进行第一次预训练和第一次正式训练;所述初始噪声标签数据集由图片样本和图片样本的含噪声标签组成;

5、通过第一次预训练得到具有初步判别能力的第一dnn模型和第二dnn模型后,在第一次正式训练中,利用所述第一dnn模型和第二dnn模型从初始噪声标签数据集中筛选干净样本,以构建干净样本集,并将干净样本的索引标记为true值;

6、步骤2、重新初始化所述的两个dnn模型,基于给定的初始噪声标签数据集对初始化后的两个dnn模型进行第二次预训练和第二次正式训练;

7、通过第二次预训练得到具有初步判别能力的第一dnn模型和第二dnn模型后,在第二次正式训练的每轮迭代中:

8、利用第一dnn模型标记初始噪声标签数本文档来自技高网...

【技术保护点】

1.一种基于对比损失的两步骤带噪标签样本学习方法,其特征在于,包括:

2.如权利要求1所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,步骤1具体包括:

3.如权利要求1所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,步骤2具体包括:

4.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,步骤1.2中,所述GCE损失函数具体为:

5.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,步骤1.31中,按照以下公式选择在第一历史序列S1中最后连续K个迭代轮次中均标记为True的样本放入第一有标签集合将除此之外的其它样本放入第一无标签集合

6.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,步骤1.32中,按照以下公式仅选择在第二历史序列S2中最后连续K个迭代轮次中均标记为True的样本放入第二有标签集合将除此之外的其它样本放入第二无标签集合

7.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,步骤1.33具体为:

8.如权利要求2或3所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,利用GMM估计样本当前的损失分布概率wi的方法为:

...

【技术特征摘要】

1.一种基于对比损失的两步骤带噪标签样本学习方法,其特征在于,包括:

2.如权利要求1所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,步骤1具体包括:

3.如权利要求1所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,步骤2具体包括:

4.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,步骤1.2中,所述gce损失函数具体为:

5.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法,其特征在于,步骤1.31中,按照以下公式选择在第一历史序列s1中最后连续k个迭代轮次中均...

【专利技术属性】
技术研发人员:张迁朱祎杨明陈虬
申请(专利权)人:江苏开放大学江苏城市职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1