一种基于对比损失的两步骤带噪标签样本学习方法技术

技术编号：41186467 阅读：4 留言：0更新日期：2024-05-07 22:18

本发明专利技术提出一种基于对比损失的两步骤带噪标签样本学习方法，该方法针对现有两步骤噪声样本学习方法LongReMix存在的问题，如类别数较多的噪声数据集表现较差，对噪声类型敏感等，首先引入鲁棒性损失函数预训练两个模型以减轻对噪声类别的敏感性，其次在两个步骤中均引入对比损失与SSL技术结合，使模型可以学习更多无标签样本的特征信息从而提高模型鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域，具体涉及一种基于对比损失的两步骤带噪标签样本学习方法。

技术介绍

1、深度神经网络(deep neural networks，dnn)在计算机视觉领域取得巨大成功的一部分关键因素可以归功于那些大规模且具有准确标注的数据集，然而这类数据集的收集耗资巨大，且不可避免的引入不干净标注(噪声标签，noisy labels)。现有训练方法易使dnn陷入过拟合，导致性能下降，因此噪声标签学习(learning with noisy labels，lnl)成为一个巨大挑战。

2、han等人(b.han，q.m.yao，x.r.yu，g.niu，m.xu，w.h.h，i.w.tsang，m.sugiyama，“co-teaching：robust training of deep neural networks with extremely noisylabels，”in proc.ieee conf.adv.neural inf.process.sys.，vol.31，2018.)从经验角度发现训练中损失小的样本更有可能含有干净标签，因此同时训练两个相同结构的模型根据样本损失互相筛选带有干净标签的样本，但其训练的模型测试性能较低。wei等人(h.x.wei，l.feng，x.y chen，b.an，″combating noisy labels by agreement：a jointtraining method with co-regularization，”in proc.ieee conf.o

技术实现思路

1、本专利技术针对现有技术中的不足，提供一种基于对比损失的两步骤带噪标签样本学习方法，该方法针对现有两步骤噪声样本学习方法longremix存在的问题，如类别数较多的噪声数据集表现较差，对噪声类型敏感等，首先引入鲁棒性损失函数预训练两个模型以减轻对噪声类别的敏感性，其次在两个步骤中均引入对比损失与ssl技术结合，使模型可以学习更多无标签样本的特征信息从而提高模型鲁棒性。

2、为实现上述目的，本专利技术采用以下技术方案：

3、一种基于对比损失的两步骤带噪标签样本学习方法，包括：

4、步骤1、选择相同结构的两个dnn模型，定义其为第一dnn模型和第二dnn模型；基于给定的初始噪声标签数据集对两个dnn模型进行第一次预训练和第一次正式训练；所述初始噪声标签数据集由图片样本和图片样本的含噪声标签组成；

5、通过第一次预训练得到具有初步判别能力的第一dnn模型和第二dnn模型后，在第一次正式训练中，利用所述第一dnn模型和第二dnn模型从初始噪声标签数据集中筛选干净样本，以构建干净样本集，并将干净样本的索引标记为true值；

6、步骤2、重新初始化所述的两个dnn模型，基于给定的初始噪声标签数据集对初始化后的两个dnn模型进行第二次预训练和第二次正式训练；

7、通过第二次预训练得到具有初步判别能力的第一dnn模型和第二dnn模型后，在第二次正式训练的每轮迭代中：

8、利用第一dnn模型标记初始噪声标签数本文档来自技高网...

【技术保护点】

1.一种基于对比损失的两步骤带噪标签样本学习方法，其特征在于，包括：

2.如权利要求1所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，步骤1具体包括：

3.如权利要求1所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，步骤2具体包括：

4.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，步骤1.2中，所述GCE损失函数具体为：

5.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，步骤1.31中，按照以下公式选择在第一历史序列S1中最后连续K个迭代轮次中均标记为True的样本放入第一有标签集合将除此之外的其它样本放入第一无标签集合

6.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，步骤1.32中，按照以下公式仅选择在第二历史序列S2中最后连续K个迭代轮次中均标记为True的样本放入第二有标签集合将除此之外的其它样本放入第二无标签集合

7.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，步骤1.33具体为：

8.如权利要求2或3所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，利用GMM估计样本当前的损失分布概率wi的方法为：

...

【技术特征摘要】

1.一种基于对比损失的两步骤带噪标签样本学习方法，其特征在于，包括：

2.如权利要求1所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，步骤1具体包括：

3.如权利要求1所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，步骤2具体包括：

4.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，步骤1.2中，所述gce损失函数具体为：

5.如权利要求2所述的基于对比损失的两步骤带噪标签样本学习方法，其特征在于，步骤1.31中，按照以下公式选择在第一历史序列s1中最后连续k个迭代轮次中均...

【专利技术属性】
技术研发人员：张迁，朱祎，杨明，陈虬，
申请(专利权)人：江苏开放大学江苏城市职业学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人