抵抗标签噪声的图像识别网络训练方法、装置、设备和介质制造方法及图纸

技术编号:40529254 阅读:12 留言:0更新日期:2024-03-01 13:49
本申请涉及一种抵抗标签噪声的图像识别网络训练方法、装置、设备和介质,通过将对图像识别网络进行迭代训练时,将上一次进行迭代训练时的图像识别网络作为教师网络,将当前次进行迭代训练时的图像识别网络作为学生网络,根据学生网络输出的预测结果以及对应的标签计算得到交叉熵损失,根据学生网络以及教师网络输出的预测结果计算得到自我非真蒸馏损失,根据交叉熵损失以及自我非真蒸馏损失得到总损失函数,最后利用总损失函数对图像识别网络中的可学习参数进行调整,直至收敛,得到训练好的图像识别网络。采用本方法可有效抵抗噪声标签对网络训练的干扰。

【技术实现步骤摘要】

本申请涉及图像分类任务,特别是涉及一种抵抗标签噪声的图像识别网络训练方法、装置、设备和介质


技术介绍

1、目前,神经网络在目标检测、语言翻译、图像分类等众多机器学习方法中都取得了令人瞩目的成就。这些方法的成功通常依赖于高质量的数据集。然而,在复杂的现实场景中,要获得准确标注的高质量数据集是昂贵且困难的。为提升效率和降低成本,研究人员通常会选择采用网络爬取或者众包等方式采集数据,通过这些方式得到的数据集不可避免地包含大量噪声标签。例如,拥有一千五百万张图片的imagenet数据集通过众包平台进行了三年的人工标注而完成。由于专业知识的限制和工作中的疏漏,人工标注过程难免会产生错误,导致采集得到的数据集中存在一部分错误标记的标签。另外,在医疗方面,可能会遇到一些复杂难辨的医疗数据。即使是经验丰富的病理学家,也无法给出完全可信的诊断结果,这就导致标注医疗相关数据集的过程也会不可避免地产生一些错误标记的标签。在一些更复杂的现实情形中,受到数据质量问题、数据编码问题以及通信问题等的影响,实际采集到的数据集甚至可能仅包含少量的干净标签。这些噪声标签的存在会对网络的训练本文档来自技高网...

【技术保护点】

1.一种抵抗标签噪声的图像识别网络训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的图像识别网络训练方法,其特征在于,所述图像样本对应的标签为真值标签或噪声标签。

3.根据权利要求2所述的图像识别网络训练方法,其特征在于,所述根据所述学生网络以及教师网络输出的预测结果计算得到自我非真蒸馏损失包括:

4.根据权利要求3所述的图像识别网络训练方法,其特征在于,所述总损失函数表示为:

5.根据权利要求4所述的图像识别网络训练方法,其特征在于,所述自我非真蒸馏损失为:

6.一种抵抗标签噪声的图像识别网络训练装置,其特征在于,...

【技术特征摘要】

1.一种抵抗标签噪声的图像识别网络训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的图像识别网络训练方法,其特征在于,所述图像样本对应的标签为真值标签或噪声标签。

3.根据权利要求2所述的图像识别网络训练方法,其特征在于,所述根据所述学生网络以及教师网络输出的预测结果计算得到自我非真蒸馏损失包括:

4.根据权利要求3所述的图像识别网络训练方法,其特征在于,所述总损失函数表示为:

5.根据权利要求4所...

【专利技术属性】
技术研发人员:杨绍武蓝龙李明龙黄达李雪琼王静怡
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1