【技术实现步骤摘要】
图像分类模型的训练方法、装置及电子设备
[0001]本公开涉及人工智能
,尤其涉及计算机视觉、深度学习
,尤其涉及一种图像分类模型的训练方法、装置及电子设备。
技术介绍
[0002]目前,图像分类模型的训练效果,取决于大规模可信赖的图像的获取,以及对图像的正确标注过程。然而,获取大规模可信赖的图像以及对图像的正确标注,是极其困难的。
[0003]相关技术中,训练数据中经常包含有部分错误标注的图像。采用该训练数据对图像分类模型进行训练时,训练得到的图像分类模型的准确度低。
技术实现思路
[0004]本公开提供了一种图像分类模型的训练方法、装置及电子设备。
[0005]根据本公开的一方面,提供了一种图像分类模型的训练方法,所述方法包括:获取训练数据,所述训练数据包括:样本图像,以及所述样本图像对应的样本类别;根据所述样本图像以及所述样本图像对应的样本类别,对初始的图像分类模型进行第一阶段训练,以获取所述样本图像在至少一个轮次的类别预测数据;根据所述样本图像的所述类别预测数据,确定所述样本图像对应的类别标注情况;根据所述样本图像、所述样本图像对应的样本类别以及类别标注情况,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型。
[0006]根据本公开的另一方面,提供了一种噪声标注检测器的训练方法,所述方法包括:获取参考训练数据,所述参考训练数据包括:样本图像,以及所述样本图像对应的样本类别以及类别标注情况;根据所述样本图像以及所述样本图像对应的样本类别,对初始的深 ...
【技术保护点】
【技术特征摘要】
1.一种图像分类模型的训练方法,包括:获取训练数据,所述训练数据包括:样本图像,以及所述样本图像对应的样本类别;根据所述样本图像以及所述样本图像对应的样本类别,对初始的图像分类模型进行第一阶段训练,以获取所述样本图像在至少一个轮次的类别预测数据;根据所述样本图像的所述类别预测数据,确定所述样本图像对应的类别标注情况;根据所述样本图像、所述样本图像对应的样本类别以及类别标注情况,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型。2.根据权利要求1所述的方法,其中,所述样本图像在第i个轮次的类别预测数据包括:第i个轮次中所述样本图像输入所述图像分类模型时,所述图像分类模型输出的所述样本类别的预测概率;其中,i大于0且小于或者等于M,M为至少一个轮次的总轮次数量。3.根据权利要求1或2所述的方法,其中,所述根据所述样本图像的所述类别预测数据,确定所述样本图像对应的类别标注情况,包括:将所述样本图像的所述类别预测数据输入噪声标注检测器,获取所述噪声标注检测器输出的类别标注情况;其中,所述噪声标注检测器,根据至少一个参考样本图像、所述参考样本图像的参考类别预测数据以及参考类别标注情况训练得到。4.根据权利要求1所述的方法,其中,所述类别标注情况包括正确标注情况、闭集噪声标注情况和开集噪声标注情况;所述正确标注情况,表示所述样本图像对应的样本类别为所述样本图像的真实类别;所述闭集噪声标注情况,表示所述样本图像对应的样本类别不为所述样本图像的真实类别,且所述样本类别存在于预设类别集合中;所述开集噪声标注情况,表示所述样本图像对应的样本类别不为所述样本图像的真实类别,且所述样本类别未存在于所述预设类别集合中。5.根据权利要求1或4所述的方法,其中,所述根据所述样本图像、所述样本图像对应的样本类别以及类别标注情况,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型,包括:根据所述样本图像、所述样本图像对应的样本类别以及类别标注情况,生成子训练数据;所述子训练数据包括:正确标注情况的样本图像以及对应的样本类别、闭集噪声标注情况的样本图像、开集噪声标注情况的样本图像对;所述样本图像对由同一个样本图像进行不同的增强处理得到;根据所述子训练数据,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型。6.根据权利要求5所述的方法,其中,所述根据所述子训练数据,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型,包括:将所述子训练数据中的样本图像输入所述图像分类模型,获取所述样本图像在所述预设类别集合中各个类别上的预测概率;针对正确标注情况的样本图像,根据所述样本图像在各个所述类别上的预测概率以及所述样本图像对应的样本类别,构建第一子损失函数;
针对闭集噪声标注情况的样本图像,根据所述样本图像在各个所述类别上的预测概率,构建第二子损失函数;针对开集噪声标注情况的样本图像对,根据所述样本图像对中两个样本图像在各个所述类别上的预测概率,构建第三子损失函数;根据所述第一子损失函数、所述第二子损失函数和所述第三子损失函数,确定损失函数;根据所述损失函数的数值对所述图像分类模型进行系数调整,实现第二阶段训练,得到训练好的图像分类模型。7.一种噪声标注检测器的训练方法,包括:获取参考训练数据,所述参考训练数据包括:样本图像,以及所述样本图像对应的样本类别以及类别标注情况;根据所述样本图像以及所述样本图像对应的样本类别,对初始的深度学习模型进行训练,以获取所述样本图像在至少一个轮次的类别预测数据;根据所述样本图像对应的类别标注情况以及所述样本图像的所述类别预测数据,对所述噪声标注检测器进行训练,得到训练好的用于根据样本图像的类别预测数据确定类别标注情况的噪声标注检测器。8.根据权利要求7所述的方法,其中,所述获取参考训练数据,包括:获取候选训练数据,所述候选训练数据包括:正确标注情况的样本图像,以及所述样本图像对应的样本类别;针对所述候选训练数据中的第一部分的样本图像,将所述样本图像对应的样本类别采用预设类别集合中除所述真实类别之外的其他类别进行替换处理,得到闭集噪声标注情况的样本图像;针对所述候选训练数据中的第二部分的样本图像,将所述样本图像对应的样本类别采用除所述预设类别集合中类别之外的其他类别进行替换处理,得到开集噪声标注情况的样本图像;根据正确标注情况的样本图像以及对应的样本类别、闭集噪声标注情况的样本图像以及对应的样本类别、开集噪声标注情况的样本图像以及对应的样本类别,生成所述参考训练数据。9.根据权利要求7所述的方法,其中,所述样本图像在第i个轮次的类别预测数据包括:第i个轮次中所述样本图像输入所述深度学习模型时,所述深度学习模型输出的所述样本类别的预测概率;其中,i大于0且小于或者等于M,M为至少一个轮次的总轮次数量。10.一种图像分类模型的训练装置,包括:获取模块,用于获取训练数据,所述训练数据包括:样本图像,以及所述样本图像对应的样本类别;第一训练模块,用于根据所述样本图像以及所述样本图像对应的样本类别,对初始的图像分类模型进行第一阶段训练,以获取所述样本图像在至少一个轮次的类别预测数据;确定...
【专利技术属性】
技术研发人员:李徐泓,贾庆睿,熊昊一,窦德景,
申请(专利权)人:百度时代网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。