图像分类模型的训练方法、装置及电子设备制造方法及图纸

技术编号:36708859 阅读:31 留言:0更新日期:2023-03-01 09:33
本公开提供了图像分类模型的训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习技术领域。具体实现方案为:获取训练数据;根据训练数据中的样本图像以及样本图像对应的样本类别,对初始的图像分类模型进行第一阶段训练,以获取样本图像在至少一个轮次的类别预测数据;根据样本图像的类别预测数据,确定样本图像对应的类别标注情况;根据样本图像、样本图像对应的样本类别以及类别标注情况,对图像分类模型进行第二阶段训练,得到训练好的图像分类模型,从而能够在图像分类模型的训练中,结合样本图像在至少一个轮次的类别预测数据区分不同类别标注情况的样本图像,提高训练得到的图像分类模型的准确度。确度。确度。

【技术实现步骤摘要】
图像分类模型的训练方法、装置及电子设备


[0001]本公开涉及人工智能
,尤其涉及计算机视觉、深度学习
,尤其涉及一种图像分类模型的训练方法、装置及电子设备。

技术介绍

[0002]目前,图像分类模型的训练效果,取决于大规模可信赖的图像的获取,以及对图像的正确标注过程。然而,获取大规模可信赖的图像以及对图像的正确标注,是极其困难的。
[0003]相关技术中,训练数据中经常包含有部分错误标注的图像。采用该训练数据对图像分类模型进行训练时,训练得到的图像分类模型的准确度低。

技术实现思路

[0004]本公开提供了一种图像分类模型的训练方法、装置及电子设备。
[0005]根据本公开的一方面,提供了一种图像分类模型的训练方法,所述方法包括:获取训练数据,所述训练数据包括:样本图像,以及所述样本图像对应的样本类别;根据所述样本图像以及所述样本图像对应的样本类别,对初始的图像分类模型进行第一阶段训练,以获取所述样本图像在至少一个轮次的类别预测数据;根据所述样本图像的所述类别预测数据,确定所述样本图像对应的类别标注情况;根据所述样本图像、所述样本图像对应的样本类别以及类别标注情况,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型。
[0006]根据本公开的另一方面,提供了一种噪声标注检测器的训练方法,所述方法包括:获取参考训练数据,所述参考训练数据包括:样本图像,以及所述样本图像对应的样本类别以及类别标注情况;根据所述样本图像以及所述样本图像对应的样本类别,对初始的深度学习模型进行训练,以获取所述样本图像在至少一个轮次的类别预测数据;根据所述样本图像对应的类别标注情况以及所述样本图像的所述类别预测数据,对所述噪声标注检测器进行训练,得到训练好的用于根据样本图像的类别预测数据确定类别标注情况的噪声标注检测器。
[0007]根据本公开的另一方面,提供了一种图像分类模型的训练装置,所述装置包括:获取模块,用于获取训练数据,所述训练数据包括:样本图像,以及所述样本图像对应的样本类别;第一训练模块,用于根据所述样本图像以及所述样本图像对应的样本类别,对初始的图像分类模型进行第一阶段训练,以获取所述样本图像在至少一个轮次的类别预测数据;确定模块,用于根据所述样本图像的所述类别预测数据,确定所述样本图像对应的类别标注情况;第二训练模块,用于根据所述样本图像、所述样本图像对应的样本类别以及类别标注情况,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型。
[0008]根据本公开的另一方面,提供了一种噪声标注检测器的训练装置,包括:获取模块,用于获取参考训练数据,所述参考训练数据包括:样本图像,以及所述样本图像对应的样本类别以及类别标注情况;第一训练模块,用于根据所述样本图像以及所述样本图像对
应的样本类别,对初始的深度学习模型进行训练,以获取所述样本图像在至少一个轮次的类别预测数据;第二训练模块,用于根据所述样本图像对应的类别标注情况以及所述样本图像的所述类别预测数据,对所述噪声标注检测器进行训练,得到训练好的用于根据样本图像的类别预测数据确定类别标注情况的噪声标注检测器。
[0009]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开上述提出的图像分类模型的训练方法,或者,执行本公开上述提出的噪声标注检测器的训练方法。
[0010]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行本公开上述提出的图像分类模型的训练方法,或者,执行本公开上述提出的噪声标注检测器的训练方法。
[0011]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开上述提出的图像分类模型的训练方法,或者,实现本公开上述提出的噪声标注检测器的训练方法。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1是根据本公开第一实施例的示意图;
[0015]图2是根据本公开第二实施例的示意图;
[0016]图3是根据本公开第三实施例的示意图;
[0017]图4是根据本公开第四实施例的示意图;
[0018]图5是噪声标注检测器的训练示意图;
[0019]图6是根据本公开第五实施例的示意图;
[0020]图7是根据本公开第六实施例的示意图;
[0021]图8是用来实现本公开实施例的图像分类模型的训练方法或者噪声标注检测器的训练方法的电子设备的框图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]目前,图像分类模型的训练效果,取决于大规模可信赖的图像的获取,以及对图像的正确标注过程。然而,获取大规模可信赖的图像以及对图像的正确标注,是极其困难的。
[0024]相关技术中,训练数据中经常包含有部分错误标注的图像。采用该训练数据对图像分类模型进行训练时,训练得到的图像分类模型的准确度低。
[0025]针对上述问题,本公开提出一种图像分类模型的训练方法、装置及电子设备。
[0026]图1是根据本公开第一实施例的示意图,需要说明的是,本公开实施例的图像分类模型的训练方法可应用于图像分类模型的训练装置,该装置可被配置于电子设备中,以使该电子设备可以执行图像分类模型的训练功能。以下实施例中以执行主体为电子设备为例进行说明。
[0027]其中,电子设备可以为任一具有计算能力的设备,例如可以为个人电脑(Personal Computer,简称PC)、移动终端、服务器等,移动终端例如可以为车载设备、手机、平板电脑、个人数字助理、穿戴式设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
[0028]如图1所示,该图像分类模型的训练方法可以包括如下步骤:
[0029]步骤101,获取训练数据,训练数据包括:样本图像,以及样本图像对应的样本类别。
[0030]在本公开实施例中,样本图像可以为原始图像,或者,对原始图像进行图像增强等处理得到的图像。其中,图像增强,例如旋转、剪切、仿射变换、高斯模糊等,可以根据实际需要进行设置。
[0031]其中,样本图像对应的样本类别,可以为样本图像的真实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类模型的训练方法,包括:获取训练数据,所述训练数据包括:样本图像,以及所述样本图像对应的样本类别;根据所述样本图像以及所述样本图像对应的样本类别,对初始的图像分类模型进行第一阶段训练,以获取所述样本图像在至少一个轮次的类别预测数据;根据所述样本图像的所述类别预测数据,确定所述样本图像对应的类别标注情况;根据所述样本图像、所述样本图像对应的样本类别以及类别标注情况,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型。2.根据权利要求1所述的方法,其中,所述样本图像在第i个轮次的类别预测数据包括:第i个轮次中所述样本图像输入所述图像分类模型时,所述图像分类模型输出的所述样本类别的预测概率;其中,i大于0且小于或者等于M,M为至少一个轮次的总轮次数量。3.根据权利要求1或2所述的方法,其中,所述根据所述样本图像的所述类别预测数据,确定所述样本图像对应的类别标注情况,包括:将所述样本图像的所述类别预测数据输入噪声标注检测器,获取所述噪声标注检测器输出的类别标注情况;其中,所述噪声标注检测器,根据至少一个参考样本图像、所述参考样本图像的参考类别预测数据以及参考类别标注情况训练得到。4.根据权利要求1所述的方法,其中,所述类别标注情况包括正确标注情况、闭集噪声标注情况和开集噪声标注情况;所述正确标注情况,表示所述样本图像对应的样本类别为所述样本图像的真实类别;所述闭集噪声标注情况,表示所述样本图像对应的样本类别不为所述样本图像的真实类别,且所述样本类别存在于预设类别集合中;所述开集噪声标注情况,表示所述样本图像对应的样本类别不为所述样本图像的真实类别,且所述样本类别未存在于所述预设类别集合中。5.根据权利要求1或4所述的方法,其中,所述根据所述样本图像、所述样本图像对应的样本类别以及类别标注情况,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型,包括:根据所述样本图像、所述样本图像对应的样本类别以及类别标注情况,生成子训练数据;所述子训练数据包括:正确标注情况的样本图像以及对应的样本类别、闭集噪声标注情况的样本图像、开集噪声标注情况的样本图像对;所述样本图像对由同一个样本图像进行不同的增强处理得到;根据所述子训练数据,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型。6.根据权利要求5所述的方法,其中,所述根据所述子训练数据,对所述图像分类模型进行第二阶段训练,得到训练好的图像分类模型,包括:将所述子训练数据中的样本图像输入所述图像分类模型,获取所述样本图像在所述预设类别集合中各个类别上的预测概率;针对正确标注情况的样本图像,根据所述样本图像在各个所述类别上的预测概率以及所述样本图像对应的样本类别,构建第一子损失函数;
针对闭集噪声标注情况的样本图像,根据所述样本图像在各个所述类别上的预测概率,构建第二子损失函数;针对开集噪声标注情况的样本图像对,根据所述样本图像对中两个样本图像在各个所述类别上的预测概率,构建第三子损失函数;根据所述第一子损失函数、所述第二子损失函数和所述第三子损失函数,确定损失函数;根据所述损失函数的数值对所述图像分类模型进行系数调整,实现第二阶段训练,得到训练好的图像分类模型。7.一种噪声标注检测器的训练方法,包括:获取参考训练数据,所述参考训练数据包括:样本图像,以及所述样本图像对应的样本类别以及类别标注情况;根据所述样本图像以及所述样本图像对应的样本类别,对初始的深度学习模型进行训练,以获取所述样本图像在至少一个轮次的类别预测数据;根据所述样本图像对应的类别标注情况以及所述样本图像的所述类别预测数据,对所述噪声标注检测器进行训练,得到训练好的用于根据样本图像的类别预测数据确定类别标注情况的噪声标注检测器。8.根据权利要求7所述的方法,其中,所述获取参考训练数据,包括:获取候选训练数据,所述候选训练数据包括:正确标注情况的样本图像,以及所述样本图像对应的样本类别;针对所述候选训练数据中的第一部分的样本图像,将所述样本图像对应的样本类别采用预设类别集合中除所述真实类别之外的其他类别进行替换处理,得到闭集噪声标注情况的样本图像;针对所述候选训练数据中的第二部分的样本图像,将所述样本图像对应的样本类别采用除所述预设类别集合中类别之外的其他类别进行替换处理,得到开集噪声标注情况的样本图像;根据正确标注情况的样本图像以及对应的样本类别、闭集噪声标注情况的样本图像以及对应的样本类别、开集噪声标注情况的样本图像以及对应的样本类别,生成所述参考训练数据。9.根据权利要求7所述的方法,其中,所述样本图像在第i个轮次的类别预测数据包括:第i个轮次中所述样本图像输入所述深度学习模型时,所述深度学习模型输出的所述样本类别的预测概率;其中,i大于0且小于或者等于M,M为至少一个轮次的总轮次数量。10.一种图像分类模型的训练装置,包括:获取模块,用于获取训练数据,所述训练数据包括:样本图像,以及所述样本图像对应的样本类别;第一训练模块,用于根据所述样本图像以及所述样本图像对应的样本类别,对初始的图像分类模型进行第一阶段训练,以获取所述样本图像在至少一个轮次的类别预测数据;确定...

【专利技术属性】
技术研发人员:李徐泓贾庆睿熊昊一窦德景
申请(专利权)人:百度时代网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1