图像识别模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32436304 阅读:23 留言:0更新日期:2022-02-26 07:54
本申请提出一种图像识别模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,通过将训练样本图像分别输入待训练的第一图像识别模型和训练完成的第二图像识别模型,从而由第二图像识别模型指导第一图像识别模型进行学习,使得第一图像识别模型仅针对第二图像识别模型识别出的干净样本进行学习;如此,可以在利用大规模训练样本进行训练时,由训练完成的第二图像识别模型指导对第一图像识别模型的训练,使第一图像识别模型仅利用干净样本进行训练,能够提升图像识别模型的训练效率。效率。效率。

【技术实现步骤摘要】
图像识别模型的训练方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能
,具体而言,涉及一种图像识别模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]在利用大规模图像数据集进行图像识别模型的训练时,由于大规模图像数据集中一般存在较多的噪声样本,需要对图像数据集进行一定的数据清洗,以剔除图像数据集中的至少部分噪声样本,从而提升图像识别模型的训练效果。
[0003]然而,目前的数据清洗方案较为复杂,导致图像识别模型的训练效率较低。

技术实现思路

[0004]本申请的目的在于提供一种图像识别模型的训练方法、装置、电子设备及存储介质,能够提升图像识别模型的训练效率。
[0005]为了实现上述目的,本申请采用的技术方案如下:
[0006]第一方面,本申请提供一种图像识别模型的训练方法,应用于电子设备,所述电子设备保存有待训练的第一图像识别模型和训练完成的第二图像识别模型;所述方法包括:
[0007]将训练样本图像分别输入所述第一图像识别模型和所述第二图像识别模型,以使所述第一图像识别模型提取所述训练样本图像对应的特征信息,以及使所述第二图像识别模型输出所述训练样本图像对应的类型识别结果;其中,所述类型识别结果表征所述训练样本图像为噪声样本或者是干净样本;
[0008]当所述训练样本图像为噪声样本,则丢弃所述特征信息;
[0009]当所述训练样本图像为干净样本,则利用所述特征信息对所述第一图像识别模型进行训练。
[0010]第二方面,本申请提供一种图像识别模型的训练装置,应用于电子设备,所述电子设备保存有待训练的第一图像识别模型和训练完成的第二图像识别模型;所述装置包括:
[0011]数据处理模块,用于将训练样本图像分别输入所述第一图像识别模型和所述第二图像识别模型,以使所述第一图像识别模型提取所述训练样本图像对应的特征信息,以及使所述第二图像识别模型输出所述训练样本图像对应的类型识别结果;其中,所述类型识别结果表征所述训练样本图像为噪声样本或者是干净样本;
[0012]模型训练模块,用于当所述训练样本图像为噪声样本,则丢弃所述特征信息;
[0013]所述模型训练模块还用于,当所述训练样本图像为干净样本,则利用所述特征信息对所述第一图像识别模型进行训练。
[0014]第三方面,本申请提供一种电子设备,所述电子设备包括存储器,用于存储一个或多个程序;处理器;当所述一个或多个程序被所述处理器执行时,实现上述的图像识别模型的训练方法。
[0015]第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算
机程序被处理器执行时实现上述的图像识别模型的训练方法。
[0016]本申请提供的一种图像识别模型的训练方法、装置、电子设备及存储介质,通过将训练样本图像分别输入待训练的第一图像识别模型和训练完成的第二图像识别模型,从而由第一图像识别模型提取该训练样本图像对应的特征信息,且由第二图像识别模型输出该训练样本图像的类型识别结果;以使当第二图像识别模型输出的类型识别结果表征该训练样本图像为噪声样本,则丢弃该训练样本图像对应的特征信息,而当第二图像识别模型输出的类型识别结果表征该训练样本图像为干净样本,则利用该训练样本图像对应的特征信息对第一图像识别模型进行训练;如此,可以在利用大规模训练样本进行训练时,由训练完成的第二图像识别模型指导对第一图像识别模型的训练,使第一图像识别模型仅利用干净样本进行训练,能够提升图像识别模型的训练效率。
[0017]为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0018]为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
[0019]图1示出本申请提供的电子设备的一种示意性结构框图;
[0020]图2示出本申请提供的训练方法的一种训练网络示意图;
[0021]图3示出本申请提供的图像识别模型的训练方法的一种示意性流程框图;
[0022]图4示出本申请提供的图像识别模型的训练装置的一种示意性结构框图。
[0023]图中:100-电子设备;101-存储器;102-处理器;103-通信接口;300-训练装置;301-数据处理模块;302-模型训练模块。
具体实施方式
[0024]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请的一些实施例中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请的组件可以以各种不同的配置来布置和设计。
[0025]因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请选定的一些实施例。基于本申请中的一部分实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0026]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0027]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存
在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0028]在例如上述的对图像数据集中的噪声样本进行清洗的场景中,对应的噪声样本一般包括标签混乱的样本和异常样本;其中,标签混乱的样本一般是指某个标签下的部分训练样本在其他标签下也含有,即一个训练样本包括有多个标签;而异常样本一般是指标签错误的样本,即一个训练样本对应的标签不属于训练集中的任意一个。
[0029]为此,在对图像识别模型进行训练时,一般需要对训练样本进行数据清洗,以提高对图像识别模型的训练效果。
[0030]其中,一些数据清洗策略包括离线数据清洗和在线数据清洗;离线数据清洗一般需要用户人为的对训练样本进行清洗,这种方式一般需要耗费大量的人力成本,不适合利用大规模图像数据集对图像识别模型进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法,其特征在于,应用于电子设备,所述电子设备保存有待训练的第一图像识别模型和训练完成的第二图像识别模型;所述方法包括:将训练样本图像分别输入所述第一图像识别模型和所述第二图像识别模型,以使所述第一图像识别模型提取所述训练样本图像对应的特征信息,以及使所述第二图像识别模型输出所述训练样本图像对应的类型识别结果;其中,所述类型识别结果表征所述训练样本图像为噪声样本或者是干净样本;当所述训练样本图像为噪声样本,则丢弃所述特征信息;当所述训练样本图像为干净样本,则利用所述特征信息对所述第一图像识别模型进行训练。2.如权利要求1所述的方法,其特征在于,将所述训练样本图像输入所述第二图像识别模型,以使所述第二图像识别模型输出所述训练样本图像对应的所述类型识别结果的步骤,包括:将所述训练样本图像输入所述第二图像识别模型,由所述第二图像识别模型输出所述训练样本图像对应的预测类别向量;其中,所述预测类别向量包括多个预测标签类别各自对应的预测参数,每一预测参数表征所述训练样本图像属于对应预测标签类别的概率;确定出接收的标签类别在所述预测类别向量中对应的目标预测参数;其中,所述接收的标签类别属于所述多个预测标签类别中的一个;当所述目标预测参数在所述预测类别向量包含的所有预测参数中,按照从大到小的顺序排列在前k个,则确定所述训练样本图像为干净样本;其中,k为正整数;当所述目标预测参数在所述预测类别向量包含的所有预测参数中,按照从大到小的顺序未排列在前k个,则确定所述训练样本图像为噪声样本。3.如权利要求2所述的方法,其特征在于,所述方法还包括:当所述第一图像识别模型的训练次数达到设定的次数阈值,对k进行更新,并以更新后的k,以及新的训练样本图像,继续执行将训练样本图像分别输入所述第一图像识别模型和所述第二图像识别模型,以使所述第一图像识别模型提取所述训练样本图像对应的特征信息,以及使所述第二图像识别模型输出所述训练样本图像对应的类型识别结果的步骤,直至所述第一图像识别模型收敛。4.如权利要求2所述的方法,其特征在于,所述第一图像识别模型的损失函数表示如下:Loss=-log(1-P
θ
(x
i
,y
t
))其中,x
i
表示所述训练样本图像的特征信息,y
t
表示所述接收的标签类别,P
θ
(x
i
,y
t
)表示所述训练样本图像对应于所述接收的标签类别的权重参数;s表示设定的超参数,K表示所...

【专利技术属性】
技术研发人员:黄颖邱尚锋张文伟
申请(专利权)人:广州虎牙科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1