图片识别模型的训练方法和装置、存储介质及电子设备制造方法及图纸

技术编号:39331191 阅读:23 留言:0更新日期:2023-11-12 16:07
本申请公开了一种图片识别模型的训练方法和装置、存储介质及电子设备。其中,该方法包括:获取第一目标图片识别模型和第二目标图片识别模型,其中,第一目标图片识别模型与第二目标图片识别模型用于识别已知的第一类型的图片;通过将第一样本图片集合中的图片分别输入到第一目标图片识别模型和第二目标图片识别模型,对第一目标图片识别模型进行训练,直到第一目标图片识别模型对应的第一目标损失函数的取值满足预设的第一收敛条件,结束对第一目标图片识别模型的训练,将结束训练时的第一目标图片识别模型,确定为第三目标图片识别模型。本申请解决了相关技术无法训练出能够识别未知类型图片的模型的技术问题。别未知类型图片的模型的技术问题。别未知类型图片的模型的技术问题。

【技术实现步骤摘要】
图片识别模型的训练方法和装置、存储介质及电子设备


[0001]本申请涉及计算机
,具体而言,涉及一种图片识别模型的训练方法和装置、存储介质及电子设备。

技术介绍

[0002]在图片识别过程中,通常使用预先训练好的图片识别模型对待识别图片的类型进行识别,但在利用该方法对较多冷门风格(类型)图片进行识别时,例如,对二次元图片(Animation ComicGame,简称ACG)进行内容审核时,由于ACG图片包括多种未知类型的图片,使得待识别图片的类型数据较难采集,从而导致在模型训练过程中样本数量较少,使得无法训练得到能够识别ACG图片类型的图片识别模型。
[0003]相关技术中,通常使用预先训练好的图片识别模型进行预训练,并利用迁移学习的方法,逐步从一个图片类型迁移到另一个图片类型,从而实现对图片类型的识别。然而,在未知的图片类型较多的情况下,采用上述迁移学习的方法很难学习到所有图片类型数据,并且在训练过程中需要调节的参数较多,难以保证图片识别模型对于不同类型的图片均具有较强的识别能力,很大程度上会使得模型在不断微调过程中,从而造成无本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图片识别模型的训练方法,其特征在于,包括:获取第一目标图片识别模型和第二目标图片识别模型,其中,所述第一目标图片识别模型与所述第二目标图片识别模型是已训练好的相同的图片识别模型,所述第一目标图片识别模型与所述第二目标图片识别模型用于识别已知的第一类型的图片;通过将第一样本图片集合中的图片分别输入到所述第一目标图片识别模型和所述第二目标图片识别模型,对所述第一目标图片识别模型进行训练,直到所述第一目标图片识别模型对应的第一目标损失函数的取值满足预设的第一收敛条件,结束对所述第一目标图片识别模型的训练,将结束训练时的所述第一目标图片识别模型,确定为第三目标图片识别模型,其中,所述第一样本图片集合中的图片的类型包括待识别的第二类型,所述第三目标图片识别模型用于识别所述第二类型的图片,在对所述第一目标图片识别模型进行训练的过程中,当所述第一目标图片识别模型对应的所述第一目标损失函数的取值不满足所述第一收敛条件的情况下,所述第一目标图片识别模型中的参数被调整;其中,所述第一目标损失函数的取值是根据第一损失函数的取值和第二损失函数的取值确定得到的取值,所述第一损失函数的取值表示所述第一目标图片识别模型根据输入的图片确定的预测类型和所述输入的图片对应的标签类型之间的损失值,所述第二损失函数的取值表示第一图片表征向量与第二图片表征向量之间的分布损失值,所述第一图片表征向量是所述第一目标图片识别模型根据所述输入的图片确定的图片表征向量,所述第二图片表征向量是所述第二目标图片识别模型根据所述输入的图片确定的图片表征向量。2.根据权利要求1所述的方法,其特征在于,所述通过将第一样本图片集合中的图片分别输入到所述第一目标图片识别模型和所述第二目标图片识别模型,对所述第一目标图片识别模型进行训练,包括:通过以下步骤对所述第一目标图片识别模型进行第i轮训练,其中,i为大于或等于1的正整数,当i等于1时,经过第0轮训练得到的所述第一目标图片识别模型是使用所述第一样本图片集合对所述第一目标图片识别模型进行训练之前的所述第一目标图片识别模型:从所述第一样本图片集合中获取第i组图片,将所述第i组图片输入到经过第i

1轮训练得到的所述第一目标图片识别模型,得到所述经过第i

1轮训练得到的所述第一目标图片识别模型根据所述第i组图片确定的第i组第一图片表征向量,以及第i组预测类型;将所述第i组图片输入到所述第二目标图片识别模型,得到所述第二目标图片识别模型根据所述第i组图片确定的第i组第二图片表征向量;通过所述第一损失函数,确定所述第i组预测类型和所述第i组图片对应的标签类型之间的损失值,得到所述第一损失函数的第i轮取值;通过所述第二损失函数,确定所述第i组第一图片表征向量和所述第i组第二图片表征向量之间的分布损失值,得到所述第二损失函数的第i轮取值;根据所述第一损失函数的第i轮取值和所述第二损失函数的第i轮取值,确定所述第一目标损失函数的第i轮取值;在所述第一目标损失函数的第i轮取值满足所述第一收敛条件的情况下,结束对所述第一目标图片识别模型的训练;在所述第一目标损失函数的第i轮取值不满足所述第一收敛条件的情况下,对所述经过第i

1轮训练得到的所述第一目标图片识别模型中的参数进行调整,得到经过第i轮训练得到的所述第一目标图片识别模型。3.根据权利要求2所述的方法,其特征在于,
所述将所述第i组图片输入到经过第i

1轮训练得到的所述第一目标图片识别模型,得到所述经过第i

1轮训练得到的所述第一目标图片识别模型根据所述第i组图片确定的第i组第一图片表征向量,以及第i组预测类型,包括:通过经过第i

1轮训练得到的第一编码器,对所述第i组图片进行编码,得到所述第i组第一图片表征向量,其中,所述经过第i

1轮训练得到的所述第一目标图片识别模型中包括经过第i

1轮训练得到的第一编码器;所述将所述第i组图片输入到所述第二目标图片识别模型,得到所述第二目标图片识别模型根据所述第i组图片确定的第i组第二图片表征向量,包括:通过所述第二目标图片识别模型中的第二编码器,对所述第i组图片进行编码,得到所述第i组第二图片表征向量;其中,所述经过第i

1轮训练得到的第一编码器与所述第二编码器具有相同的网络结构。4.根据权利要求3所述的方法,其特征在于,所述通过经过第i

1轮训练得到的第一编码器,对所述第i组图片进行编码,得到所述第i组第一图片表征向量,包括:在所述第一编码器包括P个卷积层、M个卷积残差模块以及类型对齐模块的情况下,将所述第i组图片依次经过所述P个卷积层和所述M个卷积残差模块,得到所述第i组第一图片表征向量,其中,P为大于或等于2的正整数,M为大于或等于2的正整数;其中,所述P个卷积层和所述M个卷积残差模块依次级联连接,所述类型对齐模块的输入与所述M个卷积残差模块中的第h个卷积残差模块的输出连接,所述类型对齐模块的输出与所述M个卷积残差模块中的第j个卷积残差模块的输入连接,1≤h<j<M。5.根据权利要求4所述的方法,其特征在于,所述将所述第i组图片依次经过所述P个卷积层和所述M个卷积残差模块,得到所述第i组第一图片表征向量,包括:对所述第i组图片中的每个图片执行以下步骤,其中,执行以下步骤时,所述每个图片为当前图片:将所述当前图片输入到所述P个卷积层中的第1个卷积层,经过所述P个卷积层和所述M个卷积残差模块中的前h个卷积残差模块的处理,得到所述第h个卷积残差模块输出的第h个卷积表征向量;将所述第h个卷积表征向量输入到所述类型对齐模块,通过所述类型对齐模块中的第一池化模块对所述第h个卷积表征向量进行第一池化操作,得到第一池化表征向量,并通过所述类型对齐模块中的第二池化模块对所述第h个卷积表征向量进行第二池化操作,得到第二池化表征向量,其中,所述第一池化操作与所述第二池化操作不同;将所述第一池化表征向量通过所述类型对齐模块中的第一多层感知器,得到第一感知表征向量;将所述第二池化表征向量通过所述类型对齐模块中的第二多层感知器,得到第二感知表征向量;根据所述第一感知表征向量和所述第二感知表征向量,确定所述类型对齐模块输出的对齐表征向量;将所述第h个卷积表征向量输入到所述M个卷积残差模块中的第h+1个卷积残差模块,经过所述第h+1个卷积残差模块至第M个卷积残差模块的处理,得到所述当前图片的第一图片表征向量,其中,所述第j个卷积残差模块的输入包括:第j

1个卷积残差模块输出的第j

1个卷积表征向量以及所述对齐表征向量。6.根据权利要求2所述的方法,其特征在于,所述通过所述第二损失函数,确定所述第i组第一图片表征向量和所述第i组第二图片表征向量之间的分布损失值,得到所述第二损
失函数的第i轮取值,包括:在所述第i组图片包括B张图片的情况下,对所述B张图片中的每张图片,执行以下操作,共得到B个分布损失值,并将所述第二损失函数的第i轮取值确定为等于所述B个分布损失值的均值,其中,B为大于或等于2的正整数,执行以下操作时,所述每张图片为当前图片:将所述当前图片的第一图片表征向量转换成第一一维表征向量,将所述当前图片的第二图片表征向量转换成第二一维表...

【专利技术属性】
技术研发人员:朱城鄢科
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1