图像识别模型的训练方法、装置、设备、存储介质及产品制造方法及图纸

技术编号:39745378 阅读:5 留言:0更新日期:2023-12-17 23:44
本申请公开一种图像识别模型的训练方法、装置、设备、存储介质及产品,涉及机器学习领域。该方法包括:获取第一样本图像,第一样本图像对应有样本增强图像和下采样图像;通过样本学生模型对第一样本图像进行图像内容识别,得到用于指示第一样本图像中图像内容的第一预测结果;通过样本专家模型对样本增强图像和下采样图像的第一融合特征表示进行图像内容识别,得到参考伪标签;基于第一预测结果和参考伪标签之间的差异,确定第一损失值;基于第一损失值对样本学生模型进行训练,得到目标识别模型。也即,通过输入不同尺寸的图像能够使得生成的伪标签准确度更高,从而提高目标识别模型的准确度。型的准确度。型的准确度。

【技术实现步骤摘要】
图像识别模型的训练方法、装置、设备、存储介质及产品


[0001]本申请实施例涉及机器学习领域,特别涉及一种图像识别模型的训练方法、装置、设备、存储介质及产品。

技术介绍

[0002]图像识别是指对输入图像进行识别,从而获取输入图像中的目标对象所在的位置以及目标对象对应的分类信息。
[0003]在相关技术中,在对图像识别模型进行训练的过程中,基于半监督的图像识别模型的训练方法通常通过少量的带标签的数据集合大量无标签的数据集进行训练,当专家模型根据无标签的数据进行预测后生成的伪标签对学生模型进行训练,再将训练后的学生模型的模型参数来更新专家模型的模型参数,实现学生模型和专家模型之间的迭代更新,将最终更新得到的学生模型作为目标检测模型。
[0004]然而在相关技术中,在训练过程中由于输入的图像尺寸并不一致,因此专家模型得到的伪标签准确度也不同,会导致学生模型的训练准确度降低,进而导致最终训练得到的目标识别模型的准确度也较低。

技术实现思路

[0005]本申请实施例提供了一种图像识别模型的训练方法、装置、设备、存储介质及产品,能够提高图像识别模型的准确度。所述技术方案如下。
[0006]一方面,提供了一种图像识别模型的训练方法,所述方法包括:
[0007]获取第一样本图像,所述第一样本图像对应有样本增强图像和下采样图像,所述样本增强图像是对所述第一样本图像进行特征多样性变化得到的图像,所述下采样图像是指对所述样本增强图像进行下采样得到的图像;
[0008]通过样本学生模型对所述第一样本图像进行图像内容识别,得到用于指示所述第一样本图像中图像内容的第一预测结果;
[0009]通过样本专家模型对所述样本增强图像和所述下采样图像的第一融合特征表示进行图像内容识别,得到参考伪标签;
[0010]基于所述第一预测结果和所述参考伪标签之间的差异,确定第一损失值;
[0011]基于所述第一损失值对所述样本学生模型进行训练,得到目标识别模型,所述目标识别模型用于对图像中进行图像内容识别。
[0012]另一方面,提供了一种图像识别模型的训练装置,所述装置包括:
[0013]获取模块,用于获取第一样本图像,所述第一样本图像对应有样本增强图像和下采样图像,所述样本增强图像是对所述第一样本图像进行特征多样性变化得到的图像,所述下采样图像是指对所述样本增强图像进行下采样得到的图像;
[0014]识别模块,用于通过样本学生模型对所述第一样本图像进行图像内容识别,得到用于指示所述第一样本图像中图像内容的第一预测结果;
[0015]所述识别模块,还用于通过样本专家模型对所述样本增强图像和所述下采样图像的第一融合特征表示进行图像内容识别,得到参考伪标签;
[0016]确定模块,用于基于所述第一预测结果和所述参考伪标签之间的差异,确定第一损失值;
[0017]训练模块,用于基于所述第一损失值对所述样本学生模型进行训练,得到目标识别模型,所述目标识别模型用于对图像中进行图像内容识别。
[0018]另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述图像识别模型的训练方法。
[0019]另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的图像识别模型的训练方法。
[0020]另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的图像识别模型的训练方法。
[0021]本申请实施例提供的技术方案带来的有益效果至少包括:
[0022]在获取未存在参考标签的第一样本图像后,对第一样本图像进行图像增强处理得到样本增强图像,并对样本增强图像进行下采样得到下采样图像,从而通过不同图像尺寸的样本增强图像和下采样图像输入样本专家模型从而获得参考伪标签,根据参考伪标签监督训练样本学生模型,最终得到目标识别模型。也即,通过输入不同尺寸的图像能够使得生成的伪标签准确度更高,从而提高目标识别模型的准确度。
附图说明
[0023]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1是本申请一个示例性的实施例提供的图像识别模型的训练方法示意图;
[0025]图2是本申请一个示例性实施例提供的实施环境示意图;
[0026]图3是本申请一个示例性实施例提供的图像识别模型的训练方法流程图;
[0027]图4是本申请另一个示例性实施例提供的图像识别模型的训练方法流程图;
[0028]图5是本申请另一个示例性实施例提供的图像识别模型的训练方法流程图;
[0029]图6是本申请另一个示例性实施例提供的预训练模型训练过程示意图;
[0030]图7是本申请一个示例性实施例提供的效果对比图;
[0031]图8是本申请另一个示例性实施例提供的效果对比图;
[0032]图9是本申请一个示例性实施例提供的图像识别模型的训练装置结构框图;
[0033]图10是本申请另一个示例性实施例提供的图像识别模型的训练装置结构框图;
[0034]图11是本申请一个示例性实施例提供的服务器的结构示意图。
具体实施方式
[0035]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
[0036]首先,针对本申请实施例中涉及的名词进行简单介绍。
[0037]人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0038]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法,其特征在于,所述方法包括:获取第一样本图像,所述第一样本图像对应有样本增强图像和下采样图像,所述样本增强图像是对所述第一样本图像进行特征多样性变化得到的图像,所述下采样图像是指对所述样本增强图像进行下采样得到的图像;通过样本学生模型对所述第一样本图像进行图像内容识别,得到用于指示所述第一样本图像中图像内容的第一预测结果;通过样本专家模型对所述样本增强图像和所述下采样图像的第一融合特征表示进行图像内容识别,得到参考伪标签;基于所述第一预测结果和所述参考伪标签之间的差异,确定第一损失值;基于所述第一损失值对所述样本学生模型进行训练,得到目标识别模型,所述目标识别模型用于对图像中进行图像内容识别。2.根据权利要求1所述的方法,其特征在于,所述通过样本专家模型对所述样本增强图像和所述下采样图像的第一融合特征表示进行图像内容识别,得到参考伪标签,包括:通过所述样本专家模型对所述样本增强图像进行特征提取,得到所述样本增强图像对应的第一特征组;通过所述样本专家模型对所述下采样图像进行特征提取,得到所述下采样图像对应的第二特征组;将所述第一特征组和所述第二特征组之间进行加权特征融合,得到所述第一融合特征表示;对所述第一融合特征表示进行图像内容识别,得到所述参考伪标签。3.根据权利要求2所述的方法,其特征在于,所述将所述第一特征组和所述第二特征组之间进行加权特征融合,得到所述第一融合特征表示,包括:对第k+1层第一特征表示和第k层第二特征表示进行特征拼接,得到拼接特征表示,所述第一特征组中包括n层第一特征表示,所述第二特征组中包括n层第二特征表示,2≤k<n且k,n为整数;对所述拼接特征表示进行池化操作,得到所述拼接特征表示对应的池化特征表示;对所述池化特征表示进行激活操作,得到所述池化特征对应的激活特征表示;对所述激活特征表示进行线性操作,得到第k+1个融合权重;基于所述融合权重将所述第k+1层第一特征表示和所述第k层第二特征表示进行特征融合,得到所述第k+1层特征融合结果;将n层特征融合结果作为所述第一融合特征表示。4.根据权利要求2所述的方法,其特征在于,所述对所述第一融合特征表示进行图像内容识别,得到所述参考伪标签,包括:对所述第一融合特征表示进行特征解码,得到所述第一样本图像对应的多个参考预测结果,所述参考预测结果用于指示所述第一样本图像中图像内容的分类概率值;获取预设分数阈值;将所述多个参考预测结果中所述分类概率值达到所述预设分数阈值的至少一个参考预测结果作为所述参考伪标签。5.根据权利要求1至4任一所述的方法,其特征在于,所述通过所述样本学生模型对所
述样本增强图像和所述下采样图像分别进行图像内容识别,得到用于指示所述第一样本图像中图像内容的第一预测结果,包括:通过所述样本学生模型对所述样本处理图像和所述下采样图像分别进行特征提取,得到所述样本处理图像对应的第三特征组,以及得到所述下采样图像对应的第四特征组;对所述第三特征组和所述第四特征组进行加权特征融合,得到第二融合特征表示;对所述第三特征组、所述第四特征组和所述第二融合特征表示分别进行特征解码,得到所述第三特征组对应的第一子预测结果、所述第四特征组对应的第二子预测结果以及所述第二融合特征表示对应的第三子预测结果;将所述第一子预测结果、所述第二子预测结果和所述第三子预测结果作为所述第一预测结果。6.根据权利要...

【专利技术属性】
技术研发人员:刘亮张江宁王亚彪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1