图像识别模型的训练方法、装置、设备、存储介质及产品制造方法及图纸

技术编号：39745378 阅读：5 留言：0更新日期：2023-12-17 23:44

本申请公开一种图像识别模型的训练方法、装置、设备、存储介质及产品，涉及机器学习领域。该方法包括：获取第一样本图像，第一样本图像对应有样本增强图像和下采样图像；通过样本学生模型对第一样本图像进行图像内容识别，得到用于指示第一样本图像中图像内容的第一预测结果；通过样本专家模型对样本增强图像和下采样图像的第一融合特征表示进行图像内容识别，得到参考伪标签；基于第一预测结果和参考伪标签之间的差异，确定第一损失值；基于第一损失值对样本学生模型进行训练，得到目标识别模型。也即，通过输入不同尺寸的图像能够使得生成的伪标签准确度更高，从而提高目标识别模型的准确度。型的准确度。型的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别模型的训练方法、装置、设备、存储介质及产品

[0001]本申请实施例涉及机器学习领域，特别涉及一种图像识别模型的训练方法、装置、设备、存储介质及产品。

技术介绍

[0002]图像识别是指对输入图像进行识别，从而获取输入图像中的目标对象所在的位置以及目标对象对应的分类信息。
[0003]在相关技术中，在对图像识别模型进行训练的过程中，基于半监督的图像识别模型的训练方法通常通过少量的带标签的数据集合大量无标签的数据集进行训练，当专家模型根据无标签的数据进行预测后生成的伪标签对学生模型进行训练，再将训练后的学生模型的模型参数来更新专家模型的模型参数，实现学生模型和专家模型之间的迭代更新，将最终更新得到的学生模型作为目标检测模型。
[0004]然而在相关技术中，在训练过程中由于输入的图像尺寸并不一致，因此专家模型得到的伪标签准确度也不同，会导致学生模型的训练准确度降低，进而导致最终训练得到的目标识别模型的准确度也较低。

技术实现思路

[0005]本申请实施例提供了一种图像识别模型的训练方法、装置、设备、存储介质及产品，能够提高图像识别模型的准确度。所述技术方案如下。
[0006]一方面，提供了一种图像识别模型的训练方法，所述方法包括：
[0007]获取第一样本图像，所述第一样本图像对应有样本增强图像和下采样图像，所述样本增强图像是对所述第一样本图像进行特征多样性变化得到的图像，所述下采样图像是指对所述样本增强图像进行下采样得到的图像；
[0008]通过样本学生模...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法，其特征在于，所述方法包括：获取第一样本图像，所述第一样本图像对应有样本增强图像和下采样图像，所述样本增强图像是对所述第一样本图像进行特征多样性变化得到的图像，所述下采样图像是指对所述样本增强图像进行下采样得到的图像；通过样本学生模型对所述第一样本图像进行图像内容识别，得到用于指示所述第一样本图像中图像内容的第一预测结果；通过样本专家模型对所述样本增强图像和所述下采样图像的第一融合特征表示进行图像内容识别，得到参考伪标签；基于所述第一预测结果和所述参考伪标签之间的差异，确定第一损失值；基于所述第一损失值对所述样本学生模型进行训练，得到目标识别模型，所述目标识别模型用于对图像中进行图像内容识别。2.根据权利要求1所述的方法，其特征在于，所述通过样本专家模型对所述样本增强图像和所述下采样图像的第一融合特征表示进行图像内容识别，得到参考伪标签，包括：通过所述样本专家模型对所述样本增强图像进行特征提取，得到所述样本增强图像对应的第一特征组；通过所述样本专家模型对所述下采样图像进行特征提取，得到所述下采样图像对应的第二特征组；将所述第一特征组和所述第二特征组之间进行加权特征融合，得到所述第一融合特征表示；对所述第一融合特征表示进行图像内容识别，得到所述参考伪标签。3.根据权利要求2所述的方法，其特征在于，所述将所述第一特征组和所述第二特征组之间进行加权特征融合，得到所述第一融合特征表示，包括：对第k+1层第一特征表示和第k层第二特征表示进行特征拼接，得到拼接特征表示，所述第一特征组中包括n层第一特征表示，所述第二特征组中包括n层第二特征表示，2≤k＜n且k，n为整数；对所述拼接特征表示进行池化操作，得到所述拼接特征表示对应的池化特征表示；对所述池化特征表示进行激活操作，得到所述池化特征对应的激活特征表示；对所述激活特征表示进行线性操作，得到第k+1个融合权重；基于所述融合权重将所述第k+1层第一特征表示和所述第k层第二特征表示进行特征融合，得到所述第k+1层特征融合结果；将n层特征融合结果作为所述第一融合特征表示。4.根据权利要求2所述的方法，其特征在于，所述对所述第一融合特征表示进行图像内容识别，得到所述参考伪标签，包括：对所述第一融合特征表示进行特征解码，得到所述第一样本图像对应的多个参考预测结果，所述参考预测结果用于指示所述第一样本图像中图像内容的分类概率值；获取预设分数阈值；将所述多个参考预测结果中所述分类概率值达到所述预设分数阈值的至少一个参考预测结果作为所述参考伪标签。5.根据权利要求1至4任一所述的方法，其特征在于，所述通过所述样本学生模型对所
述样本增强图像和所述下采样图像分别进行图像内容识别，得到用于指示所述第一样本图像中图像内容的第一预测结果，包括：通过所述样本学生模型对所述样本处理图像和所述下采样图像分别进行特征提取，得到所述样本处理图像对应的第三特征组，以及得到所述下采样图像对应的第四特征组；对所述第三特征组和所述第四特征组进行加权特征融合，得到第二融合特征表示；对所述第三特征组、所述第四特征组和所述第二融合特征表示分别进行特征解码，得到所述第三特征组对应的第一子预测结果、所述第四特征组对应的第二子预测结果以及所述第二融合特征表示对应的第三子预测结果；将所述第一子预测结果、所述第二子预测结果和所述第三子预测结果作为所述第一预测结果。6.根据权利要...

【专利技术属性】
技术研发人员：刘亮，张江宁，王亚彪，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人