目标模型的训练方法、装置、电子设备、介质和程序产品制造方法及图纸

技术编号:37122907 阅读:28 留言:0更新日期:2023-04-01 05:18
本公开提供了一种目标模型的训练方法、装置、电子设备、介质和程序产品,涉及人工智能技术领域,尤其涉及计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于智慧城市、元宇宙等场景。具体实现方案为:获取训练数据集,所述训练数据集包括第一训练数据和第二训练数据,第一训练数据包括第一图像和目标标签,第二训练数据包括第二图像和目标标签,其中,第二图像为对第一图像进行第一仿射变换之后得到的图像;将训练数据集输入目标网络骨架进行训练,得到用于对图像进行分类的目标模型,其中,目标网络骨架为具有第一仿射不变性的网络骨架,第一仿射变换与第二仿射变换为不同的仿射变换。本公开可以提高模型的训练效果。本公开可以提高模型的训练效果。本公开可以提高模型的训练效果。

【技术实现步骤摘要】
目标模型的训练方法、装置、电子设备、介质和程序产品


[0001]本公开涉及人工智能
,尤其涉及计算机视觉、增强现实、虚拟现实、深度学习等
,可应用于智慧城市、元宇宙等场景。具体涉及一种目标模型的训练方法、装置、电子设备、介质和程序产品。

技术介绍

[0002]相关技术中,通常需要训练各种图像分类模型。相关技术中的训练手段为:获取大量样本图像,并为每个样本图像设置类别标签,以得到训练样本。然后,基于所得到的训练样本对模型进行训练,以得到具有图像分类功能的模型。

技术实现思路

[0003]本公开提供了一种目标模型的训练方法、装置、电子设备、介质和程序产品。
[0004]根据本公开的第一方面,提供了一种目标模型的训练方法,包括:
[0005]获取训练数据集,所述训练数据集包括第一训练数据和第二训练数据,所述第一训练数据包括第一图像和目标标签,所述第二训练数据包括第二图像和所述目标标签,其中,所述第二图像为对所述第一图像进行第一仿射变换之后得到的图像;
[0006]将所述训练数据集输入目标网络骨架进行本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种目标模型的训练方法,包括:获取训练数据集,所述训练数据集包括第一训练数据和第二训练数据,所述第一训练数据包括第一图像和目标标签,所述第二训练数据包括第二图像和所述目标标签,其中,所述第二图像为对所述第一图像进行第一仿射变换之后得到的图像;将所述训练数据集输入目标网络骨架进行训练,得到用于对图像进行分类的目标模型,其中,所述目标网络骨架为具有第一仿射不变性的网络骨架,所述第一仿射不变性与第二仿射变换相对应,所述第一仿射变换与所述第二仿射变换为不同的仿射变换。2.根据权利要求1所述的方法,其中,所述第一仿射变换和所述第二仿射变换中,一者为拉伸仿射变换,另一者为旋转仿射变换。3.根据权利要求1所述的方法,其中,所述训练数据集包括目标训练数据,所述目标训练数据为所述训练数据集中的任意训练数据,所述将所述训练数据集输入目标网络骨架进行训练,得到用于对图像进行分类的目标模型,包括:将所述目标训练数据包括的图像输入所述目标网络骨架进行分类,得到所述目标网络骨架输出的预测类别信息;基于所述预测类别信息与所述目标训练数据包括的标签对所述目标网络骨架进行参数优化,得到所述目标模型。4.根据权利要求3所述的方法,其中,所述目标网络骨架包括特征提取层,所述将所述目标训练数据包括的图像输入所述目标网络骨架进行分类,包括:将所述目标训练数据包括的图像输入所述目标网络骨架进行分类,得到所述特征提取层所输出的第一预测特征信息,其中,所述目标网络骨架用于基于所述第一预测特征信息,确定所述预测类别信息;所述基于所述预测类别信息与所述目标训练数据包括的标签对所述目标网络骨架进行参数优化,得到所述目标模型,包括:基于所述预测类别信息、所述目标训练数据包括的标签、所述第一预测特征信息和目标特征信息对所述目标网络骨架进行参数优化,得到所述目标模型,其中,所述目标特征信息包括所述目标训练数据包括的图像中的待分类对象的期望特征,所述预测特征信息包括对所述待分类对象的预测特征。5.根据权利要求4所述的方法,其中,所述基于所述预测类别信息、所述目标训练数据包括的标签、所述第一预测特征信息和目标特征信息对所述目标网络骨架进行参数优化,得到所述目标模型之前,所述方法还包括:对所述目标训练数据包括的图像进行K次不同的所述第一仿射变换,得到K张不同的第三图像,所述K为大于1的整数;将所述K张不同的第三图像分别输入所述目标网络骨架进行分类,得到所述特征提取层所输出的K组第二预测特征信息;基于所述K组第二预测特征信息生成所述目标特性信息,其中,所述目标特征信息为所述K组第二预测特征信息的平均特征信息。6.根据权利要求1所述的方法,其中,所述将所述训练数据集输入目标网络骨架进行训练,得到目标模型,包括:将所述训练数据集输入目标网络骨架进行迭代训练;
每隔预设时长,基于预设测试数据确定训练得到的模型的模型精度;在第s+1次确定的模型精度与第s次确定的模型精度相同的情况下,确定模型收敛,并将收敛的模型确定为所述目标模型,所述s为大于0的整数。7.一种目标模型的训练装置,包括:获取模块,用于获取训练数据集,所述训练数据集包括第一训练数据和第二训练数据,所述第一训练数据包括第一图像和目标标签,所述第二训练数据包括第二图像和所述目标标签,...

【专利技术属性】
技术研发人员:沈铮阳
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1