一种图像分类模型训练方法、装置及电子设备制造方法及图纸

技术编号:34733802 阅读:64 留言:0更新日期:2022-08-31 18:23
本公开提供了一种图像分类模型训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习和计算机视觉技术领域。具体实现方案为:获取目标图像样本集;将所述目标图像样本集中的各图像样本分别输入目标骨干网络模型和第一教师模型,得到所述目标骨干网络模型输出的第一分类概率和所述第一教师模型输出的第二分类概率;基于所述第一分类概率和所述第二分类概率确定损失函数;基于所述损失函数调整所述目标骨干网络模型的参数;其中,所述目标骨干网络模型用于确定输入至所述目标骨干网络模型的图像的类别,所述目标骨干网络模型的初始参数基于第二学生模型确定。模型的初始参数基于第二学生模型确定。模型的初始参数基于第二学生模型确定。

【技术实现步骤摘要】
一种图像分类模型训练方法、装置及电子设备


[0001]本公开涉及人工智能
,尤其涉及深度学习和计算机视觉
的图像分类模型训练方法、装置及电子设备。

技术介绍

[0002]在基于深度学习的计算机视觉任务中,如图像分类等均需要工作人员根据不同的场景和任务,对图像处理模型的参数进行调整,导致图像分类的效率低;因此,提高图像分类的效率是计算机视觉领域一直追求的目标。

技术实现思路

[0003]本公开提供了一种图像分类模型训练方法、装置及电子设备。
[0004]根据本公开的第一方面,提供了一种图像分类模型训练方法,包括:
[0005]获取目标图像样本集;
[0006]将所述目标图像样本集中的各图像样本分别输入目标骨干网络模型和第一教师模型,得到所述目标骨干网络模型输出的第一分类概率和所述第一教师模型输出的第二分类概率;
[0007]基于所述第一分类概率和所述第二分类概率确定损失函数;
[0008]基于所述损失函数调整所述目标骨干网络模型的参数;
[0009]其中,所述目标骨干网络本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像分类模型训练方法,包括:获取目标图像样本集;将所述目标图像样本集中的各图像样本分别输入目标骨干网络模型和第一教师模型,得到所述目标骨干网络模型输出的第一分类概率和所述第一教师模型输出的第二分类概率;基于所述第一分类概率和所述第二分类概率确定损失函数;基于所述损失函数调整所述目标骨干网络模型的参数;其中,所述目标骨干网络模型用于确定输入至所述目标骨干网络模型的图像的类别,所述目标骨干网络模型的初始参数基于第二学生模型确定。2.根据权利要求1所述的方法,其中,所述获取目标图像样本集包括:获取初始图像样本集;对所述初始图像样本集中的各初始图像样本进行数据增强处理,得到候选图像样本集;确定所述初始图像样本集以及所述候选图像样本集构成的图像样本集合为所述目标图像样本集。3.根据权利要求2所述的方法,其中,所述对所述初始图像样本集中的各初始图像样本进行数据增强处理,包括:对所述初始图像样本集中的各初始图像样本执行下述至少一种处理:图像变换、图像剪裁和图像擦除。4.根据权利要求1所述的方法,其中,所述方法还包括:获取第一图像样本集;将所述第一图像样本集中的各图像分别输入第二教师模型,得到所述第二教师模型输出的图像类别分布概率;将所述第一图像样本集中的各图像作为所述第二学生模型的输入,将所述图像类别分布概率作为所述第二学生模型的输出,训练所述第二学生模型。5.根据权利要求4所述的方法,其中,所述方法还包括:确定训练完成的所述第二学生模型的参数为所述目标骨干网络模型的初始参数。6.根据权利要求1所述的方法,其中,所述方法还包括:针对所述目标骨干网络模型中的第一超参数,遍历所述第一超参数对应的超参数值,确定全部所述超参数值对应的各目标骨干网络模型中的最优目标骨干网络模型;确定所述最优目标骨干网络模型对应的超参数值为所述第一超参数对应的超参数值。7.根据权利要求1所述的方法,其中,所述第一超参数包括下述中的至少一项:学习率、图像的输入分辨率、分阶段学习率倍数、随机擦除概率、随机数据增强概率和第一教师模型选择。8.根据权利要求1所...

【专利技术属性】
技术研发人员:魏胜禹崔程郭若愚郜廷权吕健周颖杜宇宁吕雪莹
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1