图像识别模型的训练方法、图像识别方法以及相关装置制造方法及图纸

技术编号:36040502 阅读:21 留言:0更新日期:2022-12-21 10:46
本公开提供了一种图像识别模型的训练方法、图像识别方法以及相关装置,涉及人工智能技术领域,尤其涉及深度学习、图像处理、大模型、计算机视觉技术领域。具体实现方案为:获取初始模型的骨干网络包含的模型参数,对模型参数进行特征分解,得到模型参数的至少两个子参数,基于图像样本数据对初始模型进行迭代训练,以获得图像识别模型,在任一次迭代训练的过程中,基于本次迭代训练的输出结果和图像样本数据的样本标签,调整第一子参数,第二子参数保持不变。如此,达到了对骨干网络中少量参数进行微调的效果,能够在避免模型过拟合的情况下提升骨干网络的训练效果,能够训练得到能力更好的模型,从而提升了图像识别的准确性。从而提升了图像识别的准确性。从而提升了图像识别的准确性。

【技术实现步骤摘要】
图像识别模型的训练方法、图像识别方法以及相关装置


[0001]本公开涉及人工智能
,尤其涉及深度学习、图像处理、大模型、计算机视觉
,具体涉及一种图像识别模型的训练方法、图像识别方法以及相关装置。

技术介绍

[0002]深度学习的出现,不仅拓展了人工智能的领域范围,还促进了人工智能的发展。其中,小样本学习的研究对响应当前人工智能的发展规划以及突破人工智能的理论瓶颈具有重要的意义。小样本学习的目标是通过少量样本数据的学习,使得机器模型能够获得与人类水平相当的识别能力。

技术实现思路

[0003]本公开提供了一种图像识别模型的训练方法、图像识别方法以及相关装置。
[0004]根据本公开的一方面,提供了一种图像识别模型的训练方法,该方法包括:
[0005]获取初始模型的骨干网络包含的模型参数,其中,用于训练该初始模型的图像样本数据的数量小于阈值;
[0006]对该模型参数进行特征分解,得到该模型参数的至少两个子参数,该至少两个子参数包括第一子参数和第二子参数;
[0007]基于该图像样本数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型的训练方法,所述方法包括:获取初始模型的骨干网络包含的模型参数,其中,用于训练所述初始模型的图像样本数据的数量小于阈值;对所述模型参数进行特征分解,得到所述模型参数的至少两个子参数,所述至少两个子参数包括第一子参数和第二子参数;基于所述图像样本数据对所述初始模型进行迭代训练,以获得所述图像识别模型;在任一次迭代训练的过程中,将所述图像样本数据输入上一次迭代训练后得到的模型中,以获得本次迭代训练的输出结果,根据所述输出结果和所述图像样本数据的样本标签,调整所述第一子参数,所述第二子参数保持不变;所述样本标签用于指示所述图像样本数据的图像信息。2.根据权利要求1所述的方法,其中,所述模型参数包括以下至少一项:所述骨干网络中卷积层包含的模型参数;所述骨干网络中的网络层包含的模型参数。3.根据权利要求1所述的方法,其中,所述第一子参数包括:权重子参数;所述第二子参数包括:特征子参数;所述权重子参数表示所述特征子参数的权重比例,所述特征子参数表示基于所述模型参数所确定的语义特征。4.根据权利要求1所述的方法,其中,所述对所述模型参数进行特征分解,得到所述模型参数的至少两个子参数,包括:对所述模型参数进行奇异值分解或正交三角分解,得到所述至少两个子参数。5.根据权利要求1所述的方法,其中,所述根据所述输出结果和所述图像样本数据的样本标签,调整所述第一子参数,包括:根据所述输出结果与所述图像样本数据的样本标签,确定本次迭代训练的模型损失值;根据所述模型损失值,调整所述第一子参数。6.根据权利要求1所述的方法,还包括:获取待识别图像;将所述待识别图像输入所述图像识别模型,通过所述图像识别模型提取所述待识别图像的图像特征,基于所述图像特征对所述待识别图像进行处理,以获得处理结果,所述处理包括分类处理、分割处理或预测处理中的任一项。7.一种图像识别方法,所述方法包括:获取待识别图像;将所述待识别图像输入图像识别模型,通过所述图像识别模型提取所述待识别图像的图像特征,基于所述图像特征对所述待识别图像进行处理,以获得处理结果,所述处理包括分类处理、分割处理或预测处理中的任一项;其中,所述图像识别模型是采用数量小于阈值的图像样本数据对初始模型进行训练得到的;在采用所述图像样本数据对所述初始模型进行训练的过程中,所述初始模型的骨干网络中包含的第一子参数被调整,除所述第一子参数外的其他所述骨干网络的第二子参数
保持不变。8.根据权利要求7所述的方法,还包括:获取所述初始模型的骨干网络包含的模型参数;对所述模型参数进行特征分解,得到所述模型参数的至少两个子参数,所述至少两个子参数包括所述第一子参数和所述第二子参数;基于所述图像样本数据对所述初始模型进行迭代训练,以获得所述图像识别模型;在任一次迭代训练的过程中,将所述图像样本数据输入上一次迭代训练后得到的模型中,以获得本次迭代训练的输出结果,根据所述输出结果和所述图像样本数据的样本标签,调整所述第一子参数,所述第二子参数保持不变;所述样本标签用于指示所述图像样本数据的图像信息。9.一种图像识别模型的训练装置,所述装置包括:获取模块,用于获取初始模型的骨干网络包含的模型参数,其中,用于训练所述初始模型的图像样本数据的数量小于阈值;分解模块,用于对所述模型参数进行特征分解,得到所述模型参数的至少两个子参数,所述至少两个子参数包括第一子参数和第二子参数;训练模块,用于基于所述图像样本数据对所述初始模型进行迭代训练,以获得所述图像识别模型;调整模块,用于在任一次迭代训练的过...

【专利技术属性】
技术研发人员:谌强
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1