视觉模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号:30185886 阅读:20 留言:0更新日期:2021-09-29 08:22
本申请实施例公开了一种目标视觉模型的训练方法、装置、设备及存储介质。该目标视觉模型的训练方法包括:获取第一样本图像和背景图像;根据所述第一样本图像获取目标图像,并将所述目标图像置于所述背景图像得到第二样本图像;将各个样本图像输入至待训练模型中,以使得所述待训练模型根据所述样本图像预测出对应的预测类别;根据所述目标类别和所述预测类别,确定第一损失值,并根据所述第一损失值对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型。本申请实施例中可以解决因样本数据少、样本数据获取困难等原因而导致模型性能低的问题。致模型性能低的问题。致模型性能低的问题。

【技术实现步骤摘要】
视觉模型的训练方法、装置、设备及存储介质


[0001]本申请实施例涉及计算机视觉
,具体涉及一种目标视觉模型的训练方法、装置、设备及存储介质。

技术介绍

[0002]随着人工智能技术的不断发展,对图像中的目标进行识别的方式也越来越多的采用机器学习算法完成。
[0003]目前大部分机器学习依赖于大量的标注数据,若要训练得到性能较好的网络模型,则需要获取大量的样本数据对模型进行训练。然而,在实际情况中,往往会存在样本数据少、样本数据获取困难等问题。因此,如何在样本数据较少的情况下训练出高性能的模型是机器学习的一个难题。

技术实现思路

[0004]本申请实施例提供一种目标视觉模型的训练方法、装置、设备及存储介质,可以使得训练数据得到扩增,进而使得模型性能得到提升,解决因样本数据少、样本数据获取困难等原因而导致模型性能低的问题。
[0005]第一方面,本申请实施例提供一种目标视觉模型的训练方法,所述方法包括:
[0006]获取第一样本图像和背景图像,所述背景图像是指任意场景的图像,所述第一样本图像是指承载了第一目标物体的图像;
[0007]根据所述第一样本图像获取目标图像,并将所述目标图像置于所述背景图像得到第二样本图像,所述目标图像是指所述第一样本图像中承载物体的区域的图像;
[0008]将各个样本图像输入至待训练模型中,以使得所述待训练模型根据所述样本图像预测出对应的预测类别,其中,所述样本图像包括所述第一样本图像和所述第二样本图像,所述样本图像标注有图像中的物体的类别标签,所述类别标签用于指示所述样本图像中的物体所属的目标类别;
[0009]根据所述目标类别和所述预测类别,确定第一损失值,并根据所述第一损失值对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型。
[0010]在本申请的一些实施例中,所述待训练模型还包括目标分割分支,所述样本图像还标注有图像中的物体的分割标签,所述分割标签用于指示所述样本图像中的物体的分割数据;
[0011]所述根据所述第一损失值对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型,包括:
[0012]获取所述目标分割分支根据所述样本图像输出的预测分割数据;
[0013]根据所述预测分割数据和所述分割标签对应的分割数据,确定第二损失值;
[0014]根据所述第一损失值和所述第二损失值,对所述待训练模型的模型参数进行调
整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型。
[0015]在本申请的一些实施例中,所述待训练模型还包括关键点检测分支,所述样本图像还标注有图像中的物体的关键点标签,所述关键点标签用于指示所述样本图像中的物体的关键点信息;
[0016]所述根据所述第一损失值和所述第二损失值,对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型,包括:
[0017]获取所述关键点检测分支根据所述样本图像输出的预测关键点;
[0018]根据所述预测关键点和所述关键点标签对应的关键点信息,确定第三损失值;
[0019]根据所述第一损失值、所述第二损失值和所述第三损失值,对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型。
[0020]在本申请的一些实施例中,所述方法还包括:
[0021]获取待检测图像,并将所述待检测图像输入所述目标视觉模型;
[0022]获取所述关键点检测分支根据所述待检测图像输出的第二目标物体的关键点,所述第二目标物体是指所述待检测图像中承载的物体。
[0023]在本申请的一些实施例中,所述方法还包括:
[0024]获取待识别图像,并将所述待识别图像输入所述目标视觉模型;
[0025]获取所述目标分割分支根据所述待识别图像输出的第三目标物体的分割数据,所述第三目标物体是指所述待识别图像中承载的物体。
[0026]在本申请的一些实施例中,所述第二样本图像对应的类别标签与所述第一样本图像对应的类别标签相同。
[0027]在本申请的一些实施例中,所述样本图像还包括第三样本图像,所述第三样本图像通过以下步骤得到:
[0028]对待处理图像进行图像预处理,得到所述第三样本图像,所述待处理图像包括第一样本图像、第二样本图像中的至少一种,所述图像预处理包括图像旋转、图像缩放、图像裁剪、图像滤波、图像填充、图像对比度变换、图像颜色变换、图像锐化操作中的至少一种。
[0029]第二方面,本申请实施例提供一种目标视觉模型的训练装置,所述目标视觉模型的训练装置包括:
[0030]获取单元,用于获取第一样本图像和背景图像,所述背景图像是指任意场景的图像,所述第一样本图像是指承载了第一目标物体的图像;
[0031]处理单元,用于根据所述第一样本图像获取目标图像,并将所述目标图像置于所述背景图像得到第二样本图像,所述目标图像是指所述第一样本图像中承载物体的区域的图像;
[0032]训练单元,用于将各个样本图像输入至待训练模型中,以使得所述待训练模型根据所述样本图像预测出对应的预测类别,其中,所述样本图像包括所述第一样本图像和所述第二样本图像,所述样本图像标注有图像中的物体的类别标签,所述类别标签用于指示所述样本图像中的物体所属的目标类别;根据所述目标类别和所述预测类别,确定第一损失值,并根据所述第一损失值对所述待训练模型的模型参数进行调整,直至满足预设的停
止训练条件,将训练好的所述待训练模型作为目标视觉模型。
[0033]在本申请的一些实施例中,所述待训练模型还包括目标分割分支,所述样本图像还标注有图像中的物体的分割标签,所述分割标签用于指示所述样本图像中的物体的分割数据;所述训练单元具体还用于:
[0034]获取所述目标分割分支根据所述样本图像输出的预测分割数据;
[0035]根据所述预测分割数据和所述分割标签对应的分割数据,确定第二损失值;
[0036]根据所述第一损失值和所述第二损失值,对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型。
[0037]在本申请的一些实施例中,所述待训练模型还包括关键点检测分支,所述样本图像还标注有图像中的物体的关键点标签,所述关键点标签用于指示所述样本图像中的物体的关键点信息;所述训练单元具体还用于:
[0038]获取所述关键点检测分支根据所述样本图像输出的预测关键点;
[0039]根据所述预测关键点和所述关键点标签对应的关键点信息,确定第三损失值;
[0040]根据所述第一损失值、所述第二损失值和所述第三损失值,对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标视觉模型的训练方法,其特征在于,所述方法包括:获取第一样本图像和背景图像,所述背景图像是指任意场景的图像,所述第一样本图像是指承载了第一目标物体的图像;根据所述第一样本图像获取目标图像,并将所述目标图像置于所述背景图像得到第二样本图像,所述目标图像是指所述第一样本图像中承载物体的区域的图像;将各个样本图像输入至待训练模型中,以使得所述待训练模型根据所述样本图像预测出对应的预测类别,其中,所述样本图像包括所述第一样本图像和所述第二样本图像,所述样本图像标注有图像中的物体的类别标签,所述类别标签用于指示所述样本图像中的物体所属的目标类别;根据所述目标类别和所述预测类别,确定第一损失值,并根据所述第一损失值对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型。2.根据权利要求1所述的目标视觉模型的训练方法,其特征在于,所述待训练模型还包括目标分割分支,所述样本图像还标注有图像中的物体的分割标签,所述分割标签用于指示所述样本图像中的物体的分割数据;所述根据所述第一损失值对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型,包括:获取所述目标分割分支根据所述样本图像输出的预测分割数据;根据所述预测分割数据和所述分割标签对应的分割数据,确定第二损失值;根据所述第一损失值和所述第二损失值,对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型。3.根据权利要求2所述的目标视觉模型的训练方法,其特征在于,所述待训练模型还包括关键点检测分支,所述样本图像还标注有图像中的物体的关键点标签,所述关键点标签用于指示所述样本图像中的物体的关键点信息;所述根据所述第一损失值和所述第二损失值,对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型,包括:获取所述关键点检测分支根据所述样本图像输出的预测关键点;根据所述预测关键点和所述关键点标签对应的关键点信息,确定第三损失值;根据所述第一损失值、所述第二损失值和所述第三损失值,对所述待训练模型的模型参数进行调整,直至满足预设的停止训练条件,将训练好的所述待训练模型作为目标视觉模型。4.根据权利要求3所述的目标视觉模型的训练方法,其特征在于,所述方法还包括:获取待检测图像,并将所述待检...

【专利技术属性】
技术研发人员:陈奇华
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1