视觉模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号：30185886 阅读：20 留言：0更新日期：2021-09-29 08:22

本申请实施例公开了一种目标视觉模型的训练方法、装置、设备及存储介质。该目标视觉模型的训练方法包括：获取第一样本图像和背景图像；根据所述第一样本图像获取目标图像，并将所述目标图像置于所述背景图像得到第二样本图像；将各个样本图像输入至待训练模型中，以使得所述待训练模型根据所述样本图像预测出对应的预测类别；根据所述目标类别和所述预测类别，确定第一损失值，并根据所述第一损失值对所述待训练模型的模型参数进行调整，直至满足预设的停止训练条件，将训练好的所述待训练模型作为目标视觉模型。本申请实施例中可以解决因样本数据少、样本数据获取困难等原因而导致模型性能低的问题。致模型性能低的问题。致模型性能低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
视觉模型的训练方法、装置、设备及存储介质

[0001]本申请实施例涉及计算机视觉
，具体涉及一种目标视觉模型的训练方法、装置、设备及存储介质。

技术介绍

[0002]随着人工智能技术的不断发展，对图像中的目标进行识别的方式也越来越多的采用机器学习算法完成。
[0003]目前大部分机器学习依赖于大量的标注数据，若要训练得到性能较好的网络模型，则需要获取大量的样本数据对模型进行训练。然而，在实际情况中，往往会存在样本数据少、样本数据获取困难等问题。因此，如何在样本数据较少的情况下训练出高性能的模型是机器学习的一个难题。

技术实现思路

[0004]本申请实施例提供一种目标视觉模型的训练方法、装置、设备及存储介质，可以使得训练数据得到扩增，进而使得模型性能得到提升，解决因样本数据少、样本数据获取困难等原因而导致模型性能低的问题。
[0005]第一方面，本申请实施例提供一种目标视觉模型的训练方法，所述方法包括：
[0006]获取第一样本图像和背景图像，所述背景图像是指任意场景的图像，所述第一样本图像是指承载了第一目标物体的图像；
[0007]根据所述第一样本图像获取目标图像，并将所述目标图像置于所述背景图像得到第二样本图像，所述目标图像是指所述第一样本图像中承载物体的区域的图像；
[0008]将各个样本图像输入至待训练模型中，以使得所述待训练模型根据所述样本图像预测出对应的预测类别，其中，所述样本图像包括所述第一样本图像和所述第二样本图像，所述样本图像标注有图像中的...

【技术保护点】

【技术特征摘要】
1.一种目标视觉模型的训练方法，其特征在于，所述方法包括：获取第一样本图像和背景图像，所述背景图像是指任意场景的图像，所述第一样本图像是指承载了第一目标物体的图像；根据所述第一样本图像获取目标图像，并将所述目标图像置于所述背景图像得到第二样本图像，所述目标图像是指所述第一样本图像中承载物体的区域的图像；将各个样本图像输入至待训练模型中，以使得所述待训练模型根据所述样本图像预测出对应的预测类别，其中，所述样本图像包括所述第一样本图像和所述第二样本图像，所述样本图像标注有图像中的物体的类别标签，所述类别标签用于指示所述样本图像中的物体所属的目标类别；根据所述目标类别和所述预测类别，确定第一损失值，并根据所述第一损失值对所述待训练模型的模型参数进行调整，直至满足预设的停止训练条件，将训练好的所述待训练模型作为目标视觉模型。2.根据权利要求1所述的目标视觉模型的训练方法，其特征在于，所述待训练模型还包括目标分割分支，所述样本图像还标注有图像中的物体的分割标签，所述分割标签用于指示所述样本图像中的物体的分割数据；所述根据所述第一损失值对所述待训练模型的模型参数进行调整，直至满足预设的停止训练条件，将训练好的所述待训练模型作为目标视觉模型，包括：获取所述目标分割分支根据所述样本图像输出的预测分割数据；根据所述预测分割数据和所述分割标签对应的分割数据，确定第二损失值；根据所述第一损失值和所述第二损失值，对所述待训练模型的模型参数进行调整，直至满足预设的停止训练条件，将训练好的所述待训练模型作为目标视觉模型。3.根据权利要求2所述的目标视觉模型的训练方法，其特征在于，所述待训练模型还包括关键点检测分支，所述样本图像还标注有图像中的物体的关键点标签，所述关键点标签用于指示所述样本图像中的物体的关键点信息；所述根据所述第一损失值和所述第二损失值，对所述待训练模型的模型参数进行调整，直至满足预设的停止训练条件，将训练好的所述待训练模型作为目标视觉模型，包括：获取所述关键点检测分支根据所述样本图像输出的预测关键点；根据所述预测关键点和所述关键点标签对应的关键点信息，确定第三损失值；根据所述第一损失值、所述第二损失值和所述第三损失值，对所述待训练模型的模型参数进行调整，直至满足预设的停止训练条件，将训练好的所述待训练模型作为目标视觉模型。4.根据权利要求3所述的目标视觉模型的训练方法，其特征在于，所述方法还包括：获取待检测图像，并将所述待检...

【专利技术属性】
技术研发人员：陈奇华，
申请(专利权)人：顺丰科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人