模型训练方法、姿态估计方法、装置及电子设备制造方法及图纸

技术编号:27744364 阅读:31 留言:0更新日期:2021-03-19 13:38
本申请公开了一种模型训练方法、姿态估计方法、装置及电子设备,涉及计算机视觉、增强现实、深度学习等人工智能技术领域。具体实现方案为:获取样本图像;将样本图像输入第一模型进行训练,得到目标姿态估计模型;目标姿态估计模型包括人像分割网络和姿态估计模型,姿态估计模型的输入包括人像分割网络的输出。利用样本图像对第一模型进行训练,得到的目标姿态估计模型包括人像分割网络和姿态估计模型,而不是仅对姿态估计模型进行训练得到用于姿态估计的模型,在本实施例中,相对姿态估计模型,增加了人像分割网络的模型,通过人像分割网络可获得更多的图像语义信息,如此,可提高训练得到的目标姿态估计模型的性能。

【技术实现步骤摘要】
模型训练方法、姿态估计方法、装置及电子设备
本申请涉及计算机技术中的计算机视觉、增强现实、深度学习等人工智能
,尤其涉及一种模型训练方法、姿态估计方法、装置及电子设备。
技术介绍
人体姿态估计算法可以检测出图片或视频中各个人体关键点(例如,关节点、骨骼等)的位置,在人体交互、动作识别、行为监控、美体等领域具有十分广泛的应用价值。对于人体姿态估计,人体姿态估计模型是关键,目前在人体姿态估计模型的训练过程中,常采用的方法是直接将样本图像输入用于检测人体各关键点的热图(heatmap)的待训练模型进行训练。
技术实现思路
本申请提供一种模型训练方法、姿态估计方法、装置及电子设备。第一方面,本申请一个实施例提供一种模型训练方法,所述方法包括:获取样本图像;将所述样本图像输入第一模型进行训练,得到目标姿态估计模型;其中,所述目标姿态估计模型包括人像分割网络和姿态估计模型,所述姿态估计模型的输入包括所述人像分割网络的输出。利用样本图像对第一模型进行训练,得到的目标姿态估计模型包括人像本文档来自技高网...

【技术保护点】
1.一种模型训练方法,所述方法包括:/n获取样本图像;/n将所述样本图像输入第一模型进行训练,得到目标姿态估计模型;/n其中,所述目标姿态估计模型包括人像分割网络和姿态估计模型,所述姿态估计模型的输入包括所述人像分割网络的输出。/n

【技术特征摘要】
1.一种模型训练方法,所述方法包括:
获取样本图像;
将所述样本图像输入第一模型进行训练,得到目标姿态估计模型;
其中,所述目标姿态估计模型包括人像分割网络和姿态估计模型,所述姿态估计模型的输入包括所述人像分割网络的输出。


2.根据权利要求1所述的方法,所述第一模型包括初始人像分割网络和初始姿态估计模型,所述初始人像分割网络的输入包括所述样本图像,所述初始姿态估计模型的输入包括所述初始人像分割网络的输出;
所述将所述样本图像输入第一模型进行训练,得到目标姿态估计模型,包括:
将所述样本图像输入所述初始人像分割网络,利用所述初始人像分割网络输出的第一分割图像以及所述样本图像对应的真实分割图像,确定第一损失值;
利用所述初始姿态估计模型根据所述第一分割图像输出的热图以及所述样本图像对应的真实热图,确定第二损失值;
依据所述第一损失值和所述第二损失值,对所述第一模型进行训练,得到所述目标姿态估计模型。


3.根据权利要求2所述的方法,所述依据所述第一损失值和所述第二损失值,对所述第一模型进行训练,得到所述目标姿态估计模型,包括:
计算所述第一损失值与所述第二损失值之和,得到总损失值;
根据所述总损失值,对所述第一模型进行训练,得到所述目标姿态估计模型。


4.根据权利要求1所述的方法,所述样本图像为样本人体框图;
所述获取样本图像,包括:
获取样本图片;
对所述样本图片进行人体检测,确定所述样本图片中的人体框;
对所述样本图片中的人体框进行剪裁,得到所述样本人体框图。


5.一种姿态估计方法,所述方法包括:
获取待测图像;
通过目标姿态估计模型对所述待测图像进行人体姿态估计,输出所述待测图像的多个关键点的预测热图;
其中,所述目标姿态估计模型包括人像分割网络和姿态估计模型,所述人像分割网络的输入包括所述待测图像,所述姿态估计模型的输入包括所述人像分割网络的输出。


6.根据权利要求5所述的方法,所述通过目标姿态估计模型对所述待测图像进行人体姿态估计,输出所述待测图像的多个关键点的预测热图,包括:
对所述待测图像进行人体检测,确定所述待测图像中的人体框;
对所述待测图像中的人体框进行剪裁,得到待测人体框图;
通过所述目标姿态估计模型对所述待测人体框图进行人体姿态估计,输出所述待测图像的多个关键点的预测热图。


7.一种模型训练装置,所述装置包括:
第一获取模块,用于获取样本图像;
训练模块,用于将所述样本图像输入第一模型进行训练,得到目标姿态估计模型;
其中,所述目标姿态估计模型包括人像分割网络和姿态估计模型,所述姿态估计模型的输入包括所述人像分割网络的输出。


8.根据权利要求7所述的装置,所述第一模型包括初始人像分割网络和初始姿态估计...

【专利技术属性】
技术研发人员:杨少雄
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1