人体姿态估计方法和装置、电子设备、存储介质、程序制造方法及图纸

技术编号：18784276 阅读：25 留言：0更新日期：2018-08-29 07:08

本发明专利技术实施例公开了一种人体姿态估计方法和装置、电子设备、存储介质、程序，其中，方法包括：利用坐标估计网络，基于图像获得至少一个人体图像特征；基于所述人体图像特征获得所述图像中的人体关键点的二维坐标信息，所述图像包括至少一个人体关键点；利用深度估计网络，基于所述图像和所述图像中的人体关键点的二维坐标信息获得人体关键点的深度信息。本发明专利技术上述实施例通过坐标估计网络获得图像中各人体关键点的二维坐标信息，通过二维坐标信息可确定人体关键点在图像中所处的平面位置；获得人体关键点的深度信息，通过获得的人体关键点的深度信息结合二维坐标信息，即可确定图像中人体关键点的三维坐标信息，实现三维人体姿态估计。

全部详细技术资料下载

【技术实现步骤摘要】
人体姿态估计方法和装置、电子设备、存储介质、程序
本专利技术涉及计算机视觉技术，尤其是一种人体姿态估计方法和装置、电子设备、存储介质、程序。
技术介绍
人体姿态估计是计算机视觉领域的一个基础研究课题。给定一张图像或一段视频，人体姿态估计旨在定位出图像或视频中人体身体各部分的二维位置或者三维位置。人体姿态估计在很多领域都有重要应用，如动作识别，行为识别，服装解析，人物比对，人机交互等。随着深度学习的快速发展，二维人体姿态估计已经取得了长足的进步。然而三维人体姿态估计的进展仍然十分有限，三维人体姿态估计的难点主要在于获取训练数据十分困难，对二维人体姿态估计数据集而言，可通过人工标注获得，标注员只需要标注出人体关键点在图像中的位置即可；而对于三维人体姿态数据集，还需要知道每个关键点的深度信息，而深度信息无法通过人工标注。
技术实现思路
本专利技术实施例提供的一种人体姿态估计技术。根据本专利技术实施例的一个方面，提供的一种人体姿态估计方法，包括：利用坐标估计网络，基于图像获得至少一个人体图像特征；基于所述人体图像特征获得所述图像中的人体关键点的二维坐标信息，所述图像包括至少一个人体关键点；利用深度估计网络，基于所述图像和所述图像中的人体关键点的坐标信息获得所述人体关键点的深度信息。在基于本专利技术上述方法的另一个实施例中，所述坐标估计网络和所述深度估计网络通过与判别网络对抗训练获得。在基于本专利技术上述方法的另一个实施例中，每个所述人体图像特征对应一个人体关键点。在基于本专利技术上述方法的另一个实施例中，所述人体图像特征包括得分特征图；基于所述人体图像特征获得所述图像...

【技术保护点】
1.一种人体姿态估计方法，其特征在于，包括：利用坐标估计网络，基于图像获得至少一个人体图像特征；基于所述人体图像特征获得所述图像中的人体关键点的二维坐标信息，所述图像包括至少一个人体关键点；利用深度估计网络，基于所述图像和所述图像中的人体关键点的二维坐标信息获得所述人体关键点的深度信息。

【技术特征摘要】
1.一种人体姿态估计方法，其特征在于，包括：利用坐标估计网络，基于图像获得至少一个人体图像特征；基于所述人体图像特征获得所述图像中的人体关键点的二维坐标信息，所述图像包括至少一个人体关键点；利用深度估计网络，基于所述图像和所述图像中的人体关键点的二维坐标信息获得所述人体关键点的深度信息。2.根据权利要求1所述的方法，其特征在于，所述坐标估计网络和所述深度估计网络通过与判别网络对抗训练获得。3.根据权利要求1或2所述的方法，其特征在于，每个所述人体图像特征对应一个人体关键点。4.根据权利要求1-3任一所述的方法，其特征在于，所述人体图像特征包括得分特征图；基于所述人体图像特征获得所述图像中的人体关键点的二维坐标信息，包括：基于所述得分特征图中最大分值的位置，将所述最大分值的位置映射到所述图像，得到对应所述人体关键点的二维坐标信息。5.根据权利要求1-4任一所述的方法，其特征在于，所述利用深度估计网络，基于所述图像和所述图像中的人体关键点的二维坐标信息获得人体关键点的深度信息，包括：所述图像经过所述坐标估计网络中的至少一个卷积层输出中间图像特征；利用深度估计网络，基于所述...

【专利技术属性】
技术研发人员：杨巍，欧阳万里，王晓刚，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人