【技术实现步骤摘要】
一种视频人体姿态估计方法及装置
[0001]本专利技术涉及计算机视觉领域,尤其是涉及一种视频人体姿态估计方法及装置。
技术介绍
[0002]人体姿态估计(Human Pose Estimation,HPE)已在计算机视觉的历史中得到广泛研究。给定一段从传感器捕获的点云的观测,或者一段RGB(色彩模式)视频,甚至是一张RGB图像,让神经网络或者迭代程序自动还原人体姿态,是人体姿态估计的主要任务。
[0003]HPE得到的人体模型的参数信息,包含着人体的几何信息和运动信息,这些信息已得到广泛的应用,常见的有人机交互、增强现实(Augmentation Reality,AR)、虚拟现实(Virtual Reality,VR)等等。除此之外,HPE在自动驾驶中也有着广泛而关键的应用,如行人检测。通过HPE技术实现的行人检测比传统的目标检测更加精确,为自动驾驶的安全提供保障。随着元宇宙(Metaverse)的概念的提出,人体姿态估计成为其一关键技术,越来越多学者投入到人体姿态估计的研究,HPE的热度即将被推向高潮。
[ ...
【技术保护点】
【技术特征摘要】
1.一种视频人体姿态估计方法,其特征在于,包括以下步骤:S1:输入视频并切割视频为图像;S2:确定视频中每一个人的位置并裁剪;S3:将裁剪后的图像输入到基于蒙皮多人线性模型的人体姿态估计方法中,得到结果数据,所述蒙皮多人线性模型为基于顶点的裸体人体三维模型;S4:初始化隐空间序列,将数据输入动作先验条件变分自编码器,对齐关节点并计算生成器和观测的结果的平方误差,极小化所述平方误差;S5:输出人体姿态估计结果。2.如权利要求1所述的方法,其特征在于,步骤S3中所述基于蒙皮多人线性模型为SMPL,所述基于蒙皮多人线性模型的人体姿态估计方法为PARE。3.如权利要求1所述的方法,其特征在于,步骤S4中所述动作先验条件变分自编码器为HuMoR。4.如权利要求1所述的方法,其特征在于,步骤S4中,所述关节点对齐步骤包括如下变换:y=D(z)y
′
=y
‑
y0其中y为动作先验条件变分自编码器中的解码器的输出,y0为动作先验条件变分自编码器估计结果的人体模型的盆骨顶点坐标,为所述人体姿态估计方法的蒙皮多人线性模型的估计结果,为所述人体姿态估计方法的估计结果的人体模型的盆骨顶点坐标,D()表示动作先验条件变分自解码器,z为隐空...
【专利技术属性】
技术研发人员:张凯,陈文硕,
申请(专利权)人:清华大学深圳国际研究生院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。