一种估计三维人体姿态及手部信息的方法技术

技术编号：20869787 阅读：37 留言：0更新日期：2019-04-17 10:01

本发明专利技术为一种估计三维人体姿态及手部信息的方法，实现了一种新的以彩色深度相机单帧数据来自动准确的同时估计人体和手部的姿态以及人体实际体形的独特方法。首先将深度相机的关节预测与深度学习从彩色图预测关节的方法结合，同时获取人体的头部的转向解决现有技术不能匹配头部姿态的问题。同时，在人体估计中同时还原人手的姿态，使人体结果更形象具体，使用深度学习的方法从彩色图预测出手的3D姿态，然后使用3D人体关节拟合能量模型来完成人体姿态与最新的参数化人体模型SMPL+H的拟合。最后将获取的人体表面点云与拟合的模型进行配准提升人体形状估计的精确程度。籍此估计出一个准确的包含手部真实姿态的三维人体模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种估计三维人体姿态及手部信息的方法
本专利技术属于图像处理
，具体为一种估计三维人体姿态及手部信息的方法。
技术介绍
我们致力于以景深彩色相机/Kinect的单帧数据准确的估计穿着衣服的人的裸体形状及姿态，包括手部的准确状态。相对一些复杂的系统，我们仅使用一个消费级的深度相机，并且仅利用其一帧的数据即可真缺估计任意姿态下的人体。在此工作中，我们提出了创造性的混合关节预测方法，即将深度相机从深度数据预测到的人体关节与以深度学习方法从彩色图像预测到的3D关节相结合从而得到更准确鲁棒的关节位置，并能同时从相机得到人体的头部实际转向。同时我们能比较超前的同时估计出人手的姿态达到一个人“全体”的估计，为此我们进行人手的姿态的预测，然后建立一个新的以3D关节等信息拟合出人体的能量模型，辅以单面人体点云从而获取准确的估计结果。现存的工作或花费较大或较为复杂或有缺陷，我们的系统一定程度上填补了这项空缺。如图1，简单展示了我们的系统的内容。重建人体有很多相关的工作，但之前的工作都有着其缺陷或局限。文献[13,14]使用多立体相机系统获取3D扫描序列，结合模型[8]来重建人体，但花费昂贵。文献[3,4,5,6]使用多个位置的Kinect或彩色相机进行重建，文献[11,12]在多相机的基础上使用静态统计模型提升结果的鲁棒性。但上面这些方法依然需要较大的花费以及要求一定的空间，而我们的方法仅仅需要一个消费级的深度相机即可方便准确的估计出三维人体。也有一些工作致力于单相机的人体重建。文献[1,2]以单个相机的多角度数据进行重建，但要求人静止不动，而我们的方法只需要人在镜头前...

【技术保护点】
1.一种估计三维人体姿态及手部信息的方法，其特征在于，由计算机按如下步骤进行：步骤1：通过景深彩色相机获取彩色图与深度图，并传递至计算机；所述景深彩色相机，可由RGB相机和深度相机/红外相机替代；步骤2：由计算机进行混合关节预测；步骤3：由计算机拟合人体模型到关节点，并约束头部方向估计人体姿态和体型；步骤4：由计算机使用点云数据对拟合结果进行细节优化；步骤5：由计算机对拟合过程进行优化，并输出结果。

【技术特征摘要】
1.一种估计三维人体姿态及手部信息的方法，其特征在于，由计算机按如下步骤进行：步骤1：通过景深彩色相机获取彩色图与深度图，并传递至计算机；所述景深彩色相机，可由RGB相机和深度相机/红外相机替代；步骤2：由计算机进行混合关节预测；步骤3：由计算机拟合人体模型到关节点，并约束头部方向估计人体姿态和体型；步骤4：由计算机使用点云数据对拟合结果进行细节优化；步骤5：由计算机对拟合过程进行优化，并输出结果。2.根据权利要求1所述的一种估计三维人体姿态及手部信息的方法，其特征在于，所述景深彩色相机为一台具有RGB相机、深度传感器和红外投影机功能的相机，进一步说，景深彩色相机为Kinect相机。3.根据权利要求1所述的一种估计三维人体姿态及手部信息的方法，其特征在于，本发明的具体方法如下：首先，通过景深彩色相机的单帧数据作为输入，该单帧数据包含深度图，彩色图，以及相机从深度图计算得到的人体骨骼与头部方向数据；然后，使用混合预测的方法获取所需的3D骨骼关节点、3D人手关节点和人体3D点云数据，采用最小化SMPL关节和数据3D关节之间的误差的目标函数，将SMPL+H模型准确拟合到3D骨骼关节点；所述3D骨骼关节点为混合预测后包括手指骨骼关节点在内的数据；通过最小化SMPL关节和数据3D关节/3D骨骼关节点之间的误差的目标函数，首先对人体姿态进行拟合，得到一个与真实人体姿态体型基本一致的模型；然后，将模型的头部方向约束到人体的头部方向并使用3D点云数据通过一个约束人体点云与模型表面的能量函数来对拟合结果的细节准确性进行进一步优化，从而得到最终的准确的人体估计结果。4.根据权利要求1所述的一种估计三维人体姿态及手部信息的方法，其特征在于，步骤1的具体方法如下：景深彩色相机为微软的第二代Kinect设备，该设备包含RGB相机/彩色相机、红外深度传感器。5.根据权利要求1所述的一种估计三维人体姿态及手部信息的方法，其特征在于，步骤2的具体方法如下：由景深彩色相机获取被采样人体的25个关节点，其中某些关节点严重偏离，结合LCR-Net深度学习的方法从彩色图估计的13个人体3D关节点进行混合预测，从而获得准确的关节位置：对于不准确的关节点j，通过LCR-Net获得的关节点的关节角度来对其进行修正从而得到该关节点的准确位置j*：其中jp为该关节点在关节树上的父关节点，是指向z轴方向的单位向量，R为罗德里格斯旋转矩阵，当j在LCR-Net所预测的骨骼中对应的关节点为j′，我们通过下式计算R：其中E是三维单位矩阵，A为向量的反对称矩阵，j′p为jp在LCR-Net中对应的关节点，是j′在关节树上的父关节点。6.根据权利要求1所述的一种估计三维人体姿态及手部信息的方法，其特征在于，步骤3的具体方法如下：通过最小化SMPL标准模型与目标人体之间的偏差的目标函数来完成3D模型的拟合过程；为了获得准确的拟合结果，我们将目标函数定义为五个能量项的集合，具体为：E(β,θ,t)＝Ejoints+Epose+Eshape+Esphere+Ehead(7)其中，Ejoints是关节数据项，用来将模型拟合到实际人体；Epose和Eshape是姿态和形状先验项，用来防止拟合过程中模型异常的姿态和体形变化；Esphere是人体惩罚项，用来防止变化过程中人体身体之间发生异常重合渗透，例如模型的手臂变形到了人身体里；Ehead是头部数据项，用来将模型的头部方向拟合到人体实际头部方向。数据项：在该项将SMPL+H模型的3D关节点与前述关节点进行匹配，从而将模型变换到人的真实姿态和体形；在经过混合关节预测后，同时包括人体骨骼和手骨骼的关节点；具体方法为：通过最小化所获得的关节点与SMPL+H模型关节点之间的欧式距离来进行匹配：其中ωjoints是该项的权重，Ji和Jm,i分别是本方法获...

【专利技术属性】
技术研发人员：方贤勇，杨继魁，汪粼波，李薛剑，
申请(专利权)人：安徽大学，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人