一种基于深度相机的人体实时三维重建方法技术

技术编号：36887541 阅读：13 留言：0更新日期：2023-03-15 21:40

本发明专利技术公开了一种基于深度相机的人体实时三维重建方法。本发明专利技术使用SMPL

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度相机的人体实时三维重建方法

[0001]本专利技术涉及人体三维重建
，具体的说，涉及一种基于深度相机的人体实时三维重建方法。

技术介绍

[0002]随着技术的不断进步，相关的科学研究从二维图像逐渐扩展到了三维模型。相比于二维图像，三维模型具有更直观的呈现形式和更丰富的语义信息，更符合人类对于三维立体世界的认知。远程会议、VR试衣、在线VR教育等应用不仅要求能够对人体进行重建，还需要实时地将人在3D空间中进行表示。
[0003]为了实现这一目的，可以使用基于多摄像机标定和点云融合的非参数化建模方法或是基于人体先验知识的参数化建模方法。非参数化方法通常使用点云作为人体模型表征方式，通过相机标定或是点云配准方法计算多相机之间的坐标关系，利用该关系将不同视角的稠密点云进行融合得到完整人体模型。该类方法在计算资源足够的情况下具有较高的分辨率，重建出来的人体模型具有较高的逼真程度，并且能够很好地适应人体拓扑结构变化。然而这种方法需要大量且密集的图像作为输入，并且要求严密的相机标定或复杂的点云配准方法。同时，该类方法在目标对象被遮挡时，难以完整地表征整个人体三维模型。参数化的方法首先利用机器学习技术从海量数据中学习一个参数化的人体模型，利用少量的参数就可以对该模型进行变形控制。之后，使用该模型作为模板，并利用机器学习方法从数据中生成参数，利用参数对模板进行变形控制，从而实现实时重建的效果。参数化的重建方法非常轻量，具有更广泛的应用价值，但其缺点在于需要较复杂的深度学习模型以及大量的训练数据。同时，现有方法

【技术保护点】

【技术特征摘要】
1.一种基于深度相机的人体实时三维重建方法，其特征在于，其使用SMPL
‑
X作为参数化的人体模型，通过训练神经网络从输入的彩色图像RGB和深度图像D中控制该模型的变形，实现实时重建效果；包括以下步骤：(1)基于深度相机从正面和背面采集目标人体的RGB图像和D图像，基于缓冲和滤波两种方法对数据进行预处理；(2)根据人体姿态估计结果对图像数据裁剪得到局部数据，通过学习局部细节特征，提升SMPL
‑
X人体模型手部和脸部的精度，获得SMPL
‑
X人体模型的参数：姿态参数形状参数和表情参数首先对深度相机采集得到的RGB图像，使用OpenPose获取人体关键点的姿态信息；然后根据其输出结果计算人体关节点的边界点x
max
，x
min
，y
max
，y
min
，则人体边界框的中心c和大小s计算为：s＝γ(x
max
‑
x
min
,y
max
‑
y
min
),(x,y)∈O其中，γ表示放大系数；接着，使用计算出的边界框进行仿射变换T
p
(c,s)，从原始RGB图像I和深度图像D中剪裁得到包含全部关键点的人体主干图像；同样的操作也适用于脸部部位和手部部位，最后得到分别包含主干、脸部和手部的三幅RGB图像I
p
和相应的三幅深度图像D
p
：I
p
＝ST[I；T
p
(c
p
,s
p
)],D
p
＝ST[D；T
p
(c
p
,s
p
)],p∈[global,face,hand]其中，ST代表空间变换；输入数据I
p
和D
p
经过注意力机制处理后，基于人体重建网络预测SMPL
‑
X人体模型的参数；人体重建网络包含三个子网络：主干网络、手部网络和脸部网络；其中：主干网络从人体主干RGB图、人体主干深度图以及主干位姿中提取特征主干网络从人体主干RGB图、人体主干深度图以及主干位姿中提取特征脸部网络从脸部RGB图中提取特征手部网络从手部RGB图像中提取特征在所有特征被提取后，分别通过全连接层来预测SMPL
‑
X人体模型的参数；最后，通过对三个子网络的输出进行加权融合得到最终输出；人体重建网络的损失函数由三部分构成，分别为参数损失L
params
、关节点损失L
joint
和反投影损失L
re
...

【专利技术属性】
技术研发人员：宋梁，卢洋，倪伟，张冠华，蒋林华，余晗，王梓名，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人