像素对齐的体积化身制造技术

技术编号：39124156 阅读：19 留言：0更新日期：2023-10-23 14:47

一种形成像素对齐的体积化身的方法包括接收多个二维图像，该多个二维图像具有主体的至少两个或更多个视场。该方法还包括使用可学习权重集来从该多个二维图像中提取多个图像特征；沿着该主体的三维模型与观看者的所选择的观察点之间的方向对该多个图像特征进行投影；以及向该观看者提供该主体的三维模型的图像。还提供了一种系统和一种非暂时性计算机可读介质，该非暂时性计算机可读介质存储指令以执行上述方法。执行上述方法。执行上述方法。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】像素对齐的体积化身
[0001]相关申请的交叉引用
[0002]本公开涉及并根据35 U.S.C.
§
119(e)要求于2020年12月23日提交的、Lombardi等人的名称为LEARNING TO PREDICT IMPLICIT VOLUMETRIC AVATARS的、第63/129,989号美国临时申请的优先权，出于所有目的，该美国临时申请的内容特此通过引用全部并入。

[0003]本公开涉及在虚拟现实(virtual reality，VR)和增强现实(augmented reality，AR)应用中生成忠实的面部表情，以用于生成实时体积化身。更具体地，本公开提供了VR/AR应用的多身份设置中的实时体积化身。

技术介绍

[0004]在VR/AR应用领域，获取并渲染逼真的人类头部是实现虚拟远程呈现的一个具有挑战性的问题。目前，通过在多视角数据上以特定于个人的方式进行训练的体积方法来实现最高质量。与更简单的基于网格的模型相比，这些模型更好地表示精细的结构，例如头发。体积模型通常采用全局代码来表示面部表情，使得体积模型可以由小的动画参数集来驱动。虽然这种架构实现了令人印象深刻的渲染质量，但是这些架构无法轻易地扩展到多身份设置，并且这些架构计算成本高并且难以在“实时”应用中实践。

技术实现思路

[0005]在第一方面，提供了一种计算机实现的方法，该方法包括：接收多个二维图像，该多个二维图像具有主体的至少两个或更多个视场；使用可学习权重集来从该多个二维图像中提取多个图像特...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法，包括：接收多个二维图像，所述多个二维图像具有主体的至少两个或更多个视场；使用可学习权重集来从所述多个二维图像中提取多个图像特征；沿着所述主体的三维模型与观看者的所选择的观察点之间的方向对所述多个图像特征进行投影；以及向所述观看者提供所述主体的所述三维模型的图像。2.根据权利要求1所述的计算机实现的方法，其中，提取多个图像特征包括：提取摄像头的固有特性，所述摄像头用于收集所述多个二维图像。3.根据权利要求1或2所述的计算机实现的方法，其中，沿着所述主体的三维模型与观看者的所选择的观察点之间的方向对多个图像特征进行投影包括：对与第一方向相关联的特征图和与第二方向相关联的特征图进行插值。4.根据任一项前述权利要求所述的计算机实现的方法，其中，沿着所述主体的三维模型与所选择的观察点之间的方向对多个图像特征进行投影包括：沿着所述主体的三维模型与所述所选择的观察点之间的所述方向，针对多个像素对所述多个图像特征进行聚合。5.根据任一项前述权利要求所述的计算机实现的方法，其中，沿着所述主体的三维模型与所选择的观察点之间的方向对多个图像特征进行投影包括：以置换不变组合来串联由多个摄像头中的各个摄像头产生的多个特征图，所述多个摄像头中的每个摄像头具有固有特性。6.根据任一项前述权利要求所述的计算机实现的方法，还包括：基于所述主体的三维模型的图像与所述主体的地面真值图像之间的差异来评估损失函数，以及基于所述损失函数来更新所述可学习权重集中的至少一个可学习权重。7.根据任一项前述权利要求所述的计算机实现的方法，其中，所述主体是客户端设备的用户，所述客户端设备具有指向所述用户的网络摄像头，所述方法还包括：将所述所选择的观察点识别为从所述客户端设备指向所述用户的所述网络摄像头的位置。8.根据任一项前述权利要求所述的计算机实现的方法，其中，所述观看者正在使用网络耦接的客户端设备，并且提供所述主体的所述三维模型的图像包括：将如下视频流式传输到所述网络耦接的客户端设备：所述视频具有所述主体的三维模型的多个图像。9.根据任一项前述权利要求所述的计算机实现的方法，其中，所述主体是客户端设备的用户，...

【专利技术属性】
技术研发人员：斯蒂芬，
申请(专利权)人：元平台技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人