一种视频驱动的三维人脸表情动画生成方法技术

技术编号：38341964 阅读：12 留言：0更新日期：2023-08-02 09:22

本发明专利技术一种视频驱动的三维人脸表情动画生成方法，逐帧将输入的源图像和驱动视频送入编码器并将得到的源图像向量与驱动视频帧向量混合，使用混合向量生成驱动网格和线性纹理贴图，完成人脸模型驱动；使用线性纹理贴图和驱动网格进行渲染得到线性纹理渲染图；将源图像展开到UV空间得到源纹理贴图，源纹理贴图和驱动网格进行渲染得到源纹理渲染图；从线性纹理渲染图中提取面部语义图；将源图像、源纹理渲染图和面部语义图作为输入条件送入纹理生成模块得到生成的面部图像并将其展开至UV空间，得到UV纹理贴图；使用UV纹理贴图和驱动网格进行渲染得到动画帧；串联所有动画帧输出三维人脸表情动画。提高了面部纹理质量，生成更高逼真度的人脸动画。高逼真度的人脸动画。高逼真度的人脸动画。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频驱动的三维人脸表情动画生成方法

[0001]本专利技术涉及计算机视觉和计算机图形学领域，具体为一种视频驱动的三维人脸表情动画生成方法。

技术介绍

[0002]人脸表情动画生成技术是一种将人脸图像或视频转换成逼真的三维动态人脸表情动画的技术。现有的人脸表情动画生成技术主要存在以下四个方面的缺点和不足：
[0003]缺乏真实性：现有技术使用的纹理贴图和模型通常是以平均面孔为基础，难以捕捉到个体面部特征的细节，缺乏真实感。
[0004]局限性：现有技术大多只能生成受限制的、静态的表情，无法根据实时视频输入生成连续的、自然的表情变化。
[0005]计算复杂度高：现有技术需要进行复杂的数据处理和计算，需要较长时间才能生成一个人脸表情动画，且计算复杂度随着动画长度和质量的提高而增加。
[0006]对数据依赖性强：现有技术需要大量的已标注或未标注的训练数据，对数据的质量和数量要求较高。

技术实现思路

[0007]本专利技术基于3DMM技术和人脸图像生成技术的视频驱动的三维人脸表情动画生成方法，引入了实时视频输入来捕捉人脸的细节和动态表情，生成更加逼真的面部纹理贴图，同时也能够实现连续的、自然的表情变化；同时，该方法还可有效减少计算复杂度和对数据的依赖性，提高了生成的动画效果的逼真度和速度。从而克服了现有技术的缺点和不足。
[0008]本专利技术为解决其技术问题所采用的技术方案是：
[0009]一种视频驱动的三维人脸表情动画生成方法，步骤包括：
[001...

【技术保护点】

【技术特征摘要】
1.一种视频驱动的三维人脸表情动画生成方法，其特征步骤包括：S1：输入一张人脸源图像和一个驱动视频；S2：逐帧将源图像和驱动视频送入编码器，得到源图像的向量和驱动视频帧的向量；S3：将源图像的向量与驱动视频帧的向量混合得到混合向量，然后使用混合向量生成驱动网格和线性纹理贴图，完成人脸模型驱动；S4：使用线性纹理贴图和驱动网格进行渲染，得到线性纹理渲染图；S5：将源图像展开到UV空间得到源纹理贴图，然后使用源纹理贴图和驱动网格进行渲染，得到源纹理渲染图；S6：从线性纹理渲染图中提取面部语义图；S7：将源图像、源纹理渲染图和面部语义图作为输入条件送入纹理生成模块，得到生成的面部图像；S8：将生成的面部图像展开至UV空间，得到UV纹理贴图；S9：使用得到的UV纹理贴图和驱动网格进行渲染，得到动画帧；S10：串联所有动画帧，输出三维人脸表情动画。2.根据权利要求1所述的一种视频驱动的三维人脸表情动画生成方法，其特征在于，步骤S2中所述的编码器采用ResNet
‑
50结构，含有一个236维的预测头，并且输出236维向量，该向量由身份参数β、表情参数θ、位姿参数ψ、纹理参数γ、光照参数l、相机参数c拼接而成，其中身份参数β、表情参数θ、位姿参数ψ为3DMM模型参数；该编码器采用端到端的无监督训练方式。3.根据权利要求2所述的一种视频驱动的三维人脸表情动画生成方法，其特征在于，步骤S3中所述将源图像的向量与驱动视频帧的向量混合得到混合向量，具体为：将源图像的向量中的身份参数、纹理参数与驱动视频帧的向量中的表情参数、位姿参数、光照参数和相机参数进行混合，通过在3DMM模型的参数空间保持所述身份参数，转移所述表情参数和所述位姿参数来完成人脸模型驱动。4.根据权利要求2所述的一种视频驱动的三维人脸表情动画生...

【专利技术属性】
技术研发人员：魏巍，王袆宸，张丹妮，
申请(专利权)人：大连民族大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人