基于统一驱动的人脸渲染方法、装置、设备及存储介质制造方法及图纸

技术编号：36437261 阅读：16 留言：0更新日期：2023-01-20 22:51

本发明专利技术提供一种基于统一驱动的人脸渲染方法、装置、设备及存储介质，涉及人工智能技术领域。该方法包括：获取目标源数据，其中所述目标源数据至少包括：初始人脸图像；将所述初始人脸图像输入预设的驱动模型，输出与所述初始人脸图像对应的三维人脸参数，其中，所述三维人脸参数是所述驱动模型对所述初始人脸图像进行提取和转换得到的；根据预设的渲染策略，对所述三维人脸参数进行渲染，生成目标人脸图像。通过本发明专利技术提供的实施例不仅能提高驱动精度，而且解耦了驱动与渲染。而且解耦了驱动与渲染。而且解耦了驱动与渲染。

全部详细技术资料下载

【技术实现步骤摘要】
基于统一驱动的人脸渲染方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种基于统一驱动的人脸渲染方法、装置、设备及存储介质。

技术介绍

[0002]在利用人工智能进行人脸三维重建时，从中间表达的角度分析，当前现有技术中基于人工智能驱动的技术方案主要包括以下几种：第一种，以潜变量（latent）作为中间表达，进行端到端训练。如通过对比学习解耦ID、语音和头部姿态，使生成的驱动视频可以从不同驱动源分别获取ID、嘴形及头部姿态进行可控驱动，经过GAN框架生成图像，通过解耦expression（表情）中的eye blink（眨眼）和mouth（嘴形），结合对比学习连结mouth embedding（嘴开口）和audio embedding（嵌入音频），也能够从不同驱动源分别获取头部姿态，表情及嘴形特征，驱动radience field（辐射场）生成person specific（个人特定）的渲染图像。然而由于整体为基于端到端训练，存在驱动和渲染耦合的情况，即学习出来的2D latent space（2D潜变量空间）跟训练阶段使用的生成器强相关，导致latent难以覆用于其他生成器; 而且因为是端到端的训练，没有对学习出来的latent做约束和监督，所以即使用相同的生成器和网路结构，如果训练数据不同，那么学习出来的latent也没法交叉使用，耦合问题严重。
[0003]第二种，同样以latent作为中间表达，端到端训练，但第一种现有技术的虚拟人建模以图片为主。第二种则以计算机图形学中常用...

【技术保护点】

【技术特征摘要】
1.一种基于统一驱动的人脸渲染方法，其特征在于，包括：获取目标源数据，其中所述目标源数据至少包括：初始人脸图像；将所述初始人脸图像输入预设的驱动模型，输出与所述初始人脸图像对应的三维人脸参数，其中，所述三维人脸参数是所述驱动模型对所述初始人脸图像进行提取和转换得到的；根据预设的渲染策略，对所述三维人脸参数进行渲染，生成目标人脸图像。2.根据权利要求1所述的基于统一驱动的人脸渲染方法，其特征在于，所述获取目标源数据至少包括：获取多个初始数据；根据每一所述初始数据的属性，按照预设属性分类策略对多个所述初始数据进行分类提取处理，得到多个子数据集；从多个所述子数据集中筛选出目标数据集，并从所述目标数据集中筛选出所述目标源数据。3.根据权利要求1所述的基于统一驱动的人脸渲染方法，其特征在于，所述驱动模型至少包括：潜变量提取模型、潜变量转换模型；所述将所述初始人脸图像输入预设的驱动模型，输出与所述初始人脸图像对应的三维人脸参数，包括：将所述初始人脸图像输入所述潜变量提取模型，提取出与所述初始人脸图像对应的人脸潜变量特征；利用所述潜变量转换模型将所述人脸潜变量特征转换为对应的三维人脸参数。4.根据权利要求3所述的基于统一驱动的人脸渲染方法，其特征在于，所述人脸潜变量特征至少包括：第一人脸特征、人脸动作特征；所述将所述初始人脸图像输入所述潜变量提取模型，提取出与所述初始人脸图像对应的人脸潜变量特征，包括：将所述初始人脸图像输入预设的人脸识别模型，并利用所述人脸识别模型中的第一编码器对所述初始人脸图像进行第一提取处理，得到对应的所述第一人脸特征；以及利用所述人脸识别模型中的第二编码器对所述初始人脸图像进行第二提取处理，得到对应的第二人脸特征；对所述第二人脸特征进行解耦处理，生成多个所述人脸动作特征。5.根据权利要求4所述的基于统...

【专利技术属性】
技术研发人员：王文斓，
申请(专利权)人：北京红棉小冰科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人