面部建模模型的训练方法、建模方法、装置及设备制造方法及图纸

技术编号：39745364 阅读：6 留言：0更新日期：2023-12-17 23:44

本申请公开了一种面部建模模型的训练方法、建模方法、装置及设备，涉及人工智能领域。包括：获取样本面部图像，样本面部图像中包含在同一时刻不同视角下采集得到的面部图像；将样本面部图像输入面部建模模型的编码器进行特征编码，得到不同面部区域对应的面部区域潜码以及面部动作对应的面部动作潜码；将面部区域潜码以及面部动作潜码输入面部建模模型的神经辐射场进行三维面部重建，得到三维面部图像；基于三维面部图像与样本面部图像间的三维重建损失，对面部建模模型的编码器以及神经辐射场进行训练。本申请实施例提供的方法，可训练得到对面部解耦控制的面部建模模型，实现三维面部建模，可提高模拟真实性。可提高模拟真实性。可提高模拟真实性。

全部详细技术资料下载

【技术实现步骤摘要】
面部建模模型的训练方法、建模方法、装置及设备

[0001]本申请实施例涉及人工智能领域，特别涉及一种面部建模模型的训练方法、建模方法、装置及设备。

技术介绍

[0002]在计算机视觉
，生成可驱动的面部有着广泛的应用。在应用中，重建面部需根据输入信号改变视角与表情等，应具有自然的说话神态且与驱动信号同步。
[0003]相关技术中，采用音频驱动面部的方式进行面部重建。而采用音频驱动的方式，由于不同人声音等存在较大差异，导致训练得到的网络可能存在不同的生成结果，造成驱动不准确的情况。因此，在另一种方式中，可通过文本驱动面部的方式进行面部重建。
[0004]然而，相关技术中，基于文本驱动的方式仅可生成二维面部图像，无法实现对三维面部的驱动，模拟效果较差。

技术实现思路

[0005]本申请实施例提供了一种面部建模模型的训练方法、建模方法、装置及设备，通过对面部的解耦控制，实现三维面部建模，提高模拟真实性。所述技术方案如下：
[0006]一方面，本申请实施例提供了一种面部建模模型的训练方法，所述方法包括：
[0007]获取样本面部图像，所述样本面部图像中包含在同一时刻不同视角下采集得到的面部图像；
[0008]将所述样本面部图像输入面部建模模型的编码器进行特征编码，得到不同面部区域对应的面部区域潜码以及面部动作对应的面部动作潜码；
[0009]将所述面部区域潜码以及所述面部动作潜码输入所述面部建模模型的神经辐射场进行三维面部重建，得到三维面部图像；
...

【技术保护点】

【技术特征摘要】
1.一种面部建模模型的训练方法，其特征在于，所述方法包括：获取样本面部图像，所述样本面部图像中包含在同一时刻不同视角下采集得到的面部图像；将所述样本面部图像输入面部建模模型的编码器进行特征编码，得到不同面部区域对应的面部区域潜码以及面部动作对应的面部动作潜码；将所述面部区域潜码以及所述面部动作潜码输入所述面部建模模型的神经辐射场进行三维面部重建，得到三维面部图像；基于所述三维面部图像与所述样本面部图像间的三维重建损失，对所述面部建模模型的所述编码器以及所述神经辐射场进行训练。2.根据权利要求1所述的方法，其特征在于，所述神经辐射场包含区域神经辐射场、动作神经辐射场以及渲染神经辐射场；所述将所述面部区域潜码以及所述面部动作潜码输入所述面部建模模型的神经辐射场中进行三维面部重建，得到三维面部图像，包括：将所述面部动作潜码输入所述动作神经辐射场，得到动作转换矩阵；基于所述动作转换矩阵对面部三维坐标进行动作变换，得到面部动作坐标；将所述面部动作坐标以及所述面部区域潜码输入所述区域神经辐射场，得到面部区域切面，所述面部区域切面的特征维度高于所述面部区域潜码的特征维度；将所述面部动作坐标与所述面部区域切面输入所述渲染神经辐射场，得到面部颜色以及面部密度，所述面部颜色与所述面部密度用于生成所述三维面部图像。3.根据权利要求2所述的方法，其特征在于，所述将所述样本面部图像输入面部建模模型的编码器进行特征编码，得到不同面部区域对应的面部区域潜码以及面部动作对应的面部动作潜码，包括：将所述样本面部图像输入所述编码器进行特征编码，得到上部区域潜码、下部区域潜码以及所述面部动作潜码，所述上部区域潜码用于表征上半脸的面部特征，所述下部区域潜码用于表征下半脸的面部特征；所述将所述面部动作坐标以及所述面部区域潜码输入所述区域神经辐射场，得到面部区域切面，包括：将所述面部动作坐标与所述上部区域潜码输入上部神经辐射场，得到上部区域切面；将所述面部动作坐标与所述下部区域潜码输入下部神经辐射场，得到下部区域切面。4.根据权利要求1至3任一所述的方法，其特征在于，所述基于三维面部图像与所述样本面部图像间的三维重建损失，对所述面部建模模型的所述编码器以及所述神经辐射场进行训练，包括：基于所述三维面部图像与所述样本面部图像间的像素差异确定像素误差损失；基于所述三维面部图像与所述样本面部图像间的掩码差异确定掩码误差损失；基于所述像素误差损失与所述掩码误差损失确定所述三维重建损失，以及基于所述三维重建损失训练所述编码器与所述神经辐射场。5.根据权利要求1至3任一所述的方法，其特征在于，所述编码器包含编码网络以及解耦神经辐射场；所述将所述样本面部图像输入面部建模模型的编码器进行特征编码，得到不同面部区
域对应的面部区域潜码以及面部动作对应的面部动作潜码，包括：将所述样本面部图像输入所述编码网络进行特征编码，得到面部状态潜码，所述面部状态潜码用于表征所述样本面部图像对应时刻朗读者朗读文本时的整体面部状态；将所述面部状态潜码输入所述解耦神经辐射场进行解耦，得到上部区域潜码、下部区域潜码以及所述面部动作潜码，所述上部区域潜码用于表征上半脸的面部特征，所述下部区域潜码用于表征下半脸的面部特征。6.根据权利要求5所述的方法，其特征在于，所述方法还包括：基于不同时刻下的所述上部区域潜码、所述下部区域潜码以及所述面部动作潜码，确定解耦损失，所述解耦损失用于表征不同时刻下对面部解耦的差异；基于所述解耦损失，训练所述解耦神经辐射场。7.根据权利要求6所述的方法，其特征在于，所述基于不同时刻下的所述上部区域潜码、所述下部区域潜码以及所述面部动作潜码，确定解耦损失，包括：获取第一时刻下样本面部图像对应的第一上部区域潜码、第一下部区域潜码以及第一面部动作潜码，以及获取第二时刻下样本面部图像对应的第二上部区域潜码、第二下部区域潜码以及第二面部动作潜码；基于所述第一上部区域潜码、所述第一面部动作潜码以及所述第二下部区域潜码，确定上部解耦损失；基于所述第一下部区域潜码、所述第一面部动作潜码以及所述第二上部区域潜码，确定下部解耦损失；基于所述第二面部动作潜码、所述第一上部区域潜码以及所述第一下部区域潜码，确定动作解耦损失；基于所述上部解耦损失、所述下部解耦损失以及所述动作解耦损失，确定所述解耦损失。8.根据权利要求7所述的方法，其特征在于，所述基于所述第一上部区域潜码、所述第一面部动作潜码以及...

【专利技术属性】
技术研发人员：李小雨，陈本旺，王璇，张琦，单瀛，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人