数字人脸形象更换方法、装置、设备及存储介质制造方法及图纸

技术编号：38843053 阅读：30 留言：0更新日期：2023-09-17 09:55

本发明专利技术涉及人工智能技术，揭露一种数字人脸形象更换方法，包括：对待更换人脸视频进行人脸编码处理，得到待更换人脸表征；将从新人脸图像中提取的新人脸的身份特征向量注入待更换人脸表征中，得到替换身份后的人脸表征；将替换身份后的人脸表征与从待更换人脸视频中获取的多通道语音表征图进行特征合并处理，得到合并后的特征图；对合并后的特征图进行解码处理。本发明专利技术还涉及区块链技术，待更换人脸视频存储于区块链中。本发明专利技术能够解决现有技术中，对于数字人脸生成技术主要聚焦于语音驱动数字人说话人脸生成任务，缺少一种生成人脸的形象快速、边界变更的可行方案等问题。边界变更的可行方案等问题。边界变更的可行方案等问题。

全部详细技术资料下载

【技术实现步骤摘要】
数字人脸形象更换方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种数字人脸形象更换方法、装置、设备及存储介质。

技术介绍

[0002]语音驱动的人脸生成是人工智能研究及数字媒体领域中受到广泛关注的研究课题，是虚拟数字人等应用走向落地过程中涉及的关键技术，有着重要的实用价值和经济价值。比如在面对面对接的客服行业中，人工客服往往按照固定的问询话术为客户提供服务，而这一过程可以结合人工智能技术使用语音驱动的真实感数字人脸生成系统进行替代。这样的系统可以为客户营造一个极其真实的对话形象，不仅可以帮助提高服务质量，而且可以极大地解放人力资源。
[0003]现有的语音驱动数字人脸生成技术方案功能比较单一，虽然可以在给定任意语音和任意目标人脸视频的情况下生成语音和口型高度同步的目标人脸视频。但是为了呈现给客户令人满意的数字形象，这一过程需要录制数字人形象的真人模板视频(即目标人脸视频)。为了得到视觉效果良好的面部动态，录制视频数据这一过程会耗费较多的人力、时间和精力，一旦遇到需要更换形象的情况，会加剧时间成本和沟通成本，不能很好地应对需求的变化。
[0004]从输入的语音数字信号到生成的2D、3D数字人脸是一个跨模态的复杂过程。目前的数字人脸生成技术主要聚焦于语音驱动数字人说话人脸生成任务，即给定任意语音和任意目标人脸视频的情况下生成语音和口型高度同步的目标人脸视频，若想要更改人脸形象，则需要重新录制人形象的真人模板视频，耗费较多的人力、时间和精力，目前缺少一种生成人脸的形象快捷变...

【技术保护点】

【技术特征摘要】
1.一种数字人脸形象更换方法，应用于电子装置，其特征在于，所述方法包括：对待更换人脸视频进行人脸编码处理，得到待更换人脸表征；其中，所述待更换人脸表征包括图像背景信息、人脸构成信息和与所述人脸构成信息对应的待更换人脸的身份特征向量；将从预先获取的新人脸图像中提取的新人脸的身份特征向量注入所述待更换人脸表征中，得到替换身份后的人脸表征；将所述替换身份后的人脸表征与从所述待更换人脸视频中获取的多通道语音表征图进行特征合并处理，得到合并后的特征图；对所述合并后的特征图进行解码处理，生成具有新人脸的身份特征并保持所述待更换人脸视频中的图像背景信息的替换人脸视频。2.根据权利要求1所述的数字人脸形象更换方法，其特征在于，将从预先获取的新人脸图像中提取的新人脸的身份特征向量注入所述待更换人脸表征中，得到替换身份后的人脸表征包括：从所述新人脸图像中提取新人脸的身份特征信息；其中，所述新人脸的身份特征信息包括人脸构成信息和与所述人脸构成信息对应的新人脸的身份特征向量；基于所述新人脸图像与所述待更换人脸表征中相同的人脸构成信息，将所述新人脸的身份特征向量替换所述待更换人脸表征中的待更换人脸的身份特征向量，得到替换身份后的人脸表征。3.根据权利要求2所述的数字人脸形象更换方法，其特征在于，所述基于所述新人脸图像与所述待更换人脸表征中相同的人脸构成信息，将所述新人脸的身份特征向量替换所述待更换人脸表征中的待更换人脸的身份特征向量，得到替换身份后的人脸表征包括：将所述新人脸的身份特征向量与所述待更换人脸表征中的每一人脸特征图作为输入对，得到输入对集；其中，所述待更换人脸表征包括预设数量的人脸特征图；所述人脸特征图对应有所述待更换人脸的身份特征向量；所述待更换人脸的身份特征向量的维度与所述新人脸的身份特征向量的维度数相等；将所述输入对集中的输入对逐次输入预设的身份注入模型中，其中，所述身份注入模型包括全连接层和图片风格迁移层；通过所述全连接层预测出与所述输入对中的新人脸的身份特征向量的维度数相同的计算通道，并在每个所述计算通道内分别计算所述新人脸的身份特征向量的均值及方差和所述待更换人脸的身份特征向量的均值及方差；根据所述全连接层得到的每个计算通道输出的对应维度数的新人脸的身份特征向量的均值及方差和待更换人脸的身份特征向量的均值及方差，通过图片风格迁移层逐个对所述计算通道进行风格迁移计算，统计所有所述计算通道的风格迁移计算结果；基于所有所述计算通道的风格迁移计算结果，得到相应的输出对的替换身份后的人脸特征图；统计所有替换身份后的人脸特征图，得到替换身份后的人脸特征图集，将所述替换身份后的人脸特征图集作为替换身份后的人脸表征。4.根据权利要求1所述的数字人脸形象更换方法，其特征在于，所述待更换人脸视频存储于区块链中，在所述对待更换人脸视频进行人脸编码处理，得到待更换人脸表征之前，还
包括：针对所述待更换人脸视频的每一帧画面，以人脸为中心裁切出包含人脸的图像；将所述包含人脸的图像按照每帧画面...

【专利技术属性】
技术研发人员：周超勇，鲍威弘，吴志勇，
申请(专利权)人：清华大学深圳国际研究生院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人