基于空间相关性模型的人脸表情操纵视频生成方法与系统技术方案

技术编号：41750619 阅读：8 留言：0更新日期：2024-06-21 21:35

本公开了一种基于空间相关性模型的人脸表情操纵视频生成方法与系统，本发明专利技术通过构建空间相关性学习模型对前后生成的视频的质量进行定性和定量比较；通过在现有的人脸表情操纵技术中引入额外的监督信号，提高视频的质量。该方法采用全新的监督模块，能够减少视频局部失真，提高用户观感。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机图像处理和机器学习领域，更具体地，涉及一种基于空间相关性模型的人脸表情操纵视频生成方法与系统。

技术介绍

1、随着互联网技术的更新迭代，以及人们对于视频影像的质量要求的提高，现有的人脸表情操纵技术存在的缺点逐渐暴露在大众的视野中。目前的人脸表情操纵技术在对人脸表情进行操纵时，对于语音及其对应的嘴部动作的保持能力存在不足，导致实际应用中出现视频话音不同步。此外，人脸表情操纵技术缺乏局部监督，生成的视频存在局部失真的情况，导致用户观感不佳。

2、现有技术提供了一种虚拟数字人唇形同步方法及系统。本方法首先根据预先获取的目标语料进行视频拍摄得到样本视频，并从样本视频中提取出人脸图像和音频信息，然后将人脸图像通过openface工具进行处理得到面部关键点图像，并将音频信息进行预处理转换为mel频谱图；最后基于面部关键点图像和mel频谱图对wav2lip模型进行训练，并训练完成的wav2lip模型对目标视频进行处理得到对应的唇形视频。

技术实现思路

1、本专利技术为克服...

【技术保护点】

1.一种基于空间相关性模型的人脸表情操纵视频生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于空间相关性模型的人脸表情操纵视频生成方法，其特征在于，获得训练好的空间相关性模型的方法为：

3.根据权利要求2所述的一种基于空间相关性模型的人脸表情操纵视频生成方法，其特征在于，所述特征提取网络单元包括依次连接的第一卷积层、第一归一化层、第一激活层、第一残差层、第二残差层、第三残差层、第四残差层、第二归一化层、平均池化层、全连接层、第三归一化层、第二激活层；

4.根据权利要求2所述的一种基于空间相关性模型的人脸表情操纵视频生成方法，其特征在于，...

【技术特征摘要】

1.一种基于空间相关性模型的人脸表情操纵视频生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于空间相关性模型的人脸表情操纵视频生成方法，其特征在于，获得训练好的空间相关性模型的方法为：

4.根据权利要求2所述的一种基于空间相关性模型的人脸表情操纵视频生成方法，其特征在于，所述视觉差异损失总损失具体为：

5.根据权利要求4所述的一种基于空间相关性模型的人脸表情操纵视频生成方法，其特征在于，所述对比损失具体为：

6.一...

【专利技术属性】
技术研发人员：陈添水，朱宇杰，林坚满，杨志景，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人