虚拟人物视频生成的唇语同步优化方法和系统技术方案

技术编号：36810036 阅读：21 留言：0更新日期：2023-03-09 00:38

本发明专利技术提供了一种虚拟人物视频生成的唇语同步优化方法和系统，包括：获取针对用户请求的回答内容的语音数据；根据所述回答内容的语音数据，生成不包含唇语同步部分的低分辨率肖像视频；根据所述回答内容的语音数据、所述低分辨率肖像视频，生成高分辨率唇语同步部分视频；将所述低分辨率肖像视频的分辨率调整为与所述高分辨率唇语同步部分视频一致，然后与所述高分辨率唇语同步部分视频进行拼接，形成虚拟人形象视频。本发明专利技术能够实现优化虚拟人物视频唇部动作，达到视频、音频协调一致，并利用自适应裁剪方法与3D人脸的重建渲染方法对视频中的唇语部分单独处理，使得虚拟人视频生成的时间得以大大缩减的同时又保证了整体虚拟人视频的质量。人视频的质量。人视频的质量。

全部详细技术资料下载

【技术实现步骤摘要】
虚拟人物视频生成的唇语同步优化方法和系统

[0001]本专利技术涉及，具体地，涉及虚拟人物视频生成的唇语同步优化方法。
[0002]本专利技术涉及深度神经网络、意图识别、多模态、视频生成、流程机器人等领域，更具体的说是一种虚拟人物视频生成的唇语同步优化方法。

技术介绍

[0003]随着信息技术、计算机技术以及人工智能技术的不断发展，元宇宙逐渐被人熟知。然而现有元宇宙虚拟人物没有考虑到视频的细节特征，比如唇语同步，导致其形象存在着脸谱化、机械化的问题。唇语的视频细节与声音不同步会降低视频质量，还会削弱人类对虚拟人的信任程度。当前业界主流的办法包括两类：第一类是语音驱动的3D虚拟人模型(AudioDVP)，第一类模型存在录制成本高、可拓展性低的问题。第二类是2D的语音
‑
口型联合生成模型(Wav2lip)。第二类模型存在视频清晰度低、生成的视频质量差的问题。这些现有技术需要投入大量人力和时间才能达到逼真、拟人的效果。

技术实现思路

[0004]针对现有技术中的缺陷，本专利技术的目的是提供一种虚拟人物视频生成的唇语同步优化方法和系统。
[0005]根据本专利技术提供的一种虚拟人物视频生成的唇语同步优化方法，包括：
[0006]语音数据获取步骤：获取针对用户请求的回答内容的语音数据；
[0007]低分辨率视频生成步骤：根据所述回答内容的语音数据，生成不包含唇语同步部分的低分辨率肖像视频；
[0008]高分辨率视频生成步骤：根据所述回答内容的语音数据、所...

【技术保护点】

【技术特征摘要】
1.一种虚拟人物视频生成的唇语同步优化方法，其特征在于，包括：语音数据获取步骤：获取针对用户请求的回答内容的语音数据；低分辨率视频生成步骤：根据所述回答内容的语音数据，生成不包含唇语同步部分的低分辨率肖像视频；高分辨率视频生成步骤：根据所述回答内容的语音数据、所述低分辨率肖像视频，生成高分辨率唇语同步部分视频；视频拼接步骤：将所述低分辨率肖像视频的分辨率调整为与所述高分辨率唇语同步部分视频一致，然后与所述高分辨率唇语同步部分视频进行拼接，形成虚拟人形象视频。2.根据权利要求1所述的虚拟人物视频生成的唇语同步优化方法，其特征在于，还包括：审核步骤：对低分辨率肖像视频、高分辨率唇语同步部分视频进行内容审核，若满足审核条件，则触发视频拼接步骤进行视频的拼接。3.根据权利要求1所述的虚拟人物视频生成的唇语同步优化方法，其特征在于，还包括：虚拟人展示步骤：将虚拟人形象视频，以及与虚拟人形象视频匹配的文本、语音作为三种模态展示给观看者，其中，文本数据与语音数据保持相同的语意信息，虚拟人形象视频中的唇语动作和语音数据保持动态协调。4.根据权利要求1所述的虚拟人物视频生成的唇语同步优化方法，其特征在于，所述回答内容为对用户请求的语音数据进行意图识别得到的问题所预先存储的匹配的内容；对唇语同步部分单独进行自适应裁剪与3D重建渲染。5.一种虚拟人物视频生成的唇语同步优化系统，其特征在于，包括：语音数据获取模块：获取针对用户请求的回答内容的语音数据；低分辨率视频生成模块：根据所述回答内容的语音数据，生成不包含唇语同步部分...

【专利技术属性】
技术研发人员：舒毓倩，
申请(专利权)人：兴业数字金融服务上海股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人