虚拟数字人音唇同步优化方法、装置、设备及存储介质制造方法及图纸

技术编号：42832710 阅读：35 留言：0更新日期：2024-09-24 21:06

本发明专利技术涉及计算机视觉技术领域，公开了一种虚拟数字人音唇同步优化方法、装置、设备及存储介质。虚拟数字人音唇同步优化方法包括：获取下一时刻虚拟数字人待输出的目标音频片段；判断目标音频片段是否属于待处理的音频类型；若目标音频片段属于待处理的音频类型，则基于预置音唇同步优化策略，生成目标音频片段对应的3D人脸嘴型参数帧序列；基于3D人脸嘴型参数帧序列，生成对应3D人脸嘴型图像帧序列并渲染至虚拟数字人中。本发明专利技术能够适应各类音频类型，提升了虚拟数字人在不同音频类型下的嘴型流畅性与自然性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉，尤其涉及一种虚拟数字人音唇同步优化方法、装置、设备及存储介质。

技术介绍

1、在当今数字与娱乐行业迅速发展的背景下，实时互动直播平台成为了用户娱乐和交流的新选择。尤其是2d数字人(虚拟形象)的实时互动直播，以其独有的吸引力和广泛的应用潜力受到了市场的青睐。然而，现行的2d数字人实时音频反馈技术面临着若干挑战，特别是在实现音唇同步方面，现有音唇同步技术目前还存在如嘴型抖动、过渡不自然等驱动效果不佳的问题。

技术实现思路

1、本专利技术的主要目的在于提供一种虚拟数字人音唇同步优化方法、装置、设备及存储介质，旨在解决现有音唇同步技术存在驱动效果不佳的技术问题。

2、本专利技术第一方面提供一种虚拟数字人音唇同步优化方法，所述虚拟数字人音唇同步优化方法包括：

3、获取下一时刻虚拟数字人待输出的目标音频片段；

4、判断所述目标音频片段是否属于待处理的音频类型，其中，所述待处理的音频类型包括短时音频类型和静音音频类型；

5、若所述...

【技术保护点】

1.一种虚拟数字人音唇同步优化方法，其特征在于，所述虚拟数字人音唇同步优化方法包括：

2.根据权利要求1所述的虚拟数字人音唇同步优化方法，其特征在于，所述若所述目标音频片段属于待处理的音频类型，则基于预置音唇同步优化策略，生成所述目标音频片段对应的3D人脸嘴型参数帧序列包括：

3.根据权利要求1所述的虚拟数字人音唇同步优化方法，其特征在于，所述若所述目标音频片段属于待处理的音频类型，则基于预置音唇同步优化策略，生成所述目标音频片段对应的3D人脸嘴型参数帧序列包括：

4.根据权利要求3所述的虚拟数字人音唇同步优化方法，其特征在于，在所述若所述目标音频片段...

【技术特征摘要】

1.一种虚拟数字人音唇同步优化方法，其特征在于，所述虚拟数字人音唇同步优化方法包括：

2.根据权利要求1所述的虚拟数字人音唇同步优化方法，其特征在于，所述若所述目标音频片段属于待处理的音频类型，则基于预置音唇同步优化策略，生成所述目标音频片段对应的3d人脸嘴型参数帧序列包括：

3.根据权利要求1所述的虚拟数字人音唇同步优化方法，其特征在于，所述若所述目标音频片段属于待处理的音频类型，则基于预置音唇同步优化策略，生成所述目标音频片段对应的3d人脸嘴型参数帧序列包括：

4.根据权利要求3所述的虚拟数字人音唇同步优化方法，其特征在于，在所述若所述目标音频片段属于静音音频类型，则判断所述目标音频片段的前一音频片段是否属于静音音频类型之后，还包括：

5.根据权利要求3或4所述的虚拟数字人音唇同步优化方法，其特征...

【专利技术属性】
技术研发人员：林哲，
申请(专利权)人：广州虎牙科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人