动画生成方法、装置、存储介质及电子设备制造方法及图纸

技术编号：31812562 阅读：57 留言：0更新日期：2022-01-08 11:15

本公开涉及一种动画生成方法、装置、存储介质及电子设备，所述方法包括：获取输入文本；生成与所述输入文本对应的目标音素序列，所述目标音素序列包括与所述输入文本对应的音频中的每个音频帧对应的音素；根据所述目标音素序列，确定与所述目标音素序列对应的表情动画曲线，所述表情动画曲线用于表征随时间变化的表情变化过程；基于所述表情动画曲线对预设的虚拟形象进行渲染，生成所述虚拟形象的动画，实现了无需通过摄像设备来实时捕捉用户的表情数据来驱动虚拟形象的目的。情数据来驱动虚拟形象的目的。情数据来驱动虚拟形象的目的。

全部详细技术资料下载

【技术实现步骤摘要】
动画生成方法、装置、存储介质及电子设备

[0001]本公开涉及电子信息
，具体地，涉及一种动画生成方法、装置、存储介质及电子设备。

技术介绍

[0002]增强现实(Augmented Reality，AR)技术，是一种实时地计算摄像机影像的位置及角度并加上对应图像、视频、三维模型的技术，这种技术的目的是在屏幕上把虚拟世界融入现实世界并进行互动。其中，ARKit是一种开发框架，用于提供AR开发平台。
[0003]相关技术中，ARKit需要通过摄像设备实时捕捉用户的表情数据，进而利用该表情数据来驱动虚拟形象(例如，游戏人物形象)做出与用户相同的表情，实现增强现实。

技术实现思路

[0004]提供该部分内容以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该部分内容并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面，本公开提供一种动画生成方法，包括：
[0006]获取输入文本；
[0007]生成与所述输入文本对应的目标音素序列，所述目标音素序列包括与所述输入文本对应的音频中的每个音频帧对应的音素；
[0008]根据所述目标音素序列，确定与所述目标音素序列对应的表情动画曲线，所述表情动画曲线用于表征随时间变化的表情变化过程；
[0009]基于所述表情动画曲线对预设的虚拟形象进行渲染，生成所述虚拟形象的动画。
[0010]第二方面，本公开提供一种动画生成装置，...

【技术保护点】

【技术特征摘要】
1.一种动画生成方法，其特征在于，包括：获取输入文本；生成与所述输入文本对应的目标音素序列，所述目标音素序列包括与所述输入文本对应的音频中的每个音频帧对应的音素；根据所述目标音素序列，确定与所述目标音素序列对应的表情动画曲线，所述表情动画曲线用于表征随时间变化的表情变化过程；基于所述表情动画曲线对预设的虚拟形象进行渲染，生成所述虚拟形象的动画。2.根据权利要求1所述的动画生成方法，其特征在于，所述生成与所述输入文本对应的目标音素序列，包括：获取预配置的与所述输入文本对应的音素帧数序列，所述音素帧数序列中包括与所述输入文本对应的音素序列中每个音素的音频帧数；根据所述音素序列中每个音素的音频帧数，对所述音素序列中每个音素的个数进行扩展，生成与所述输入文本对应的目标音素序列。3.根据权利要求1所述的动画生成方法，其特征在于，所述生成与所述输入文本对应的目标音素序列，包括：获取与所述输入文本对应的音频；根据所述输入文本和所述音频，采用训练好的语音识别模型，生成与所述输入文本对应的目标音素序列。4.根据权利要求3所述的动画生成方法，其特征在于，所述语音识别模型通过以下方式训练得到：获取多个第一样本，每个所述第一样本包括样本文本、与所述样本文本对应的样本音频和样本目标音素序列，所述样本目标音素序列包括与所述样本音频中每个音频帧对应的音素；基于多个第一样本迭代更新初始语音识别模型的参数以减小各第一样本对应的第一损失函数值，得到训练好的语音识别模型；其中，各第一样本对应的第一损失函数值通过以下过程确定：根据语音识别模型对所述第一样本进行处理，得到预测目标音素序列；基于所述预测目标音素序列和所述第一样本的样本目标音素序列的差异，确定所述第一样本对应的第一损失函数值。5.根据权利要求1
‑
4任一所述的动画生成方法，其特征在于，所述根据所述目标音素序列，确定与所述目标音素序列对应的表情动画曲线，包括：根据表情预测模型对所述目标音素序列进行处理，得到所述目标音素序列中每个音素的各表情类别的权重；针对所述目标音素序列中的每个音素，对该音素的各表情类别的权重进行加权，并基于加权结果确定与该音素对应的目标表情参数；根据所述目标音素序列中所有音素的目标表情参数，确定与所述目标音素序列对应的表情动画曲线。6.根据权利要求5所述的动画生成方法，其特征在于，所述表情预测模型包括特征提取网络和线性网络，所述根据表情预测模型对所述目标音素序列进行处理，得到所述目标音
素序列中每个音素的各表情类别的权重，包括：根据所述特征提取网络对所述目标音素序列进行处理，得到所述目标音素序列的目标特征向量；根据所述线性...

【专利技术属性】
技术研发人员：毕成，马泽君，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人