实时驱动虚拟人的方法、装置、电子设备及介质制造方法及图纸

技术编号：30944132 阅读：20 留言：0更新日期：2021-11-25 19:53

本说明书实施例公开了一种实时驱动虚拟人的方法，获取用于驱动虚拟人的待处理数据，所述待处理数据包括文本数据和语音数据中的至少一种；使用端到端模型对所述待处理数据进行处理，确定出所述待处理数据对应的手势特征序列；将所述手势特征序列输入到已训练的肌肉模型中，通过所述肌肉模型驱动虚拟人；由于端到端模型能够在更短时间内获取手势特征序列；再将手势特征序列输入到肌肉模型中，直接驱动虚拟人，极大的降低了其计算量和数据传输量，且还提高了计算效率，使得驱动虚拟人的实时性得到极大的提高，从而能够实现实时驱动虚拟人进行手语输出。进行手语输出。进行手语输出。

全部详细技术资料下载

【技术实现步骤摘要】
实时驱动虚拟人的方法、装置、电子设备及介质

[0001]本说明书实施例涉及虚拟人处理
，尤其涉及一种实时驱动虚拟人的方法、装置、电子设备及介质。

技术介绍

[0002]数字人类(Digital Human)简称数字人，是利用计算机模拟真实人类的一种综合性的渲染技术，也被称为虚拟人类、超写实人类、照片级人类。由于人对真人太熟悉了，通过花费大量时间可以获取使得3D静态模型很真，但在驱动3D静态模型进行动作时，即使是一个细微的表情都会重新建模，由于模型的真实度非常高会导致建模会需要进行大量的数据进行计算，其计算过程较长，通常模型的一个动作可能需要一个小时或几个小时的计算才能实现，导致驱动的实时性能非常差。

技术实现思路

[0003]本说明书实施例提供了一种实时驱动虚拟人的方法、装置、电子设备及介质，使得驱动虚拟人的实时性提高。
[0004]本说明书实施例第一方面提供了一种实时驱动虚拟人的方法，包括：
[0005]获取用于驱动虚拟人的待处理数据，所述待处理数据包括文本数据和语音数据中的至少一种；
[0006]使用端到端模型对所述待处理数据进行处理，确定出所述待处理数据对应的手势特征序列；
[0007]将所述手势特征序列输入到已训练的肌肉模型中，通过所述肌肉模型驱动虚拟人；
[0008]其中，所述使用端到端模型对所述待处理数据进行处理，包括：
[0009]获取所述待处理数据的文本特征和时长特征；
[0010]根据所述文本特征和所述时长特征，确定出所述...

【技术保护点】

【技术特征摘要】
1.一种实时驱动虚拟人的方法，其特征在于，包括：获取用于驱动虚拟人的待处理数据，所述待处理数据包括文本数据和语音数据中的至少一种；使用端到端模型对所述待处理数据进行处理，确定出所述待处理数据对应的手势特征序列；将所述手势特征序列输入到已训练的肌肉模型中，通过所述肌肉模型驱动虚拟人；其中，所述使用端到端模型对所述待处理数据进行处理，包括：获取所述待处理数据的文本特征和时长特征；根据所述文本特征和所述时长特征，确定出所述手势特征序列。2.如权利要求1所述的方法，其特征在于，所述获取所述待处理数据的文本特征和时长特征，包括：通过fastspeech模型获取所述文本特征；通过时长模型获取所述时长特征，其中，所述时长模型为深度学习模型。3.如权利要求2所述的方法，其特征在于，若所述fastspeech模型输出面部特征序列和手势特征序列，所述根据所述文本特征和所述时长特征，确定出所述声学特征序列，包括：将所述文本特征和所述时长特征输入到所述fastspeech模型中，得到所述面部特征序列和所述手势特征序列。4.如权利要求3所述的方法，其特征在于，所述将所述手势特征序列输入到已训练的肌肉模型中，包括：将所述面部特征序列和所述手势特征序列进行融合，得到融合特征序列；将所述融合特征序列输入到所述肌肉模型中。5.如权利要求4所述的方法，其特征在于，所述将所述面部特征序列和所述手势特征序列进行融合，得到融合特征序列，...

【专利技术属性】
技术研发人员：陈伟，樊博，孟凡博，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人