生成数字人形象的方法、装置、电子设备及存储介质制造方法及图纸

技术编号：39307195 阅读：8 留言：0更新日期：2023-11-12 15:55

本申请提供了一种生成数字人形象的方法、装置、电子设备及存储介质，该方法包括：响应于接收到第一用户输入数据，对所述第一用户输入数据进行预处理，其中，所述第一用户输入数据用于描述待生成的数字人形象的特征；基于预处理后的所述第一用户输入数据和第一随机噪声向量，利用深度学习方法生成多个数字人形象，并呈现所述多个数字人形象供用户选择；响应于接收到第二用户输入数据，基于所述第二用户输入数据和第二随机噪声向量来修正所选数字人形象，得到多个修正后的数字人形象，所述第二随机噪声向量的维度小于所述第一随机噪声向量的维度。本申请解决了现有技术中数字人生成工具生成的数字人形象的个性化程度较低的技术问题。术问题。术问题。

全部详细技术资料下载

【技术实现步骤摘要】
生成数字人形象的方法、装置、电子设备及存储介质

[0001]本申请涉及数字人生成
，具体而言，涉及一种生成数字人形象的方法、装置、电子设备及存储介质。

技术介绍

[0002]目前存在两种主要的数字人生成方法。
[0003]第一种方法是提供一系列预先生成的数字人形象供用户选择。这些数字人形象通常经过精心设计和渲染，以确保它们看起来吸引人且适用于各种应用场景。用户可以从这些选项中选择一个或多个数字人形象，用作他们的虚拟代表或角色。然而，这种方法的主要问题是缺乏个性化和定制性。每个用户都有独特的外貌特征和风格偏好，但他们只能从有限的选项中进行选择，从而限制了他们的自由度。
[0004]另一种实现方式是允许用户通过所谓的“捏脸”操作来创建个性化的数字人。在这种情况下，用户可以在数字人形象的基础上进行调整，包括调整头发、眼睛、鼻子、嘴巴等特征，以满足他们的个性化需求。尽管这种方法允许一定程度的个性化，但通常需要用户花费大量时间和精力来微调数字人形象。这对于那些希望快速创建数字人形象的用户来说可能不是最佳选择，并且对于不熟悉数字建模工具的用户来说可能会感到困难。
[0005]总体而言，现有的数字人生成工具仍然存在缺乏个性化、定制性差以及效率较低的问题。
[0006]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0007]本专利技术实施例提供了一种生成数字人形象的方法、装置、电子设备及存储介质，以至少解决现有技术中数字人生成工具生成的数字人形象的个性化程度较低的...

【技术保护点】

【技术特征摘要】
1.一种生成数字人形象的方法，其特征在于，包括：响应于接收到第一用户输入数据，对所述第一用户输入数据进行预处理，其中，所述第一用户输入数据用于描述待生成的数字人形象的特征；基于预处理后的所述第一用户输入数据和第一随机噪声向量，利用深度学习方法生成多个数字人形象，并呈现所述多个数字人形象供用户选择；响应于接收到第二用户输入数据，基于所述第二用户输入数据和第二随机噪声向量来修正所选数字人形象，得到多个修正后的数字人形象，其中，所述第二随机噪声向量的维度小于所述第一随机噪声向量的维度，所选数字人形象是用户从所述多个数字人形象中选择出的一个数字人形象。2.根据权利要求1所述的方法，其特征在于，基于预处理后的所述第一用户输入数据和第一随机噪声向量，利用深度学习方法生成多个数字人形象，包括：基于预处理后的所述第一用户输入数据得到文本描述信息，并将所述文本描述信息和所述第一随机噪声向量进行融合，得到条件输入向量，其中，所述第一随机噪声向量的维度小于预设维度阈值；基于所述条件输入向量，利用所述深度学习方法生成所述多个数字人形象。3.根据权利要求2所述的方法，其特征在于，将所述文本描述信息和所述第一随机噪声向量进行融合，得到条件输入向量，包括：确定插值系数，其中，所述插值系数用于指示所述文本描述信息和所述第一随机噪声向量之间的混合程度；基于所述插值系数，融合所述文本描述信息和所述第一随机噪声向量，得到所述条件输入向量。4.根据权利要求1所述的方法，其特征在于，基于所述第二用户输入数据和第二随机噪声向量来修正所选数字人形象，得到多个修正后的数字人形象，包括：对所述第二用户输入数据进行语义分析，并基于所述语义分析的结果确定约束条件，其中，所述第二用户输入数据包括文本数据或语音数据；基于所述约束条件和所述第二随机噪声向量，来修正所选数字人形象，得到所述多个修正后的数字人形象。5.根据权利要求4所述的方法，其特征在于，基于所述约束条件和所述第二随机噪声向量，来修正所选数字人形象，得到所述多个修正后的数字人形象，包括：基于所述约束条件，调整所选数字人形象的多个生成参数，其中，所述约束条件包括姿势和动作条件、外貌条件、服饰条件和情感条件；基于所述第二随机噪声向量，以小于预设阈值的步进，随机调整所述多个生成参数中的至少一个生成参数；基于随机调整后的所述多个生成参数，...

【专利技术属性】
技术研发人员：王新国，
申请(专利权)人：世优北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人