数字人物形象的生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37354720 阅读：12 留言：0更新日期：2023-04-27 07:05

本发明专利技术提供一种数字人物形象的生成方法、装置、电子设备及计算机可读存储介质，涉及数字人技术领域。所述方法包括：获取数字人物目标情感的综合得分序列；将目标情感的综合得分序列生成生成对抗网络GAN隐空间矢量；基于GAN隐空间矢量合成数字人物形象视频的各帧，并与音频同步，以得到数字人物形象。以至少解决相关技术中存在的数字人物形象较为呆板，缺乏真实感的问题。适应于数字人物合成、情感分析等场景。场景。场景。

全部详细技术资料下载

【技术实现步骤摘要】
数字人物形象的生成方法、装置、电子设备及存储介质

[0001]本专利技术涉及数字人
，尤其涉及一种数字人物形象的生成方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]数字人物形象生成算法的一个重要的应用场景为完成数字人物的语音播报，其中，采用的AI(Artificial Intelligence，人工智能)算法自动生成能够说话的数字人物形象，并且形成连续的口型正确的视频。
[0003]在上述的方案中，为了增强虚拟数字人物的表现力，通常在语音播报的视频中随机地加入眨眼、歪头等动作，以使虚拟数字人物的形象更加真实。但是数字人物仍缺乏情感上的表现力，导致数字人物形象较为呆板，缺乏真实感。

技术实现思路

[0004]本专利技术所要解决的技术问题是针对现有技术的上述不足，提供一种数字人物形象的生成方法、装置、电子设备及计算机可读存储介质，以至少解决相关技术中存在的数字人物形象较为呆板，缺乏真实感的问题。
[0005]第一方面，本专利技术提供一种数字人物形象的生成方法，包括：获取数字人物目标情感的综合得分序列；将目标情感的综合得分序列生成生成对抗网络GAN隐空间矢量；基于GAN隐空间矢量合成数字人物形象视频的各帧，并与音频同步，以得到数字人物形象。
[0006]优选地，所述获取数字人物目标情感的综合得分序列，具体包括：获取数字人物播报文本对应的目标情感的得分，并获取数字人物播报语音对应的目标情感的得分；比对播报文本对应的目标情感的得分和播报语音对应的目标情感的得分，并...

【技术保护点】

【技术特征摘要】
1.一种数字人物形象的生成方法，其特征在于，包括：获取数字人物目标情感的综合得分序列；将目标情感的综合得分序列生成生成对抗网络GAN隐空间矢量；基于GAN隐空间矢量合成数字人物形象视频的各帧，并与音频同步，以得到数字人物形象。2.根据权利要求1所述的数字人物形象的生成方法，其特征在于，所述获取数字人物目标情感的综合得分序列，具体包括：获取数字人物播报文本对应的目标情感的得分，并获取数字人物播报语音对应的目标情感的得分；比对播报文本对应的目标情感的得分和播报语音对应的目标情感的得分，并基于插值模型算法，计算目标情感的综合得分；将目标情感的综合得分生成目标情感的综合得分序列。3.根据权利要求2所述的数字人物形象的生成方法，其特征在于，所述获取数字人物播报文本对应的目标情感的得分，具体包括：获取数字人物播报文本；采用文本情感分析模型计算数字人物播报文本对应的目标情感的得分，所述获取数字人物播报语音对应的目标情感的得分，具体包括：获取数字人物播报语音；采用语音情感分析模型计算数字人物播报语音对应的目标情感的得分。4.根据权利要求3所述的数字人物形象的生成方法，其特征在于，在所述计算目标情感的综合得分之后，以及在所述将目标情感的综合得分生成目标情感的综合得分序列之前，还包括：生成播报文本对应的目标情感的得分序列，以使文本情感分析模型根据播报文本对应的目标情感的得分序列更新文本情感分析模型的参数；生成播报语音对应的目标情感的得分序列，以使语音情感分析模型根据播报语音对应的目标情感的得分序列更新语音情感分析模型的参数；获取更新后的文本情感分析模型和语音情感分析模型分别计算的目标情感的得分，并更新目标情感的综合得分。5.根据权利要求1所述的数字人物形象的生成方法，其特征在于，目标情感包括以下至少之一：微笑、紧张、愤怒、无奈、担忧，所述将目标情感的综合得分序列生成GAN隐空间矢量，具体包括：针对每个目标情感的综合得分序列，采用N个通道计算方式分别生成相应的隐空间矢量，N为大于2的正整数；对N个通道进行评判评分，以选择出评分排序靠前的m个通道，m为...

【专利技术属性】
技术研发人员：周广，吴浩然，
申请(专利权)人：中国联合网络通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人