语音动画的合成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：36016816 阅读：31 留言：0更新日期：2022-12-21 10:08

本申请实施例提供了一种语音动画的合成方法、装置、电子设备及存储介质，涉及语音技术领域。该方法包括：显示图像采集控件，响应于图像采集控件的触发操作，采集目标用户的面部图像，获得目标面部图像；显示跟读信息和跟读控件，响应于跟读控件的触发操作，采集目标用户输入的、与跟读信息对应的音频信息；获取并显示包括目标用户唇形变化的图像的语音动画，目标用户的唇形变化与音频信息的内容同步，目标用户唇形变化的图像是根据目标面部图像中的唇形和音频信息得到的。本申请实施例能够帮助用户根据语音动画更准确地练习发音以及发音时的唇形，提高语言学习的兴趣和效率。提高语言学习的兴趣和效率。提高语言学习的兴趣和效率。

全部详细技术资料下载

【技术实现步骤摘要】
语音动画的合成方法、装置、电子设备及存储介质

[0001]本申请涉及语音
，具体而言，本申请涉及一种语音动画的合成方法、装置、电子设备及存储介质。

技术介绍

[0002]在语言学习中，听和读是非常重要的，通常情况下，在学习语言时需要跟着听到的发音进行朗读，进而进行各种语音的学习。
[0003]很多情况下靠学习者自己还是无法知道自身发音是否标准。因此，大多语言学习软件还会向学习者展示发音时的标准唇形图案，以帮助学习者参照标准唇形图案，调整自己的唇形来纠正发音。
[0004]然而，现有技术所提供的标准唇形图案要么是手绘的，要么是模特的唇形图案，学习者并不能够准确模仿出标准唇形图案，影响发音的准确性，降低语言学习的热情。

技术实现思路

[0005]本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的语音动画的合成方法、装置、电子设备及存储介质。
[0006]第一方面，提供了一种语音动画的合成方法，该方法包括：
[0007]显示图像采集控件，响应于图像采集控件的触发操...

【技术保护点】

【技术特征摘要】
1.一种语音动画的合成方法，其特征在于，包括：显示图像采集控件，响应于所述图像采集控件的触发操作，采集目标用户的面部图像，获得目标面部图像；显示跟读信息和跟读控件，响应于所述跟读控件的触发操作，采集所述目标用户输入的、与所述跟读信息对应的音频信息；获取并显示包括所述目标用户唇形变化的图像的语音动画，所述目标用户的唇形变化与所述音频信息的内容同步，所述目标用户唇形变化的图像是根据所述目标面部图像中的唇形和音频信息得到的。2.根据权利要求1所述的语音动画的合成方法，其特征在于，获得所述语音动画的方式，包括：获取至少一种样本唇形，所述样本唇形用于表达至少一种音素的发音；根据所述样本唇形对所述目标面部图像中目标用户的唇形进行更新，获得合成面部图像，所述合成面部图像中目标用户的唇形用于表达相应的样本唇形表达的音素的发音；对所述音频信息进行语音识别，获得所述音频信息的音素序列，所述音素序列中包括所述音频信息中至少一个时间点对应的音素；确定与所述音素序列中各音素对应的合成面部图像，并依据各个合成面部图像获得目标用户唇形变化的合成面部图像序列；获取所述音频信息中所述音素序列对应的音频帧序列，根据所述音频帧序列在所述音频信息中的时间信息，将所述音频帧序列和所述合成面部图像序列进行同步，生成所述语音动画。3.根据权利要求2所述的语音动画的合成方法，其特征在于，所述确定与所述音素序列中各音素对应的合成面部图像，包括：确定所述音素序列中各音素对应的唇形，获得唇形序列；确定所述唇形序列中各唇形对应的合成面部图像。4.根据权利要求2所述的语音动画的合成方法，其特征在于，所述获得合成面部图像序列，之后还包括：将所述合成面部图像序列中的合成面部图像分别与预设的素材图像进行融合，获得融合图像序列；所述将所述音频帧序列和所述合成面部图像序列进行同步，获得所述语音动画，包括：将所述音频帧序列和所述融合图像序列进行同步，获得所述语音动画。5.根据权利要求2所述的语音动画的合成方法，其特征在于，所述对所述音频信息进行语音识别，获得所述音频信息的音素序列，包括：获得音频信息的初始翻译文本，根据所述初始翻译文本确定所述音频信息的语种；若确定所述音频信息的语种为目标语种，则从初始翻译文本中获取待校正的分词结果以及所述分词结果中的多音字；从所述多音字中筛选出...

【专利技术属性】
技术研发人员：曹爽，潘伟洲，曾润良，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人