图像生成方法、存储介质和电子设备技术

技术编号：29227642 阅读：14 留言：0更新日期：2021-07-10 01:14

本发明专利技术实施例公开了一种图像生成方法、存储介质和电子设备。本发明专利技术实施例在确定目标音频中各音频片段对应的音素标签后，根据各音素标签确定各音频片段的对应的唇部宽度和唇部高度，并根据各音频片段对应的唇部宽度和唇部高度生成目标形象对应的唇部图像序列。本发明专利技术实施例基于音素标签确定发音时应呈现出的唇部宽度和唇部高度，根据目标音频中各音频片段对应的唇部宽度和唇部高度自动生成目标音频对应的唇部图像序列，有效降低了通过可视化方式进行词语发音学习的图像获取成本。式进行词语发音学习的图像获取成本。式进行词语发音学习的图像获取成本。

全部详细技术资料下载

【技术实现步骤摘要】
图像生成方法、存储介质和电子设备

[0001]本专利技术涉及数据处理
，具体涉及一种图像生成方法、存储介质和电子设备。

技术介绍

[0002]随着互联网和计算机技术的不断普及，线上教学活动，特别是语言类线上教学活动因此变得越来越频繁。语言的学习对于学习者是至关重要的，而词语发音则是语言学习中的基础，因此词语发音的学习是语言类线上教学活动中必不可少的一个环节。词语发音的线上教学方式通过需要通过可视化方式向学习者展示词语发音过程中的唇形变化，但不同的语言具有不同的发音方式，且词语数量十分庞大，因此通过录制真人的唇形变化的方式显然是不现实的。

技术实现思路

[0003]有鉴于此,本专利技术实施例的目的在于提供一种图像生成方法、存储介质和电子设备，用于根据目标音频中各音频片段对应的音素标签自动生成音频对应的唇部图像序列，有效降低了通过可视化方式进行词语发音学习的图像获取成本。
[0004]根据本专利技术实施例的第一方面，提供一种图像生成方法，所述方法包括：
[0005]获取目标音频；
[0006]确定所述目标音频中各音频片段对应的音素标签；
[0007]根据各所述音素标签确定各所述音频片段对应的人脸特征参数，所述人脸特征参数包括唇部宽度和唇部高度；
[0008]根据各所述唇部宽度和对应的所述唇部高度确定目标形象的唇部图像序列。
[0009]优选地，所述方法还包括：
[0010]根据各所述唇部宽度和对应的所述唇部高度确定所述目标形象的面部图像序列。<...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法，其特征在于，所述方法包括：获取目标音频；确定所述目标音频中各音频片段对应的音素标签；根据各所述音素标签确定各所述音频片段对应的人脸特征参数，所述人脸特征参数包括唇部宽度和唇部高度；根据各所述唇部宽度和对应的所述唇部高度确定目标形象的唇部图像序列。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：根据各所述唇部宽度和对应的所述唇部高度确定所述目标形象的面部图像序列。3.根据权利要求1所述的方法，其特征在于，所述确定所述目标音频中各音频片段对应的音素标签包括：基于预定的语音识别模型对所述目标音频进行语音识别，确定各所述音频片段对应的所述音素标签。4.根据权利要求1所述的方法，其特征在于，所述根据各所述音素标签确定各所述音频片段对应的人脸特征参数包括：根据各所述音素标签确定各所述音频片段对应的特征向量；根据各所述特征向量，基于预定的特征识别模型确定各所述音频片段对应的所述唇部宽度以及所述唇部高度。5.根据权利要求4所述的方法，其特征在于，所述特征向量为所述音频片段的独热向量；所述根据各所述音素标签确定各所述音频片段对应的特征向量包括：基于预先确定的音素表确定各所述音素标签在所述音素表中的排序位置；对于各所述音频片段，根据对应的所述排序位置确定对应的所述独热向量。6.根据权利要求3所述的方法，其特征在于，所述语音识别模型基于第一样本集合训练获得，所述第一样本集合包括多个第一样本，各所述第一样本包括第一音频片段和所...

【专利技术属性】
技术研发人员：冯富森，闫嵩，
申请(专利权)人：北京大米科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人