嘴型生成方法、装置、设备及存储介质制造方法及图纸

技术编号：38822388 阅读：16 留言：0更新日期：2023-09-15 20:01

本发明专利技术涉及一种嘴型生成方法、装置、设备及存储介质，其中，嘴型生成方法包括：获取数字人的原始音频；根据原始音频，确定原始音频对应的预设情绪嘴型图和预设原始嘴型图；根据预设原始嘴型图和预设情绪嘴型图，确定原始音频对应的目标嘴型图。该方法可以先根据数字人的原始音频，确定其对应的预设情绪嘴型图以及预设原始嘴型图，然后再基于上述预设情绪嘴型图和预设原始嘴型图，得到原始音频对应的目标嘴型图，以使得目标嘴型图可以带有情绪，从而更好地保证目标嘴型图与原始音频之间的匹配度，提升使用体验。提升使用体验。提升使用体验。

全部详细技术资料下载

【技术实现步骤摘要】
嘴型生成方法、装置、设备及存储介质

[0001]本申请涉及人工智能
，具体涉及一种嘴型生成方法、装置、设备及存储介质。

技术介绍

[0002]当前，AI(人工智能)合成虚拟人物视频是人工智能技术应用的全新领域，包括语音合成、语音识别、机器翻译、表情识别、人体动作识别、高清图像处理等多项先进技术，实现了定制化的虚拟人物解决方案。通过AI生成的虚拟人物可用于许多与人交互的场景，如新闻播报、课堂教育、养老陪护、人机交互等。在视频行业可以定制化的生成不同人物形象，使视频交互内容更加生动有趣。
[0003]虚拟数字人，即采用计算机视觉或计算机图形学的技术手段，生成真人风格或卡通形象的人物模型。用户可以通过语音、文本等形式与数字人进行交互，虚拟数字人通过算法驱动面部的表情、嘴型和肢体动作的变化，配合声音，与用户进行互动，给予应答。目前，数字人已广泛应用于政务、金融、景区、电商等场景，例如在景区提供讲解服务、在电商网站上提供客户咨询服务等。
[0004]但是，现有技术在制作虚拟数字人时，容易存在虚拟数字人的嘴型和语音不对应，以及虚拟数字人的嘴型和虚拟数字人情绪不协调的技术问题，难以满足用户的需求。

技术实现思路

[0005]本申请的目的之一在于提供一种嘴型生成方法，其可以使得数字人的嘴型与语音以及情绪更加匹配；本申请的目的之二在于提供一种嘴型生成装置；本申请的目的之三在于提供一种电子设备；本申请的目标之四在于提供一种存储介质。
[0006]为了实现上述目的，第一方面，本申请提供了一种嘴...

【技术保护点】

【技术特征摘要】
1.一种嘴型生成方法，其特征在于，所述嘴型生成方法包括：获取数字人的原始音频；根据所述原始音频，确定所述原始音频对应的预设情绪嘴型图和预设原始嘴型图；根据所述预设原始嘴型图和所述预设情绪嘴型图，确定原始音频对应的目标嘴型图。2.根据权利要求1所述的嘴型生成方法，其特征在于，所述根据所述原始音频，确定所述原始音频对应的预设情绪嘴型图和预设原始嘴型图，包括：根据所述原始音频，确定所述原始音频对应的音素数据；其中，所述音素数据包括带有时间序列的多个音素；根据所述音素数据，确定所述预设原始嘴型图和所述预设情绪嘴型图。3.根据权利要求2所述的嘴型生成方法，其特征在于，所述根据所述音素数据，确定所述预设原始嘴型图和所述预设情绪嘴型图，包括：获取嘴型数据库；其中，所述嘴型数据库包括多个音素与嘴型关键参数的对应关系；根据所述嘴型数据库和所述音素数据，确定所述原始音频对应的多个预设嘴型关键参数；其中，多个所述预设嘴型关键参数与所述音素数据中的多个音素一一对应；根据多个所述预设嘴型关键参数以及所述音素数据，确定所述预设原始嘴型图。4.根据权利要求3所述的嘴型生成方法，其特征在于，所述根据所述音素数据，确定所述预设原始嘴型图和所述预设情绪嘴型图，包括：当确定需要对所述原始音频进行情绪化处理时，根据所述嘴型数据库和所述音素数据，确定所述原始音频对应的多个预设情绪动作参数；其中，所述嘴型数据库包括多个音素与情绪动作参数的对应关系，多个所述预设情绪动作参数与所述音素数据中的多个音素一一对应；根据多个所述预设情绪动作参数以及所述音素数据，确定所述预设情绪嘴型图。5.根据权利要求3所述的嘴型生成方法，其特征在于，所述嘴型数据库...

【专利技术属性】
技术研发人员：魏来，
申请(专利权)人：重庆长安汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人