一种口型生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：29257350 阅读：19 留言：0更新日期：2021-07-13 17:29

本申请涉及一种口型生成方法、装置、计算机设备及存储介质，口型生成方法包括以下步骤：获取语音信息；对语音信息进行识别，以得到文字信息，并确认该文字信息对应的状态信息；对文字信息进行识别，得到该文字信息对应的拼音字符串，并将拼音字符串划分为声母音素和韵母音素；从预存的口型库内找出与声母音素、韵母音素对应的声母口型和韵母口型，并根据声母口型、韵母口型合成相应的汉字口型；根据状态信息调整汉字口型的开口幅度，并控制角色模型作出相应的口型动作。本申请具有提高口型匹配的精准度的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种口型生成方法、装置、计算机设备及存储介质
本申请涉及动画生成
，尤其是涉及一种口型生成方法、装置、计算机设备及存储介质。
技术介绍
随着动画等娱乐产业的发展，在各种动画视频中，通常会涉及到一些图像显示需要与音频互相配合的对话场景，在对话场景中，常常需要播放场景角色对话的声音，及呈现与对话音频相配合的场景角色口型。目前，一般通过声音或文字自动给场景角色配口型，最根本的是文字匹配口型。其中，声音会转换成文字，再从预存的口型库中找到对应文字的口型，然后由控制器去控制角色模型作出相应的口型动作。针对上述中的相关技术，专利技术人认为存在有以下缺陷：口型库内的口型是不变的，而人们处于不同的状态时，其说话时口型会有一定的变化，导致口型匹配的精准度不高。
技术实现思路
为了提高口型匹配的精准度，本申请提供了一种口型生成方法、装置、计算机设备及存储介质。第一方面，本申请提供一种口型生成方法，采用如下的技术方案：一种口型生成方法，包括以下步骤：获取语音信息；对语音信息进行识别，以得到文字信息，并确认该文字信息对应的状态信息；对文字信息进行识别，得到该文字信息对应的拼音字符串，并将拼音字符串划分为声母音素和韵母音素；从预存的口型库内找出与声母音素、韵母音素对应的声母口型和韵母口型，并根据声母口型、韵母口型合成相应的汉字口型；根据状态信息调整汉字口型的开口幅度，并控制角色模型作出相应的口型动作。通过采用上述技术方案，导入音频文件，对...

【技术保护点】
1.一种口型生成方法，其特征在于，包括以下步骤：/n获取语音信息；/n对语音信息进行识别，以得到文字信息，并确认该文字信息对应的状态信息；/n对文字信息进行识别，得到该文字信息对应的拼音字符串，并将拼音字符串划分为声母音素和韵母音素；/n从预存的口型库内找出与声母音素、韵母音素对应的声母口型和韵母口型，并根据声母口型、韵母口型合成相应的汉字口型；/n根据状态信息调整汉字口型的开口幅度，并控制角色模型作出相应的口型动作。/n

【技术特征摘要】
1.一种口型生成方法，其特征在于，包括以下步骤：
获取语音信息；
对语音信息进行识别，以得到文字信息，并确认该文字信息对应的状态信息；
对文字信息进行识别，得到该文字信息对应的拼音字符串，并将拼音字符串划分为声母音素和韵母音素；
从预存的口型库内找出与声母音素、韵母音素对应的声母口型和韵母口型，并根据声母口型、韵母口型合成相应的汉字口型；
根据状态信息调整汉字口型的开口幅度，并控制角色模型作出相应的口型动作。

2.根据权利要求1所述的一种口型生成方法，其特征在于：所述确认该文字信息对应的状态信息，包括：
对文字信息进行分句，得到分句文字；
获取分句文字中的实时语速和实时音频，对实时语速和实时音频进行分析，根据分析结果得到该分句文字对应的状态信息，所述状态信息包括平常状态和激动状态。

3.根据权利要求2所述的一种口型生成方法，其特征在于：所述获取分句文字中的实时语速和实时音频，对实时语速和实时音频进行分析，根据分析结果得到该分句文字对应的状态信息，所述状态信息包括平常状态和激动状态，包括：
获取分句文字的总用时及分句文字的字数，根据总用时和字数得到该分句文字的实时语速，将该实时语速与预设语速进行对比；
识别分句文字的实时音频，将实时音频与预定音频进行比对，并记录实时音频高于预定音频的超频时间；
当实时语速大于预设语速，且超频时间大于总用时的二分之一，则判断为激动状态；否则，判断为平常状态。

4.根据权利要求2所述的一种口型生成方法，其特征在于：所述对文字信息进行分句，得到分句文字，包...

【专利技术属性】
技术研发人员：刘莎，贺明泉，杨爱，高玥，
申请(专利权)人：深圳市山水原创动漫文化有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人