发音评价方法、装置、介质及电子设备制造方法及图纸

技术编号：34291365 阅读：27 留言：0更新日期：2022-07-27 09:33

本公开涉及一种发音评价方法、装置、介质及电子设备，包括：获取用户音频和与用户音频对应的跟读文本；根据用户音频和跟读文本，通过预先训练得到的深度学习打分模型获取用户音频中各单词对应的第一单词得分和第一单词得分的置信度；若单词对应的第一单词得分的置信度小于预设阈值，根据预设发音评价规则确定单词的第二单词得分作为目标单词得分，目标单词得分表征单词的发音准确程度。这样，不仅能够通过深度学习打分模型来进行一轮打分，而且还能对一轮打分中置信度不足的单词再次通过预设发音评价规则进行更加准确地发音评价，从而保证了该用户音频的得分评价能够更加准确，提高了对该用户音频的发音评价的整体准确率。提高了对该用户音频的发音评价的整体准确率。提高了对该用户音频的发音评价的整体准确率。

全部详细技术资料下载

【技术实现步骤摘要】
发音评价方法、装置、介质及电子设备

[0001]本公开涉及音频
，具体地，涉及一种发音评价方法、装置、介质及电子设备。

技术介绍

[0002]对用户跟读音频进行发音评测，进而提供精确到单词级的发音评估得分，是发音评测领域中常见的场景。目前，常见的发音评测通常是采用GOP分数来进行，例如，先得到跟读文本对应的每个音素的时间戳和似然值，从而计算得到每个音素的GOP分数，最后通过加权平均的方式得到单词GOP分数作为最终分数。但是，这样的方案存在对发音中存在的少量错误不敏感，在大部分发音良好的情况下无法识别个别典型发音错误时，无法对所有的跟读内容进行评测等等多种问题，亟需解决。

技术实现思路

[0003]提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0004]第一方面，本公开提供一种发音评价方法，所述方法包括：获取用户音频和与所述用户音频对应的跟读文本；根据所述用户音频和所述跟读文本，通过预先训练得到的深度学习打分模型获取所述用户音频中各单词对应的第一单词得分和所述第一单词得分的置信度；若所述单词对应的第一单词得分的置信度小于预设阈值，根据预设发音评价规则确定所述单词的第二单词得分作为目标单词得分，所述目标单词得分表征所述单词的发音准确程度。
[0005]第二方面，本公开提供一种发音评价装置，所述装置包括：获取模块，用于获...

【技术保护点】

【技术特征摘要】
1.一种发音评价方法，其特征在于，所述方法包括：获取用户音频和与所述用户音频对应的跟读文本；根据所述用户音频和所述跟读文本，通过预先训练得到的深度学习打分模型获取所述用户音频中各单词对应的第一单词得分和所述第一单词得分的置信度；若所述单词对应的第一单词得分的置信度小于预设阈值，根据预设发音评价规则确定所述单词的第二单词得分作为目标单词得分，所述目标单词得分表征所述单词的发音准确程度。2.根据权利要求1所述的方法，其特征在于，所述根据预设发音评价规则确定所述单词的第二单词得分作为目标单词得分包括：根据所述用户音频和所述跟读文本，通过预设音素发音类型判断规则确定所述单词中各音素的音素发音类型，所述音素发音类型用于表征所述单词中各音素发音情况的可接受程度；根据所述单词中各音素的所述音素发音类型确定所述单词的所述第二单词得分，并将所述第二单词得分作为所述目标单词得分。3.根据权利要求2所述的方法，其特征在于，所述音素发音类型包括：标准、不标准、可容忍错误、不可容忍错误。4.根据权利要求2所述的方法，其特征在于，所述根据所述用户音频和所述跟读文本，通过预设音素发音类型判断规则确定所述单词中各音素的音素发音类型包括：根据所述用户音频和所述跟读文本，确定所述单词中各音素对应的GOP得分，所述单词中各音素对应的音素类型以及所述单词中各音素在所述单词中的位置；根据所述单词中各音素对应的GOP得分，所述单词中各音素对应的音素类型以及所述单词中各音素在所述单词中的位置，通过所述预设音素发音类型判断规则确定所述单词中各音素的所述音素发音类型。5.根据权利要求4所述的方法，其特征在于，所述根据所述用户音频和所述跟读文本，确定所述单词中各音素对应的GOP得分，所述单词中各音素对应的音素类型以及所述单词中各音素在所述单词中的位置包括：通过预先训练得到的声学模型从所述用户音频中提取声学特征，所述声学特征为帧级别的似然值；通过所述跟读文本构建加权有限状态转换器；对所述声学特征和所述加...

【专利技术属性】
技术研发人员：高绍钧，王凯，李伟，马泽君，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人