一种发音评测方法、装置、设备及存储介质制造方法及图纸

技术编号：36576273 阅读：8 留言：0更新日期：2023-02-04 17:34

本申请实施例公开一种发音评测方法、装置、设备及存储介质。该方法包括：获取待评测音频和对应的参考文本，通过预设的声学模型对齐待评测音频和对应的参考文本，得到待评测音频的第一测试文本；将第一测试文本中连续的相同字母合并得到第二测试文本，计算第二测试文本中各字母的后验概率，根据后验概率确定对应字母的发音准确度；根据第二测试文本中的字母和对应参考文本中的字母，确定漏读的字母；将第二测试文本中的blank符删除或替换为停顿符得到第三测试文本，根据预设的停顿语言模型计算第三测试文本的语言模型困惑度，根据语言模型困惑度确定待评测音频的发音流利度。采用上述技术手段，解决现有发音评测方式的评测维度单一的问题。一的问题。一的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种发音评测方法、装置、设备及存储介质

[0001]本申请实施例涉及辅助学习
，尤其涉及一种发音评测方法、装置、设备及存储介质。

技术介绍

[0002]发音质量评测技术是计算机辅助语言学习的一个细分方法，发音质量评测技术要求高校准确地指出学习者的发音错误，给出字母级别的客观评价，帮助学习者纠正发音错误。发音错误类型包括错读、漏读、多读和停顿。
[0003]现有的发音评测方式是通过CTC(Connectionist Temporal Classification，联结时序分类)检测发音参数和声学参数之间非线性关系的瞬时区域，以检测发音错读。或者提取基于基音信息的短语停顿等特征，以检测发音流利度。但专利技术人发现，这两种发音测评方式只针对某一种发音错误类型进行发音质量测评，而无法评估其他维度发音情况，评测结果不够全面准确。

技术实现思路

[0004]本申请实施例提供一种发音评测方法、装置、设备及存储介质，解决现有发音评测方式的评测维度单一的问题，提高评测结果的准确性。
[0005]在第一方面，本申请实施例提供了一种发音评测方法，包括：
[0006]获取待评测音频和对应的参考文本，通过预设的声学模型对齐所述待评测音频和对应的参考文本，得到所述待评测音频的第一测试文本，所述第一测试文本包含对应参考文本中的字母和blank符；
[0007]将所述第一测试文本中连续的相同字母合并得到第二测试文本，计算所述第二测试文本中各字母的后验概率，根据所述后验概率确定对应字母的发音准确度...

【技术保护点】

【技术特征摘要】
1.一种发音评测方法，其特征在于，包括：获取待评测音频和对应的参考文本，通过预设的声学模型对齐所述待评测音频和对应的参考文本，得到所述待评测音频的第一测试文本，所述第一测试文本包含对应参考文本中的字母和blank符；将所述第一测试文本中连续的相同字母合并得到第二测试文本，计算所述第二测试文本中各字母的后验概率，根据所述后验概率确定对应字母的发音准确度；根据所述第二测试文本中的字母和对应参考文本中的字母，确定漏读的字母；将所述第二测试文本中的blank符删除或替换为停顿符得到第三测试文本，根据预设的停顿语言模型计算所述第三测试文本的语言模型困惑度，根据所述语言模型困惑度确定所述待评测音频的发音流利度。2.根据权利要求1所述的方法，其特征在于，所述通过预设的声学模型对齐所述待评测音频和对应的参考文本，得到所述待评测音频的长度一致的第一测试文本包括：在所述参考文本的每个字母前后各插入一个blank符，得到第五测试文本；根据所述待评测音频的帧长度和所述第五测试文本，以及预设的状态跳转条件，确定包含至少一条转移路径的转移路径网络；其中，所述状态跳转条件包括从字母前的blank符跳转至字母后的blank符；计算所述转移路径上字母和blank符的后验概率，根据所述转移路径上的字母和blank符的后验概率，在所述转移路径网络中确定出最优路径；将所述最优路径对应的字符序列确定为所述第一测试文本。3.根据权利要求2所述的方法，其特征在于，所述计算所述第二测试文本中各字母的后验概率包括：确定所述最优路径上字母的后验概率为所述第一测试文本中字母的后验概率；将所述第一测试文本中单独出现的字母的后验概率确定为所述第二测试文本对应字母的后验概率；计算所述第一测试文本中连续出现的字母的平均后验概率，将所述平均后验概率确定为所述第二测试文本对应字母的后验概率。4.根据权利要求1所述的方法，其特征在于，所述根据所述第二测试文本中的字母和对应参考文本中的字母，确定漏读的字母包括：将所述第二测试文本中的blank符删除得到第四测试文本，将所述第四测试文本与对应的参考文本进行比较，确定漏读的字母。5.根据权利要求1所述的方法，其特征在于，所述将所述第二测试文本中的blank符删除或替换为停顿符得到第三测试文本包括：根据所述第二测试文本中的blank符序列，确定所述blank符序列的序列长度；将所述第二测试文本中所述序列长度满足预设长度阈值...

【专利技术属性】
技术研发人员：叶珑，雷延强，
申请(专利权)人：广州视源人工智能创新研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人