一种发音流利度评测方法、装置、设备及存储介质制造方法及图纸

技术编号：35845683 阅读：12 留言：0更新日期：2022-12-07 10:25

本申请实施例公开了一种发音流利度评测方法、装置、设备及存储介质。本申请实施例提供的技术方案通过对待评测语音进行语音识别，得到包含测试停顿信息的测试文本，并将测试文本中的测试停顿信息去除，得到无停顿文本，根据该无停顿文本构建词间停顿路径网络，并根据词间停顿路径网络中直连分支路径和停顿分支路径对应的概率权重，并从词间停顿路径网络中确定最优路径，根据最优路径确定包含参考停顿信息的参考文本，可根据测试文本和参考文本进行发音流利度评测，得到待评测语音对应的发音流利度评测结果，参考停顿信息反映了流利语音中存在的停顿习惯，更适应于发音停顿的特点，有效提高发音流利度的评测效果。效提高发音流利度的评测效果。效提高发音流利度的评测效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种发音流利度评测方法、装置、设备及存储介质

[0001]本申请实施例涉及计算机
，尤其涉及一种发音流利度评测方法、装置、设备及存储介质。

技术介绍

[0002]发音流利度评估是计算机辅助语言学习的一个细分方向，发音流利度评估要求高效准确地还原学习者的实际发音流利情况，给出韵律短语级别的流利程度评价，帮助学习者评估口语的熟练程度。
[0003]开放式题型的流利度评估采用韵律维度特征，主要包括韵律短语停顿特征、重读音节特征、边界调特征和节奏特征等。其中，短语停顿特征既融合了语速特征，又涵盖了对语法的掌握程度，是流利度评估中的一个重要特征。但是目前对发音流利度的评测一般是从文本语法语义出发，忽略了流利语音中可能存在的停顿习惯，无法适配于发音停顿的特点，导致发音流利度评测的效果不理想。

技术实现思路

[0004]本申请实施例提供一种发音流利度评测方法、装置、设备及存储介质，以提高发音流利度的评测效果。
[0005]在第一方面，本申请实施例提供了一种发音流利度评测方法，包括：
[0006]获取待评测语音，并对待评测语音进行语音识别，得到包含测试停顿信息的测试文本；
[0007]将所述测试文本中的测试停顿信息去除，以得到无停顿文本，并基于所述无停顿文本构建词间停顿路径网络，所述词间停顿路径网络记录有文本单词间的直连分支路径和含词间停顿的停顿分支路径，以及所述直连分支路径和所述停顿分支路径对应的概率权重，所述概率权重由训练好的词间停顿预测模型，对所述无停顿文本进行分析得到；<...

【技术保护点】

【技术特征摘要】
1.一种发音流利度评测方法，其特征在于，包括：获取待评测语音，并对待评测语音进行语音识别，得到包含测试停顿信息的测试文本；将所述测试文本中的测试停顿信息去除，以得到无停顿文本，并基于所述无停顿文本构建词间停顿路径网络，所述词间停顿路径网络记录有文本单词间的直连分支路径和含词间停顿的停顿分支路径，以及所述直连分支路径和所述停顿分支路径对应的概率权重，所述概率权重由训练好的词间停顿预测模型，对所述无停顿文本进行分析得到；根据所述概率权重，在所述词间停顿路径网络中确定最优路径，并基于所述最优路径确定包含参考停顿信息的参考文本，所述最优路径由直连分支路径和停顿分支路径组成；根据所述测试文本和所述参考文本进行发音流利度评测，以得到所述待评测语音对应的发音流利度评测结果。2.根据权利要求1所述的发音流利度评测方法，其特征在于，所述发音流利度评测方法还包括：获取基于参考文本录制得到的待评测语音，对所述待评测语音进行强制对齐，得到包含测试停顿信息的测试文本。3.根据权利要求1所述的发音流利度评测方法，其特征在于，所述词间停顿路径网络为加权有限状态转移器网络，所述基于所述无停顿文本构建词间停顿路径网络，包括：利用词间停顿预测模型，对所述无停顿文本进行词间停顿预测，以得到所述无停顿文本的各个文本单词对应的预测概率；基于所述无停顿文本和所述预测概率，构建加权有限状态转移器网络。4.根据权利要求1所述的发音流利度评测方法，其特征在于，所述根据所述概率权重，在所述词间停顿路径网络中确定最优路径，包括：根据所述概率权重，基于维特比算法在所述词间停顿路径网络中搜索最优路径。5.根据权利要求1所述的发音流利度评测方法，其特征在于，所述根据所述测试文本和所述参考文本进行发音流利度评测，以得到所述待评测语音对应的发音流利度评测结果，包括：基于对机器学习模型的模型评价指标，根据所述测试文本和所述参考文本进行停顿评价，以得到停顿评价结果；根据所述参考文本的第一语言模型困惑度和所述测试文本的第二语言模型困惑度之间的困惑度差异，得到文本评价结果；对所述停顿评价结果和所述文本评价结果进行加权求和得到综合评价结果，根据综合评价结果确定所述待评测语音对应的发音流利度评测结果。6.根据权利要求5所述的发音流利度评测方法，其特征在于，所述根据所述测试文本和所述参考文本进行停顿评价，包括：基于所述测试文本和所述参考文本，计算所述待评测语音对应的精确率和召回率；根据所述精确率和所述召回率，计算所述待评测语音对应的停顿评价结果。7.根据权利要求6所述的发音流利度评测方法，其特征在于，所述精确率的计算公式为：
其中，T
P
为测试文本和参考文本之间停顿位置一致的停顿位置数量，F
P
为测试文本中...

【专利技术属性】
技术研发人员：叶珑，雷延强，
申请(专利权)人：广州视源人工智能创新研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人