发音评价方法、装置、可读介质及电子设备制造方法及图纸

技术编号:38339944 阅读:27 留言:0更新日期:2023-08-02 09:20
本公开涉及一种发音评价方法、装置、可读介质及电子设备,所述方法包括:获取待评价的目标语音和所述目标语音对应的目标文本;根据目标语音和目标文本,确定目标语音对应的多个目标音素特征;将多个目标音素特征和至少一个目标评价任务输入预先生成的发音评价模型,以获取发音评价模型输出的每个目标评价任务对应的评价值;其中,发音评价模型通过多个样本集对目标神经网络模型进行训练得到的,样本集包括样本文本的每个样本音素的样本音素信息、每个样本音素在样本语音中的样本音素特征、多个样本评价任务以及每个样本评价任务对应的样本评价值,样本音素信息包括样本音素标识和样本位置信息。样本位置信息。样本位置信息。

【技术实现步骤摘要】
发音评价方法、装置、可读介质及电子设备


[0001]本公开涉及语音识别
,具体地,涉及一种发音评价方法、装置、可读介质及电子设备。

技术介绍

[0002]随着互联网的发展,基于互联网的语言学习应用也得到了快速的发展,语音评价是帮助自主语言学习者学习的一项重要技术,能够从准确度、流利度、完整度、韵律等方面对学习者的发音进行评价。
[0003]相关技术中,通过评价模型对发音进行评价,不同的评价模型用于从不同维度进行发音评价,例如,通过准确度评价模型评价发音的准确度,通过完整度评价模型评价发音的完整度,但是,评价模型需要通过大量人工标注的训练样本进行训练,而人工标注的成本比较高,导致训练样本成为稀缺资源,在训练样本数量有限的情况下,训练得到的评价模型的准确率比较低,从而使得根据该评价模型确定的发音评价值的准确率也比较低。因此,如何提高发音评价的准确率成为亟待解决的问题。

技术实现思路

[0004]提供该部分内容以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该部分内容并不旨在标识要求保护的技术方案本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种发音评价方法,其特征在于,包括:获取待评价的目标语音和所述目标语音对应的目标文本;根据所述目标语音和所述目标文本,确定所述目标语音对应的多个目标音素特征,所述目标音素特征用于表征所述目标文本中的目标音素在所述目标语音中的音素特征,不同目标音素对应不同的目标音素特征;将多个所述目标音素特征和至少一个目标评价任务输入预先生成的发音评价模型,以获取所述发音评价模型输出的每个所述目标评价任务对应的评价值;其中,所述发音评价模型通过多个样本集对目标神经网络模型进行训练得到的,所述样本集包括样本文本的每个样本音素的样本音素信息、每个所述样本音素在样本语音中的样本音素特征、多个样本评价任务以及每个所述样本评价任务对应的样本评价值,所述样本音素信息包括样本音素标识和样本位置信息,所述样本位置信息用于表征所述样本音素在所述样本文本对应的样本音素序列中的位置。2.根据权利要求1所述的方法,其特征在于,所述发音评价模型通过以下方式预先生成:获取多个所述样本集,并从多个所述样本集中确定当前样本集;根据所述当前样本集,循环执行模型训练步骤,直至根据多个所述样本评价值和所述当前样本集的多个当前预测评价值确定训练后的目标神经网络模型满足预设停止迭代条件,将训练后的目标神经网络模型作为所述发音评价模型,所述当前预测评价值为所述当前样本集输入该训练后的目标神经网络模型后输出的所述样本评价任务对应的评价值;所述模型训练步骤包括:通过所述目标神经网络模型获取所述当前样本集中每个所述样本评价任务对应的当前预测评价值;在根据多个所述当前预测评价值和多个所述样本评价值确定所述目标神经网络模型不满足所述预设停止迭代条件的情况下,根据多个所述当前预测评价值和多个所述样本评价值,确定目标损失值,根据所述目标损失值更新所述目标神经网络模型的参数,得到训练后的目标神经网络模型,将训练后的目标神经网络模型作为新的目标神经网络模型,并从多个所述样本集中确定新的当前样本集。3.根据权利要求2所述的方法,其特征在于,所述通过所述目标神经网络模型获取所述当前样本集中每个所述样本评价任务对应的当前预测评价值包括:针对每个所述样本评价任务,根据所述样本评价任务,通过所述目标神经网络模型对所述当前样本集的多个当前样本音素特征和所述当前样本集的多个当前样本音素信息进行特征提取,得到所述样本评价任务对应的音素评价特征,并根据所述音素评价特征和所述样本评价任务,确定所述样本评价任务对应的当前预测评价值。4.根据权利要求3所述的方法,其特征在于,所述目标神经网络模型包括特征提取子模型,所述根据所述样本评价任务,通过所述目标神经网络模型对所述当前样本集的多个当前样本音素特征和所述当前样本集的多个当前样本音素信息进行特征提取,得到所述样本评价任务对应的音素评价特征包括:针对所述当前样本集的每个当前样本音素,对所述当前样本音素的当前样本音素特征和所述当前样本音素的当前样本...

【专利技术属性】
技术研发人员:李亮亮李伟高绍钧田霄海付凯奇马泽君
申请(专利权)人:脸萌有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1