口语评测模型的训练方法及装置制造方法及图纸

技术编号:37503503 阅读:23 留言:0更新日期:2023-05-07 09:39
本说明书提供口语评测模型的训练方法及装置,其中所述口语评测模型的训练方法包括:获取样本音频以及所述样本音频对应的样本口语分值;根据所述样本音频确定音频特征,并将所述音频特征输入至口语评测模型进行处理,获得评测口语分值以及口语等级概率分布;根据所述评测口语分值和所述样本口语分值计算第一损失值,以及所述口语等级概率分布和所述样本口语分值计算第二损失值;基于所述第一损失值和所述第二损失值对所述口语评测模型进行调参,并继续训练直至满足训练停止条件。并继续训练直至满足训练停止条件。并继续训练直至满足训练停止条件。

【技术实现步骤摘要】
口语评测模型的训练方法及装置


[0001]本说明书涉及音频处理
,特别涉及口语评测模型的训练方法及装置。

技术介绍

[0002]随着互联网技术的发展,语音识别技术在越来越多的领域得以应用。在口语评测场景中,通常情况下,计算机会自动对用户朗读的一句话进行整体发音评测,而用户朗读的内容往往需要对应的参考文本,无法做到无文本评测口语分值。此外基于有序回归对口语进行流利度打分虽然能够实现无文本评测,但是该方法在infer时需要将评分音频与所有锚定音频组成pair判断流利度,以得到最终的分数;该过程不仅需要预先组成pair,而且计算量较大,因此亟需一种有效的方案以解决上述问题。

技术实现思路

[0003]有鉴于此,本说明书实施例提供了一种口语评测模型的训练方法。本说明书同时涉及一种口语评测模型的训练装置,一种口语评测方法,一种口语评测装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0004]根据本说明书实施例的第一方面,提供了一种口语评测模型的训练方法,包括:
[0005]获取样本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种口语评测模型的训练方法,其特征在于,包括:获取样本音频以及所述样本音频对应的样本口语分值;根据所述样本音频确定音频特征,并将所述音频特征输入至口语评测模型进行处理,获得评测口语分值以及口语等级概率分布;根据所述评测口语分值和所述样本口语分值计算第一损失值,以及所述口语等级概率分布和所述样本口语分值计算第二损失值;基于所述第一损失值和所述第二损失值对所述口语评测模型进行调参,并继续训练直至满足训练停止条件。2.根据权利要求1所述的方法,其特征在于,所述获取样本音频以及所述样本音频对应的样本口语分值,包括:获取所述样本音频;确定所述样本音频对应流利维度的流利度分值,发音维度的发音分值以及语义维度的语义分值;计算所述流利度分值、所述发音分值以及所述语音分值的平均值,根据计算结果确定所述样本口语分值。3.根据权利要求1所述的方法,其特征在于,所述根据所述样本音频确定音频特征,包括:根据所述样本音频构建声学特征;将所述声学特征输入至预训练的声学模型进行处理,获得所述音频特征。4.根据权利要求1所述的方法,其特征在于,所述根据所述评测口语分值和所述样本口语分值计算第一损失值,包括:根据所述评测口语分值和所述样本口语分值读取均方损失函数;利用所述均方损失函数对所述评测口语分值和所述样本口语分值进行计算,获得所述第一损失值。5.根据权利要求1所述的方法,其特征在于,所述根据所述口语等级概率分布和所述样本口语分值计算第二损失值,包括:根据所述口语等级概率分布和所述样本口语分值读取交叉熵损失函数;利用所述交叉熵损失函数对所述口语等级概率分布和所述样本口语分值进行计算,获得第二损失值。6.根据权利要求1

5任意一项所述的方法,其特征在于,所述基于所述第一损失值和所述第二损失值对所述口语评测模型进行调参,包括:确定所述第二损失值对应的损失权重,并基于所述损失权重和所述第二损失值计算第三损失值;对所述第一损失值和所述第三损失值进行求和获得目标损失值;基于所述目标损失值对所述口语评测模型进行调参。7.根据权利要求1

5任意一项所述的方法,其特征在于,所述获取样本音频以及所述样本音频对应的样本口语分值步骤执行之后,还包括:对所述样本口语分值进行划分,获得口语等级信息;相应的...

【专利技术属性】
技术研发人员:吴凡李振权卓邦声王宏伟林倩倩郭涵韬陆家辉
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1