朗读评测方法、装置、设备、存储介质及计算机程序产品制造方法及图纸

技术编号:41515556 阅读:22 留言:0更新日期:2024-05-30 14:52
本申请提出一种朗读评测方法、装置、设备、存储介质及计算机程序产品,该方法包括:获取朗读文本对应的目标音素序列;所述目标音素序列中对应多发音单词的目标音素位置具有多个音素;基于每个音素位置上所有音素的嵌入向量表示,生成所述目标音素序列的嵌入向量表示;对所述目标音素序列的嵌入向量表示和朗读语音的声学特征进行联合解码,确定标准朗读音素序列;基于所述标准朗读音素序列进行朗读评测。整个过程不再依赖于强制切分,避免了不良切分效果所造成的影响,提升了评测结果的稳定性。

【技术实现步骤摘要】

本申请涉及语音处理,尤其涉及一种朗读评测方法、装置、设备、存储介质及计算机程序产品


技术介绍

1、随着越来越多中英文口语学习和考试的推广,越来越多的人/机构开始使用各种终端设备进行口语/朗读评测。为降低多发音词语所造成的影响,目前大多口语朗读评测方案中,通常需要对朗读文本的音素序列和朗读语音进行强制切分/强制对齐(forcealignment)。然后使用强制切分后的结果数据,完成后续评测处理流程。

2、然而,目前强制切分技术的切分效果无法保障,在不良切分效果下势必影响评测结果的准确性。因此,在朗读评测方案中使用强制切分技术将导致评测结果不够稳定的问题。


技术实现思路

1、基于上述技术现状,本申请提出一种朗读评测方法、装置、设备、存储介质及计算机程序产品,能够提升朗读评测结果的稳定性。

2、根据本申请实施例的第一方面,提供了一种朗读评测方法,所述方法包括:获取朗读文本对应的目标音素序列;其中,所述目标音素序列中对应多发音单词的目标音素位置具有多个音素;基于每个音素位置上所有音素的嵌入向本文档来自技高网...

【技术保护点】

1.一种朗读评测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取朗读文本对应的目标音素序列包括:

3.根据权利要求2所述的方法,其特征在于,确定各个所述音素序列之间音素位置的对应关系,包括:

4.根据权利要求1所述的方法,其特征在于,对所述目标音素序列的嵌入向量表示和朗读语音的声学特征进行联合解码,确定标准朗读音素序列,包括:

5.根据权利要求4所述的方法,其特征在于,基于各个音素位置对应的音素全集后验概率,确定所述标准朗读音素序列,包括:

6.根据权利要求4所述的方法,其特征在于,基于所述标准朗...

【技术特征摘要】

1.一种朗读评测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取朗读文本对应的目标音素序列包括:

3.根据权利要求2所述的方法,其特征在于,确定各个所述音素序列之间音素位置的对应关系,包括:

4.根据权利要求1所述的方法,其特征在于,对所述目标音素序列的嵌入向量表示和朗读语音的声学特征进行联合解码,确定标准朗读音素序列,包括:

5.根据权利要求4所述的方法,其特征在于,基于各个音素位置对应的音素全集后验概率,确定所述标准朗读音素序列,包括:

6.根据权利要求4所述的方法,其特征在于,基于所述标准朗读音素序列进行朗读评测,包括:

7.根据权利要求4所述的方法,其...

【专利技术属性】
技术研发人员:杨康吴奎张凯波盛志超竺博
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1