发音准确度确定方法、装置、存储介质和电子设备制造方法及图纸

技术编号:27833000 阅读:33 留言:0更新日期:2021-03-30 11:45
本申请实施例提供的发音准确度确定方法、装置、存储介质和电子设备,先确定出语音数据包含的各个语音帧对应的真实音素的质量评估值,接着根据各个语音帧对应的真实音素的质量评估值,确定出语音数据中发音错误的单字的错误类型,最后根据各个语音帧对应的真实音素的质量评估值,以及语音数据中发音错误的单字的错误类型,确定语音数据的发音准确度。与相关技术相比,本申请实施例提供的方法根据各个语音帧对应的真实音素的质量评估值和语音数据中发音错误的单字的错误类型共同得到该语音数据的发音准确度,可以有效提高对语音进行发音评测的准确性。音评测的准确性。音评测的准确性。

【技术实现步骤摘要】
发音准确度确定方法、装置、存储介质和电子设备


[0001]本申请涉及计算机
,更具体地说,涉及一种发音准确度确定方法、装置、存储介质和电子设备。

技术介绍

[0002]随着计算机技术和互联网的发展,学员可以通过电子设备进行在线语言学习或语言测试。电子设备可以采集学员输入的语音数据,通过语音评测技术对采集到的语音数据进行发音准确度评测。
[0003]语音评测技术作为一项重要的计算机辅助评判技术,可以辅助语言专家或老师更高效地对学员的发音水平进行评判,同时,降低语言专家或老师的工作量。
[0004]目前,语音评测技术通常采用一个模型对输入的语音数据进行评测,得到一个语音评测结果,该方式只能对语音数据的发音准确度进行粗略和笼统地评测,因此对语音数据进行发音评测的准确性较低。

技术实现思路

[0005]为解决相关技术中存在的技术问题,本申请实施例提供一种发音准确度确定方法、装置、存储介质和电子设备,可以提高发音评测的准确性。
[0006]为达到上述目的,本申请实施例的技术方案是这样实现的
[000本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种发音准确度确定方法,其特征在于,包括:确定待评测的语音数据包含的各个语音帧对应的真实音素;基于预设的参考音素集合,分别确定所述各个语音帧对应的真实音素的质量评估值;根据所述各个语音帧对应的真实音素的质量评估值,确定所述语音数据中发音错误的单字的错误类型;根据所述各个语音帧对应的真实音素的质量评估值,以及所述语音数据中发音错误的单字的错误类型,确定所述语音数据的发音准确度。2.根据权利要求1所述的方法,其特征在于,所述确定待评测的语音数据包含的各个语音帧对应的真实音素,包括:获取待评测的语音数据;采用已训练的对齐模型对所述语音数据进行解析,确定所述语音数据包含的各个语音帧;并对所述各个语音帧进行特征提取,分别获得各个语音帧对应的语音特征,以及根据各个语音帧对应的语音特征,确定所述各个语音帧对应的真实音素;其中,所述语音特征至少包括发音音素。3.根据权利要求2所述的方法,其特征在于,所述基于预设的参考音素集合,分别确定所述各个语音帧对应的真实音素的质量评估值,包括:针对所述各个语音帧,分别执行以下操作:基于预设的参考音素集合,分别确定一个语音帧对应于所述参考音素集合中各个参考音素的概率值;将所述一个语音帧对应的真实音素,与所述各个参考音素进行匹配;将匹配成功的一个参考音素对应的概率值,作为所述一个语音帧对应的真实音素的概率值;确定所述一个语音帧对应于所述各个参考音素的概率值中的最大概率值;基于所述一个语音帧对应的真实音素的概率值和所述最大概率值,确定所述一个语音帧对应的真实音素的质量评估值。4.根据权利要求3所述的方法,其特征在于,所述基于预设的参考音素集合,分别确定一个语音帧对应于所述参考音素集合中各个参考音素的概率值,包括:采用已训练的打分模型,将所述一个语音帧对应的语音特征与预设的参考音素集合中各个参考音素进行匹配,分别确定所述一个语音帧对应于所述参考音素集合中各个参考音素的概率值。5.根据权利要求1至4中任一项所述的方法,其特征在于,根据所述各个语音帧对应的真实音素的质量评估值,确定所述语音数据中发音错误的单字的错误类型,包括:根据所述各个语音帧对应的真实音素的质量评估值,确定存在发音错误的真实音素;根据所述各个语音帧对应的存在发音错误的真实音素,确定所述语音数据中发音错误的单字的错误类型。6.根据权利要求2所述的方法,其特征在于,所述对齐模型的训练过程,包括:获取第一训练数据集,所述第一训练数据集中包括多个语音数据样本,每个语音数据样本均标注有对应的实际真实音素...

【专利技术属性】
技术研发人员:黄羿衡杜念冬冯树林翁超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1