语音评测方法、计算机设备、存储介质和计算机程序产品技术

技术编号:33651987 阅读:35 留言:0更新日期:2022-06-02 20:30
本申请涉及一种语音评测方法、装置、计算机设备、存储介质和计算机程序产品。通过获取待评测语音和对应的样本文本的匹配结果信息,得到待评测语音包含的单词与样本文本中包含的单词的匹配情况,并基于匹配结果信息,确定待评测语音中与样本文本对应的目标单词,获取每个目标单词的音素,从而根据匹配结果信息、音素等信息确定待评测语音在预设评测指标下的评测结果。相较于传统的基于人工的语音评测方式,本方案通过利用待评测语音和样本文本的匹配结果,基于待评测语音中包含的各个单词的音素进行多个指标的评测,实现提高歌唱评测客观性的效果。观性的效果。观性的效果。

【技术实现步骤摘要】
语音评测方法、计算机设备、存储介质和计算机程序产品


[0001]本申请涉及机器学习
,特别是涉及一种语音评测方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]歌唱作为人类艺术之一,已经发展许久。而随着计算机技术的发展,如今已可以在智能设备上通过软件等方式进行歌唱的录制。在对歌唱进行录制后,需要对歌唱的质量进行评测,目前对歌唱进行评测的方式通常是通过人工从多个维度进行评估和评测。然而,通过人工进行语音评测的方式主观性过强,不利于反应歌唱的真实质量。
[0003]因此,目前的歌唱评测方法存在评测不客观的缺陷。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高歌唱评测客观性的语音评测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种语音评测方法,所述方法包括:
[0006]获取待评测语音以及所述待评测语音对应的样本文本,所述样本文本包括多个样本单词;
[0007]将所述待评测语音输入语音识别模型,获本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音评测方法,其特征在于,所述方法包括:获取待评测语音以及所述待评测语音对应的样本文本,所述样本文本包括多个样本单词;将所述待评测语音输入语音识别模型,获得识别单词;获取所述识别单词与所述样本文本的匹配结果信息;所述匹配结果信息表征所述识别单词与所述样本单词的匹配情况;基于所述匹配结果信息,确定所述识别单词中与所述样本单词对应的目标单词,并获取每个目标单词对应的音素;根据所述匹配结果信息和所述目标单词对应的音素,确定所述待评测语音在预设的评测指标下的评测结果。2.根据权利要求1所述的方法,其特征在于,所述获取所述识别单词与所述样本文本的匹配结果信息,包括:获取目标语音匹配模型;所述目标语音匹配模型基于所述样本文本训练得到;根据所述目标语音匹配模型识别所述待评测语音,识别得到以下匹配结果信息中的至少一种:所述待评测语音中与所述样本文本匹配的第一语音片段、所述待评测语音中与所述样本文本不匹配的第二语音片段,以及所述样本文本中包含的但与所述待评测语音中单词不匹配的剩余样本单词。3.根据权利要求2所述的方法,其特征在于,若所述匹配结果信息中包括第一语音片段,所述基于所述匹配结果信息,确定所述识别单词中与所述样本单词对应的目标单词,并获取每个目标单词对应的音素,包括:获取所述第一语音片段中包含的目标单词;针对所述目标单词对应的每帧语音,获取该帧语音对应的三音素,将所述三音素中的中间音素作为该帧语音对应的帧音素;根据所述目标单词对应的多个帧语音的帧音素,确定所述目标单词的音素。4.根据权利要求2所述的方法,其特征在于,所述评测指标还包括句子完整度,若所述匹配结果信息中包括第二语音片段和剩余样本单词,所述根据所述匹配结果信息和所述目标单词对应的音素,确定所述待评测语音在预设的评测指标下的评测结果,包括:根据所述第二语音片段,确定所述待评测语音中包含的但与所述样本文本中样本单词不匹配的未匹配单词;根据所述未匹配单词的数量、所述剩余样本单词的数量以及所述样本文本中样本单词的总数量,确定所述待评测语音在句子完整度下的评测结果。5.根据权利要求1所述的方法,其特征在于,所述评测指标包括发音准确度,所述发音准确度包括音素准确度、单词准确度、句子准确度中至少一项;所述根据所述匹配结果信息和所述目标单词对应的音素,确定所述待评测语音在预设的评测指标下的评测结果,包括:针对每个目标单词的音素,获取该音素存在的每帧音素对应的特征向量,根据所述特征向量获取该音素在所述每帧音素中对应的后验概率,并根据该音素存在的帧数以及各帧中该音素对应的后...

【专利技术属性】
技术研发人员:张斌
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1