【技术实现步骤摘要】
一种语音评测方法及装置
本申请涉及语音评测
,尤其涉及一种语音评测方法及装置。
技术介绍
目前,在智能设备进行语音合成,生成合成语音之后,需要对合成的语音质量进行评测打分,现有技术中,通常是通过人工对待评测语音进行评测,但是,人工评测往往具有主观性,会导致待评测语音的评测分数并不准确,并且,由于需要人工一一对待评测语音进行打分,这种评测方式效率也较低。
技术实现思路
本申请实施例提供一种语音评测方法及装置,以提高语音评测的效率和准确性。本申请实施例提供的具体技术方案如下:一种语音评测方法,包括:获取待评测语音;基于已训练的评测模型,以所述待评测语音为输入参数,识别所述待评测语音的各个音子,确定所述各个音子与对应的预设标准音子之间的音子语音特征相似度,并根据所述待评测语音和对应的预设标准语音,确定所述待评测语音对应的流畅语音特征相似度,其中,所述音子表征语音发音最小单元对应的音素;根据所述音子语音特征相似度和所述流畅语音特征相似度,确定所述待评测语音的评测结果。 ...
【技术保护点】
1.一种语音评测方法,其特征在于,包括:/n获取待评测语音;/n基于已训练的评测模型,以所述待评测语音为输入参数,识别所述待评测语音的各个音子,确定所述各个音子与对应的预设标准音子之间的音子语音特征相似度,并根据所述待评测语音和对应的预设标准语音,确定所述待评测语音对应的流畅语音特征相似度,其中,所述音子表征语音发音最小单元对应的音素;/n根据所述音子语音特征相似度和所述流畅语音特征相似度,确定所述待评测语音的评测结果。/n
【技术特征摘要】
1.一种语音评测方法,其特征在于,包括:
获取待评测语音;
基于已训练的评测模型,以所述待评测语音为输入参数,识别所述待评测语音的各个音子,确定所述各个音子与对应的预设标准音子之间的音子语音特征相似度,并根据所述待评测语音和对应的预设标准语音,确定所述待评测语音对应的流畅语音特征相似度,其中,所述音子表征语音发音最小单元对应的音素;
根据所述音子语音特征相似度和所述流畅语音特征相似度,确定所述待评测语音的评测结果。
2.如权利要求1所述的方法,其特征在于,进一步包括:获取待评测语音对应的语音文本;
则基于已训练的评测模型,以所述待评测语音为输入参数,识别所述待评测语音的各个音子,具体包括:
基于已训练的评测模型,以所述待评测语音和所述语音文本为输入参数,基于所述语音文本,识别所述待评测语音的各个音子。
3.如权利要求1所述的方法,其特征在于,确定所述各个音子与对应的预设标准音子之间的音子语音特征相似度,具体包括:
分别确定所述各个音子对应的音子特征;
根据确定出的各个音子特征,对所述各个音子进行分类,分别确定所述各个音子所属的预设音子类别;
分别确定所述各个音子与对应的预设音子类别中包括的预设标准音子之间的音子语音特征相似度。
4.如权利要求1-3任一项所述的方法,其特征在于,确定所述待评测语音的评测结果,具体包括:
根据所述音子语音特征相似度,确定所述待评测语音的发音得分;
根据所述流畅语音特征相似度,确定所述待评测语音的流畅得分;
将所述发音得分和所述流畅得分进行加权平均,获得所述待评测语音的最终评测得分;
根据所述最终评测得分,获得所述待评测语音的评测结果。
5.如权利要求1所述的方法,其特征在于,根据所述最终评测得分,获得所述待评测语音的评测结果,具体包括:
若确定所述最终评测得分大于或等于预设第一得分阈值,则确定所述待评测语音对应的等级为第一等级;
若确定所述最终评测得分小于所述预设第一得分阈值,且大于或等于第二预设得分阈值,则确定所述待评测语音对应的等级为第二等级,其中,所述预设第一得分阈值大于所述预设第二得分阈值;
若确定所述最终评测得分小于第二预设得分阈值,则确定所述待评测语音对应的等级为第三等级,其中,所述第一等级的语音质量大于第二等级的语音质量,所述第二等级的语音质量大于第三等级的语音质量。
6.如权利要求1或2所述的方法,其特征在于,所述评测模型的训练方式为:
获取标准语音样本集和所述标准语音样本集中的各个标准语音样本对应的标准语音文本;
分别对所述各个标准语音样本进行语音模拟,获得各个模拟语音样本;
分别将所述各个标准语音样本、对应的标准语音文本和模拟语音样本输入到所述评测模型进行训练,通过所述评测模型的特征模块,识别所述各个标准语音对应的音子和所述各个模拟语音样本对应的音子,通过所述评测模型的音子网络模块,确定所述各个标准语音的各个音子的发音与对应的模拟语音样本的各个音子之间的音子语音特征相似度,获得所述模拟语音样本的模拟发音得分,并通过所述评测模型的卷积网络模块,确定所述模拟语音对应的流畅语音特征相似度,获得所述模拟语音样本的模拟流畅得分,并根据确定出的各个模拟发音得分和确定出的各个模拟流畅得分,确定所述各个模拟语音样本对应的最终评测得分,直至所述评测模型的目标函数收敛,获得训练完成的评测模型,其中,所述目标函数为模拟语音样本和标准语音样本之间的交叉熵函数最小化。
7.如权利要求6所述的方法,其特征在于,对所述标准语音样本集中的各个标准语音样本进行语音模拟,获得各个模拟语音样本,具体包括:
根据预设第一变化强度系数,分别对所述各个标准语音样本进行音质变化模拟,获得对应模拟后的模拟语音样本,其中,所述发音变化模拟至少包括以下一种或任意组合的处理方式:语音加噪、谱加噪、谱减噪、谱扭曲、基频调整;
和/或,根据预设第二变化强度系数,对所述各个标准语音样本进行音调变化模拟,获得对应模拟后的模拟语音样本,其中,所述流畅度变化模拟至少包括以下一种或任意组合的处理方式:语音变形、发音时长拉长缩短、谱变形、基频变形。
8.一种语音评测装置,其特征在于,包括:
第一获取模块,用于获取待评测语音;
评测模块,用于基于已训练的评测模型,以所述待评测语音为输入参数,识别所述待评...
【专利技术属性】
技术研发人员:冯大航,陈孝良,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。