一种语音评测方法及相关装置制造方法及图纸

技术编号:23346449 阅读:27 留言:0更新日期:2020-02-15 04:55
本申请实施例公开了一种语音评测方法及相关装置。其中,所述方法包括:获取用户朗读目标文本所得的目标语音,以及获取所述目标文本的基准语音;根据所述基准语音和预先设定的评分容忍度确定所述目标语音的评测得分,其中,所述目标语音中的至少一个语音单元的发音混淆事件的评分容忍度不为零,所述发音混淆事件是指一语音单元混淆为其他语音单元的事件;输出所述评测得分。可见,通过实施本申请提供的技术方案,有利于提高电子设备进行语音评测的灵活性和兼容性。

A voice evaluation method and related devices

【技术实现步骤摘要】
一种语音评测方法及相关装置
本申请涉及电子设备
,具体涉及一种语音评测方法及相关装置。
技术介绍
由于不同国家和地区的人们存在的固有发音习惯,以及各地方言导致存在特有的易混淆发音单元,使得在特定的地区或人群中在言语交往中,人们对于难以区分的发音单元间的差别难以主观感受,同时也并不影响正常的言语交流,在一定程度上可以认为这些易混淆发音单元都是正确的发音。然而,传统的朗读语音评测技术在实际应用中,并没有考虑到易混淆发音单元对评测结果的影响。传统的语音评测系统对于所有地区和人群使用同一套评分标准,并不具有不同尺度要求的评测功能,因此经常出现传统语音评测系统的评测结果和用户主观感受不符,存在不能自适应不同地区、不同人群、不同评测目标的问题。
技术实现思路
本申请实施例提供了一种语音评测方法及相关装置,以期提高设备进行语音评测的灵活性和兼容性。第一方面,本申请实施例提供一种语音评测方法,包括:获取用户朗读目标文本所得的目标语音,以及获取所述目标文本的基准语音;根据所述基准语音和预先设定的评分容忍度本文档来自技高网...

【技术保护点】
1.一种语音评测方法,其特征在于,所述方法包括:/n获取用户朗读目标文本所得的目标语音,以及获取所述目标文本的基准语音;/n根据所述基准语音和预先设定的评分容忍度确定所述目标语音的评测得分,其中,所述目标语音中的至少一个语音单元的发音混淆事件的评分容忍度不为零,所述发音混淆事件是指一语音单元混淆为其他语音单元的事件;/n输出所述评测得分。/n

【技术特征摘要】
1.一种语音评测方法,其特征在于,所述方法包括:
获取用户朗读目标文本所得的目标语音,以及获取所述目标文本的基准语音;
根据所述基准语音和预先设定的评分容忍度确定所述目标语音的评测得分,其中,所述目标语音中的至少一个语音单元的发音混淆事件的评分容忍度不为零,所述发音混淆事件是指一语音单元混淆为其他语音单元的事件;
输出所述评测得分。


2.根据权利要求1所述的方法,其特征在于,所述根据所述基准语音和预先设定的评分容忍度确定所述目标语音的评测得分,包括:
对所述目标语音进行语音单元边界切分,得到所述目标语音中每个第一语音单元的切分边界;
根据语音单元混淆矩阵和所述评分容忍度构建权重系数矩阵,所述权重系数矩阵包括预设的语音单元集合中第i个第二语音单元混淆为第j个第二语音单元时的权重系数ij,i和j为正整数;
根据所述每个第一语音单元、所述基准语音和所述权重系数矩阵确定所述每个第一语音单元的发音准确度;
根据所述每个第一语音单元的发音准确度确定所述目标语音的评测得分。


3.根据权利要求2所述的方法,其特征在于,所述根据所述每个第一语音单元、所述基准语音和所述权重系数矩阵确定所述每个第一语音单元的发音准确度,包括:
根据所述每个第一语音单元、所述基准语音和所述权重系数矩阵计算所述每个第一语音单元在其切分边界内的GOP评分。


4.根据权利要求3所述的方法,其特征在于,所述根据所述每个第一语音单元、所述基准语音和所述权重系数矩阵计算所述每个第一语音单元在其切分边界内的GOP评分,包括:
计算所述每个第一语音单元在其切分边界内和所述目标文本中对应的基准语音单元的第一似然度,以及计算所述每个第一语音单元在其切分边界内和所述每个第二语音单元的第二似然度,得到所述每个第一语音单元对应的多个第二似然度;
根据所述第一似然度、所述多个第二似然度、所述权重系数矩阵计算所述每个第一语音单元在其切分边界内的GOP评分。


5.根据权利要求2所述的方法,其特征在于,在根据语音单元混淆矩阵和所述评分容忍度构建权重系数矩阵之前,所述方法还包括:
获取不同历史用户朗读历史文本所得的第一预设数量段历史语音,以及获取所述历史文本的基准语音;
对所述第一预设数量段历史语音进行语音单元边界切分,得到所述第一预设数量段历史语音中每个第三语音单元的切分边界;
计算所述每个第三语音单元在其切分边界内和所述每个第二语音单元的第三似然度,得到所述每个第三语音单元对应的多个第三似然度;
将所述每个第三语音单元对应的多个第三似然度按照由大到小的顺序进行排列,并选出所述每个第三语音单元对应的最大第三似然度;
将所述每个第三语音单元对应的最大第三似然度对应的第二语音单元和所述历史文本的基准...

【专利技术属性】
技术研发人员:杨康吴奎朱群江勇军宋雪洁
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1