语音处理、语音评测方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24858663 阅读:52 留言:0更新日期:2020-07-10 19:10
本申请涉及一种语音处理、语音评测方法、装置、计算机设备和存储介质。该方法可以是在云服务器中执行的,语音处理方法包括:对目标语音进行语音识别,得到语音解码网络中的状态节点对应的声学分数;确定目标语音对应的标准识别文本的标准解码路径;根据候选解码路径在语音解码网络中经过的目标状态节点对应的声学分数,得到候选解码路径集合中各个候选解码路径分别对应的目标解码分数,从候选解码路径集合中选取得到目标解码路径;根据目标解码路径得到目标语音对应的文本识别结果。本申请的方法涉及基于人工智能的语音识别技术,例如声学模型可以是基于机器学习方法进行模型训练得到的。采用本方法能够提高语音识别效果及语音评测效果。

【技术实现步骤摘要】
语音处理、语音评测方法、装置、计算机设备和存储介质
本申请涉及语音处理
,特别是涉及一种语音处理、语音评测方法、装置、计算机设备和存储介质。
技术介绍
随着多媒体技术和网络技术的飞速发展和广泛应用,在很多场景下都需要进行语音识别。例如对于英语教学场景,终端可以录制用户朗读英文语句的语音,并发送到云服务器中,利用云服务器的计算能力对该语音进行识别并评测,得到英语口语评测得分。目前,可以基于人工智能的语音识别模型对语音进行识别,得到语音识别结果。然而,经常存在利用语音识别模型识别得到的结果准确度差的情况,导致语音识别效果差。
技术实现思路
基于此,有必要针对上述技术问题,提供一种语音处理、语音评测方法、装置、计算机设备和存储介质。一种语音处理方法,所述方法包括:获取待识别的目标语音;对所述目标语音进行语音识别,得到语音解码网络中的状态节点对应的声学分数,所述语音解码网络包括语音识别单元对应的状态节点以及连接所述状态节点之间的边;确定所述目标语音对应的标准识别文本的标准解码路径;根据候选解码路径在所述语音解码本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,所述方法包括:/n获取待识别的目标语音;/n对所述目标语音进行语音识别,得到语音解码网络中的状态节点对应的声学分数,所述语音解码网络包括语音识别单元对应的状态节点以及连接所述状态节点之间的边;/n确定所述目标语音对应的标准识别文本的标准解码路径;/n对候选解码路径中,与所述标准解码路径对应的边的状态转移分数进行正向激励,得到所述候选解码路径的边对应的目标状态转移分数;/n根据所述候选解码路径在所述语音解码网络中经过的目标状态节点对应的声学分数,以及所述候选解码路径的边对应的目标状态转移分数,得到所述候选解码路径对应的目标解码分数;/n根据所述候选解码路径对应的...

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:
获取待识别的目标语音;
对所述目标语音进行语音识别,得到语音解码网络中的状态节点对应的声学分数,所述语音解码网络包括语音识别单元对应的状态节点以及连接所述状态节点之间的边;
确定所述目标语音对应的标准识别文本的标准解码路径;
对候选解码路径中,与所述标准解码路径对应的边的状态转移分数进行正向激励,得到所述候选解码路径的边对应的目标状态转移分数;
根据所述候选解码路径在所述语音解码网络中经过的目标状态节点对应的声学分数,以及所述候选解码路径的边对应的目标状态转移分数,得到所述候选解码路径对应的目标解码分数;
根据所述候选解码路径对应的目标解码分数从候选解码路径集合中选取得到目标解码路径;
根据所述目标解码路径经过的状态节点所对应的语音识别单元,得到所述目标语音对应的文本识别结果。


2.根据权利要求1所述的方法,其特征在于,所述根据所述候选解码路径在所述语音解码网络中经过的目标状态节点对应的声学分数,以及所述候选解码路径的边对应的目标状态转移分数,得到所述候选解码路径对应的目标解码分数包括:
确定所述候选解码路径中的当前目标状态节点;
获取由当前目标状态节点的前一目标状态节点转移到当前目标状态节点的边对应的当前目标状态转移分数;
对当前目标状态节点对应的声学分数、当前目标状态转移分数以及到达前一目标状态节点时,所述候选解码路径对应的解码分数进行累计,得到所述候选解码路径对应的当前解码分数;
将所述候选解码路径中当前目标状态节点的下一目标状态节点作为更新后的当前目标状态节点,返回所述获取由当前目标状态节点的前一目标状态节点转移到当前目标状态节点的边对应的当前目标状态转移分数的步骤,直至到达所述候选解码路径的尾部状态节点;
将到达所述尾部状态节点时,所述候选解码路径对应的当前解码分数作为所述候选解码路径对应的目标解码分数。


3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取到达当前目标状态节点时,各个所述候选解码路径分别对应的当前解码分数;
确定当前解码分数小于最大当前解码分数的候选解码路径,作为第一候选解码路径,停止对所述第一候选解码路径进行路径延伸。


4.根据权利要求1所述的方法,其特征在于,所述对候选解码路径中,与所述标准解码路径对应的边的状态转移分数进行正向激励,得到所述候选解码路径的边对应的目标状态转移分数包括:
获取所述候选解码路径中,与所述标准解码路径对应的边的初始状态转移概率,对所述初始状态转移概率进行概率增加处理,得到目标状态转移概率;
根据所述目标状态转移概率,计算得到与所述标准解码路径对应的边对应的目标状态转移分数,其中,所述目标状态转移分数与所述目标状态转移概率成正相关关系。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述文本识别结果与所述标准识别文本进行对比,得到对比结果,根据所述对比结果对所述目标语音进行语音评测,得到语音评测结果。


6.根据权利要求5所述的方法,其特征在于,所述将所述文本识别结果与所述标准识别文本进行对比,得到对比结果,根据所述对比结果对所述目标语音进行语音评测,得到语音评测结果包括:
将所述文本识别结果与所述标准识别文本进行对比,从所述文本识别结果中过滤与所述标准识别文本的词语对比不一致的无效词语,得到目标词语集合;
获取所述目标词语集合中各个目标词语对应的目标声学识别信息,根据所述目标声学识别信息对所述目标语音进行语音评测,得到语音评测结果,所述目标词语对应的目标声学识别信息是对所述目标语音进行声学识别得到的。


7.根据权利要求6所述的方法,其特征在于,所述获取所述目标词语集合中各个目标词语对应的目标声学识别信息,根据所述目标声学识别信息对所述目标语音进行语音评测,得到语音评测结果包括:
获取所述目标词语集合中各个目标词语对应的音素集合;
确定所述目标语音中,识别得到所述音素集合中的目标音素的音频帧,作为目标音频帧;
获取所述目标音频帧对应的音素识别概率,作为目标音素识别概率;
对所述目标音素识别概率进行统计处理,得到所述目标语音的发音准确度。


8.根据权利要求5所述的方法,其特征在于,所述将所述文本识别结果与所述标准识别文本进行对比,得到对比结果,根据所述对比结果对所述目标语音进行...

【专利技术属性】
技术研发人员:马建雄张翔刘海波崔立鹏钱栩磊滕达付豪张艺博王帅卢鲤关俊辉杨晖杨婷卢丹王均
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1