【技术实现步骤摘要】
语音识别方法、装置、计算机设备及存储介质
[0001]本公开涉及语音识别领域,具体涉及语音识别方法、装置、计算机设备及存储介质。
技术介绍
[0002]语码转换(Code
‑
switching,简称为CS)是指在语音输出中交替使用两种或多种语言,而现有的大多数语音识别都专注于单语种的语音识别,即,依次只能处理一种语言,因此,这种语音识别方式难以适用于两种或多种语言混合的场景中,从而导致语音识别错误。
技术实现思路
[0003]有鉴于此,本公开提供了一种语音识别方法、装置、计算机设备及存储介质,以解决语音识别的准确率较低的问题。
[0004]第一方面,本公开提供了一种语音识别方法,所述方法包括:
[0005]获取待识别语音;
[0006]基于所述待识别语音进行编码处理,得到声学编码信息;
[0007]对所述声学编码信息分别进行对应于各个语种的信息权重预测,得到与所述语种一一对应的信息权重,所述信息权重包括所述语种的声学信息以及边界;
[0008]融合所述 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:获取待识别语音;基于所述待识别语音进行编码处理,得到声学编码信息;对所述声学编码信息分别进行对应于各个语种的信息权重预测,得到与所述语种一一对应的信息权重,所述信息权重包括所述语种的声学信息以及边界;融合所述各个语种的信息权重,得到融合信息权重;基于所述融合信息权重进行解码处理,得到语音识别结果。2.根据权利要求1所述的方法,其特征在于,所述语音识别方法是通过训练得到的目标语音识别模型得到,所述目标语音识别模型是通过如下步骤训练得到的:获取样本语音以及所述样本语音的标签,所述标签包括用于表征目标文本;将所述样本语音输入预设语音识别模型中,得到预测文本,所述预设语音识别模型用于预测所述各个语种的预测信息权重,并对融合后的所述预测信息权重进行解码得到所述预测文本,所述预测信息权重包括所述样本语音中各个语种的声学信息以及边界;基于所述预测文本与所述目标文本进行损失计算,得到损失计算结果;基于损失计算结果对所述预设语音识别模型的参数进行迭代更新,以确定所述目标语音识别模型。3.根据权利要求2所述的方法,其特征在于,所述预设语音识别模型包括编码器、与语种一一对应的信息权重预测单元、融合单元以及解码处理单元,所述信息权重预测单元用于预测所述语种的信息权重,所述融合单元用于对各个语种的预测信息权重进行融合得到预测融合信息权重,所述解码处理单元用于基于所述预测融合信息权重进行解码处理得到所述预测文本。4.根据权利要求3所述的方法,其特征在于,所述解码处理单元包括连续整合分发单元以及第一解码器,所述预测文本的确定方式包括:利用所述连续整合分发单元对所述预测融合信息权重进行处理;利用所述第一解码器对所述连续整合分发单元的处理结果进行解码,确定所述预测文本。5.根据权利要求2所述的方法,其特征在于,所述预测融合信息权重的确定方式包括:获取预设信息丢失率;基于所述预设信息丢失率,分别对各个语种的预测信息权重进行随机失活处理,得到所述各个语种对应的处理结果;对所述各个语种对应的处理结果进行融合,得到所述预测融合信息权重。6.根据权利要求2所述的方法,其特征在于,所述基于所述预测文本与所述目标文本进行损失计算,得到损失计算结果,包括:获取所述标签中字符的目标数量;基于所述目标数量与所述预测融合信息权重进行损失计算,得到第一损失计算结果;基于所述预测文本以及所述目标文本进行损失计算,得到第二损失计算结果;基于所述第一损失计算结果与所述第二损失计算结果的融合,确定所述损失计算结果。7.根据权利要求6所述的方法,其特征在于,所述标签还包括所述样本语音的语种切换
标注,所述基于所述第一损失计算结果与所述第二损失计算结果的融合,确定所述损失计算结果,包括:对所述预测融合信息权重进行语种变化检测,确定语种变...
【专利技术属性】
技术研发人员:范志赟,董林昊,马泽君,
申请(专利权)人:北京有竹居网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。