语音识别方法、装置和电子设备制造方法及图纸

技术编号:32352165 阅读:29 留言:0更新日期:2022-02-20 02:22
本公开实施例公开了语音识别方法、装置和电子设备。该方法的一具体实施方式包括:获取待识别的语音块作为当前语音块,其中,当前语音块中的将来帧的数目小于第一目标数目;增加当前语音块的将来帧,得到调整后的语音块,其中,增加的将来帧中的语音内容为空,调整后的语音块中将来帧的数目为第一目标数目;对调整后的语音块进行语音识别,得到语音识别结果作为目标语音识别结果,其中,目标语音识别结果包括当前帧的语音识别结果和第一目标帧的语音识别结果,第一目标帧为位于当前帧之前的第二目标数目个语音帧;基于目标语音识别结果,对已识别出的语音识别结果进行更新。该实施方式可以在减小语音识别延迟的同时提高语音识别准确率。别准确率。别准确率。

【技术实现步骤摘要】
语音识别方法、装置和电子设备


[0001]本公开实施例涉及计算机
,具体涉及语音识别方法、装置和电子设备。

技术介绍

[0002]衡量语音识别模型的两个关键指标是准确率和延迟。根据延迟大小,一般可以将语音识别模型分为流式模型和非流式模型。非流式模型的延迟通常较大,无法实时地识别出语音对应的文本,通常也就不能做线上服务,而识别结果的准确率很高。流式模型的延迟较小,可以实时地识别出语音对应的文本,相应的识别准确率会低于非流式模型。为了在准确率和延迟之间取得平衡,通常会尝试多种不同配置延迟的流式模型,即一个模型对应一种延迟,同时准确率是确定的。

技术实现思路

[0003]提供该公开内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该公开内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004]本公开实施例提供了一种语音识别方法、装置和电子设备,可以在减小语音识别延迟的同时提高了语音识别准确率。
[0005]第一方面,本公开本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:获取待识别的语音块作为当前语音块,其中,所述当前语音块包括过去帧和当前帧,所述当前语音块中的将来帧的数目小于第一目标数目;增加所述当前语音块的将来帧,得到调整后的语音块,其中,增加的将来帧中的语音内容为空,调整后的语音块中将来帧的数目为所述第一目标数目;对所述调整后的语音块进行语音识别,得到语音识别结果作为目标语音识别结果,其中,所述目标语音识别结果包括当前帧的语音识别结果和第一目标帧的语音识别结果,所述第一目标帧为位于所述当前帧之前的第二目标数目个语音帧;基于所述目标语音识别结果,对已识别出的语音识别结果进行更新。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标语音识别结果,对已识别出的语音识别结果进行更新,包括:利用所述第一目标帧的语音识别结果对已识别出的语音识别结果中与所述第一目标帧对应的语音识别结果进行替换;将所述当前帧的语音识别结果添加到替换后的语音识别结果之后。3.根据权利要求1所述的方法,其特征在于,所述对所述调整后的语音块进行语音识别,得到语音识别结果作为目标语音识别结果,包括:将所述调整后的语音块输入预先训练的语音识别模型,得到语音识别结果作为目标语音识别结果。4.根据权利要求3所述的方法,其特征在于,所述语音识别模型为非流式语音识别模型。5.根据权利要求3所述的方法,其特征在于,所述语音识别模型包括编码器网络和解码器网络;以及所述将所述调整后的语音块输入预先训练的语音识别模型,得到语音识别结果作为目标语音识别结果,包括:将所述调整后的语音块输入所述编码器网络,得到语音识别中间结果作为目标语音识别中间结果,其中,所述目标语音识别中间结果包括当前帧的语音识别中间结果和第二目标帧的语音识别中间结果,所述第二目标帧为位于所述当前帧之前的第三目标数目个语音帧;基于所述目标语音识别中间结果和所述解码器网络,确定目标语音识别结果。6.根据权利要求5所述的方法,其特征在于,所述基于所述目标语音识别中间结果和所述解码器网络,确定目标语音识别结果,包括:利用所述第二目标帧的语音识别中间结果对已识别出的语音识别中间结果中与所述第二目标帧...

【专利技术属性】
技术研发人员:黄明坤马泽君
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1