语音识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:41313234 阅读:27 留言:0更新日期:2024-05-13 14:55
本发明专利技术涉及语音识别领域,具体涉及语音识别方法、装置、电子设备及存储介质,该方法包括获取当前待处理数据帧以及所述当前待处理数据帧的上下文待处理数据帧,上下文待处理数据帧包括当前待处理数据帧之前的上文待处理数据帧以及当前待处理数据帧之后的下文待处理数据帧;基于上下文待处理数据帧对当前待处理数据帧进行增加感受野的预处理,得到当前待处理数据帧的预处理结果;根据预处理结果进行编码以及编码后的解码处理,确定语音识别结果。在编码之前先利用上下文待处理数据帧对当前待处理数据帧进行增加感受野的预处理,使得所得到的预处理结果既能够感知上文待处理数据帧的信息,又能够感知下文待处理数据帧的信息。

【技术实现步骤摘要】

本专利技术涉及语音识别,具体涉及语音识别方法、装置、电子设备及存储介质


技术介绍

1、自动语音识别(automatic speech recognition,asr)是一种将语音序列转换为对应文本序列的技术,在语音输入法、字幕生成等场景中有广泛的应用。为了支持流式解码,通常需要将输入特征向量序列分成若干个数据块,每个数据块内包含至少一帧特征向量。现有的语音识别方法在解码时,一般是针对当前特征向量进行处理,使得编码结果仅依赖于当前特征向量,从而导致语音识别的准确性较低。


技术实现思路

1、有鉴于此,本专利技术实施例提供了一种语音识别方法、装置、电子设备及存储介质,以解决语音识别的准确性较低的问题。

2、根据第一方面,本专利技术实施例提供了一种语音识别方法,包括:

3、获取当前待处理数据帧以及所述当前待处理数据帧的上下文待处理数据帧,所述上下文待处理数据帧包括所述当前待处理数据帧之前的上文待处理数据帧以及所述当前待处理数据帧之后的下文待处理数据帧;

4、基于所述上下文待处理数本文档来自技高网...

【技术保护点】

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述上下文待处理数据帧对所述当前待处理数据帧进行增加感受野的预处理,得到所述当前待处理数据帧的预处理结果,包括:

3.根据权利要求2所述的方法,其特征在于,基于所述上下文待处理数据帧对所述当前待处理数据帧进行增加感受野的预处理,得到所述当前待处理数据帧的预处理结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述预处理结果进行编码以及编码后的解码处理,确定语音识别结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述预处理结...

【技术特征摘要】

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述上下文待处理数据帧对所述当前待处理数据帧进行增加感受野的预处理,得到所述当前待处理数据帧的预处理结果,包括:

3.根据权利要求2所述的方法,其特征在于,基于所述上下文待处理数据帧对所述当前待处理数据帧进行增加感受野的预处理,得到所述当前待处理数据帧的预处理结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述预处理结果进行编码以及编码后的解码处理,确定语音识别结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述预处理结果分别输入编码器,得到第一编码结果,包括:<...

【专利技术属性】
技术研发人员:班志华
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1