语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号:40549991 阅读:25 留言:0更新日期:2024-03-05 19:08
本申请提供了一种语音识别方法、装置、设备及存储介质,具体实现方案为:基于第i帧音频的标签状态确定跳帧数;其中,i为正整数;利用所述跳帧数对所述第i帧音频进行跳帧解码处理,得到目标音频帧对应的非空白标签特征;其中,所述目标音频帧表示第i+1帧音频之前的标签状态为非空白标签的音频帧;基于所述第i+1帧音频和所述目标音频帧对应的非空白标签特征,预测所述第i+1帧音频的标签状态;根据所述第i+1帧音频的标签状态确定所述第i+1帧音频的语音识别结果。根据本申请的技术方案,能够显著提升推理速度,从而提高语音识别的效率。

【技术实现步骤摘要】

本申请涉及语音识别,尤其涉及一种语音识别方法、装置、设备及存储介质


技术介绍

1、语音识别指的是通过机器学习的方法让机器能够自动的将语音转换成对应的文字,从而赋予机器类似人听觉的功能。随着人工智能技术的不断突破,语音输入在越来越多的场景和业务领域发挥了巨大的作用。

2、在目前端到端的语音识别系统方案中,需要持续地处理输入的样本和数据流,并进行符号化的输出。端到端的语音识别模型虽然具有良好的识别性能,但受模型结构和内存占用的影响,推理速度慢,使得语音识别的效率较低。


技术实现思路

1、为了解决上述问题,本申请提出一种语音识别方法、装置、电子设备及存储介质,能够显著提升推理速度,从而提高语音识别的效率。

2、根据本申请实施例的第一方面,提供了一种语音识别方法,包括:

3、基于第i帧音频的标签状态确定跳帧数;其中,i为正整数;

4、利用所述跳帧数对所述第i帧音频进行跳帧解码处理,得到目标音频帧对应的非空白标签特征;其中,所述目标音频帧表示第i+1帧音频之前的标签状态本文档来自技高网...

【技术保护点】

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于第i帧音频的标签状态确定跳帧数,包括:

3.根据权利要求2所述的方法,其特征在于,所述在第i帧音频的标签状态是空白标签的情况下,基于所述第i帧音频的空白标签确定k个空白帧数,包括:

4.根据权利要求2所述的方法,其特征在于,在所述第i帧音频的标签状态是空白标签的情况下,所述利用所述跳帧数对所述第i帧音频进行跳帧解码处理,得到目标音频帧对应的非空白标签特征,包括:

5.根据权利要求2所述的方法,其特征在于,在所述第i帧音频的标签状态是非空白标签的情况下...

【技术特征摘要】

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于第i帧音频的标签状态确定跳帧数,包括:

3.根据权利要求2所述的方法,其特征在于,所述在第i帧音频的标签状态是空白标签的情况下,基于所述第i帧音频的空白标签确定k个空白帧数,包括:

4.根据权利要求2所述的方法,其特征在于,在所述第i帧音频的标签状态是空白标签的情况下,所述利用所述跳帧数对所述第i帧音频进行跳帧解码处理,得到目标音频帧对应的非空白标签特征,包括:

5.根据权利要求2所述的方法,其特征在于,在所述第i帧音频的标签状态是非空白标签的情况下,所述利用所述跳帧数对所述第i帧音频进行跳帧解码处理,得到目标音频帧对应的非...

【专利技术属性】
技术研发人员:郭顺杰宋亚楠万根顺熊世富高建清潘嘉刘聪
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1