【技术实现步骤摘要】
本申请涉及语音识别,尤其涉及一种语音识别方法、装置、设备及存储介质。
技术介绍
1、语音识别指的是通过机器学习的方法让机器能够自动的将语音转换成对应的文字,从而赋予机器类似人听觉的功能。随着人工智能技术的不断突破,语音输入在越来越多的场景和业务领域发挥了巨大的作用。
2、在目前端到端的语音识别系统方案中,需要持续地处理输入的样本和数据流,并进行符号化的输出。端到端的语音识别模型虽然具有良好的识别性能,但受模型结构和内存占用的影响,推理速度慢,使得语音识别的效率较低。
技术实现思路
1、为了解决上述问题,本申请提出一种语音识别方法、装置、电子设备及存储介质,能够显著提升推理速度,从而提高语音识别的效率。
2、根据本申请实施例的第一方面,提供了一种语音识别方法,包括:
3、基于第i帧音频的标签状态确定跳帧数;其中,i为正整数;
4、利用所述跳帧数对所述第i帧音频进行跳帧解码处理,得到目标音频帧对应的非空白标签特征;其中,所述目标音频帧表示第i+1
...【技术保护点】
1.一种语音识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于第i帧音频的标签状态确定跳帧数,包括:
3.根据权利要求2所述的方法,其特征在于,所述在第i帧音频的标签状态是空白标签的情况下,基于所述第i帧音频的空白标签确定k个空白帧数,包括:
4.根据权利要求2所述的方法,其特征在于,在所述第i帧音频的标签状态是空白标签的情况下,所述利用所述跳帧数对所述第i帧音频进行跳帧解码处理,得到目标音频帧对应的非空白标签特征,包括:
5.根据权利要求2所述的方法,其特征在于,在所述第i帧音频的标签状态
...【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于第i帧音频的标签状态确定跳帧数,包括:
3.根据权利要求2所述的方法,其特征在于,所述在第i帧音频的标签状态是空白标签的情况下,基于所述第i帧音频的空白标签确定k个空白帧数,包括:
4.根据权利要求2所述的方法,其特征在于,在所述第i帧音频的标签状态是空白标签的情况下,所述利用所述跳帧数对所述第i帧音频进行跳帧解码处理,得到目标音频帧对应的非空白标签特征,包括:
5.根据权利要求2所述的方法,其特征在于,在所述第i帧音频的标签状态是非空白标签的情况下,所述利用所述跳帧数对所述第i帧音频进行跳帧解码处理,得到目标音频帧对应的非...
【专利技术属性】
技术研发人员:郭顺杰,宋亚楠,万根顺,熊世富,高建清,潘嘉,刘聪,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。