一种语音的识别方法、装置、设备和存储介质制造方法及图纸

技术编号:45058543 阅读:18 留言:0更新日期:2025-04-22 17:41
本申请实施例提供了一种语音的识别方法、装置、设备和存储介质,构建用于批量处理语音识别任务的语音识别引擎;拼接语音识别任务对应的语音数据,得到批量特征和批量缓存;采用语音识别引擎对批量缓存进行维度转置后,得到维度与批量特征对应的维度相匹配的转置缓存;根据转置缓存和批量特征,得到批量识别结果;拆分批量识别结果,得到语音识别任务对应的语音识别结果。本申请实施例通过维度转置的方式,使得批量特征和批量缓存的维度匹配,避免了频繁的拆分和重新拼接操作,从而减少了处理时间,提升了语音识别的速度。并且,由于减少了频繁的拆分和拼接操作,降低了数据处理过程中可能引入的误差,从而提高了语音识别的准确性和可靠性。

【技术实现步骤摘要】

本申请涉及语音识别,特别是涉及一种语音的识别方法和装置、一种电子设备和一种存储介质。


技术介绍

1、相关技术中,在进行实时语音识别的过程中,为了充分利用算力提升语音识别的效率,通常需要将分散的语音数据组合起来构成批量数据来进行批量识别,批量数据包括了批量特征和批量缓存两部分。由于批量特征和批量缓存的维度不匹配,需要不断地将批量数据进行拆分和重新拼接,才能使批量特征和批量缓存的维度匹配,然而,不断地将批量数据进行拆分和重新拼接会直接影响到实时语音识别的速度,进而降低语音识别的效率。


技术实现思路

1、本申请实施例提供了一种语音的识别方法,以解决批量数据不断地被拆分和拼接导致实时语音识别效率低的问题。

2、相应的,本申请实施例还提供了一种语音的识别装置、一种电子设备以及一种存储介质,用以保证上述方法的实现及应用。

3、为了解决上述问题,本申请实施例公开了一种语音的识别方法,所述方法包括:

4、构建用于批量处理语音识别任务的语音识别引擎;所述语音识别任务具有对应的语音数据;...

【技术保护点】

1.一种语音的识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述语音识别引擎包括编码器、解码器和连接器,所述根据所述转置缓存和所述批量特征,得到批量识别结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述语音识别任务支持多次执行,所述采用所述编码器对所述转置缓存和所述批量特征进行编码,得到编码缓存和编码特征,包括:

4.根据权利要求2所述的方法,其特征在于,所述编码特征具有对应的时间帧,所述采用所述连接器对所述编码特征和所述语言特征向量进行处理,得到连接结果,包括:

5.根据权利要求4所述的方法,其...

【技术特征摘要】

1.一种语音的识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述语音识别引擎包括编码器、解码器和连接器,所述根据所述转置缓存和所述批量特征,得到批量识别结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述语音识别任务支持多次执行,所述采用所述编码器对所述转置缓存和所述批量特征进行编码,得到编码缓存和编码特征,包括:

4.根据权利要求2所述的方法,其特征在于,所述编码特征具有对应的时间帧,所述采用所述连接器对所述编码特征和所述语言特征向量进行处理,得到连接结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述采用所述解码器生成语言特征向量,包括:

<...

【专利技术属性】
技术研发人员:多文昕陈宇李杰
申请(专利权)人:中电信人工智能科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1