数据处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:25992637 阅读:31 留言:0更新日期:2020-10-20 19:01
本申请提供数据处理方法、装置、计算机设备及存储介质,应用于音频流的各个待处理片段的编码计算,所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段。本申请实施例中通过获取对第一待处理片段进行编码计算得到的第一编码计算结果;在对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时,获取所述第一编码计算结果中对应于所述重叠部分的可复用结果数据,以复用于形成所述第二编码计算结果。由于先后的第一、第二待处理片段之间在音频流上存在重叠部分,利用该重叠部分对应的第一编码计算结果中的计算结果数据复用于第二编码计算结果,降低第二待处理片段计算量,提升计算效率。

【技术实现步骤摘要】
数据处理方法、装置、计算机设备及存储介质
本申请实施例涉及语音处理
,尤其涉及数据处理方法、装置、计算机设备及存储介质。
技术介绍
语音识别技术,也被称为自动语音识别(AutomaticSpeechRecognition,ASR)。语音识别模式分为文件转写、一句话、流式识别三种模式。其中流式识别模式可以实时将用户输入语音转为文本,有交互性高、响应快等特点,常应用于手机端等需要实时交互场景。随着深度学习模型应用于语音识别中,其识别性能得以大大提高;但是相应的,也带来了激增的计算量。不只限于深度学习模型方式的语音识别,在其他的音频处理中,同样会存在要降低计算量的需求,以能够提升计算效率,从而具备更突出的产品竞争力。因此,如何降低语音识别的计算量问题,已成为业界亟待解决的技术问题。
技术实现思路
有鉴于此,本申请实施例中提供数据处理方法、装置、计算机设备及存储介质,解决现有技术中的技术问题。本申请实施例提供了一种数据处理方法,应用于音频流的各个待处理片段的编码计算,所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段;所述数据处理方法包括:获取对第一待处理片段进行编码计算得到的第一编码计算结果;在对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时,获取所述第一编码计算结果中对应于所述重叠部分的可复用结果数据,以复用于形成所述第二编码计算结果。可选的,所述音频流中的每个待处理片段包括:根据音频流片段中每个音频帧得到的帧数据。可选的,所述编码计算包括:获得对应每个音频帧的编码计算结果以组成所述待处理片段的编码计算结果;其中,对应每个音频帧的编码计算结果,是根据所述音频帧及其前后获取到的每个依赖帧组成的帧段在所述待处理片段中的帧段数据进行编码计算得到的。可选的,各所述依赖帧的获取方式包括:从音频帧向前每个第一预定间隔获取一个向前的依赖帧,直至获得第一预定数量的向前的依赖帧;以及,从音频帧向后每个第二预定间隔获取一个向后的依赖帧,直至获得第二预定数量的向后的依赖帧。可选的,所述可复用结果数据包括:对应所述重叠部分中的各目标音频帧形成的部分编码计算结果;其中,对应所述目标音频帧获得的帧段数据不存在实际音频数据缺失。可选的,所述实际音频数据缺失包括:在所述帧段数据的计算依据中包含标准数据。本申请实施例还提供了一种数据处理方法,应用于音频处理模型对音频流的各个待处理片段的编码计算,所述音频处理模型有多个编码层,所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段;所述数据处理方法包括:获取对第一待处理片段经每个编码层进行编码计算输出的第一编码计算结果;在每个编码层对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时,获取相同编码层的第一编码计算结果中对应于所述重叠部分的可复用结果数据,以复用于形成所述第二编码计算结果。可选的,所述音频流中的每个待处理片段包括:根据音频流片段中每个音频帧得到的帧数据。可选的,所述编码计算包括:每个编码层根据输入数据获得对应每个音频帧的编码计算结果,以组成本编码层输出的所述待处理片段的编码计算结果;其中,首个编码层的输入数据为所述待处理片段,非首个编码层的输入数据为上一编码层输出的编码计算结果;每个编码层所获得的对应每个音频帧的编码计算结果,是根据所述音频帧及其前后获取到的每个依赖帧组成的帧段对应在该编码层的输入数据中的帧段相关数据进行编码计算得到的。可选的,各所述依赖帧的获取方式包括:从音频帧向前每个第一预定间隔获取一个向前的依赖帧,直至获得第一预定数量的向前的依赖帧;以及,从音频帧向后每个第二预定间隔获取一个向后的依赖帧,直至获得第二预定数量的向后的依赖帧。可选的,与当前编码层相应的可复用结果数据包括:对应所述重叠部分中的各目标音频帧形成的部分编码计算结果;其中,对应所述目标音频帧获得的帧段相关数据不存在实际音频数据缺失。可选的,所述实际音频数据缺失包括以下至少一种情形:1)在所述帧段相关数据的计算依据中包含标准数据;2)在所述帧段相关数据的计算依据中包含:在之前编码层的编码计算中加入过标准数据的计算结果。可选的,所述音频处理模型包括语音识别模型。本申请实施例还提供了一种数据处理装置,应用于音频流的各个待处理片段的编码计算,所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段;所述数据处理装置包括:数据获取模块,用于获取对第一待处理片段进行编码计算得到的第一编码计算结果;数据计算模块,用于在对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时,获取所述第一编码计算结果中对应于所述重叠部分的可复用结果数据,以复用于形成所述第二编码计算结果。本申请实施例还提供了一种数据处理装置,应用于音频处理模型对音频流的各个待处理片段的编码计算,所述音频处理模型有多个编码层,所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段;所述数据处理装置包括:数据获取模块,用于获取对第一待处理片段经每个编码层进行编码计算输出的第一编码计算结果;数据计算模块,用于在每个编码层对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时,获取相同编码层的第一编码计算结果中对应于所述重叠部分的可复用结果数据,以复用于形成所述第二编码计算结果。本申请实施例还提供了一种计算机设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行任一项所述数据处理方法的步骤。本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序运行时执行任一项所述数据处理方法的步骤。与现有技术相比,本申请实施例的技术方案具有以下有益效果:基于先、后进行计算的音频流的待处理片段之间对应在音频流上存在重叠部分的特点,将对在先的待处理片段的计算结果中对应该重叠部分的可复用结果数据复用于在后待处理片段的计算中,如此可以避免重复计算量,提升在后处理片段的计算效率。进一步的,在音频处理模型中,可能存在多个编码层而逐层对待处理片段生成计算结果,则相同编码层处理在先待处理片段生成的计算结果中对应重叠部分的数据可以用于在后待处理片段的计算结果的生成,从而能提升音频处理模型进行音频处理的计算效率;从而相比于现有技术,有效降低音频处理模型应用在例如语音识别中的计算量,提升计算效率。附图说明图1是本申请实施例中待处理片段之间不重叠的结构示意图。图2是本申请实施例中待处理片段之间重叠的结构示意图。图3是本申请一种实施例中数据处理方法的流程示意图。图4a是本申请实施例中前馈序列记忆神经网络(FSMN)的结构示意图本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,应用于音频流的各个待处理片段的编码计算,所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段;所述数据处理方法包括:/n获取对第一待处理片段进行编码计算得到的第一编码计算结果;/n在对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时,获取所述第一编码计算结果中对应于所述重叠部分的可复用结果数据,以复用于形成所述第二编码计算结果。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,应用于音频流的各个待处理片段的编码计算,所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段;所述数据处理方法包括:
获取对第一待处理片段进行编码计算得到的第一编码计算结果;
在对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时,获取所述第一编码计算结果中对应于所述重叠部分的可复用结果数据,以复用于形成所述第二编码计算结果。


2.根据权利要求1所述的数据处理方法,其特征在于,所述音频流中的每个待处理片段包括:根据音频流片段中每个音频帧得到的帧数据。


3.根据权利要求1或2所述的数据处理方法,其特征在于,所述编码计算包括:
获得对应每个音频帧的编码计算结果以组成所述待处理片段的编码计算结果;
其中,对应每个音频帧的编码计算结果,是根据所述音频帧及其前后的每个依赖帧组成的帧段在所述待处理片段中的帧段数据进行编码计算得到的。


4.根据权利要求3所述的数据处理方法,其特征在于,各所述依赖帧的获取方式包括:从音频帧向前每个第一预定间隔获取一个向前的依赖帧,直至获得第一预定数量的向前的依赖帧;以及,从音频帧向后每个第二预定间隔获取一个向后的依赖帧,直至获得第二预定数量的向后的依赖帧。


5.根据权利要求3所述的数据处理方法,其特征在于,所述可复用结果数据包括:对应所述重叠部分中的各目标音频帧形成的部分编码计算结果;其中,对应所述目标音频帧获得的帧段数据不存在实际音频数据缺失。


6.根据权利要求5所述的数据处理方法,其特征在于,所述实际音频数据缺失包括:在所述帧段数据的计算依据中包含标准数据。


7.一种数据处理方法,其特征在于,应用于音频处理模型对音频流的各个待处理片段的编码计算,所述音频处理模型有多个编码层,所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段;所述数据处理方法包括:
获取对第一待处理片段经每个编码层进行编码计算输出的第一编码计算结果;
在每个编码层对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时,获取相同编码层的第一编码计算结果中对应于所述重叠部分的可复用结果数据,以复用于形成所述第二编码计算结果。


8.根据权利要求7所述的数据处理方法,其特征在于,所述音频流中的每个待处理片段包括:根据音频流片段中每个音频帧得到的帧数据。


9.根据权利要求7或8所述的数据处理方法,其特征在于,所述编码计算包括:
每个编码层根据输入数据获得对应每个音频帧的编码计算结果,以组成本编码层输出的所述待处理片段的编码计算结果;
其中,首个编码层的输入数据为所述待处理片段,非首个编码层的输入数据为上一编码层...

【专利技术属性】
技术研发人员:潘能超杨玉婷杨嵩
申请(专利权)人:北京世纪好未来教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1