数据处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：25992637 阅读：31 留言：0更新日期：2020-10-20 19:01

本申请提供数据处理方法、装置、计算机设备及存储介质，应用于音频流的各个待处理片段的编码计算，所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段。本申请实施例中通过获取对第一待处理片段进行编码计算得到的第一编码计算结果；在对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时，获取所述第一编码计算结果中对应于所述重叠部分的可复用结果数据，以复用于形成所述第二编码计算结果。由于先后的第一、第二待处理片段之间在音频流上存在重叠部分，利用该重叠部分对应的第一编码计算结果中的计算结果数据复用于第二编码计算结果，降低第二待处理片段计算量，提升计算效率。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、计算机设备及存储介质
本申请实施例涉及语音处理
，尤其涉及数据处理方法、装置、计算机设备及存储介质。
技术介绍
语音识别技术，也被称为自动语音识别（AutomaticSpeechRecognition，ASR）。语音识别模式分为文件转写、一句话、流式识别三种模式。其中流式识别模式可以实时将用户输入语音转为文本，有交互性高、响应快等特点，常应用于手机端等需要实时交互场景。随着深度学习模型应用于语音识别中，其识别性能得以大大提高；但是相应的，也带来了激增的计算量。不只限于深度学习模型方式的语音识别，在其他的音频处理中，同样会存在要降低计算量的需求，以能够提升计算效率，从而具备更突出的产品竞争力。因此，如何降低语音识别的计算量问题，已成为业界亟待解决的技术问题。
技术实现思路
有鉴于此，本申请实施例中提供数据处理方法、装置、计算机设备及存储介质，解决现有技术中的技术问题。本申请实施例提供了一种数据处理方法，应用于音频流的各个待处理片段的编码计算，所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段；所述数据处理方法包括：获取对第一待处理片段进行编码计算得到的第一编码计算结果；在对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时，获取所述第一编码计算结果中对应于所述重叠部分的可复用结果数据，以复用于形成所述第二编码计算结果。可选的，所述音频流中的每个待处理片段包括：根据音频流片段...

【技术保护点】
1.一种数据处理方法，其特征在于，应用于音频流的各个待处理片段的编码计算，所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段；所述数据处理方法包括：/n获取对第一待处理片段进行编码计算得到的第一编码计算结果；/n在对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时，获取所述第一编码计算结果中对应于所述重叠部分的可复用结果数据，以复用于形成所述第二编码计算结果。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，应用于音频流的各个待处理片段的编码计算，所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段；所述数据处理方法包括：
获取对第一待处理片段进行编码计算得到的第一编码计算结果；
在对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时，获取所述第一编码计算结果中对应于所述重叠部分的可复用结果数据，以复用于形成所述第二编码计算结果。

2.根据权利要求1所述的数据处理方法，其特征在于，所述音频流中的每个待处理片段包括：根据音频流片段中每个音频帧得到的帧数据。

3.根据权利要求1或2所述的数据处理方法，其特征在于，所述编码计算包括：
获得对应每个音频帧的编码计算结果以组成所述待处理片段的编码计算结果；
其中，对应每个音频帧的编码计算结果，是根据所述音频帧及其前后的每个依赖帧组成的帧段在所述待处理片段中的帧段数据进行编码计算得到的。

4.根据权利要求3所述的数据处理方法，其特征在于，各所述依赖帧的获取方式包括：从音频帧向前每个第一预定间隔获取一个向前的依赖帧，直至获得第一预定数量的向前的依赖帧；以及，从音频帧向后每个第二预定间隔获取一个向后的依赖帧，直至获得第二预定数量的向后的依赖帧。

5.根据权利要求3所述的数据处理方法，其特征在于，所述可复用结果数据包括：对应所述重叠部分中的各目标音频帧形成的部分编码计算结果；其中，对应所述目标音频帧获得的帧段数据不存在实际音频数据缺失。

6.根据权利要求5所述的数据处理方法，其特征在于，所述实际音频数据缺失包括：在所述帧段数据的计算依据中包含标准数据。

7.一种数据处理方法，其特征在于，应用于音频处理模型对音频流的各个待处理片段的编码计算，所述音频处理模型有多个编码层，所述各个待处理片段包括在先的第一待处理片段和在后的第二待处理片段；所述数据处理方法包括：
获取对第一待处理片段经每个编码层进行编码计算输出的第一编码计算结果；
在每个编码层对与第一待处理片段在音频流上存在重叠部分的第二待处理片段进行编码计算以得到第二编码计算结果时，获取相同编码层的第一编码计算结果中对应于所述重叠部分的可复用结果数据，以复用于形成所述第二编码计算结果。

8.根据权利要求7所述的数据处理方法，其特征在于，所述音频流中的每个待处理片段包括：根据音频流片段中每个音频帧得到的帧数据。

9.根据权利要求7或8所述的数据处理方法，其特征在于，所述编码计算包括：
每个编码层根据输入数据获得对应每个音频帧的编码计算结果，以组成本编码层输出的所述待处理片段的编码计算结果；
其中，首个编码层的输入数据为所述待处理片段，非首个编码层的输入数据为上一编码层...

【专利技术属性】
技术研发人员：潘能超，杨玉婷，杨嵩，
申请(专利权)人：北京世纪好未来教育科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人