【技术实现步骤摘要】
音频帧的处理方法、系统、装置及存储介质
[0001]本专利技术涉及音频处理
,具体涉及一种音频帧的处理方法、系统、装置及存储介质。
技术介绍
[0002]为了提高音频数据的播放效果,通常会对音频数据进行回声抵消、降噪、自动增益控制等处理。借助于机器学习技术,现阶段可以通过对大量的音频数据样本进行学习,从而训练得到效果较好的音频处理模型。
[0003]然而,在需要对音频帧进行实时处理的场景下,训练得到的音频处理模型往往效果不佳。原因在于,音频处理模型的训练样本通常都是具备一定时长的音频数据,在对这些音频数据进行训练的过程中,会对前后帧的音频数据进行多次推理迭代,从而生成处理后的音频数据。但是在音频帧的实时处理场景下,每次输入音频处理模型的都是单独的音频帧,因此音频处理模型无法衡量相邻音频帧之间的联系,从而导致生成的各个音频帧在连续播放时,会存在失真的情况。
[0004]可见,目前需要一种能够有效地对音频帧进行实时处理的方法。
技术实现思路
[0005]有鉴于此,本专利技术实施方式提供了一种 ...
【技术保护点】
【技术特征摘要】
1.一种音频帧的处理方法,其特征在于,用于音频帧处理的目标音频模型被拆分为相连的多个局部模型;所述方法包括:获取当前音频帧之前的上一音频帧对应的第一状态参数,并将所述第一状态参数作为所述当前音频帧的输入状态参数;在所述输入状态参数的基础上,利用所述多个局部模型对所述当前音频帧进行处理;在对所述当前音频帧的处理过程中,生成所述当前音频帧的第二状态参数,所述第二状态参数作为所述当前音频帧之后的下一音频帧的输入状态参数。2.根据权利要求1所述的方法,其特征在于,所述多个局部模型包括长短期记忆模型和至少一组编解码模型对,所述编解码模型对中包括相绑定的编码模型和解码模型;其中,针对任一当前解码模型而言,所述当前解码模型的输入数据包括上一个解码模型的输出结果或者所述长短期记忆模型的输出结果,以及与所述当前解码模型相绑定的编码模型的输出结果。3.根据权利要求1或2所述的方法,其特征在于,用于音频帧处理的目标音频模型被拆分为相连的多个局部模型包括:对目标音频模型中的层级结构进行划分,以形成多个局部模型各自的层级结构;在所述目标音频模型中获取层级结构对应的系数矩阵,并将获取的所述系数矩阵更新至局部模型的对应层级结构中。4.根据权利要求2所述的方法,其特征在于,所述第一状态参数用于表征各个所述局部模型在处理所述上一音频帧时产生的临时缓存数据;所述第二状态参数用于表征各个所述局部模型在处理所述当前音频帧时产生的临时缓存数据。5.根据权利要求4所述的方法,其特征在于,所述第一状态参数至少包括所述长短期记忆模型对所述上一音频帧处理时对应的隐藏元参数和记忆元参数、各个所述编码模型对所述上一音频帧处理时对应的中间状态参数及各个所述解码模型对所述上一音频帧处理时对应的中间状态参数;所述第二状态参数...
【专利技术属性】
技术研发人员:徐超,宫云梅,郭秀江,鄢仁祥,浦宏杰,
申请(专利权)人:苏州科达科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。