音频处理方法、装置、系统及存储介质制造方法及图纸

技术编号:43947384 阅读:21 留言:0更新日期:2025-01-07 21:36
本公开关于一种音频处理方法、装置、系统及存储介质,涉及数据处理技术领域,以至少解决相关技术中输出的音频失真严重的问题。该方法包括:将待处理音频输入至音频转换模型,以采用音频转换模型执行如下操作:调用编码器将待处理音频编码成目标连续编码信号;基于预设编码本,将目标连续编码信号向量量化为目标离散编码信号;调用解码器基于预设编码本,将目标离散编码信号解码为由连续的目标输出编码信号构成的目标音频;其中,预设编码本包括连续编码信号与离散编码信号之间的关联映射关系,音频转换模型是以重构损失、码本损失和编码器和解码器的编解码的保持损失为约束目标训练而成的;输出音频转换模型完成操作后得到的目标音频。

【技术实现步骤摘要】

本公开涉及数据处理,尤其涉及音频处理方法、装置、系统及存储介质


技术介绍

1、随着如智慧医疗和金融领域等各个服务领域的语音智能化发展需求,音频处理已成为一种日益增长的应用趋势,而音频编解码技术在音频的数字信号处理中具有重要的应用价值。为了确保音频数据可以高效地存储、传输和播放,在当前音频编解码过程中,通常将音频信号从模拟转换为数字,并通过压缩和编码减小数据大小,然后通过解码和重构恢复为模拟信号,以实现将音频信号转化为模拟信号输出。因上述模拟信号是基于压缩和编码减小数据大小这一信号压缩处理技术得到的,会过滤一些频段使用较少的比特数信号,从而导致输出的音频失真严重,特别是在比特数极低的情况下(例如16千比特每秒或更低),上述音频编解码方式会使输出的音频出现明显的失真,极大地影响听觉效果,不具有实用价值。


技术实现思路

1、本专利技术提供一种音频处理方法、装置、系统及存储介质,以至少解决相关技术中输出的音频失真严重的问题。本专利技术的技术方案如下:

2、根据本专利技术实施例的第一方面,提供了一种音频处本文档来自技高网...

【技术保护点】

1.一种音频处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的音频处理方法,其特征在于,所述重构损失表征所述音频转换模型输入的输入样本音频与所述音频转换模型对应输出的输出音频之间的音频信号损失;所述码本损失表征在所述编码器的第一网络参数和所述解码器的第二网络参数确定的情况下,所述编码器输出的连续编码信号与基于所述预设编码本向量量化处理后的离散编码信号之间的编码损失;所述保持损失表征在所述预设码本中表征连续编码信号与离散编码信号之间关联映射关系的各个码字对应的码字值确定的情况下,所述编码器输出的连续编码信号与基于所述预设编码本向量量化处理后的离散编码信号之间的编码损...

【技术特征摘要】

1.一种音频处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的音频处理方法,其特征在于,所述重构损失表征所述音频转换模型输入的输入样本音频与所述音频转换模型对应输出的输出音频之间的音频信号损失;所述码本损失表征在所述编码器的第一网络参数和所述解码器的第二网络参数确定的情况下,所述编码器输出的连续编码信号与基于所述预设编码本向量量化处理后的离散编码信号之间的编码损失;所述保持损失表征在所述预设码本中表征连续编码信号与离散编码信号之间关联映射关系的各个码字对应的码字值确定的情况下,所述编码器输出的连续编码信号与基于所述预设编码本向量量化处理后的离散编码信号之间的编码损失。

3.根据权利要求2所述的音频处理方法,其特征在于,所述约束目标包括第一约束目标和第二约束目标;在所述将待处理音频输入至音频转换模型之前,所述方法还包括:

4.根据权利要求3所述的音频处理方法,其特征在于,所述以所述重构损失小于第一损失阈值和所述码本损失小于第二损失阈值为所述第一约束目标,对所述预设编码本中表征连续编码信号与离散编码信号之间关联映射关系的各个码字对应的码字值进行训练,包括:

5.根据权利要求4所述的音频处理方法,其特征在于,所述根据所述第一梯度,对应调...

【专利技术属性】
技术研发人员:张旭龙王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1