音频处理方法、装置、存储介质和电子设备制造方法及图纸

技术编号:41596515 阅读:24 留言:0更新日期:2024-06-07 00:06
本申请公开了一种音频处理方法、装置、存储介质和电子设备,该方法为:对第一波形进行改进离散余弦变换,以获得第一频谱,第一波形为目标音频压缩前的原始波形;通过将第一频谱输入至预先训练所得的编解码模型,得到编解码模型输出的第二频谱;对第二频谱进行逆改进离散余弦变换,以获得第二波形,第二波形为目标音频解压缩后的重建波形。该方法基于编解码模型将第一频谱作为编码、量化和解码的对象,以获得第二频谱,最后通过对第二频谱进行逆改进离散余弦变换,得到目标音频解压缩后的重建波形,能够在高采样率和低比特率场景下实现高质量的音频编解码,并且编解码模型具有模型参数小、训练速度快、生成速度快的特点。

【技术实现步骤摘要】

本申请涉及音频处理领域,尤其涉及一种音频处理方法、装置、存储介质和电子设备


技术介绍

1、音频编解码器是数字音频处理的重要研究内容,旨在于对音频进行压缩以减少表示音频所需的数据大小,同时保证可接受的解码音频质量。音频编解码器可以广泛应用于音频通信、音频压缩和一些下游任务,如语音合成等。近年来,人们越来越关注高采样率的编解码器,这对高质量的通信或语音合成非常重要。然而,采样率的增加不可避免地会导致更高的比特率,并对压缩效率和传输成本产生负面影响。

2、目前,端到端的神经网络波形音频编解码器成为主流,虽然它们的解码音频质量较高,但受限于对音频波形的直接编码和解码,低比特率压缩仍然是一个难以突破的瓶颈,并且模型复杂度仍然较高、生成效率仍然较低。


技术实现思路

1、本申请提供了一种音频处理方法、装置、存储介质和电子设备,目的在于实现高质量的音频编解码。

2、为了实现上述目的,本申请提供了以下技术方案:

3、一种音频处理方法,包括:

4、对第一波形进行改进离散余弦变换,本文档来自技高网...

【技术保护点】

1.一种音频处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述编码器包括:

3.根据权利要求1所述的方法,其特征在于,所述量化器包括:

4.根据权利要求1所述的方法,其特征在于,所述解码器包括:

5.根据权利要求1-4中任一所述的方法,其特征在于,所述编解码模型基于生成对抗网络训练得到,其中,所述生成对抗网络包括生成器以及判别器,所述生成器包括所述编解码模型;

6.根据权利要求5所述的方法,其特征在于,所述判别器包括多个子判别器,每个所述子判别器以基于所述样本波形所确定的第三频谱,以及基于所述解码波形所...

【技术特征摘要】

1.一种音频处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述编码器包括:

3.根据权利要求1所述的方法,其特征在于,所述量化器包括:

4.根据权利要求1所述的方法,其特征在于,所述解码器包括:

5.根据权利要求1-4中任一所述的方法,其特征在于,所述编解码模型基于生成对抗网络训练得到,其中,所述生成对抗网络包括生成器以及判别器,所述生成器包括所述编解码模型;

6.根据权利要求5所述的方法,其特征在于,所述判别器包括多个子判别器,每个所述子判别器以基于所述样本波形所确定的第三频谱,以及基于所...

【专利技术属性】
技术研发人员:艾杨江晓航郑瑞晨鲁叶欣凌震华
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1