音频压缩方法及装置制造方法及图纸

技术编号:44926707 阅读:26 留言:0更新日期:2025-04-08 19:06
本发明专利技术提供一种音频压缩方法及装置,所述方法包括:基于音频压缩模型,应用待压缩音频片段的复杂度,对待压缩音频片段进行压缩,得到压缩音频;音频压缩模型包括多个量化层,音频压缩模型用于对待压缩音频片段进行编码得到编码特征后,采用目标量化层对编码特征进行量化,并对量化后的编码特征进行解码得到解码特征,基于解码特征确定压缩音频;目标量化层是基于待压缩音频片段的复杂度从多个量化层中选取的至少一个量化层。本发明专利技术中的音频压缩模型可以在保证音质的前提下灵活地调整压缩率,从而使得音频压缩模型能够适应不同复杂度的音频片段,并实现音质和压缩率之间的最佳平衡。

【技术实现步骤摘要】

本专利技术涉及音频处理,尤其涉及一种音频压缩方法及装置


技术介绍

1、音频压缩是指通过特定的编码技术减少音频数据占用的存储空间,同时尽量保持原始音频的音质不被明显损害的过程。

2、目标,多采用无监督学习的方法构建音频压缩模型,并基于音频压缩模型生成低比特率的压缩音频。然而,音频压缩模型是采用统一的压缩率对输入音频进行压缩,对于包含复杂声音细节的输入音频,可能会存在部分音频信息丢失。


技术实现思路

1、本专利技术提供一种音频压缩方法及装置,用以解决现有技术中存在的缺陷。

2、本专利技术提供一种音频压缩方法,包括如下步骤:

3、确定待压缩音频片段的复杂度;

4、基于音频压缩模型,应用所述待压缩音频片段的复杂度,对所述待压缩音频片段进行压缩,得到压缩音频;

5、所述音频压缩模型包括多个量化层,所述音频压缩模型用于对所述待压缩音频片段进行编码得到编码特征后,采用目标量化层对所述编码特征进行量化,并对量化后的编码特征进行解码得到解码特征,基于所述解码特征确定本文档来自技高网...

【技术保护点】

1.一种音频压缩方法,其特征在于,包括:

2.根据权利要求1所述的音频压缩方法,其特征在于,所述音频压缩模型基于如下步骤训练得到:

3.根据权利要求2所述的音频压缩方法,其特征在于,所述基于所述样本压缩音频与所述样本原始音频片段之间的差异,对所述音频压缩模型的初始生成模型进行训练,得到所述音频压缩模型,包括:

4.根据权利要求2所述的音频压缩方法,其特征在于,所述音频压缩模型联合判别模型进行生成对抗训练得到;

5.根据权利要求4所述的音频压缩方法,其特征在于,所述初始判别模型包括多个分支,各分支用于提取输入音频的音频特征,并基于所述输入音频...

【技术特征摘要】

1.一种音频压缩方法,其特征在于,包括:

2.根据权利要求1所述的音频压缩方法,其特征在于,所述音频压缩模型基于如下步骤训练得到:

3.根据权利要求2所述的音频压缩方法,其特征在于,所述基于所述样本压缩音频与所述样本原始音频片段之间的差异,对所述音频压缩模型的初始生成模型进行训练,得到所述音频压缩模型,包括:

4.根据权利要求2所述的音频压缩方法,其特征在于,所述音频压缩模型联合判别模型进行生成对抗训练得到;

5.根据权利要求4所述的音频压缩方法,其特征在于,所述初始判别模型包括多个分支,各分支用于提取输入音频的音频特征,并基于所述输入音频的音频特征确定分类结果,各分支所提取音频特征的尺度不同;

6.根据权利要求1至5任一项所述的音频压缩...

【专利技术属性】
技术研发人员:郑阳仇凯健伍宏传孟廷
申请(专利权)人:安徽讯飞寰语科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1