音频编解码方法及相关产品技术

技术编号：34914937 阅读：26 留言：0更新日期：2022-09-15 07:04

本申请属于音视频技术领域，具体涉及一种音频编解码方法、音频编解码装置、计算机可读介质、电子设备以及计算机程序产品。音频解码方法包括：获取音频帧序列中各个音频帧的编码向量；对历史音频帧的编码向量进行上采样得到至少一个上采样特征值，所述历史音频帧是在当前音频帧之前解码的一个或者多个音频帧，所述上采样特征值是在上采样过程中得到的用于描述音频帧的特征向量；根据所述至少一个上采样特征值对所述当前音频帧的编码向量进行上采样得到所述当前音频帧的解码数据。本申请可以提高音频数据的编解码质量。提高音频数据的编解码质量。提高音频数据的编解码质量。

全部详细技术资料下载

【技术实现步骤摘要】
音频编解码方法及相关产品

[0001]本申请属于音视频
，具体涉及一种音频编解码方法、音频编解码装置、计算机可读介质、电子设备以及计算机程序产品。

技术介绍

[0002]对音视频等媒体数据进行编解码处理，可以实现对媒体数据的压缩传输，从而降低媒体数据的网络传输成本，提高网络传输效率。实时分段传输的特点决定了用户在无需下载完整媒体文件的情况下便可以实时获得媒体数据，但同时也对用户的设备性能和网络条件提出了很高的要求。在网络状态不理想的情况下，很容易出现媒体数据传输受阻、媒体数据质量差等问题。

技术实现思路

[0003]本申请提供一种音频编解码方法、音频编解码装置、计算机可读介质、电子设备以及计算机程序产品，目的在于提高媒体数据的传输效率和数据质量。
[0004]本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。
[0005]根据本申请实施例的一个方面，提供一种音频解码方法，该方法包括：
[0006]获取音频帧序列中各个音频帧的编码向量；
[0007]对历史音频帧的编码向量进行上采样得到至少一个上采样特征值，所述历史音频帧是在当前音频帧之前解码的一个或者多个音频帧，所述上采样特征值是在上采样过程中得到的用于描述音频帧的特征向量；
[0008]根据所述至少一个上采样特征值对所述当前音频帧的编码向量进行上采样得到所述当前音频帧的解码数据。
[0009]根据本申请实施例的一个方面，提供一种音频编码方法...

【技术保护点】

【技术特征摘要】
1.一种音频解码方法，其特征在于，包括：获取音频帧序列中各个音频帧的编码向量；对历史音频帧的编码向量进行上采样得到至少一个上采样特征值，所述历史音频帧是在当前音频帧之前解码的一个或者多个音频帧，所述上采样特征值是在上采样过程中得到的用于描述音频帧的特征向量；根据所述至少一个上采样特征值对所述当前音频帧的编码向量进行上采样得到所述当前音频帧的解码数据。2.根据权利要求1所述的音频解码方法，其特征在于，根据所述至少一个上采样特征值对所述当前音频帧的编码向量进行上采样得到所述当前音频帧的解码数据，包括：获取包括多个上采样层的解码器，所述至少一个上采样特征值包括由所述多个上采样层对所述历史音频帧的编码向量进行上采样处理得到的多个特征向量；将所述当前音频帧的编码向量输入所述解码器，并将所述多个特征向量对应输入所述多个上采样层；通过所述多个上采样层对所述当前音频帧的编码向量和所述多个特征向量进行上采样处理，得到所述当前音频帧的解码数据。3.根据权利要求2所述的音频解码方法，其特征在于，在将所述当前音频帧的编码向量输入所述解码器之前，所述方法还包括：获取包括多个下采样层的编码器；通过所述编码器和所述解码器对音频输入样本进行编解码处理得到音频输出样本；根据所述音频输入样本和所述音频输出样本确定所述编码器和所述解码器的第一损失误差；通过样本判别器对所述音频输入样本和所述音频输出样本进行类型判别，并根据判别结果确定所述样本判别器的第二损失误差；根据所述第一损失误差和所述第二损失误差对所述编码器、所述解码器和所述样本判别器进行生成对抗训练，以更新所述编码器、所述解码器和所述样本判别器的网络参数。4.根据权利要求3所述的音频解码方法，其特征在于，所述样本判别器包括原始样本判别器和样本特征判别器；通过样本判别器对所述音频输入样本和所述音频输出样本进行类型判别，包括：将所述音频输入样本和所述音频输出样本输入至所述原始样本判别器，得到由所述原始样本判别器输出的第一类型判别结果；分别对所述音频输入样本和所述音频输出样本进行频谱特征提取，得到样本的梅尔频谱；将所述样本的梅尔频谱输入至所述样本特征判别器，得到由所述样本特征判别器输出的第二类型判别结果。5.根据权利要求3所述的音频解码方法，其特征在于，根据所述音频输入样本和所述音频输出样本确定所述编码器和所述解码器的第一损失误差，包括：分别对所述音频输入样本和所述音频输出样本进行频谱特征提取，得到样本的梅尔频谱；根据所述音频输入样本和所述音频输出样本在梅尔频谱上的差异度确定所述编码器
和所述解码器的第一损失误差。6.根据权利要求5所述的音频解码方法，其特征在于，分别对所述音频输入样本和所述音频输出样本进行频谱特征提取，包括：获取包括至少两种样本尺度的采样窗口；通过所述采样窗口在不同的样本尺度上对所述音频输入样本和所述音频输出样本进行频谱特征提取，得到样本的多尺度梅尔频谱。7.根据权利要求2所述的音频解码方法，其特征在于，所述上采样层包括至少两个采样通道；通过所述多个上采样层对所述当前音频帧的编码向量和所述多个特征向量进行上采样处理，包括：通过所述上采样层中的至少两个采样通道对所述当前音频帧的编码向量和所述多个特征向量进行特征提取得到至少两个通道特征值；获取所述至少两个通道特征值的均值和方差；根据所述均值和方差对所述至少两个通道特征值进行归一化处理。8.根据权利要求7所述的音频解码方法，其特征在于，在根据所述均值和方差对所述至少两个通道特征值进行归一化处理之前，所述方法还包括：对各个音频帧之间的均值和方差进行加权平滑处理。9.根据权利要求1至8中任意一项所述...

【专利技术属性】
技术研发人员：华超，黄飞，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人