音频处理方法、装置、电子设备、存储介质及程序产品制造方法及图纸

技术编号:35136667 阅读:12 留言:0更新日期:2022-10-05 10:11
本申请提供了一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:对音频信号进行滤波处理,得到低频信号以及高频信号;对低频信号进行核心编码处理,得到核心码流;对低频信号进行频域变换处理,得到低频频谱,并对高频信号进行频域变换处理,得到高频频谱;对低频频谱以及高频频谱进行谱包络提取处理,得到谱包络信息,并对高频频谱进行谱平坦度提取处理,得到谱平坦度信息;对谱平坦度信息以及谱包络信息进行量化编码处理,得到频带拓展码流,并将频带拓展码流与核心码流组成编码码流。通过本申请,在编码时对谱平坦度信息进行编码,提高高频部分的编码完整度并降低复杂度,从而提高后续解码得到的音频质量。到的音频质量。到的音频质量。

【技术实现步骤摘要】
音频处理方法、装置、电子设备、存储介质及程序产品


[0001]本申请涉及音频处理技术,尤其涉及一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]在超宽带音频编码的场景中,根据人耳听觉机理与心理声学模型,用户通常对信号的低频部分比对信号的高频部分更敏感。在编解码处理中,相较于信号的高频部分,低频部分会分配得到更多码率。但这并不意味着对高频部分的舍弃,缺失高频部分会影响主观听感。
[0003]因此需要在超宽带音频编码的场景中对高频信号进行编码以及解码,相关技术中针对如何在极低码率的情况下实现高频信号的高效编解码的技术问题,相关技术中尚无有效实现方案。

技术实现思路

[0004]本申请实施例提供一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够在编码时对谱平坦度信息进行编码,提高高频部分的编码完整度并降低复杂度,从而提高后续解码得到的音频质量。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供一种音频处理方法,包括:
[0007]对音频信号进行滤波处理,得到低频信号以及高频信号;
[0008]对所述低频信号进行核心编码处理,得到核心码流;
[0009]对所述低频信号进行频域变换处理,得到低频频谱,并对所述高频信号进行频域变换处理,得到高频频谱;
[0010]对所述低频频谱以及所述高频频谱进行谱包络提取处理,得到所述音频信号的谱包络信息,并对所述高频频谱进行谱平坦度提取处理,得到所述高频频谱的谱平坦度信息;
[0011]对所述高频频谱的谱平坦度信息以及所述音频信号的谱包络信息进行量化编码处理,得到所述音频信号的频带拓展码流,并将所述频带拓展码流与所述核心码流组成所述音频信号的编码码流
[0012]本申请实施例提供一种音频处理装置,包括:
[0013]分带模块,用于对音频信号进行滤波处理,得到低频信号以及高频信号;
[0014]核心编码模块,用于对所述低频信号进行核心编码处理,得到核心码流;
[0015]频域变换模块,用于对所述低频信号进行频域变换处理,得到低频频谱,并对所述高频信号进行频域变换处理,得到高频频谱;
[0016]提取模块,用于对所述低频频谱以及所述高频频谱进行谱包络提取处理,得到所述音频信号的谱包络信息,并对所述高频频谱进行谱平坦度提取处理,得到所述高频频谱的谱平坦度信息;
[0017]量化模块,用于对所述高频频谱的谱平坦度信息以及所述音频信号的谱包络信息进行量化编码处理,得到所述音频信号的频带拓展码流,并将所述频带拓展码流与所述核心码流组成所述音频信号的编码码流。
[0018]在上述方案中,所述提取模块,还用于:对所述低频频谱进行谱包络提取处理,得到所述低频频谱的低频谱包络信息;对所述高频频谱进行谱包络提取处理,得到所述高频频谱的高频谱包络信息;将所述低频谱包络信息以及所述高频谱包络信息组成所述音频信号的谱包络信息。
[0019]在上述方案中,所述提取模块,还用于:获取所述低频频谱的第一融合配置数据,其中,所述第一融合配置数据包括每个第一谱线组合的谱线序数;针对每个所述第一谱线组合执行以下处理:从所述低频频谱中提取对应所述第一谱线组合的每个谱线序数的谱系数;对每个所述谱线序数的谱系数进行求平方处理,得到每个所述谱线序数的第一平方谱系数;当所述第一谱线组合的谱线序数的数目为多个时,对多个所述谱线序数的第一平方谱系数进行求和处理,得到第一求和结果;对所述第一求和结果进行求对数处理,得到对应所述第一谱线组合的第一融合谱包络信息;基于至少一个所述第一谱线组合的第一融合谱包络信息,生成所述低频谱包络信息。
[0020]在上述方案中,所述提取模块,还用于:获取所述高频频谱的第二融合配置数据,其中,所述第二融合配置数据包括每个第二谱线组合的谱线序数;针对每个所述第二谱线组合执行以下处理:从所述高频频谱中提取对应所述第二谱线组合的每个谱线序数的谱系数;对每个所述谱线序数的谱系数进行求平方处理,得到每个所述谱线序数的第二平方谱系数;当所述第二谱线组合的谱线序数的数目为多个时,对多个所述谱线序数的第二平方谱系数进行求和处理,得到第二求和结果;对所述第二求和结果进行求对数处理,得到对应所述第二谱线组合的第二融合谱包络信息;基于至少一个所述第二谱线组合的第二融合谱包络信息,生成所述高频谱包络信息。
[0021]在上述方案中,所述提取模块,还用于:获取所述高频频谱的第三融合配置数据,其中,所述第三融合配置数据包括每个第三谱线组合的谱线序数;针对每个所述第三谱线组合执行以下处理:获取所述第三谱线组合的几何均值,并获取所述第三谱线组合的算术均值;将所述第三谱线组合的几何均值与所述第三谱线组合的算术均值的比值作为所述第三谱线组合的谱平坦度信息;基于至少一个所述第三谱线组合的谱平坦度信息,生成所述高频频谱的谱平坦度信息。
[0022]在上述方案中,所述提取模块,还用于:获取所述高频频谱的第三融合配置数据,其中,所述第三融合配置数据包括每个第三谱线组合的谱线序数;针对每个所述第三谱线组合执行以下处理:从所述高频频谱中提取对应所述第三谱线组合的每个谱线序数的谱系数;对每个所述谱线序数的谱系数进行求平方处理,得到每个所述谱线序数的第三平方谱系数;当所述第三谱线组合的谱线序数的数目为多个时,对多个所述谱线序数的第三平方谱系数进行乘积处理,得到第一乘积结果;基于所述谱线序数的数目,对所述第一乘积结果进行开更号处理,得到对应所述第三谱线组合的几何均值;将多个所述第三谱线组合的几何均值组成所述第三谱线组合的几何均值。
[0023]在上述方案中,所述提取模块,还用于:获取所述高频频谱的第三融合配置数据,其中,所述第三融合配置数据包括每个第三谱线组合的谱线序数;针对每个所述第三谱线
组合执行以下处理:从所述高频频谱中提取对应所述第三谱线组合的每个谱线序数的谱系数;对每个所述谱线序数的谱系数进行求平方处理,得到每个所述谱线序数的第三平方谱系数;当所述第三谱线组合的谱线序数的数目为多个时,对多个所述谱线序数的第三平方谱系数进行求和处理,得到第三求和结果;基于所述谱线序数的数目,对所述第三求和结果进行求平均处理,得到对应所述第三谱线组合的算术均值;将多个所述第三谱线组合的算术均值组成所述第三谱线组合的算术均值。
[0024]在上述方案中,所述量化模块,还用于:获取谱平坦度信息的量化表以及所述谱包络信息的量化表;按照所述谱平坦度信息的量化表对所述高频频谱的谱平坦度信息进行量化处理,得到谱平坦度量化结果;按照所述谱包络信息的量化表对所述音频信号的谱包络信息进行量化处理,得到谱包络量化结果;将所述谱平坦度量化结果以及所述谱包络量化结果组成所述音频信号的频带拓展码流。
[0025]在上述方案中,所述量化模块,还用于:获取多个语音样本信号,并针对每个所述语音样本信号执行以下处理:对所述语音样本信号进行滤波处理,得到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,所述方法包括:对音频信号进行滤波处理,得到低频信号以及高频信号;对所述低频信号进行核心编码处理,得到核心码流;对所述低频信号进行频域变换处理,得到低频频谱,并对所述高频信号进行频域变换处理,得到高频频谱;对所述低频频谱以及所述高频频谱进行谱包络提取处理,得到所述音频信号的谱包络信息,并对所述高频频谱进行谱平坦度提取处理,得到所述高频频谱的谱平坦度信息;对所述高频频谱的谱平坦度信息以及所述音频信号的谱包络信息进行量化编码处理,得到所述音频信号的频带拓展码流,并将所述频带拓展码流与所述核心码流组成所述音频信号的编码码流。2.根据权利要求1所述的方法,其特征在于,所述对所述低频频谱以及所述高频频谱进行谱包络提取处理,得到所述音频信号的谱包络信息,包括:对所述低频频谱进行谱包络提取处理,得到所述低频频谱的低频谱包络信息;对所述高频频谱进行谱包络提取处理,得到所述高频频谱的高频谱包络信息;将所述低频谱包络信息以及所述高频谱包络信息组成所述音频信号的谱包络信息。3.根据权利要求2所述的方法,其特征在于,所述对所述低频频谱进行谱包络提取处理,得到所述低频频谱的低频谱包络信息,包括:获取所述低频频谱的第一融合配置数据,其中,所述第一融合配置数据包括每个第一谱线组合的谱线序数;针对每个所述第一谱线组合执行以下处理:从所述低频频谱中提取对应所述第一谱线组合的每个谱线序数的谱系数;对每个所述谱线序数的谱系数进行求平方处理,得到每个所述谱线序数的第一平方谱系数;当所述第一谱线组合的谱线序数的数目为多个时,对多个所述谱线序数的第一平方谱系数进行求和处理,得到第一求和结果;对所述第一求和结果进行求对数处理,得到对应所述第一谱线组合的第一融合谱包络信息;基于至少一个所述第一谱线组合的第一融合谱包络信息,生成所述低频谱包络信息。4.根据权利要求2所述的方法,其特征在于,所述对所述高频频谱进行谱包络提取处理,得到所述高频频谱的高频谱包络信息,包括:获取所述高频频谱的第二融合配置数据,其中,所述第二融合配置数据包括每个第二谱线组合的谱线序数;针对每个所述第二谱线组合执行以下处理:从所述高频频谱中提取对应所述第二谱线组合的每个谱线序数的谱系数;对每个所述谱线序数的谱系数进行求平方处理,得到每个所述谱线序数的第二平方谱系数;当所述第二谱线组合的谱线序数的数目为多个时,对多个所述谱线序数的第二平方谱系数进行求和处理,得到第二求和结果;对所述第二求和结果进行求对数处理,得到对应所述第二谱线组合的第二融合谱包络
信息;基于至少一个所述第二谱线组合的第二融合谱包络信息,生成所述高频谱包络信息。5.根据权利要求1所述的方法,其特征在于,所述对所述高频频谱进行谱平坦度提取处理,得到所述高频频谱的谱平坦度信息,包括:获取所述高频频谱的第三融合配置数据,其中,所述第三融合配置数据包括每个第三谱线组合的谱线序数;针对每个所述第三谱线组合执行以下处理:获取所述第三谱线组合的几何均值,并获取所述第三谱线组合的算术均值;将所述第三谱线组合的几何均值与所述第三谱线组合的算术均值的比值作为所述第三谱线组合的谱平坦度信息;基于至少一个所述第三谱线组合的谱平坦度信息,生成所述高频频谱的谱平坦度信息。6.根据权利要求5所述的方法,其特征在于,所述获取所述第三谱线组合的几何均值,包括:从所述高频频谱中提取对应所述第三谱线组合的每个谱线序数的谱系数;对每个所述谱线序数的谱系数进行求平方处理,得到每个所述谱线序数的第三平方谱系数;当所述第三谱线组合的谱线序数的数目为多个时,对多个所述谱线序数的第三平方谱系数进行乘积处理,得到第一乘积结果;基于所述谱线序数的数目,对所述第一乘积结果进行开更号处理,得到对应所述第三谱线组合的几何均值。7.根据权利要求5所述的方法,其特征在于,所述获取所述第三谱线组合的算术均值,包括:从所述高频频谱中提取对应所述第三谱线组合的每个谱线序数的谱系数;对每个所述谱线序数的谱系数进行求平方处理,得到每个所述谱线序数的第三平方谱系数;当所述第三谱线组合的谱线序数的数目为多个时,对多个所述谱线序数的第三平方谱系数进行求和处理,得到第三求和结果;基于所述谱线序数的数目,对所述第三求和结果进行求平均处理,得到对应所述第三谱线组合的算术均值。8.根据权利要求1所述的方法,其特征在于,所述对所述高频频谱的谱平坦度信息以及所述音频信号的谱包络信息进行量化编码处理,得到所述音频信号的频带拓展码流,包括:获取谱平坦度信息的量化表以及所述谱包络信息的量化表;按照所述谱平坦度信息的量化表对所述高频频谱的谱平坦度信息进行量化处理,得到谱平坦度量化结果;按照所述谱包络信息的量化表对所述音频信号的谱包络信息进行量化处理,得到谱包络量化结果;将所述谱平坦度量化结果以及所述谱包络量化结果组成所述音频信号的频带拓展码流。
9.根据权利要求8所述的方法,其特征在于,所述获取谱平坦度信息的量化表以及所述谱包络信息的量化表,包括:获取多个语音样本信号,并针对每个所述语音样本信号执行以...

【专利技术属性】
技术研发人员:黄庆博康迂勇肖玮王蒙史裕鹏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1