谐波音频信号的变换编码/解码制造技术

技术编号:17051889 阅读:26 留言:0更新日期:2018-01-17 18:57
一种用于对谐波音频信号的频率变换系数(Y(k))进行编码的编码器(20)包括以下单元:波峰定位器(22),被配置为:对具有超过预定频率相关阈值的幅度的谱峰进行定位;峰域编码器(24),被配置为:对包括已定位的波峰和在已定位的波峰周围的峰域进行编码;低频集合编码器(26),被配置为:对在所述峰域之外并在交越频率以下的系数的至少一个低频集合进行编码,所述交越频率取决于用于对峰域进行编码的比特数;噪声基底增益编码器(28),被配置为:对所述峰域之外的未编码系数的至少一个高频集合的噪声基底增益进行编码。

Transform coding / decoding of harmonic audio signals

A method for frequency conversion coefficient of harmonic audio signal (Y (k)) encoding encoder (20) includes the following units: wave locator (22), configured to locate the peak with frequency dependent amplitude exceeds a predetermined threshold; peak domain encoder (24), configured to: including the located peaks and encoding in the peak region around the peak position; low frequency set (26), the encoder is configured to the outside of the peak field and set in at least one low frequency coefficient more frequency below the encoding bits, the crossover frequency depends on for encoding of the peak domain; noise gain base (28), the encoder is configured to gain at least a high frequency noise base set on the outside of the peak domain not encoding coefficient encoding.

【技术实现步骤摘要】
谐波音频信号的变换编码/解码本申请是2012年10月30日提交的中国专利申请No.201280072072.6的专利技术名称为“谐波音频信号的变换编码/解码”的分案申请。
本专利技术所提出的技术涉及音频信号(特别是谐波音频信号)的变换编码/解码。
技术介绍
变换编码是用于压缩和发送音频信号的主要技术。变换编码的概念是首先将信号变换到频域,然后量化并发送变换系数。解码器使用所接收的变换系数通过应用逆频率变换来重构信号波形,见图1。在图1中,将音频信号X(n)转发到频率变换器10。将所得到的频率变换Y(k)转发到变换编码器12,并将已编码的变换发送到解码器,变换解码器14对该已编码的变换进行解码。将已解码的变换转发到逆频率变换器16,逆频率变换器16将其变换为已解码的音频信号此方案背后的动机是,因为以下原因,可以更高效地量化频域系数:1)变换系数(图1中的Y(k))比输入信号采样(图1中的X(n))更非相关。2)频率变换提供能量压缩(更多的系数Y(k)接近于零并可以被忽略),以及3)变换背后的主观动机是人的听觉系统在变换域上工作,在该域上更易于选择感官上重要的信号成分。在典型的变换编解码器中,使用修正离散余弦变换(MDCT)来逐块地(有50%重合)对信号波形进行变换。在MDCT类型变换编解码器中,将块信号波形X(n)变换为MDCT矢量Y(k)。波形块的长度对应于20-40ms音频段。如果长度用2L表示,则MDCT变换可以定义为:其中k=0,...,L-1。然后,MDCT矢量Y(k)被分为多个频带(子矢量),并且每个频带中的能量(或增益)计算为:其中,mj是频带j中的第一系数,Nj指代对应频带中MDCT系数的数量(典型范围包含8-32个系数)。作为均匀频带结构的示例,对所有j设Nj=8,则G(0)可以是前8个系数的能量,G(1)可以是下8个系数的能量,以此类推。这些能量值或增益给出已量化的谱包络的近似,并将量化索引发送给解码器。通过利用对应包络增益缩放MDCT子矢量来获得残余子矢量或形状,例如对每个频带中的残余进行缩放以具有单位均方根(RMS)能量。然后,基于对应的包络增益,利用不同数量的比特来量化残余子矢量或形状。最终,在解码器处,通过利用对应包络增益缩放残余子矢量或形状来重构MDCT矢量,并使用逆MDCT来重构时域音频帧。传统变换编码概念对非常谐波的音频信号(例如单一乐器)不太有效。在图2中示出了这种谐波谱的示例(为了比较,在图3中示出了不具有过量谐波的典型音频谱)。原因是,利用谱包络的归一化不会导致足够“平”的残余矢量,并且残余编码方案不会产生可接受质量的音频信号。这种信号和编码模型之间的不匹配仅可以以非常高比特率解决,但在大多数情况下,此方案是不合适的。
技术实现思路
所提出的技术的目的是更合适于谐波音频信号的变换编码/解码方案。所提出的技术涉及一种对谐波音频信号的频率变换系数进行编码的方法,所述方法包括以下步骤:对具有超过预定频率相关阈值的幅度的谱峰进行定位;对包括已定位的波峰并在已定位的波峰周围的峰域进行编码;对在所述峰域之外并在交越频率以下的系数的至少一个低频集合进行编码,该交越频率取决于用于对所述峰域进行编码的比特数;对所述峰域之外的尚未编码系数的至少一个高频集合的噪声基底增益进行编码。所提出的技术还涉及一种用于对谐波音频信号的频率变换系数进行编码的编码器,所述编码器包括:波峰定位器,被配置为:对具有超过预定频率相关阈值的幅度的谱峰进行定位;峰域编码器,被配置为:对包括已定位的波峰和在已定位的波峰周围的峰域进行编码;低频集合编码器,被配置为:对在所述峰域之外并在交越频率以下的系数的至少一个低频集合进行编码,所述交越频率取决于用于对所述峰域进行编码的比特数;噪声基底增益编码器,被配置为:对所述峰域之外的尚未编码的系数的至少一个高频集合的噪声基底增益进行编码。所提出的技术还涉及一种包括这种编码器的用户设备(UE)。所提出的技术涉及一种用于对已编码的频率变换谐波音频信号的频率变换系数进行重构的方法,所述方法包括以下步骤:对已编码的频率变换谐波音频信号的谱峰域进行解码;对系数的至少一个低频集合进行解码;对所述峰域之外的每个低频集合的系数进行分配;对所述峰域之外的系数的至少一个高频集合的噪声基底增益进行解码;用具有所述对应噪声基底增益的噪声来填充每个高频集合。所提出的技术还涉及一种用于对已编码的频率变换谐波音频信号的频率变换系数进行重构的解码器,所述解码器包括:峰域解码器,被配置为:对所述已编码的频率变换谐波音频信号的谱峰域进行解码;低频集合解码器,被配置为:对系数的至少一个低频集合进行解码;系数分配器,被配置为:对所述峰域之外的每个低频集合的系数进行分配;噪声基底增益解码器,被配置为:对所述峰域之外的系数的至少一个高频集合的噪声基底增益进行解码;噪声填充器,被配置为:用具有所述对应噪声基底增益的噪声来填充每个高频集合。所提出的技术还涉及一种包括这种编码器的用户设备(UE)。所提出的谐波音频编码/解码方案为大类别的谐波音频信号提供了比传统编码方案更好的感官质量。附图说明可以通过参考以下说明书连同附图最佳地理解本技术及其其他目的和优点,在附图中:图1示出了频率变换编码概念;图2示出了谐波音频信号的典型谱;图3示出了非谐波音频信号的典型谱;图4示出了峰域;图5是示出了所提出的编码方法的流程图;图6A-D是示出了所提出的编码方法的示例实施例;图7是所提出的编码器的示例实施例的框图;图8是所提出的解码方法的流程图;图9A-C示出了所提出的解码方法的示例实施例;图10是所提出的解码器的示例实施例的框图;图11是所提出的编码器的示例实施例的框图;图12是所提出的解码器的示例实施例的框图;图13是包括所提出的编码器的UE的示例实施例的框图;图14是包括所提出的解码器的UE的示例实施例的框图;图15是所提出的编码方法的一部分的示例实施例的流程图;图16是所提出的编码器中峰域编码器的示例实施例的框图;图17是所提出的解码方法的一部分的示例实施例的流程图;图18是所提出的解码器中峰域解码器的示例实施例的框图。具体实施方式图2示出了谐波音频信号的典型谱,图3示出了非谐波音频信号的典型谱。谐波信号的谱是通过由非常弱的频带分离的强谱峰形成的,而非谐波信号的谱更平滑。所提出的技术提供更好地处理谐波音频信号的备选音频编码模型。主要概念是频率变换矢量(例如MDCT矢量)未分为包络和残余部分,而是一起直接提取和量化谱峰以及相邻MDCT频段(bin)。在高频处,不对相邻波峰之外的低能量系数进行编解码(coded),而是在解码器处进行噪声填充。这里,在传统编码中使用的信号模型,{谱包络+残余}被替换为新模型{谱峰+噪声基底}。在低频处,仍对相邻波峰之外的系数进行编解码,因为它们具有重要的感官作用。编码器编码器侧的主要步骤是:●对谱峰域进行定位和编码●对低频(LF)谱系数进行编码。已编码区域的大小取决于在峰域编码之后剩余的比特的数量。●对峰域之外的谱系数的噪声基底增益进行编码首先估计噪声基底,然后通过波峰采选算法(在附录I-II中更详细地描述了对应的算法)提取谱峰。在波峰位置,将每个波峰及其周围的4个相邻波峰归一化为单位能量,参见图4。换本文档来自技高网
...
谐波音频信号的变换编码/解码

【技术保护点】
一种用于对谐波音频信号的修正离散余弦变换MDCT系数(Y(k))进行编码的方法,所述方法包括以下步骤:对具有超过预定阈值的幅度的谱峰进行定位(S1),其中通过将系数与所述阈值进行比较以形成波峰候选的矢量并按照降序从所述波峰候选中提取元素来定位所述谱峰,其中所述阈值计算如下:

【技术特征摘要】
2012.03.29 US 61/617,2161.一种用于对谐波音频信号的修正离散余弦变换MDCT系数(Y(k))进行编码的方法,所述方法包括以下步骤:对具有超过预定阈值的幅度的谱峰进行定位(S1),其中通过将系数与所述阈值进行比较以形成波峰候选的矢量并按照降序从所述波峰候选中提取元素来定位所述谱峰,其中所述阈值计算如下:其中是平均波峰能量,是平均噪声基底能量,以及γ具有固定预定值,并且按照Ep(k)=βEp(k)+(1-β)|Y(k)|计算波峰能量,按照Enf(k)=αEnf(k)+(1-α)|Y(k)|计算噪声基底能量,其中在波峰能量的计算中强调高能系数的贡献,而在噪声基底能量的计算中强调低能系数的贡献;对包括已定位的波峰和在已定位的波峰周围的峰域进行编码(S2),其中所述谱峰与相邻MDCT频段一起被量化;使用多个保留比特,对在所述峰域之外并在交越频率以下的系数的第一低频LF集合进行编码(S3),所述交越频率取决于用于对所述峰域进行编码的比特数,其中编码(S3)包括:如果在对所述峰域进行编码之后有非保留比特可用,则对所述峰域之外的系数的一个或多个其他低频集合进行编码;以及使用多个保留比特,对所述峰域之外的尚未编码的系数的至少一个高频集合的噪声基底增益进行编码(S4)。2.根据权利要求1所述的编码方法,其中,加权因子α定义如下:以及加权因子β定义如下:3.根据权利要求1或2所述的编码方法,其中对峰域进行编码的步骤(S2)包括:对波峰的谱位置和符号进行编码(S2-A);对波峰增益进行量化(S2-B);对已量化的波峰增益进行编码(S2-C);将所述波峰周围的预定频段缩放(S2-D)所述已量化的波峰增益的倒数倍;对已缩放的频段进行形状编码(S2-E)。4.根据权利要求1至3中任一项所述的编码方法,其中所述峰域包括所述波峰和所述波峰周围的四个MDCT频段。5.根据前述权利要求中任一项所述的编码方法,其中,对系数的低频集合进行编码的步骤(S3)包括:将剩余的未量化的MDCT系数分组到24维频带中。6.根据前述权利要求中任一项所述的编码方...

【专利技术属性】
技术研发人员:沃洛佳·格兰恰诺夫托马斯·托夫特戈德塞巴斯蒂安·内斯隆德哈拉尔德·波布洛斯
申请(专利权)人:瑞典爱立信有限公司
类型:发明
国别省市:瑞典,SE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1