音频信号的频谱的频谱系数的解码方法及解码器技术

技术编号:13329742 阅读:110 留言:0更新日期:2016-07-11 19:57
通过以熵编/解码同时根据关于频谱的形状的信息对先前编/解码的频谱系数与当前编/解码的频谱系数之间的相对频谱距离进行调整的方式对当前要编/解码的频谱系数进行编/解码来提高对音频信号的频谱的频谱系数进行编码的编码效率,其中,在进行熵编/解码时,以上下文自适应方式根据先前编/解码的频谱系数执行熵编/解码。关于频谱的形状的信息可以包括:音频信号的音高或周期的度量、音频信号的频谱的谐波间距离的度量和/或频谱的频谱包络的共振峰和/或谷的相对位置,并且基于该知识,为了形成当前要编/解码的频谱系数的上下文所采用的频谱邻居可以被调整为由此确定的频谱的形状,从而增强熵编码效率。

【技术实现步骤摘要】
【国外来华专利技术】
本申请涉及针对例如可以在各种基于变换的音频编解码器中使用的音频信号的频谱的频谱系数的编码方案。
技术介绍
基于上下文的算术编码是对基于变换的编码器的频谱系数进行无噪声编码的有效方式[1]。上下文采用频谱系数与存在于其附近的已经编码的系数之间的交互信息。上下文可以在编码器和解码器侧二者处使用,并且无需发送任何额外信息。通过这种方式,基于上下文的熵编码具有提供比无记忆熵编码更高增益的潜力。然而,实际上,上下文的设计尤其由于内存要求、计算复杂度和对信道误差的鲁棒性而受到严重约束。这些约束限制了基于上下文的熵编码的效率,并且造成了较低的编码增益,特别是针对必须限制上下文以采用信号的谐波结构的音调信号。此外,在低延迟的基于音频变换的编码中,低重叠窗用于减小算法延迟。作为直接结果,MDCT的泄露对于音调信号而言很重要,并且导致更高的量化噪声。可以如针对MPEG2/4-AAC[2]所进行的那样在频域中通过对变换和预测进行组合或者在时域中利用预测来处理音调信号[3]。考虑编码构思将是有利的,这提高了编码效率。因此,本专利技术的目的是提供针对音频信号的频谱的频谱系数的编码构思,这提高了编码效率。该目的是通过未决的独立权利要求的主题来实现的。本申请的基本发现是,可以通过以熵编/解码同时根据关于频谱的形状的信息对先前编/解码的频谱系数与当前编/解码的频谱系数之间的相对频谱距离进行调整的方式对当前要编/解码的频谱系数进行编/解码来提高对音频信号的频谱的频谱系数进行编码的编码效率,其中,在进行熵编/解码时,以上下文自适应方式根据先前编/解码的频谱系数执行熵编/解码。关于频谱的形状的信息可以包括:音频信号的音高或周期的度量、音频信号的频谱的谐波间距离的度量和/或频谱的频谱包络的共振峰和/或谷的相对位置,并且基于该知识,为了形成当前要编/解码的频谱系数的上下文所采用的频谱邻居可以被调整为由此确定的频谱的形状,从而增强熵编码效率。附图说明有利实现是从属权利要求的主题,并且在下文中参照附图描述了本申请的优选实施例,在附图中:图1示出了说明频谱系数编码器及其在对音频信号的频谱的频谱系数进行编码时的操作模式的示意图;图2示出了说明适应图1的频谱系数编码器的频谱系数解码器的示意图;图3示出了根据实施例的图1的频谱系数编码器的可能内部结构的框图;图4示出了根据实施例的图2的频谱系数解码器的可能内部结构的框图;图5示意性地指示了频谱(其系数要被编码/解码)的图形以说明根据音频信号的音高或周期的度量或者谐波间距离的度量对相对频谱距离的调整;图6示出了说明根据实施例的频谱(其频谱系数要被编码/解码)(其中,根据基于LP的感知加权合成滤波器(即,其逆)对频谱进行频谱成形)同时说明了根据实施例根据共振峰间距离度量对相对频谱距离的调整的示意图;图7示意性地示出了根据实施例的频谱的一部分,以说明围绕当前要编码/解码的频谱系数的上下文模板以及根据关于频谱的形状的信息来对上下文模板频谱扩展的调整;图8示出了说明根据实施例的使用标量函数从上下文模板81的参考频谱系数的一个或多个值进行映射以导出要用于对当前频谱系数进行编码/解码的概率分布估计的示意图;图9a示意性地示出了使用隐式信令以在编码器和解码器之间对相对频谱距离的调整进行同步;图9b示出了说明使用显式信令以在编码器和解码器之间对相对频谱距离的调整进行同步的示意图;图10a示出了根据实施例的基于变换的音频编码器的框图;图10b示出了适应图10a的编码器的基于变换的音频解码器的框图;图11a示出了根据实施例的使用频域频谱成形的基于变换的音频编码器的框图;图11b示出了适应图11a的编码器的基于变换的音频解码器的框图;图12a示出了根据实施例的基于线性预测的变换码激励音频编码器的框图;图12b示出了适应图12a的编码器的基于线性预测的变换码激励音频解码器;图13示出了根据另一实施例的基于变换的音频编码器的框图;图14示出了适应图13的实施例的基于变换的音频解码器的框图;图15示出了说明覆盖当前要编码/解码的频谱系数的邻居的传统上下文或上下文模板;图16a至图16c示出了根据本申请的实施例的修改的上下文模板配置或映射的上下文;图17示意性地示出了谐波频谱的图形以说明针对谐波频谱使用图16a至图16c中的任意一个的映射的上下文相对于图15的上下文模板定义的优点;图18示出了根据实施例用于优化用于上下文映射的相对频谱距离D的算法的流程图。具体实施方式图1示出了根据实施例的频谱系数编码器10。编码器被配置为对音频信号的频谱的频谱系数进行编码。图1以频谱图12的形式示出了连续频谱。更准确地,频谱系数14被示出为沿时间轴t和频率轴f在频谱时间上布置的框。虽然频谱时间分辨率可能保持恒定,但是图1示出了频谱时间分辨率可以随着时间而改变,其中在图1中在16处示出了一个这样的时刻。该频谱图12可以是在不同时刻应用于音频信号18的频谱分解变换的结果,例如,重叠变换,如严格采样变换,例如,MDCT或某种其他实值严格采样变换。迄今为止,频谱图12可以由频谱系数编码器10以频谱20的形式接收,频谱20由变换系数序列构成,变换系数序列中的每一个变换系数属于相同的时刻。频谱20因而表示频谱图的频谱片,并且在图1中被示出为频谱图12的单独列。每一个频谱由变换系数序列14构成,并且已经使用例如某一窗函数24根据音频信号18的相应时间帧22导出。具体地,时间帧22顺序地布置在前述时刻,并且与频谱20的时间序列相关联。如图1所示,它们可以彼此重叠,如同相应的变换窗24可以实现的一样。也即是说,如本文所使用的,“频谱”表示属于相同时刻的频谱系数,因此是频率分解。“频谱图”是由连续频谱构成的时频分解,其中“频谱(Spectra)”是频谱(spectrum)的复数。但是,有时“频谱”同义地用于频谱图。如果原始信号在时域并且变换是频率变换,则“变换系数”同义地用于“频谱系数”。如刚刚所述的,频谱系数编码器10用于对音频信号18的频谱图12的频谱系数14进行编码,并且为此,编码器可以例如应用预定的编码/解码顺序,这沿频谱时间路径遍历例如频谱系数14,这例如在频谱上在一个频谱20内从低频到高频扫描频谱系数14,然后继续处理时间连续频谱20的频谱系数,如图1在26处所示。通过下面更详细所述的方式,编码器10被配置为通过以上下文自适应方式根据一个或多本文档来自技高网...

【技术保护点】
一种解码器(40),被配置为对音频信号(18)的频谱(12)的频谱系数(14)进行解码,所述解码器被配置为通过以上下文自适应的方式根据先前解码的频谱系数(o)进行熵解码、并且根据关于所述频谱的形状的信息对所述先前解码的频谱系数(o)与当前要解码的频谱系数(x)之间的相对频谱距离(28)进行调整,来对所述当前要解码的频谱系数(x)进行解码。

【技术特征摘要】
【国外来华专利技术】2013.10.18 EP 13189391.9;2014.07.28 EP 14178806.71.一种解码器(40),被配置为对音频信号(18)的频谱(12)的频谱系数(14)进行解码,
所述解码器被配置为通过以上下文自适应的方式根据先前解码的频谱系数(o)进行熵解
码、并且根据关于所述频谱的形状的信息对所述先前解码的频谱系数(o)与当前要解码的
频谱系数(x)之间的相对频谱距离(28)进行调整,来对所述当前要解码的频谱系数(x)进行
解码。
2.根据权利要求1所述的解码器,其中,关于所述频谱的形状的信息包括以下至少一
项:
所述音频信号(18)的音高或周期的度量(60);
所述音频信号的频谱(12)的谐波间距离的度量;
所述频谱的频谱包络的共振峰(70)和/或谷(72)的相对位置。
3.根据权利要求1或2所述的解码器,其中,所述解码器(40)被配置为通过显式信号作
用来导出关于所述频谱的形状的信息。
4.根据权利要求1或2所述的解码器,其中,所述解码器(40)被配置为根据所述频谱的
先前解码的频谱系数(o)或先前解码的基于LPC的频谱包络来导出关于所述频谱的形状的
信息。
5.根据前述权利要求中任一项所述的解码器,其中,所述解码器(40)被配置为使得对
所述熵解码的依赖性涉及多个先前解码的频谱系数(o),所述多个先前解码的频谱系数(o)
的频谱位置的频谱扩展是根据关于所述频谱的形状的信息来调整的。
6.根据前述权利要求中任一项所述的解码器,其中,所述解码器(40)被配置为使得
关于所述频谱的形状的信息是所述音频信号的音高的度量(60),并且所述解码器被配
置为根据所述音高的度量来调整所述先前解码的频谱系数(o)与所述当前要解码的频谱系
数(x)之间的相对频谱距离(28),使得所述相对频谱距离随着音高的增加而增加,或者
关于所述频谱的形状的信息是所述音频信号的周期的度量(60),并且所述解码器被配
置为根据所述周期的度量来调整所述先前解码的频谱系数(o)与所述当前要解码的频谱系
数(x)之间的相对频谱距离(28),使得所述相对频谱距离随着周期的增加而减小,或者
关于所述频谱的形状的信息是所述音频信号的频谱(12)的谐波间距离的度量,并且所
述解码器(40)被配置为根据所述谐波间距离的度量来调整所述先前解码的频谱系数(o)与
所述当前要解码的频谱系数(x)之间的相对频谱距离,使得所述相对频谱距离随着谐波间
距离的增加而增加,或者
关于所述频谱的形状的信息包括所述频谱的频谱包络的共振峰(70)和/或谷(72)的相
对位置,并且所述解码器被配置为根据所述位置来调整所述先前解码的频谱系数与所述当
前要解码的频谱系数之间的相对频谱距离,使得所述相对频谱距离随着所述频谱包络中的
谷之间和/或所述频谱包括中的共振峰之间的频谱距离(74)的增加而增加。
7.根据前述权利要求中任一项所述的解码器,其中,所述解码器被配置为:在通过熵解
码对所述当前要解码的频谱系数进行解码时,通过使所述先前解码的频谱系数经历标量函
数(82)来导出...

【专利技术属性】
技术研发人员:纪尧姆·福克斯马蒂亚斯·诺伊辛格马库斯·马特拉斯史蒂芬·道尔拉
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1