音频解码器、音频编码器、用于解码音频信号的方法、用于编码音频信号的方法、计算机程序及音频信号技术

技术编号:7152759 阅读:158 留言:0更新日期:2012-04-11 18:40
一种用于基于经熵编码的音频信息提供已解码的音频信息的音频解码器,包括基于上下文的熵解码器,所述基于上下文的熵解码器配置为依据上下文解码该经熵编码的音频信息,所述上下文基于在非重置操作状态下先前已解码的音频信息。所述基于上下文的熵解码器配置为依据所述上下文选择映射信息,用于从所述已编码的音频信息推导出所述已解码的音频信息。所述基于上下文的熵解码器包括上下文重置器,所述上下文重置器配置为重置用于选择映射信息的所述上下文至默认上下文,所述默认上下文独立于所述先前已解码的音频信息。

【技术实现步骤摘要】
【国外来华专利技术】
根据本专利技术的实施例涉及音频解码器、音频编码器、用于解码音频信号的方法、用于编码音频信号的方法及相应的计算机程序。一些实施例涉及音频信号。根据本专利技术的一些实施例涉及音频编码/解码概念,其中边信息用于重置熵编码 /解码的上下文。一些实施例涉及算术编码器的重置的控制。
技术介绍
传统音频编码概念包括熵编码方案(例如用于编码频域信号表示的频谱系数)以便减少冗余。典型地,熵编码被应用于基于频域的编码方案的量化的频谱系数或用于基于时域的编码方案的量化的时域样本。这些熵编码方案典型地使用传输码字与相对应的码本索引的结合,码本索引允许解码器查询码本某一页,用于解码该码本页上与所传输的码字相对应的已编码的信息字。有关此种音频编码概念的细节,例如参考国际标准IS0/IEC 14496-3 :2005(E), 第三部分音频,第四部分一般音频编码(GA)-AAC,Twin VQ, BSAC,其中描述了所谓的用于“熵/编码”的概念。然而已发现由于需要进行对详细码本选择信息(例如Sect_cb)的常规传输,产生位率的显著开销(overhead)。因此,本专利技术的目的为创造位率有效概念,该位率有效概念用于将熵解码的映射规则自适应于信号统计。
技术实现思路
通过根据权利要求1的音频解码器、根据权利要求12的音频编码器、根据权利要求11的用于解码音频信号的方法、根据权利要求16的用于编码音频信号的方法、根据权利要求17的计算机程序及根据权利要求18的已编码的音频信号可实现本目的。根据本专利技术的实施例提出了一种音频解码器,该音频解码器用于基于已编码的音频信息提供已解码的音频信息。该音频解码器包括基于上下文的熵解码器,所述基于上下文的熵解码器配置为依据上下文解码该经熵编码的音频信息,该上下文基于在非重置操作状态下先前已解码的音频信息。该熵解码器配置为选定映射信息(例如累积频率表或霍夫曼码本),用于依据该上下文从该已编码的音频信息推导出已解码的音频信息。此外,该基于上下文的熵解码器也包括上下文重置器,所述上下文重置器配置为响应于该已编码的音频信息的边信息重置用于选择映射信息的上下文至默认上下文,所述默认上下文独立于所述先前已解码的音频信息。本实施例基于这样的发现在多种情况下对于推导出上下文,该实施例是位率有效的,该上下文依据基于先前已解码的音频信息项目的上下文决定经熵编码的音频信息对已解码的音频信息的映射(例如通过检查码本,或通过确定机率分布),因此可探讨在该经熵编码的音频信息内部的相关性。例如,如果某个频率分辨单元包括在该第一音频帧的大强度,则有高机率该相同的频率分辨单元在该第一音频帧后的下一个音频帧再者包括大的强度。因此,显然基于该上下文的映射信息的选择相比较于这样的情况可减少位率,在该情况下传输用于映射信息的选择的详细信息,该映射信息用于从该已编码的音频信息推导出该已解码的音频信息。然而,也发现从先前已解码的音频信息推导出上下文偶尔导致这样的情况,在该情况下选择的映射信息(用于从该已编码的音频信息推导出该已解码的音频信息)显然不适合,因此导致用于编码该音频信息所需要的位不必要地高。例如如果随后音频帧的频谱能量分布显著不同,使得随后音频帧内部的新的频谱能分布强烈偏离基于先前音频帧内部的频谱分布知识可预期的频谱能分布,则可能发生此种情况。根据本专利技术的关键概念,在这样的情况下,其中位率将因不当映射信息的选择 (用于从该已编码的音频信息推导出该已解码的音频信息)而显著降级,响应于该已编码的音频信息的边信息重置该上下文,因此实现默认映射信息(与该默认上下文相关联)的选择,而其又导致对该音频信息的编码/解码的中等位消耗。综上所述,本专利技术的关键概念为音频信息的位率有效编码可通过结合基于上下文的熵解码器实现,该熵解码器通常(在非重置操作状态下)使用先前已编码的音频信息用于推导出上下文及用于选择相对应的映射信息,该熵解码器具有基于边信息的重置机构, 用于重置该上下文,由于此种概念为了维持适当解码上下文只需极少努力,因此在正常情况下(当该音频内容符合用于映射规则的基于上下文选择的设计预期时),此种概念很好地适应于该音频内容,以及在异常情况下(当该音频内容强烈偏离预期时)可避免位率的过度增高。在优选实施例中,该上下文重置器配置为在具有相同频谱分辨率(例如频率分辨单元数目)的相关联频谱数据的随后时部(例如音频帧)之间变化时选择性重置该基于上下文的熵解码器。本实施例基于这样的发现,即使频谱分辨率维持不变,上下文的重置可具有有利效果(就减少所需位率而言)。换句话说,由于发现即使无需改变频谱分辨率(例如经由从每个帧的“长窗口”切换成每个帧多个“短窗口”),上下文仍然可能不当,因此发现与频谱分辨率的变化独立,执行上下文的重置是可能的。换句话说,发现即使在不希望从低时间分辨率(例如长窗口,结合高频谱分辨率)改变为高时间分辨率(例如短窗口,结合低频谱分辨率)的情况下,上下文可能不当(导致需要重置该上下文)。在优选实施例中,该音频解码器配置为接收描述在第一音频帧及于该第一音频帧后的第二音频帧中的频谱值的信息作为该已编码的音频信息。在此种情况下,该音频解码器优选包括频域至时域变换器,该频域至时域变换器用于重迭与相加第一窗口化时域信号和第二窗口化时域信号,该第一窗口化时域信号基于该第一音频帧的频谱值,该第二窗口化时域信号基于该第二音频帧的频谱值。该音频解码器用于分开调整用于获得该第一窗口化时域信号的窗口的窗口形状及用于获得该第二窗口化时域信号的窗口的窗口形状。音频解码器优选还配置为响应于该边信息,执行在第一音频帧的频谱值解码与第二音频帧的频谱值解码之间的上下文的重置,即使第二窗口形状与第一窗口形状相同亦如此,使得在重置情况下,用于解码第二音频帧的已编码音频信息的上下文独立于第一音频帧的已解码音频信息。本实施例允许在第一音频帧频谱值解码(使用基于上下文所选用的映射信息)与第二音频帧频谱值解码(使用基于上下文选用的映射信息)之间的上下文的重置,即使第一音频帧与第二音频帧的窗口化时域信号为重迭及相加亦如此,以及即使选用相同窗口形状用于从该第一音频帧及第二音频帧的频谱值推导出第一窗口化时域信号及第二窗口化时域信号亦如此。因此,上下文的重置可被引入作为额外自由度,可通过上下文重置器甚至在密切相关音频帧的频谱值的解码之间应用,其窗口化时域信号通过使用相同窗口形状推导出并被重迭与相加。因此,优选上下文的重置独立于所使用的窗口形状,也独立于随后帧的窗口化时域信号属于邻接的音频内容即为重迭与相加的事实。在优选实施例中,熵解码器配置为响应于边信息,重置在具有相同频率分辨率的相邻音频信息的帧的音频信息解码之间的上下文。在本实施例中,上下文重置的执行独立于频率分辨率的改变。在再一个实施例中,音频解码器配置为接收上下文重置边信息,用于以信号传递该上下文的重置。在此种情况下,音频解码器也配置为额外接收窗口形边信息以调整窗口的窗口形状用于独立于执行上下文的重置而获得第一及第二窗口化时间信号。在优选实施例中,音频解码器配置为接收每个已编码音频信息的音频帧的1位上下文重置标记,作为用于重置该上下文的边信息。在此种情况下,音频解码器优选配置为除了接收上下文重置标记外,接收描述通过已编码音频信息所表示的本文档来自技高网...

【技术保护点】
1.一种用于基于经熵编码的音频信息(110;210,222,224)提供已解码的音频信息(112;212)的音频解码器(100;200),所述音频解码器(100;200)包括:基于上下文的熵解码器(120;240),所述基于上下文的熵解码器(120;240)配置为依据上下文(q[0],q[1])解码所述经熵编码的音频信息(110;210,222,224),所述上下文基于在非重置操作状态的先前已解码的音频信息;其中,所述基于上下文的熵解码器(120;240)配置为依据所述上下文(q[0];q[1])选定映射信息(cum_freq[pki]),用于从所述已编码的音频信息推导出所述已解码的音频信息(112;212);以及其中,所述基于上下文的熵解码器(120;240)包括上下文重置器(130),所述上下文重置器(130)配置为响应于所述已编码音频信息(110;210)的边信息(132;arith_reset_flag),重置(arith_reset_context)所述用于选择映射信息的上下文(q[0],q[1])至默认上下文,所述默认上下文独立于所述先前已解码的音频信息(qs)。

【技术特征摘要】
【国外来华专利技术】US61/103,8202008年10月8日1.一种用于基于经熵编码的音频信息(110;210,222,224)提供已解码的音频信息 (112 ;212)的音频解码器(100 ;200),所述音频解码器(100 ;200)包括基于上下文的熵解码器(120 ;240),所述基于上下文的熵解码器(120 ;240)配置为依据上下文(qW],q[l])解码所述经熵编码的音频信息(110 ;210,222,2M),所述上下文基于在非重置操作状态的先前已解码的音频信息;其中,所述基于上下文的熵解码器(120 ;240)配置为依据所述上下文(qW] ;q[l])选定映射信息(cum_freq[pki]),用于从所述已编码的音频信息推导出所述已解码的音频信息(112 ;212);以及其中,所述基于上下文的熵解码器(120 ;240)包括上下文重置器(130),所述上下文重置器(130)配置为响应于所述已编码音频信息(110 ;210)的边信息(132 ;arith_reset_ flag),重置(arith_reset_COnteXt)所述用于选择映射信息的上下文(qW],q[l])至默认上下文,所述默认上下文独立于所述先前已解码的音频信息(qs)。2.根据权利要求1所述的音频解码器(100;200),其中,所述上下文重置器(130)配置为在所述具有相同频谱分辨率的相关联频谱数据的已编码音频信息(110;210)的随后时间部分(1010 ;1012)的解码间,可选择地重置所述基于上下文的熵解码器(120 ;240)。3.根据权利要求1或2所述的音频解码器(100;200),其中,所述音频解码器配置为接收描述在第一音频帧(1010)及在所述第一音频帧之后的第二音频帧(101 内的频谱值的信息作为所述已编码音频信息(110 ;210, 222, 224)的组成部分;其中,所述音频解码器包括频谱域至时域变换器052 ;262),所述频谱域至时域变换器052 J62)配置为重迭及相加第一窗口化时域信号和第二窗口化时域信号以推导出所述已解码的音频信息(112 ;212),其中,所述第一窗口化时域信号基于所述第一音频帧 (1010)的频谱值,所述第二窗口化时域信号基于所述第二音频帧(1012)的频谱值;其中,所述音频解码器配置为分开调整用于获得所述第一窗口化时域信号的窗口的窗口形状及用于获得第二窗口化时域信号的窗口的窗口形状;以及其中,所述音频解码器配置为响应于所述边信息(132 ;arith_reset_flag),在所述第一音频帧(1010)的频谱值解码与所述第二音频帧(101 的频谱值解码之间进行所述上下文(q, q[l])的重置(arith_reset_COnteXt),即使所述第二窗口形状与所述第一窗口形状相同,从而如果所述边信息指示重置所述上下文,则用于解码所述第二音频帧(1012)的已编码音频信息的所述上下文独立于所述第一音频帧(1010)的已解码音频信息。4.根据权利要求3所述的音频解码器(100;200),其中,所述音频解码器配置为接收用于表示所述上下文重置的上下文重置边信息(132 ;arith_reset_flag);以及其中,所述音频解码器配置为额外接收窗口形状边信息(windoLsequence,window, shape);以及其中,所述音频解码器配置为独立于执行所述上下文的重置,调整所述窗口的窗口形状用于获得所述第一窗口化时域信号及所述第二窗口化时域信号。5.根据权利要求1至4任一项所述的音频解码器(100;200),其中,所述音频解码器配置为接收所述已编码音频信息的每个音频帧的1位上下文重置标记,作为用于重置所述上下文的所述边信息(132 ;arith_reset_flag);以及其中,所述音频解码器配置为除了所述上下文重置标记外,还接收用于描述由所述已编码音频信息(110;210,222,224)所表示的频谱值的频谱分辨率的边信息或用于窗口化由所述已编码音频信息所表示的时域值的时间窗口的窗口长度;以及其中,所述上下文重置器(130)配置为响应于所述1位上下文重置标记,在已编码音频信息的两个音频帧的频谱值042,244)的解码之间执行所述上下文的重置,所述已编码音频信息表示相同频谱分辨率的频谱值或窗口长度。6.根据权利要求1至5任一项所述的音频解码器(100;200),其中,所述音频解码器配置为接收所述已编码的音频信息的每个音频帧的1位上下文重置标记,作为用于重置所述上下文的边信息(132 ;arith_reset_flag);其中,所述音频解码器配置为接收已编码音频信息(110 ;210 ;22 ;2M),所述已编码音频信息(110 ;210 ;22 ;224)包括每个音频帧(1040)的多个频谱值集合(1042a, 1042b,... 1042h);其中,所述基于上下文的熵解码器(120 ;240)配置为在非重置操作状态,依据上下文 (q, q[l])解码给定音频帧(1040)的随后频谱值集合(1042b)的所述经熵编码的音频信息,所述上下文基于所述给定音频帧(1040)的先前频谱值集合(1042a)的先前已解码的音频信息(q);以及其中,所述上下文重置器(130)配置为响应于所述1位上下文重置标记(132 ;arith_ reset_flag),在所述给定的音频帧(1040)的第一频谱值集合(1042a)解码之前以及在所述给定音频帧(1040)的任何随后两个频谱值集合(1042a-1042h)的解码之间重置所述上下文(q,q[l])至所述默认上下文,从而当解码所述音频帧(1040)的多个频谱值集合(1042a-1042h)时,所述给定音频帧(1040)的所述1位上下文重置标记(132 ;arith_reset_flag)的激活引起所述上下文 (q,q[l])的多时间重置。7.根据权利要求6所述的音频解码器(100;200),其中,所述音频解码器配置为还接收群组化边信息(scale_factor_grouping);以及其中,所述音频解码器配置为依据所述群组化边信息(SCale_faCtor_groUping),群组化所述频谱值集合(1042a-1042h)中的两个或更多个,用于与通用比例因子信息的组合; 以及其中,所述上下文重置器(130)配置为响应于所述1位上下文重置标记(132 ;arith_ reSet_flag),在群组化到一起的两个频谱值集合(1042a,1042b)解码之前重置所述上下文(q,q[l])至所述默认上下文。8.根据权利要求1至7任一项所述的音频解码器(100;200),其中,所述音频解码器配置为接收每个音频帧的1位上下文重置标记(132 ;arith_ reset_flag),作为用于重置所述上下文的边信息;当所述音频解码器被配置为接收已编码音频帧序列(1070,107 作为所述已编码音频信息时,所述已编码音频帧序列包括单窗口帧(1070)及多窗口帧(1072);其中,所述熵解码器(120)配置为依据上下文,解码先前单窗口音频帧(1070)之后的多窗口音频帧(107 的经熵编码的频谱值,所述上下文基于在非重置操作状态下所述先前单窗口音频帧(1070)的先前已解码音频信息;其中,所述熵解码器(120)配置为依据上下文,解码先前多窗口音频帧(107 之后的单窗口音频帧的经熵编码的频谱值,所述上下文基于在非重置操作状态下所述先前多窗口音频帧(107 的先前已解码音频信息;其中,所述熵解码器(120)配置为依据上下文,解码先前单窗口音频帧(1010)之后的单窗口音频帧(101 的经熵编码的频谱值,所述上下文基于在非重置操作状态下所述先前单窗口音频帧(1010)的先前已解码音频信息;其中,所述熵解码器(120)配置为依据上下文,解码先前多窗口音频帧(107 之后的多窗口音频帧的经熵编码...

【专利技术属性】
技术研发人员:纪尧姆·福斯
申请(专利权)人:弗朗霍夫应用科学研究促进协会
类型:发明
国别省市:DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1