音频解码器、音频编码器、用于解码音频信号的方法、用于编码音频信号的方法、计算机程序及音频信号技术

技术编号：7152759 阅读：158 留言：0更新日期：2012-04-11 18:40

一种用于基于经熵编码的音频信息提供已解码的音频信息的音频解码器，包括基于上下文的熵解码器，所述基于上下文的熵解码器配置为依据上下文解码该经熵编码的音频信息，所述上下文基于在非重置操作状态下先前已解码的音频信息。所述基于上下文的熵解码器配置为依据所述上下文选择映射信息，用于从所述已编码的音频信息推导出所述已解码的音频信息。所述基于上下文的熵解码器包括上下文重置器，所述上下文重置器配置为重置用于选择映射信息的所述上下文至默认上下文，所述默认上下文独立于所述先前已解码的音频信息。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
根据本专利技术的实施例涉及音频解码器、音频编码器、用于解码音频信号的方法、用于编码音频信号的方法及相应的计算机程序。一些实施例涉及音频信号。根据本专利技术的一些实施例涉及音频编码/解码概念，其中边信息用于重置熵编码 /解码的上下文。一些实施例涉及算术编码器的重置的控制。
技术介绍
传统音频编码概念包括熵编码方案(例如用于编码频域信号表示的频谱系数)以便减少冗余。典型地，熵编码被应用于基于频域的编码方案的量化的频谱系数或用于基于时域的编码方案的量化的时域样本。这些熵编码方案典型地使用传输码字与相对应的码本索引的结合，码本索引允许解码器查询码本某一页，用于解码该码本页上与所传输的码字相对应的已编码的信息字。有关此种音频编码概念的细节，例如参考国际标准IS0/IEC 14496-3 :2005(E)，第三部分音频，第四部分一般音频编码(GA)-AAC，Twin VQ, BSAC，其中描述了所谓的用于“熵/编码”的概念。然而已发现由于需要进行对详细码本选择信息(例如Sect_cb)的常规传输，产生位率的显著开销(overhead)。因此，本专利技术的目的为创造位率有效概念，该位率有效概念用于将熵解码的映射规则自适应于信号统计。
技术实现思路
通过根据权利要求1的音频解码器、根据权利要求12的音频编码器、根据权利要求11的用于解码音频信号的方法、根据权利要求16的用于编码音频信号的方法、根据权利要求17的计算机程序及根据权利要求18的已编码的音频信号可实现本目的。根据本专利技术的实施例提出了一种音频解码器，该音频解码器用于基于已编码的音频信息提供已解码的音频信息。...

【技术保护点】
１．一种用于基于经熵编码的音频信息（１１０；２１０，２２２，２２４）提供已解码的音频信息（１１２；２１２）的音频解码器（１００；２００），所述音频解码器（１００；２００）包括：基于上下文的熵解码器（１２０；２４０），所述基于上下文的熵解码器（１２０；２４０）配置为依据上下文（ｑ［０］，ｑ［１］）解码所述经熵编码的音频信息（１１０；２１０，２２２，２２４），所述上下文基于在非重置操作状态的先前已解码的音频信息；其中，所述基于上下文的熵解码器（１２０；２４０）配置为依据所述上下文（ｑ［０］；ｑ［１］）选定映射信息（ｃｕｍ＿ｆｒｅｑ［ｐｋｉ］），用于从所述已编码的音频信息推导出所述已解码的音频信息（１１２；２１２）；以及其中，所述基于上下文的熵解码器（１２０；２４０）包括上下文重置器（１３０），所述上下文重置器（１３０）配置为响应于所述已编码音频信息（１１０；２１０）的边信息（１３２；ａｒｉｔｈ＿ｒｅｓｅｔ＿ｆｌａｇ），重置（ａｒｉｔｈ＿ｒｅｓｅｔ＿ｃｏｎｔｅｘｔ）所述用于选择映射信息的上下文（ｑ［０］，ｑ［１］）至默认上下文，所述默认上下文独立于所述先前已解码的音频信息（ｑｓ）。

【技术特征摘要】
【国外来华专利技术】US61/103,8202008年10月8日1.一种用于基于经熵编码的音频信息(110;210，222，224)提供已解码的音频信息 (112 ；212)的音频解码器(100 ；200)，所述音频解码器(100 ；200)包括基于上下文的熵解码器(120 ；240)，所述基于上下文的熵解码器(120 ；240)配置为依据上下文(qW]，q[l])解码所述经熵编码的音频信息(110 ；210，222，2M)，所述上下文基于在非重置操作状态的先前已解码的音频信息；其中，所述基于上下文的熵解码器(120 ；240)配置为依据所述上下文(qW] ；q[l])选定映射信息(cum_freq[pki])，用于从所述已编码的音频信息推导出所述已解码的音频信息(112 ；212)；以及其中，所述基于上下文的熵解码器(120 ；240)包括上下文重置器(130)，所述上下文重置器(130)配置为响应于所述已编码音频信息(110 ；210)的边信息(132 ；arith_reset_ flag)，重置(arith_reset_COnteXt)所述用于选择映射信息的上下文(qW]，q[l])至默认上下文，所述默认上下文独立于所述先前已解码的音频信息(qs)。2.根据权利要求1所述的音频解码器(100；200)，其中，所述上下文重置器(130)配置为在所述具有相同频谱分辨率的相关联频谱数据的已编码音频信息(110;210)的随后时间部分(1010 ；1012)的解码间，可选择地重置所述基于上下文的熵解码器(120 ；240)。3.根据权利要求1或2所述的音频解码器(100；200)，其中，所述音频解码器配置为接收描述在第一音频帧(1010)及在所述第一音频帧之后的第二音频帧(101 内的频谱值的信息作为所述已编码音频信息(110 ；210, 222, 224)的组成部分；其中，所述音频解码器包括频谱域至时域变换器052 ；262)，所述频谱域至时域变换器052 J62)配置为重迭及相加第一窗口化时域信号和第二窗口化时域信号以推导出所述已解码的音频信息(112 ；212)，其中，所述第一窗口化时域信号基于所述第一音频帧 (1010)的频谱值，所述第二窗口化时域信号基于所述第二音频帧(1012)的频谱值；其中，所述音频解码器配置为分开调整用于获得所述第一窗口化时域信号的窗口的窗口形状及用于获得第二窗口化时域信号的窗口的窗口形状；以及其中，所述音频解码器配置为响应于所述边信息(132 ；arith_reset_flag)，在所述第一音频帧(1010)的频谱值解码与所述第二音频帧(101 的频谱值解码之间进行所述上下文(q, q[l])的重置(arith_reset_COnteXt)，即使所述第二窗口形状与所述第一窗口形状相同，从而如果所述边信息指示重置所述上下文，则用于解码所述第二音频帧(1012)的已编码音频信息的所述上下文独立于所述第一音频帧(1010)的已解码音频信息。4.根据权利要求3所述的音频解码器(100；200)，其中，所述音频解码器配置为接收用于表示所述上下文重置的上下文重置边信息(132 ;arith_reset_flag)；以及其中，所述音频解码器配置为额外接收窗口形状边信息(windoLsequence，window, shape)；以及其中，所述音频解码器配置为独立于执行所述上下文的重置，调整所述窗口的窗口形状用于获得所述第一窗口化时域信号及所述第二窗口化时域信号。5.根据权利要求1至4任一项所述的音频解码器(100；200)，其中，所述音频解码器配置为接收所述已编码音频信息的每个音频帧的1位上下文重置标记，作为用于重置所述上下文的所述边信息(132 ;arith_reset_flag)；以及其中，所述音频解码器配置为除了所述上下文重置标记外，还接收用于描述由所述已编码音频信息(110;210，222，224)所表示的频谱值的频谱分辨率的边信息或用于窗口化由所述已编码音频信息所表示的时域值的时间窗口的窗口长度；以及其中，所述上下文重置器(130)配置为响应于所述1位上下文重置标记，在已编码音频信息的两个音频帧的频谱值042，244)的解码之间执行所述上下文的重置，所述已编码音频信息表示相同频谱分辨率的频谱值或窗口长度。6.根据权利要求1至5任一项所述的音频解码器(100；200)，其中，所述音频解码器配置为接收所述已编码的音频信息的每个音频帧的1位上下文重置标记，作为用于重置所述上下文的边信息(132 ；arith_reset_flag)；其中，所述音频解码器配置为接收已编码音频信息(110 ；210 ；22 ；2M)，所述已编码音频信息(110 ；210 ；22 ；224)包括每个音频帧(1040)的多个频谱值集合(1042a, 1042b,... 1042h)；其中，所述基于上下文的熵解码器(120 ；240)配置为在非重置操作状态，依据上下文 (q, q[l])解码给定音频帧(1040)的随后频谱值集合(1042b)的所述经熵编码的音频信息，所述上下文基于所述给定音频帧(1040)的先前频谱值集合(1042a)的先前已解码的音频信息(q)；以及其中，所述上下文重置器(130)配置为响应于所述1位上下文重置标记(132 ；arith_ reset_flag)，在所述给定的音频帧(1040)的第一频谱值集合(1042a)解码之前以及在所述给定音频帧(1040)的任何随后两个频谱值集合(1042a-1042h)的解码之间重置所述上下文(q，q[l])至所述默认上下文，从而当解码所述音频帧(1040)的多个频谱值集合(1042a-1042h)时，所述给定音频帧(1040)的所述1位上下文重置标记(132 ;arith_reset_flag)的激活引起所述上下文 (q,q[l])的多时间重置。7.根据权利要求6所述的音频解码器(100；200)，其中，所述音频解码器配置为还接收群组化边信息(scale_factor_grouping)；以及其中，所述音频解码器配置为依据所述群组化边信息(SCale_faCtor_groUping)，群组化所述频谱值集合(1042a-1042h)中的两个或更多个，用于与通用比例因子信息的组合；以及其中，所述上下文重置器(130)配置为响应于所述1位上下文重置标记(132 ；arith_ reSet_flag)，在群组化到一起的两个频谱值集合(1042a，1042b)解码之前重置所述上下文(q，q[l])至所述默认上下文。8.根据权利要求1至7任一项所述的音频解码器(100；200)，其中，所述音频解码器配置为接收每个音频帧的1位上下文重置标记(132 ；arith_ reset_flag)，作为用于重置所述上下文的边信息；当所述音频解码器被配置为接收已编码音频帧序列(1070,107 作为所述已编码音频信息时，所述已编码音频帧序列包括单窗口帧(1070)及多窗口帧(1072)；其中，所述熵解码器(120)配置为依据上下文，解码先前单窗口音频帧(1070)之后的多窗口音频帧(107 的经熵编码的频谱值，所述上下文基于在非重置操作状态下所述先前单窗口音频帧(1070)的先前已解码音频信息；其中，所述熵解码器(120)配置为依据上下文，解码先前多窗口音频帧(107 之后的单窗口音频帧的经熵编码的频谱值，所述上下文基于在非重置操作状态下所述先前多窗口音频帧(107 的先前已解码音频信息；其中，所述熵解码器(120)配置为依据上下文，解码先前单窗口音频帧(1010)之后的单窗口音频帧(101 的经熵编码的频谱值，所述上下文基于在非重置操作状态下所述先前单窗口音频帧(1010)的先前已解码音频信息；其中，所述熵解码器(120)配置为依据上下文，解码先前多窗口音频帧(107 之后的多窗口音频帧的经熵编码...

【专利技术属性】
技术研发人员：纪尧姆·福斯，
申请(专利权)人：弗朗霍夫应用科学研究促进协会，
类型：发明
国别省市：DE

全部详细技术资料下载我是这个专利的主人