音频编码器和音频解码器制造技术

技术编号:7139255 阅读:439 留言:0更新日期:2012-04-11 18:40
一种用于对系数段进行编码的音频编码器(100),所述系数段代表采样音频信号的不同时间或频率解析度,所述音频编码器(100)包括处理器(110),用于基于之前段的之前编码的系数,获取用于当前段的当前编码的系数的编码上下文,所述之前编码的系数代表与所述当前编码的系数不同的时间或频率解析度。所述音频编码器(100)还包括熵编码器(120),用于基于所述编码上下文,对所述当前系数进行熵编码以获得编码音频流。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频编码的领域,特别地,涉及基于上下文的熵编码领域。
技术介绍
传统音频编码概念包括用于冗余减少的熵编码方案。一般地,熵编码应用于 针对基于频率域的编码方案的量化的频谱系数、或针对基于时间域的编码方案的量化 的时间域采样。这些熵编码方案一般使用发送码字以及相应的码本索引,其允许解码 器查找特定的码本页,用于对与所述页上的所发送的码字相对应的编码信息字进行解 码。在一些编码概念中,码本索引的发送并非强制性的,例如在通过符号的上下文可确 定码本索引的情况下,例如熵编码,说明于Meine,Edler, “Improved Quantization and Lossless Coding for Subband Audio Coding,,;以及 Meine, "Vektorquantisierungund kontextabhangigearithmetische Codierung fur MPEG-4 AAC",Dissertation, Gottfried Wilhelm Leibnitz University Hannover, Hanover 2007。对于基于频率域或基于频谱域的音频编码,上下文可以描述符号或统计属性,例 如位于时间和/或频率之前的量化的频谱系数。在一些常规概念中,这些符号可同时用于 编码器侧和解码器侧,并且基于这些符号,可以同时在编码器侧和解码器侧同步地确定码 本或上下文。图9示出了上下文的示例及其依赖性。图9示出了时间频率平面,其中指示了一 定数量的符号。符号Sn,m表示在时间η和在频率m的符号。图9示出了用于编码特定符号, 其上下文用于确定相关联的码本。例如对于符号Snthmtl,这将是满足以下条件的全部符号η < n0 且任{可叫或 η = n0 且 m < m0。在实际实施中,上下文并非无限的,而是受限的。在图9所示的示例中,符号的 上下文可以例如是S0, 2、S0,1、S—15、S—U、S—U、S—U、S—U、S—2,5、S—2,4、S—2,3、S—2,2、S—2,10对于基于频率的音频编码、时间变体,可以使用信号自适应滤波器组或所谓 的块变换,例如在 Edler, B. , "Codierung von Audiosignalen mit iiberlappender Transformation und adaptiven Fensterfunktionen,,,Frequenz,Ausgabe 43,September 1989中描述过。换言之,在这些音频编码概念中随着时间的经过可能发生频率/时间解析度的改 变。流行的音频编码概念是所谓的AAC(AAC =高级音频编码),其中使用两种块长度,编码 例如1 个或IOM个已变换的系数,分别代表256个或2048个分窗时间域采样的频率组 件。这些概念允许根据特定的信号特性,在不同解析度之间进行切换,例如瞬时 (transient)或音调(tonality)的出现,或该信号是否为音乐类或语音类等等。在不同的 时间/频率解析度之间进行切换的情况下,例如在不同的AAC块类型之间切换的情况下,上下文不一致。常规概念或现有技术实施可以利用该上下文的重置,即基本上切换至其中无 任何上下文可用的状态,其中上下文是从草稿建立的。该方法在例如AAC中可以具有充分 良好的效果,原因在于其保证一列中至少有两个长块或八个短块,此处假设切换不常发生。然而,重置上下文的常规概念在编码效率方面一般并非最优的,原因在于每次重 置上下文时,后续的码本选择基于被设计用作对未知的上下文的备用解决方案的值。然后 一般选择非最优的码本。对于其中切换不常出现的情况,可以忽略编码效率的缺点。然而, 对于更频繁切换的情况,这导致编码效率的显著耗损。另一方面,对于较低数据速率/采样 速率,强烈需要更频繁的切换,原因在于特别需要变换长度对信号特性有最优自适应性。另 一方面,当频繁切换时,编码效率显著降低。
技术实现思路
本专利技术的目的是提供在音频编码中的不同变换长度之间进行切换的概念,所述音 频编码提供了增强的编码效率。可由根据权利要求1所述的音频编码器、根据权利要求8所述的音频编码方法、根 据权利要求9所述的音频解码器以及根据权利要求16所述的音频解码方法来达成该目的。本专利技术基于在时间/频率解析度随着时间而改变的情况下,在基于上下文的编码 诸如基于上下文的熵编码中,其可应用至不同时间/频率解析度时,可使用上下文映射机 制,从而达成增强的编码效率。本专利技术发现当在不同时间或频率解析度之间进行切换时,可 以从具有旧解析度的系数获取具有新解析度的系数的上下文。本专利技术发现当在音频编码中 切换时间/频率解析度时,内插、外推、次采样、降采样、升采样等可用于上下文的自适应和 /或获取°本专利技术的实施例提供一种映射方法,其将具有旧解析度的已存储的上下文的频率 系数或频谱系数映射至当前上下文或当前帧的频率解析度。换言之,之前的上下文信息可 用于码本确定,即用于获取新的上下文信息。实施例允许块长度的更频繁的切换,因此允许 对信号特性的更好的自适应,同时不损耗编码效率。附图说明 将使用附图来详细说明本专利技术的实施例,在附图中 图1示出了音频编码器的实施例; 图2示出了音频解码器的实施例; 图3示出了上下文升采样的实施例; 图4示出了上下文降采样的实施例; 图5示出了音频切换时间和频率解析度; 图6示出了实施例的实施; 图7a示出了编码方法的实施例的流程图; 图7b示出了实施例的一般上下文更新过程; 图7c示出了用于解析度改变的实施例的上下文更新过程; 图8示出了解码方法的实施例的流程图;以及 图9示出了现有技术的时间频率编码方案。具体实施例方式图1示出了用于对系数段进行编码的音频编码器100的实施例,该系数段代表采 样音频信号的不同的时间或频率解析度。音频编码器100包括处理器110,用于基于之前段 的之前已编码系数来获取当前段的当前已编码系数的编码上下文,该之前已编码系数代表 与当前已编码系数不同的时间或频率解析度。音频编码器的实施例还包括熵编码器120,用 于基于该编码上下文对当前系数进行熵编码,以获得编码音频流。在实施例中,系数可以对应于音频采样、量化音频采样、频谱系数或频率系数、扩 缩系数、变换系数或滤波系数等或其任一种组合。在实施例中,音频编码器100还可以包括用于提供来自音频流的系数段的设备, 该系数形成在各系数间变化的频谱解析度的音频信号的频谱表示。提供段的该装置适于基 于不同时间域窗口长度或不同音频帧来确定段,即具有不同长度或每个带宽不同数量系数 的音频信号,即具有不同频谱或频率解析度。该提供装置适于确定IOM或128时间、频率 或频谱系数的段。在实施例中,处理器110可以适于基于当前及之前的系数或段的频率域或频谱域 表示,来获取编码上下文。换言之,在实施例中,可在不同时间域和/或频率域或频谱域中 表示连续段。处理器110可以适于基于例如之前段和/或当前段的相邻频谱系数,而获取 当前段的每个频带或频谱带的编码上下文。在实施例中,可以初始时在时间域中确定该段, 例如,通过将输入音频流分窗来确定。基于这些时间域段或系数,可以通过变换来确定频率 或本文档来自技高网
...

【技术保护点】
一种用于对系数段进行编码的音频编码器(100),所述系数段代表采样音频信号的不同时间或频率解析度,所述音频编码器(100)包括:处理器(110),用于基于之前段的之前编码的系数,获取用于当前段的当前编码的系数的编码上下文,所述之前编码的系数代表与所述当前编码的系数不同的时间或频率解析度;以及熵编码器(120),用于基于所述编码上下文,对所述当前系数进行熵编码以获得编码音频流。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:马库斯·马特拉斯
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1