音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法及使用区域从属算术编码映射规则的计算机程序技术

技术编号:7775643 阅读:212 留言:0更新日期:2012-09-15 17:56
一种用以基于一已编码的音频信息(2210)而提供一已解码的音频信息(2212)的音频解码器(2200),包含:用以基于经算术编码的频谱值表示(2222)而提供多个已解码的频谱值(2224)的一算术解码器(2220),及用以使用已解码的频谱值(2224)而提供时域音频表示的一频域至时域变换器(2230),从而获得解码的音频信息。该算术解码器被配置为依据上下文状态而选择描述一码值映射至一符号码的映射规则。该算术解码器被配置为依据多个事先解码频谱值并且还依据欲解码的频谱值是位于第一预定频率区还是位于第二预定频率区,而判定描述该目前上下文状态的一数值型目前上下文值。一种音频编码器基于一输入的音频信息而提供已编码的音频信息。

【技术实现步骤摘要】
【国外来华专利技术】
依据本专利技术的实施例是有关于ー种用以基于已编码的音频信息而提供已解码的音频信息的音频解码器,一种用以基于输入的音频信息而提供已编码的音频信息的音频编码器,ー种用以基于已编码的音频信息而提供已解码的音频信息的方法,一种用以基于输入的音频信息而提供已编码的音频信息的方法,及一种计算机程序。依据本专利技术的实施例是有关于ー种改良式无噪声频谱编码,其可用于音频编码器或音频解码器,例如所谓的统一语音与音频编码器(USAC)。
技术介绍
后文中将简短解说本专利技术的背景,从而有助于了解本专利技术及其优点。过去十年间,大量努力致カ于以良好位率效率而可能数字式储存与发布音频内容。此ー方面有ー项重大成就是国际标准IS0/IEC 14496-3的定义。此ー标准的第三部分是有关音频内容的编码及解码,而第三部分的第四子部分是有关一般音频编码。IS0/IEC 14496第三部分,第四子部分定义一般音频内容的编码及解码构想。此外,已提出进ー步改良来改善质量和/或减低所要求的位率。依据该项标准所叙述的构想,时域音频信号被转换成时频表示。从时域变换成时频域典型地是使用时域样本的变换区块执行,该变换区块也称作为“帧”。已发现较佳是使用重叠帧,其移位例如半个帧,原因在于重叠允许有效地避免(或至少減少)假影(artifacts)。此外,已发现须进行开窗(windowing),以免源自于此种时间上有限的巾贞处理的假影。通过将该输入的音频信号的ー开窗部从时域变换成时频域,许多情况下,获得能量压缩,使得部分频谱值包含比多个其它频谱值显著更大的幅度。如此,许多情况下,幅度显著高于该等频谱值平均幅度的频谱值的数量相对较少。结果导致能量压缩的时域至时频域变换的ー个典型例是所谓的修正离散余弦变换(MDCT)。频谱值经常是依据心理声学(psychoacoustic)模型而定标(scaled)及量化,使得针对心理声学上较重要的频谱值的量化误差较小,而针对心理声学上较不重要的频谱值的量化误差较大。已经定标与量化的频谱值被编码来提供其位率有效的表示。例如,所谓的量化频谱系数的霍夫曼编码的使用在国际标准ISO/IEC14496-3:2005 (E),第三部分,第四子部分中进行了描述。然而,已发现频谱值的编码质量对所要求的位率有显著影响。同样,已发现音频解码器的复杂程度是取决于用于编码该频谱值的编码处理,音频解码器经常制作成可携式消费者装置,因此须价廉且耗电量低。综上所述,需要可提供位率效率与资源效率间的改良式折衷的一种音频内容的编码及解码构想。
技术实现思路
依据本专利技术的ー实施例,形成ー种用以基于已编码的音频信息而提供已解码的音频信息的音频解码器。该音频解码器包含用以基于多个频谱值的经算木编码的表示而提供该些已解码的频谱值的一算木解码器。该音频解码器也包含用以使用该些已解码的频谱值而提供ー时域音频表示,藉此获得已解码的音频信息的ー频域至时域变换器。该算术解码器被配置为依据一上下文状态,而选择描述ー码值(其可提取自表示该已编码的音频信息的一位串流)映射至一符号码(其可为表示一已解码的频谱值的数值、或其最高有效位平面)的映射规则。该算术解码器被配置为依据多个事先解码的频谱值并且也依据要被解码的频谱值是否位于第一预定频率区或位于第二预定频率区,而判定描述该目前上下文状态的一数值型目前上下文值。已发现对于目前要被解码的频谱值所在频率区的考虑,允许上下文运算质量的显 著改良而未显著増加上下文运算所要求的运算量。此外,通过考虑位在目前要被解码的频谱值邻近的事先解码频谱值间的统计相依性是随频率而异这一事实,上下文可被选择从而允许用于与较低频相关联的频谱值的解码及用干与较高频相关联的频谱值的解码这两者都有高的编码效率。上下文对目前要被解码的频谱值与事先解码频谱值(典型地来自于目前要被解码的频谱值的直接邻近或间接邻近)间的统计相依性细节的调整适应良好,能够提高编码效率,同时保持运算量合理地低。发现能够以极低运算量来考虑频率区,原因在于目前要被解码的频谱值的频率指数在算木解码过程中是必然已知的。如此,上下文的选择性调适能够以少量运算量执行而仍带来编码效率的改良。在一较佳实施例,算木解码器被配置为依据要被解码的频谱值是否位在第一预定频率区或位在第二预定频率区,而选择性地修正该数值型目前上下文值。除了数值型目前上下文值的先前运算(或其它測定)タト,数值型目前上下文值的选择性地修正允许该数值型目前上下文值的“正常”运算(或其它測定)与要被解码的频谱值目前所在该频率区的考虑组合。该数值型目前上下文值的“正常”运算可与该数值型目前上下文值的区相依性调适工作分开处理,这典型地降低了运算法则与运算量的复杂度。同样,只使用此ー构想,就能够容易地升级包含该数值型目前上下文值的“正常”运算的系统。在一较佳实施例,该算术解码器被配置为测定该数值型目前上下文值,使得该数值型目前上下文值是基于多个事先解码频谱值的组合,或基于自多个事先解码频谱值所导出的多个中间值的组合;以及使得该数值型目前上下文值依据要被解码的频谱值是位在第一预定频率区还是位在第二预定频率区,而选择性地在基于多个事先解码频谱值的组合,或基于自多个事先解码频谱值所导出的多个中间值的组合所得的一值上增加。已发现数值型目前上下文值依据要被解码的频谱值所在的频率区而选择性増加,允许数值型目前上下文值的有效评估,而同时維持运算量少。在一较佳实施例,该算术解码器被配置为至少在第一频率区与第二频率之间区别,藉此判定该数值型目前上下文值,其中,该第一频率区包含与该音频内容的ー给定时间部分(例如,ー帧或一子帧)相关联的频谱值中的至少15% ;及其中该第一频率区为低频区且包含具有最低频率的相关联的频谱值(是在与该音频内容的给定(目前)时间部分相关联的该频谱值集合内)。已发现通过常见地考虑频谱的下部(包含频谱值的至少15%)作为第一频率区,可达成良好的上下文调适,原因在于频谱值间的统计相依性并未包含在此低频率区的强变化。如此,不同区的数目可維持充分地小,而其又转而协助避开使用过多不同的映射规则。然而,在若干实施例,若第一频率区包含至少ー个频谱值、至少ニ个频谱值、或至少三个频谱值就足够了,即便如此仍以选用更延伸的第一频谱区为佳。在一较佳实施例,该算术解码器被配置为至少在第一频率区与第二频率之间区另IJ,藉此判定该数值型目前上下文值,其中该第二频率区包含与该音频内容的ー给定时间部分(例如ー帧或一子帧)相关联的频谱值中的至少15% ;及其中该第二频率区为高频区且包含具有 最高频率的相关联的频谱值(是在与该音频内容的给定(目前)时间部分相关联的该频谱值集合内)。已发现通过常见地考虑频谱顶部(包含频谱值的至少15%)作为第二频率区,可达成良好的上下文调适,原因在于频谱值间的统计相依性并未包含在该高频率区上的强变化。如此,不同区的数目可維持充分地小,而其又转而协助避开使用过多不同的映射规则。然而,在若干实施例,若第二频率区包含至少ー个频谱值、至少ニ个频谱值、或至少三个频谱值就足够了,但即便如此仍以选用更延伸的第一频谱区为佳。在一较佳实施例,该算术解码器被配置为至少在第一频率区、第二频率区、以及第三频率之间区别,藉此依据要被解码的频谱值是在这至少三个频率区中的哪ー个的判定而判定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2009.10.20 US 61/253,4591.一种用以基于已编码的音频信息(210 ;810 ;2210)而提供已解码的音频信息(212 ;812 ;2212)的音频解码器(200 ;800 ;2200),所述音频编码器包含 用以基于经算术编码的频谱值表示(222 ;821 ;2222 ;acod_m[pki], [m]acod_r [r])而提供多个已解码的频谱值(232 ;822 ;2224 ;a)的ー算术解码器(230 ;820 ;2220);及 用以使用所述已解码的频谱值(232 ;822 ;2224 ;a)来获得所述已解码的音频信息而提供时域音频表示的ー频域至时域变换器(26 ;830 ;2230); 其中,所述算术解码器被配置为依据上下文状态而选择描述ー码值(aCod_m[pki] [m];value)对应至一符号码(symbol)的映射规则(cum_freq, ari_cf m[pki] [9]) 其中,所述算术解码器被配置为依据多个事先解码频谱值(s)并且还依据要被解码的频谱值(a)是位于第一预定频率区还是位于第二预定频率区,而判定描述所述目前上下文状态的ー数值型目前上下文值(s)。2.根据权利要求I所述的音频解码器,其中,所述算术解码器被配置为依据要被解码的频谱值(a)是位于第一预定频率区还是位于第二预定频率区而选择性地修正所述数值型目前上下文值(S)。3.根据权利要求I或2所述的音频解码器,其中,所述算术解码器被配置为判定所述数值型目前上下文值(S),使得所述数值型目前上下文值(S)是基于多个事先解码频谱值的组合,或基于自多个事先解码频谱值(a)所导出的多个中间值(c0, cl, c2, c3, c4, c5, c6)的组合,并且使得依据要被解码的频谱值是位于第一预定频率区还是位于第二预定频率区,所述数值型目前上下文值(S)被选择性地増加超过基于多个事先解码频谱值的组合、或基于自多个事先解码频谱值所导出的中间值(c0, cl, c2, c3, c4, c5, c6)组合所得的ー值。4.根据权利要求I至3中任一项所述的音频解码器,其中,所述算术解码器被配置为在至少第一频率区与第二频率区间区别,从而判定所述数值型目前上下文值(S), 其中,所述第一频率区包含与所述音频内容的ー给定时间部分相关联的频谱值中的至少15%,及其中,所述第一频率区为低频区且包含具有最低频率的相关联的频谱值。5.根据权利要求I至4中任一项所述的音频解码器,其中,所述算术解码器被配置为在至少第一频率区与第二频率区间区别,从而判定所述数值型目前上下文值(S), 其中,所述第二频率区包含与所述音频内容的ー给定时间部分相关联的频谱值中的至少15%,及其中,所述第二频率区为高频区且包含具有最高频率的相关联的频谱值。6.根据权利要求I至5中任一项所述的音频解码器,其中,所述算术解码器被配置为至少在第一频率区、第二频率区与第三频率区间区别,从而依据所述要被解码的频谱值是在至少三个所述频率区中的哪ー个的判定而判定所述数值型目前上下文值(S) '及 其中,所述第一频率区、所述第二频率区及所述第三频率区中的每ー个包含多个相关联的频谱值。7.根据权利要求6所述的音频解码器,其中,所述音频信息的ー给定时间部分的频谱值中的至少八分之ー是与所述第一频率区相关联,及其中,所述音频信息的ー给定时间部分的频谱值中的至少五分之ー是与所述第二频率区相关联,及其中,所述音频信息的ー给定时间部分的频谱值中的至少四分之ー是与所述第三频率区相关联。8.根据权利要求I至7中任一项所述的音频解码器,其中,所述算术解码器被配置为运算包含至少第一被加数及至少第二被加数的一和,作为该加的结果而获得所述数值型目前上下文值(S), 其中,所述第一被加数是经由描述事先解码频谱值(a)的振幅的多个中间值(CO,Cl,c2,c3,c4,c5,c6)的组合获得,及 其中,所述第二被加数(region)描述要被解码的频谱值是与多个频率区中的哪ー个频率区相关联。9.根据权利要求I至8中任一项所述的音频解码器,其中,所述算术解码器被配置为依据要被解码的频谱值是位于多个不同频率区中的哪ー个频率区的判定,而修正所述数值型目前上下文值(S)的ニ进制表示的ー个或多个预定位位置。10.根据权利要求I至9中任一项所述的音频...

【专利技术属性】
技术研发人员:纪尧姆·福奇斯维内什·苏布巴拉曼尼古劳斯·雷特尔巴赫马库斯·穆赖特鲁斯马克·伽依尔帕特里克·瓦姆博尔德克里斯蒂安·格里贝尔奥利弗·魏斯
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1