基于先前解码频谱值的范数来获得脉络子区值的音频编码器、音频解码器、编码及解码音频信息的方法及计算机程序技术

技术编号:8133974 阅读:237 留言:0更新日期:2012-12-27 12:18
一种用以基于编码音频信息来提供解码音频信息的音频解码器包含用以基于频谱值的算术编码表示来提供多个解码频谱值的算术解码器,及使用所述解码频谱值来提供时域音频表示以获得解码音频信息的频域至时域变换器。算术解码器被配置成依据由一数值当前脉络值所描述的一脉络状态来选择描述一码值至一符元码的映射的映射规则。算术解码器被配置成依据多个先前已解码频谱值来确定数值当前脉络值。算术解码器被配置成基于先前已解码频谱值来获取多个脉络子区值,并储存所述脉络子区值。算术解码器被配置成依据所储存的脉络子区值来导算出与一或多个当前欲解码的频谱值相关联的一数值当前脉络值。算术解码器被配置成计算由多个先前已解码频谱值所形成的一向量的范数,以获得与所述多个先前已解码频谱值相关联的一共用脉络子区值。一种音频编码器使用类似的构想。

【技术实现步骤摘要】
【国外来华专利技术】
依据本专利技术的实施例有关于一种用以基于编码音频信息来提供解码音频信息的音频解码器,一种用以基于输入音频信息来提供编码音频信息的音频编码器,一种用以基于编码音频信息来提供解码音频信息的方法,一种用以基于输入音频信息来提供编码音频信息的方法及一种计算机程序。依据本专利技术的实施例有关于一种改良型频谱无噪声编码,其可用于音频编码器或音频解码器,例如,所谓的统一语音及音频编码装置(USAC)。
技术介绍
后文中将简单解释本专利技术背景以便于了解本专利技术及其优点。过去十年间努力致力 于使以良好比特率效率来以数字方式储存及分配音频内容成为可能。就这个方面而言的一项重要成就是国际标准IS0/IEC 14496-3的确定。此标准的部分3有关于音频内容的编码及解码,而部分3的子部分4有关于一般音频编码。IS0/IEC 14496部分3,子部分4定义用于一般音频内容的编码及解码的构想。此外,已提出要进一步改良以改善品质及/或减少所需的比特率。依据该项标准所述构想,时域音频信号被转换成时频表示。从时域变换成时频域通常是使用变换区块来进行,变换区块也被称为时域样本的「帧」。业已发现较佳地是使用移位,例如,移位半帧的重叠帧,原因在于重叠允许有效地避免(或至少减少)假影(artifact)。此外,业已发现须进行加窗(windowing)来避免源自于此种时间上有限巾贞处理上的假影。借由将输入音频信号的一加窗部分从时域变换成时频域,在许多情况下获得能量压缩(energy compaction),使得若干频谱值包含比多个其它频谱值明显变大的幅度。据此,在许多情况下,有相对较少数频谱值具有的幅度明显高于频谱值的平均幅度。导致能量压缩的时域至时频域变换的一个典型实例为所谓的修正离散余弦变换(MDCT)。频谱值常依据心理声学模型来定标及量化,使得对心理声学上较为重要的频谱值的量化误差相对较小,而对心理声学上较不重要的频谱值的量化误差相对较大。将已定标且已量化频谱值编码来提供它们的一比特率有效率的表示。例如,使用量化频谱系数的所谓霍夫曼编码,记载在国际标准IS0/IEC14496-3:2005 (E)部分3子部分4中。但业已发现频谱值的编码品质对所需的比特率具有显著影响。并且还发现经常应用在可携式消费装置并因此应当是廉价且耗电量低的音频解码器的复杂度取决于用以编码频谱值的编码方法。综上所述,需要有一种用以编码及解码音频内容的构想,其提供比特率效率与资源效率间的改良折衷。
技术实现思路
依据本专利技术的一实施例形成一种用以基于一编码音频信息来提供一解码音频信息的音频解码器。该音频解码器包含用以基于频谱值的算术编码表示来提供多个解码频谱值的一算术解码器。该音频解码器还包含用以使用所述解码频谱值来提供一时域音频表示,以获得解码音频信息的一频域至时域变换器。该算术解码器被配置成依据由一数值当前脉络值所描述的一脉络状态来选择描述将一码值映射至一符元码(symbol code)(该符元码典型地描述一频谱值或多个频谱值,或者一频谱值或多个频谱值的最高有效比特平面)的一映射规则。该算术解码器被配置成依据多个先前已解码频谱值来确定该数值当前脉络值。该算术解码器还被配置成基于先前已解码频谱值来获得多个脉络子区值并储存所述脉络子区值。该算术解码器被配置成依据所储存的脉络子区值来导算出与一或多个欲解码的频谱值相关联的一数值当前脉络值(或更准确地说,界定用于解码一或多个欲解码频 谱值的一脉络)。该算术解码器被配置成计算由多个先前已解码频谱值所形成的一向量的范数,以获得与所述多个先前已解码频谱值相关联的一共用脉络子区值。本专利技术之此实施例是基于以下研究结果通过计算由多个先前已解码频谱值所形成的一向量的范数,可获得内存有效的脉络子区信息,原因在于由多个先前已解码频谱值所形成的此向量的范数包含最相关的脉络信息。在形成范数的情况下,频谱值符号通常被丢弃。但发现,如果真发生的话,频谱值的符号只包含对脉络状态的从属影响,因此可被删除而不会严重损害脉络子区值的有效性。此外,还发现,通常由多个先前已解码频谱值所形成的一向量的范数的形成带来平均效应,允许信息数量减少,同时仍会导致以足够准确度来反映当前脉络情况的一脉络值。简而言之,通过储存脉络子区值,可将储存呈多个脉络子区值形式的脉络的内存需求控制得很小,脉络子区值基于由多个先前已解码频谱值(而非频谱值本身)所形成的一向量的范数的运算。在一较佳实施例中,该算术解码器被配置成计算多个先前已解码频谱值的绝对值的总和,以获得与所述多个先前已解码频谱值相关联的共用脉络子区值,所述频谱值较佳地是但不一定与该频域至时域变换器的相邻频率仓(frequency bin)及该音频信息的一共用时间部分相关联。已发现,与范数运算相对应,计算多个先前已解码频谱值的绝对值的总和是计算有意义的脉络子区值的一种特别有效的方式。此处应注意,计算一向量的绝对值的总和等于计算该向量之所谓的L-I范数。换言之,计算一向量的绝对值的总和是计算范数的实例。在一较佳实施例中,该算术解码器被配置成量化多个先前已解码频谱值的范数,以获得与所述多个先前已解码频谱值相关联的共用脉络子区值,先前已解码频谱值与该频域至时域变换器的相邻频率仓及该音频信息的一共用时间部分相关联。量化该范数,例如,可包含以离散尺度(例如,绝对整数值的总和)来计算该范数,并且还限制其结果。在一较佳实施例中,该算术解码器被配置成量化多个先前已解码频谱值的范数,以获得与所述多个先前已解码频谱值相关联的该共用脉络子区值,所述频谱值较佳地是但不一定与该频域至时域变换器的相邻频率仓及该音频信息的一共用时间部分相关联。已发现,量化该范数可能有助于将信息量控制得相当小。举例而言,量化可能有助于减少表示该脉络子区值所需的比特数目,且因此可协助提供具有少数比特的数值当前脉络值。在一较佳实施例中,该算术解码器被配置成计算使用一共用码值来编码的多个先前已解码频谱值的绝对值的总和,以获得与所述多个先前已解码频谱值相关联的共用脉络子区值。已发现,若对使用一共用码值编码的此类频谱值形成一共用脉络子区值,则脉络的准确度特别高。因此,每一个脉络子区值可与一个码值相对应,这又在储存该脉络子区值时获得良好的内存效率。在一较佳实施例中,该算术解码器被配置成提供有符号的已解码离散频谱值给该频域至时域变换器,及计算与所述有符号的已解码频谱值相对应的绝对值的总和,以获得与所述多个先前已解码频谱值相关联的共用脉络子区值。已发现,有符号的值作为输入频域至时域变换器的输入值,就音频质量而言有时是有利的,原因在于这允许考虑音频内容重建时的相位。但也发现,脉络子区值删除相位信息(亦即关于频谱值的符号信息),并不会使使用脉络子区值所导算出的脉络状态信息的准确度严重降级,原因在于在大多数情况下,相位信息在不同的频率仓间并没有强烈的相关性。在一较佳实施例中,该算术解码器被配置成由先前已解码频谱值的绝对值的总和来导算出一有限总和值(或由多个先前已解码的离散频谱值所形成的一向量的范数导出一有限范数值),使得该有限总和值的一可能值范围小于一可能总和值范围(或使得该有 限范数值的一可能值范围小于一可能范数值范围)。已发现,限制脉络子区值允许减少用于储存脉络子区值所需的比特数目。而且,已发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.01.12 US 61/294,3571.一种用以基于ー编码音频信息(210;810)来提供一解码音频信息(212;812)的音频解码器(200 ;800),所述音频解码器包含 一算木解码器(230 ;820),用以基于多个频谱值的算术编码表示(222 ;821)来提供多个解码频谱值(232 ;822);及 ー频域至时域变换器(260 ;830),用以使用所述解码频谱值(232 ;822)来提供ー时域音频表示(262 ;812),以获得所述解码音频信息(212 ;812); 其中所述算术解码器(230 ;820)被配置成依据由ー数值当前脉络值(c)所描述的ー脉络状态来选择一映射规则(297 ;cum_freq[]),所述映射规则描述ー码值(acod_m, value)到一符元码(symbol)的映射;且 其中所述算术解码器(230;820)被配置成依据多个先前已解码的频谱值来确定所述数值当前脉络值(c); 其中所述算术解码器被配置成基于先前已解码的频谱值来获得多个脉络子区值(q[i-l],q [i],q [i+1],q[l] [i_l]),并储存所述脉络子区值; 其中所述算术解码器被配置成依据所储存的脉络子区值(q [i-l],q [i],q[i+l],q[l][i_l])来导算出与一或多个欲解码的频谱值相关联的一数值当前脉络值(C); 其中所述算术解码器被配置成计算由多个先前已解码频谱值(a,b)所形成的一向量的范数,以获得与所述多个先前已解码频谱值相关联的一共用脉络子区值(q[l] [i])。2.如权利要求I所述的音频解码器,其中所述算术解码器被配置成计算与所述频域至时域变换器的相邻频率仓及所述音频信息的一共用时间部分相关联的多个先前已解码频谱值的绝对值的总和,以获得与所述多个先前已解码频谱值相关联的所述共用脉络子区 值。3.如权利要求I所述的音频解码器,其中所述算术解码器被配置成量化与所述频域至时域变换器的相邻频率仓及所述音频信息的一共用时间部分相关联的多个先前已解码频 谱值的范数,以获得与所述多个先前已解码频谱值相关联的所述共用脉络子区值。4.如权利要求I至3中任ー权利要求所述的音频解码器,其中所述算术解码器被配置成计算使用一共用码值(acod_m, value)来编码的多个先前已解码频谱值(a, b)的绝对值的总和,以获得与所述多个先前已解码频谱值相关联的所述共用脉络子区值。5.如权利要求I至4中任ー权利要求所述的音频解码器,其中所述算术解码器被配置成提供有符号的已解码频谱值给所述频域至时域变换器,并计算与所述有符号的已解码频谱值相对应的绝对值的总和,以获得与所述多个先前已解码频谱值相关联的所述共用脉络子区值。6.如权利要求I至5中任ー权利要求所述的音频解码器,其中所述算术解码器被配置成由先前已解码频谱值的绝对值的ー总和来导算出一有限总和值,使得由所述有限总和值表示的一可能值范围小于一可能总和值范围。7.如权利要求I至6中任ー权利要求所述的音频解码器,其中所述算术解码器被配置成依据与先前已解码频谱值的不同集合相关联的多个脉络子区值(q[i-l],q, [i],q [i+1],q[l] [i_l])来获得ー数值当前脉络值(c)。8.如权利要求7所述的音频解码器,其中所述算术解码器被配置成获得ー数值当前脉络值(C)的一数字表示,使得所述数值当前脉络值的数字表示的第一部分由多个先前已解码频谱值的绝对值的第一总和值或第一有限总和值来确定,且使得所述数值当前脉络值的数字表示的第二部分由多个先前已解码频谱值的绝对值的第二总和值或第二有限总和值来确定。9.如权利要求7或8所述的音频解码器,其中所述算术解码器被配置成获得所述数值当前脉络值(C),使得多个先前已解码频谱值的绝对值的第一总和值或第一有限总和值,及多个先前已解码频谱值的绝对值的第二总和值或第二有限总和值包含所述数值当前脉络值(C)中的不同权值。10.如权利要求7至9中任ー权利要求所述的音频解码器,其中所述算术解码器被配置成依据多个先前已解码频谱值的绝对值的一总和值或一有限总和值(q[l][i_l])来修改描述与ー或多个先前已解码频谱值相关联的一脉络状态的ー数值先前脉络值(C)的数字表示,以获得描述与ー或多个欲解码频谱值相关联的ー脉络状态的ー数值当前脉络值(C)的数字表示。11.如权利要求I至10中任ー权利要求所述的音频解码器,其中所述算术解码器被配置成检查多个脉络子区值(q[l][i-3],q[l][i_2],q[l][i-l])的一总和是否小于或等于一预定总和临界值,及依据ー检查结果来选择性地修改所述数值当前脉络值(C), 其中所述脉络子区值(q[l] [i-3],q[l] [i_2],q[l] [i_l])中的每ー个脉络子区值是相关联的多个先前已解码频谱值的绝对值的一总和值或一有限总和值。12.如权利要求I至11中的任ー权利要求所述的音频解码器,其中所述算术解码器被配置成考虑由与所述音频内容的一先前时间部分相关联的先前已解码...

【专利技术属性】
技术研发人员:古拉米福克斯马库斯穆尔特斯尼可拉斯瑞特贝哈维格纳许苏巴拉曼奥利佛威斯马克盖耶尔帕特里克沃姆博得克里斯汀格里贝尔
申请(专利权)人:弗劳恩霍弗实用研究促进协会
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1