音频编码器,音频解码器,编码音频信息,编码和解码音频信号的方法及计算机程序技术

技术编号:7131362 阅读:318 留言:0更新日期:2012-04-11 18:40
一种基于编码音频信息提供解码音频信息的音频解码器,包括基于窗口的信号变换器,被配置成将编码音频信息描述的时频表示映射至时域表示。该基于窗口的信号变换器被配置成基于窗口信息从包括具有不同过渡斜率的窗口与具有不同变换长度的窗口在内的多个窗口中选择窗口。音频解码器包括窗口选择器,被配置成评估可变码字长度窗口信息,以选择用于处理与音频信息的给定帧相关联的时频表示的给定部分的窗口。

【技术实现步骤摘要】
【国外来华专利技术】
依据本专利技术的实施例涉及一种基于输入音频信息来提供编码音频信息的音频编码器、以及一种基于编码音频信息提供解码音频信息的音频解码器。依据本专利技术的其他实施例涉及一种编码音频信息。依据本专利技术其他实施例涉及一种基于编码音频信息提供解码音频信息的方法、以及一种用于基于输入音频信息提供编码音频信息的方法。其他实施例涉及用于执行本专利技术方法的计算机程序。本专利技术的实施例涉及对联合语音/音频编码(USAC)比特流语法的建议更新。
技术介绍
在下文中,本专利技术的某些背景将被解释以帮助理解本专利技术及其优势。在过去的十年中,已在建立数字存储及分发音频内容的可能性上投入巨大的努力。此方式的一个重要成就是国际标准IS0/IEC 14496-3的定义。此标准的第3部分涉及音频内容的编码及解码,第3部分的第4子部分涉及一般音频编码。IS0/IEC 14496第3部分、第4子部分定义一般音频内容的编码及解码的概念。另外,进一步的改进被提出以改进品质及/或减少所需比特率。然而,依据该标准描述的概念,时域音频信号被转换成时频表示。该从时域到时频域的变换典型地使用变换块执行,变换块也称为时域采样的“帧”。已发现使用被移位例如半个帧的交叠帧是有利的,因为交叠允许有效地避免(或至少减少)伪像。另外,已发现应执行窗口化以避免源自对时间上有限的帧的处理的伪像。并且,窗口化允许对后续时间上移位但交叠的帧的交叠和相加过程的优化。然而,已经发现使用均一长度的窗口来有效地表现边缘(即音频内容中的急剧转变或所谓的瞬变)是有问题的,因为转变的能量将展开在窗口的整个期间上,这导致可听到的伪像。因此,提议在不同长度的窗口之间切换,使得音频内容的近似稳定的部分使用长窗口被编码,且使得音频内容的过渡部分(例如包括瞬变的部分)使用较短窗口被编码。然而,在允许在不同的窗口之间进行选择以将音频内容从时域变换成时频域的系统中,当然需要向解码器发信号通知哪个窗口应被用于解码给定帧的编码音频内容。在常规系统中,例如在依据国际标准IS0/IEC 14496-3,第3部分、第4子部分的音频解码器中,将指示用于当前帧中的窗口序列的称为“windowjequence”的数据元素以两个比特写入所谓的“icsjnfo”比特流元素中的比特流中。通过考虑先前帧的窗口序列,可以信号通知八个不同的窗口序列。鉴于以上讨论,可见由于需要信号通知所使用的窗口类型,产生表示音频信息的编码比特流的比特负载。鉴于此情况,希望创建一种构思,其允许比特率更有效地来信号通知用于音频内容的时域表示与该音频内容的时频域表示之间变换的窗口类型。
技术实现思路
上述问题通过依据权利要求1的音频编码器、依据权利要求9的音频解码器、依据权利要求12的编码音频信息、依据权利要求14的提供解码音频信息的方法、依据权利要求 15的提供编码音频信息的方法、及依据权利要求16的计算机程序来解决。依据本专利技术的实施例建立一种基于编码音频信息提供解码音频信息的音频解码器。该音频解码器包括基于窗口的信号变换器,被配置成将由编码音频信息描述的时频表示映射至音频内容的时域表示。该基于窗口的信号变换器被配置成基于窗口信息,从包括不同过渡斜率的窗口及不同变换长度的窗口的多个窗口中选择窗口。该音频解码器包括窗口选择器,其被配置成评估可变码字长度窗口信息,以选择用于处理与音频信息的给定帧相关联的时频表示的给定部分(例如,帧)的窗口。本专利技术的该实施例根据以下发现可以通过使用可变码字长度窗口信息,来减小存储或发送指示哪一类型的窗口应被用于将音频内容的时频域表示变换成时域表示的信息所要求的比特率。已发现可变码字长度窗口信息是非常适合的,因为选择适当窗口需要的信息非常适合可变码字长度表示。例如,通过使用可变码字长度窗口信息,因为短变换长度典型地不被用于具有一或两个长过渡斜率的窗口,所以过渡斜率的选择与变换长度的选择之间的相依性可被利用。因此,冗余信息的传送可使用可变码字长度信息来避免,以提高编码音频信息的比特率效率。再如,应注意在相邻帧的窗口形状之间典型地存在相关性,在另一相邻窗口(相邻于当前考虑的窗口)的窗口类型限制了当前帧的窗口类型选择的情况下,这种相关性也可被利用以选择性地减少窗口信息的码字长度。综上所述,可变码字长度窗口信息的使用允许在不显著增加音频解码器的复杂性且不改变音频解码器的输出波形的情况下节省比特率(当与恒定码字长度窗口信息相比较时)。并且,编码音频信息的语法甚至可在一些情况中被简化,稍后将进一步详细讨论。在优选实施例中,音频解码器包括比特流解析器,被配置为解析表示编码音频信息的比特流,且从比特流提取1比特窗口斜率长度信息,且依据该1比特斜率长度信息的值从比特流选择性地提取1比特变换长度信息。在此情况中,窗口选择器较佳地被配置成依据窗口斜率长度信息,选择性地使用或忽略变换长度信息,以选择用于处理时频表示的给定部分的窗口。通过使用上述构思,可以获得窗口斜率长度信息与变换长度信息之间的分离,在一些情况中有助于简化映射。并且,窗口信息被分裂成强制窗口斜率长度比特、以及变换长度比特,变换长度比特的存在取决于窗口斜率长度比特的状态,这允许极有效的比特率降低,这可在保持比特流的语法足够简单的同时获得。因此,比特流解析器的复杂度维持足够地低。在较佳实施例中,该窗口选择器被配置成依据被选择用于处理时频信息的先前部分(例如,先前音频帧)的窗口类型,选择用于处理该时频信息的当前部分(例如,当前音频帧)的窗口类型,使得用于处理时频信息的当前部分的窗口的左侧窗口斜率长度与选择用于处理时频信息的先前部分的窗口的右侧窗口斜率长度相匹配。通过利用此信息,选择处理时频信息的当前部分的窗口类型所需要的比特率特别小,因为用于选择窗口类型的信息以特别低的复杂性被编码。特别地,不需要“浪费”比特来编码与时频信息的当前部分相关联的窗口的左侧窗口斜率长度。因此,通过使用与用于处理时频信息的先前部分的右侧窗口斜率长度的信息有关的信息,可以使用两个比特(例如,强制的窗口斜率长度比特及可选择的变换长度比特)从多于四个的多个可选择窗口中选择适当窗口。因此,不必要的冗余被避免,且编码比特流的比特率效率得到提高。在较佳实施例中,若用于处理时频信息的先前部分的窗口的右侧窗口斜率长度采取“长”值(当与指示相对较短的窗口斜率长度的“短”值相比时,指示相对较长的窗口斜率长度),且若时频信息的先前部分、时频信息的当前部分及时频信息的后续部分全部以频域核心模式编码,窗口选择器被配置成依据1比特窗口斜率长度信息的值,在第一类型窗口与第二类型窗口之间进行选择。若用于处理时频信息的先前部分的右侧窗口斜率长度采取“短”值(如上所述), 且若时频信息的先前部分、时频信息的当前部分及时频信息的后续部分全部以频域核心模式编码,窗口选择器较佳地也被配置成响应于1比特窗口斜率长度信息的第一值(例如,值 “1”),选择第三类型的窗口。另外,若1比特窗口斜率长度信息采取表示短右侧窗口斜率的第二值(例如,“0” 值),且若用于处理时频信息的先前部分的窗口的右侧窗口斜率长度采取“短”值(如上所述),且若时频信息的先前部分、时频信息的当前部分及视频部分的后续部分全部以频域核心模式编码,窗口选择器较佳地也被配置成依据1比特变换长度信息在第本文档来自技高网
...

【技术保护点】
1.一种基于编码音频信息(210)提供解码音频信息(212)的音频解码器(200),该音频解码器包括:基于窗口的信号变换器(250),被配置成将由该编码音频信息(210)描述的音频信息的时频表示(242)映射至该音频信息的时域表示(252),其中该基于窗口的信号变换器被配置成使用窗口信息(272),从多个窗口(310,312,314,316,318)中选择窗口,所述多个窗口(310,312,314,316,318)包括具有不同过渡斜率(310a,312a,314a,316a,318a,310b,312b,314b,316b,318b)的窗口以及具有相关联的不同变换长度的窗口;其中该音频解码器(200)包括:窗口选择器(270),被配置成评估可变码字长度窗口信息(224),以选择窗口用于处理所述时频表示的与所述音频信息的给定帧相关联的给定部分。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:拉尔夫·盖格尔
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1