信息信号的编码制造技术

技术编号:5459764 阅读:233 留言:0更新日期:2012-04-11 18:40
本发明专利技术可以圆满地解决瞬变问题,并且如果利用其中不移位帧边界(902a、902b)的新SBR帧类,即,网格边界仍旧与帧边界(902a、902b)同步,则可以针对解决瞬变问题而降低另一解码延迟,但是,其中,瞬变位置的指示还用作语法元素,以便在该新帧类的帧内使用语法元素,从而在编码器和/或解码器侧确定这些帧内的网格边界。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及信息信号编码,如音频编码,并且在该上下文中,具体涉及SBR (频带复制)编码。
技术介绍
在具有极小可用比特率的应用中,在对音频信号进行编码的上下 文中,已知使用SBR技术进行编码。仅低频部分被完全编码,S卩,以 足够的时间和空间分辨率被编码。对于高频部分,仅检测到谱包络或 音频信号的谱时间曲线的包络,并对其进行编码。在解码器侧,低频 部分是从己编码的信号获取到的,并随后用于从该信号中重构或"复 制"高频部分。然而,为了使己预先重构的高频部分的能量适配于原 始音频信号的高频部分内的实际能量,在解码器侧使用所发送的谱包 络来对预先重构的高频部分进行谱加权。当然,对于上述有价值的工作,重要的是,用于发送谱包络的比 特的数目要尽可能少。因此,期望在其中对谱包络进行编码的时间网 格尽可能粗。然而,另一方面,太粗的网格会导致显著的可听伪像, 特别地还带有瞬变,S卩,在高频部分占优势而不是如平常情况低频部 分占优势的位置处,或者在高频部分的振幅至少快速增大的位置处。 在音频信号中,这样的瞬变与例如音符的开始相对应,例如,对钢琴 琴弦的触动等。如果网格在瞬变时间段上太粗,则可能会在整个音频 信号的解码器侧重构过程中导致可听伪像。如己知的那样,在解码器 侧,从低频部分重构高频信号在于,在网格区域内,解码后的低频部 分的谱能量被归一化,并适配于通过加权而发送的谱包络。换言之, 在网格区域内简单执行谱加权,以便从低频部分再现高频部分。然而, 如果瞬变周围的网格区域太大,则在该网格区域内,除了瞬变能量外, 许多能量将被定位于用于再现高频部分的低频部分中的背景和/或和弦部分。通过加权因子协同放大所述低频部分,即便这不会产生对高 频部分的良好估计。在整个网格区域上,这将导致可听伪像,此外, 可听伪像甚至将设置在实际瞬变之前。该问题也可被称作"前回声"。 当瞬变周围的网格区域足够精细以使该网格区域内的低频部分 的瞬变/背景部分比率得到提高时,能够解决该问题。然而,小网格区 域或小网格边界距离是上述期望谱包络编码低比特消耗的障碍。在ISO/IEC 14496-3标准(以下简称为"该标准")中,在AAC编 码器上下文中描述SBR编码。AAC编码器以逐帧的方式对低频部分进 行编码。对于每一个这样的SBR帧,定义以上指定的时间和频率分辨 率,在这样的时间和频率分辨率下,在该帧中对高频部分的谱包络进 行编码。为了解决瞬变也可能落在SBR帧边界上的问题,该标准允许, 可以临时定义时间网格,以使网格边界不必与帧边界重合。更确切地, 在该标准中,编码器每帧向解码器发送语法元素bs—frame—class,所述 语法元素指示,对于每一帧,将针对相应帧的谱包络网格的时间网格 精确地定义在两个帧边界之间还是定义在偏离于帧边界(具体而言, 在前和/或在后)的边界之间。总之,有四种不同的SBR帧类,艮P, FIXFIX、 FIXVAR、 VARFIX禾卩VARVAR。在图12的伪码表示中示出 了定义每SBR帧中网格的标准中的编码器所使用的语法。具体地,在 图12的表示中,由编码器实际编码和/或发送的那些语法元素在图12 中以黑体字打印,在相应的行中右起第二列指示用于发送和/或编码的 比特的数目。可见,对于每个SBR帧,首先发送刚提到的语法元素 bs—frame—class。根据该语法元素,以下将示出的其他语法元素定义了 时间分辨率和/或网格。例如,如果2比特的语法元素bs一frame一class指 示所提到的SBR帧是FIXFIX SBR帧,则定义在该SBR帧中网格区域数 目和/或定义包络数目(如2一)的语法元素tmp将作为第二语法元素而 被发送。根据bs—num—env来自动调整语法元素bs一ampj:es,并不对语 法元素bs—amp一res进行编码或将其发送,其中语法元素bs—amp一res用 于在当前SBR帧中对谱包络进行编码所需要的量化步长。最后,对于 FIXFIX帧,发送比特以确定网格的频率分辨率bs一freq—res。针对一个 帧精确定义FIXFIX帧,g卩,网格边界与如由AAC编码器所定义的帧边界重合。这对于其他三个类是不同的。对于FIXVAR、 VARFIX和VARVAR 帧,发送语法元素bs—var—bord—1和/或bs—ba匸bodJ)以指示时隙(即, 用于对音频信号进行谱分解的滤波器组借以进行操作的时间单位)的 数目,其为相对于正常帧边界的偏移。根据该语法元素,还发送语法 元素bs—num—rel—1及关联的tmp和/或bs—num_rel—0及关联的tmp,以定 义多个网格区域、或包络、及其距偏移帧边界的大小。最后,还在可 变SBR帧中发送语法元素bsjointer,所述语法元素指向所定义的包络 之一,并用于根据谱包络网格来定义用于确定帧内噪声部分的一个或 两个噪声包络,然而,为了简化表示,以下将不再详细说明该语法元 素。最后,针对相应可变帧中的所有网格区域和/或包络,确定相应的 频率分辨率,即每包络的相应l比特语法元素bs一frecLres。作为示例,图13a表示FIXFIX帧,其中,语法元素tmp是l,从而 包络的数目是bs—num_eiw 2'-2。在图13a中,假设时间轴以水平方式 从左向右延伸。SBR帧(即,AAC编码器对低频部分进行编码所在的 帧之一)由图13a中的附图标记902指示。可见,SBR帧902具有16QMF 时隙长度,如所述,QMF时隙是分析滤波器组进行操作所在的作为单 位的时隙,QMF时隙由图13a中的方框904所指示。在FIXFIX帧中,包 络或网格区域906a和906b (即,这里数目为2)在SBR帧卯2中具有相 同长度,从而在SBR帧902的中心精确地定义时间网格和/或包络的边 界908。采用这种方式,图13a的示例性FIXFIX帧定义根据分析滤波 器组的谱值,在时间上确定网格区域或包络906a的谱分布和包络906 的另一谱分布。因此,包络或网格区域906a和906b指定在其中对谱包 络进行编码和/或将谱包络发送的网格。通过比较,图13b示出了VARVAR帧。再次指示了SBR帧902及关 联的QMF时隙904。然而,对于该SBR帧,语法元素bs—var—bord—0和/ 或bs—var—bord—l已定义与其关联的包络906a'、 906b,和906c,并非在 SBR帧起始卯2a处开始和/或在SBR帧结尾卯2b处结束。更确切地,可 以从图13b看出,前一SBR帧(在图13b中未示出)己被扩展到当前SBR 帧的SBR帧起始902a之外两个QMF时隙,从而前一SBR帧的最后一个包络910也扩展进当前SBR帧902。当前帧的最后一个包络906c,也扩展 到当前SBR帧902的SBR帧结尾之外,即,作为示例,这里也扩展了两 个QMF时隙。此外,作为示例,这里还可以看出,利用如下附加信息 将VARVAR帧的语法元素bs—num—rel—0和bs—num—rel—l分别调整至l: 由此定义的包络(即根据tmp^,为906a,和906b,)在SBR帧902的起 始和结尾处具有四个QMF时隙的长度,从而从帧边界以该时隙数扩展 进SBR帧902。然后,SBR帧902的剩余空间将由剩本文档来自技高网...

【技术保护点】
一种编码器,包括: 用于以信息信号的帧(902)为单位对信息信号的低频部分进行编码的装置(104、106); 用于在信息信号内定位瞬变的装置(118); 用于根据定位将至少两个可能的重构模式(FIXFIX、LD_TRAN) 当中的相应重构模式与信息信号的帧相关联、以及对于已与所述至少两个可能的重构模式中的第一个(LD_TRAN)相关联的帧来将相应的瞬变位置指示(bs_transient_position)与所述帧相关联的装置(116);以及 装置(110 、112、114),用于在依赖于与所述帧相关联的重构模式的时间网格中,产生信息信号的高频部分的谱包络的表示,从而对于与所述至少两个可能的重构模式中的第一个相关联的帧,所述帧(902)的帧边界(902a、902b)与网格(222a、220、222b)的网格边界重合,并且所述帧内的网格的网格边界依赖于瞬变位置指示(T);以及 用于将已编码的低频部分、谱包络表示、以及与关联重构模式和瞬变位置指示有关的信息组合进已编码的信息信号中的装置(108)。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:马库斯施内尔迈克尔舒尔特曼弗雷德卢茨基曼努埃尔扬德尔
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1