近透明或透明的多声道编码器/解码器方案制造技术

技术编号:6925816 阅读:180 留言:0更新日期:2012-04-11 18:40
多声道编码器/解码器方案优选地另外产生波形类型的残留信号(16)。将所述残留信号(16)与一个或多个多声道参数(14)一起传输到解码器中。与纯参数多声道解码器相比,增强型解码器由于另外的残留信号而产生具有改进的输出质量的多声道输出信号。

【技术实现步骤摘要】

本专利技术涉及多声道编码方案,具体涉及参数多声道编码方案。
技术介绍
如今,有两种技术在充分利用立体声音频信号中所包含的立体声冗余和不相干方面占优势。中侧(M/S)立体声编码,主要针对冗余去除,并基于以下事实由于两个声道经常完全相关,因此对这两个声道之和以及差进行编码更加有益。因此,与较低功率侧信号 (side signal)(或差信号)相比,可以在高功率的和信号上消耗更多比特。另一方面,强度立体声编码在每个子带上通过以和信号和方位角代替两个信号来实现不相干去除。 在解码器中,将方位角参数用于控制由子带和信号所表示的听觉事件的空间位置。将中侧和强度立体声广泛地用于现有的音频编码标准W]。M/S方法关于冗余利用的问题在于,如果两个分量异相(一个相对于另一个延迟),则M/S编码增益为零。这是概念问题,因为在实际的音频信号中时间经延迟频繁发生。 例如,空间听力在很大程度上依靠信号(尤其是低频率信号)之间的时间差。在音频记录中,时间延迟源于立体声麦克风装备,以及人工后处理(音响效果)。在中侧编码中,经常将自组织解决方案用于时间延迟问题中在不同信号的功率小于和信号的功率的常因子时只采用M/S编码。在W]中更好地提出了对准问题,在其中从另一个信号分量来预测信号分量之一。在编码器中,逐帧得到预测滤波器,并将其作为侧信号方面信息进行传输。 在中,考虑了反向自适应备选。要注意的是,性能增益很大程度上取决于信号类型,但是针对特定类型的信号,获得了与M/S立体声编码相比的显著增益。近来,参数立体声编码受到了很大关注。基于核心单声道(单一声道)编码器,这种参数方案提取了立体声(多声道)分量,并以相对低的比特率对其进行独立编码。可以将此看作强度立体声编码的概括。参数立体声编码方法在音频编码的低比特率范围内特别有用,这导致只将全部比特预算中的一小部分用于立体声分量的质量的显著增长。参数方法还由于可以缩放到多声道(多于两个声道)情况并具有提供反向兼容的能力而引人注目MP3环绕声就是这样的一个示例,其中对多声道数据进行编码,并通过数据流的侧信号声场进行传输。这允许接收机不具有对正常的立体声信号进行编码的多声道性能,但是环绕声使能的接收机可以享有多声道音频。参数方法经常依靠对不同的技术心理声学,主要是声道间电平差(ICLD’ s)和声道间时间差(ICTD’ S)。在中,提出了相干参数对于固有的音响效果具有重要意义。然而,参数方法受到以下限制由于固有的模型限制,编码器在较高比特率时不能够达到透明质量。该问题涉及参数多声道编码器,该参数多声道编码器的最大可获得质量值被限制到明显在透明质量之下的阈值。参数质量阈值如图11中的1100所示。从表示根据BBC增强型单声道编码器(110 的质量/比特率的示意性曲线图中可以看出,该质量不能超过与比特率无关的参数质量阈值1100。这意味着,即使使用增大的比特率,这种参数多声道编码器的质量也不再增大。BCC增强型单声道编码器是针对当前存在的立体声编码器或多声道编码器的示例,在其中执行立体声-下混音或多声道下混音。此外,通过描述声道间电平关系、声道间时间关系、声道间相干关系等导出参数。该参数不同于诸如中侧编码器的侧信号之类的波形信号,因为与参数表示相比, 该侧信号描述了以波形格式存在的两个声道之差,这通过给出特定参数而非逐个样本的波形表示描述了两个声道之间的相似性或相异性。在参数需要用于从编码器传输到解码器的少量比特的同时,波形描述,即从波形中导出的残留信号,需要比理论上所允许的透明重构更多的比特。图11示出了根据这种基于波形的传统的立体声编码器(1104)的典型质量/比特率。从图11中可以明显看出,比特率越大,诸如中侧立体声编码器的传统立体声编码器的质量也越高,直至该质量达到透明质量。存在一种“交叉比特率”,在这个比特率处,参数多声道编码器的特性曲线1102和传统的基于波形的立体声编码器的曲线1104相互交叉。在这个交叉(cross-over)比特率之下,参数多声道编码器远优于传统的立体声编码器。当针对两个编码器考虑同一比特率时,参数多声道编码器提供了比传统的基于波形的立体声编码器的质量高出质量差1108的质量。换言之,当希望具有特定质量1110时, 可以使用参数编码器按照与传统的基于波形的立体声编码器相比减少了差比特率1112的比特率来实现这个质量。然而,在交叉比特率之上,情况则完全不同。因为参数编码器处于其最大参数编码器质量阈值1100,所以可以只通过使用传统的基于波形的立体声编码器来获得较好的质量,该立体声编码器使用与参数编码器中所使用的相同数量的比特。
技术实现思路
本专利技术的目的是提供一种与现有多声道编码方案相比允许增大的质量和减少的比特率的编码/解码方案。根据本专利技术的第一方面,这个目的可以由多声道编码器来实现,该多声道编码器用于对具有至少两个声道的原始多声道信号进行编码,该多声道编码器包括参数提供器, 用于提供一个或多个参数,形成一个或多个参数,使得可以使用从多声道信号和一个或多个参数中所导出的一个或多个下混音信号来形成重构多声道信号;残留信号编码器,基于原始多声道信号、一个或多个下混音声道或一个或多个参数来产生已编码的残留信号,所以使用残留信号所形成的重构多声道信号比不使用残留信号所形成的重构多声道信号与原始多声道信号更相似;以及数据流成形器,用于形成具有残留信号以及一个或多个参数的数据流。根据本专利技术的第二方面,这个目的可以由多声道解码器来实现,该多声道解码器用于对具有一个或多个下混音声道、一个或多个参数以及已编码的残留信号的已编码的多声道信号进行解码,该多声道解码器包括残留信号解码器,用于基于已编码的残留信号产生已解码的残留信号;以及多声道解码器,用于使用一个或多个下混音声道和一个或多个参数来产生第一重构多声道信号,其中该多声道解码器还可以用于使用一个或多个下混音声道和已解码的残留信号来代替第一重构多声道信号或者除了第一多声道信号之外又产生第二重构多声道信号,其中该第二重构多声道信号比第一重构多声道信号与原始多声道信号更为相似。根据本专利技术的第三方面,这个目的可以由多声道编码器来实现,该多声道编码器用于对具有至少两个声道的原始多声道信号进行编码,该多声道编码器包括时间对准器, 用于使用对准参数对至少两个声道的第一声道和第二声道进行对准;下混音器,用于使用已对准的声道产生下混音声道;增益计算器,计算用于对已对准的声道进行加权的不等于 1的增益参数,因此与增益值1相比,已对准的声道之间的差减少;以及数据流成形器,用于形成具有关于下混音声道的信息、关于对准参数的信息以及关于增益参数的信息的数据流。根据本专利技术的第四方面,这个目的可以由多声道解码器来实现,该多声道解码器用于对具有关于一个或多个下混音声道的信息、关于增益参数的信息、关于对准参数的信息的已编码的多声道信号进行解码,该多声道解码器包括下混音声道解码器,用于产生已解码的下混音信号;以及处理器,用于使用增益参数对已解码的下混音声道进行处理,以获得第一解码输出声道,此外该处理器使用增益参数对已解码的下混音声道进行处理,并使用对准参数进行解对准,以获得第二解码输出声道。本专利技术的另一个方面包括相应的方法、数据流/文件和计算机程序。本专利技术基于本文档来自技高网
...

【技术保护点】
1.一种多声道编码器,用于对具有至少两个声道的原始多声道信号进行编码,所述多声道编码器包括:参数提供器(14),用于提供一个或多个参数,形成所述一个或多个参数,使得可以使用一个或多个下混音声道以及一个或多个参数来形成重构多声道信号,所述下混音声道是从原始多声道信号中获得的;残留信号编码器(16),用于基于原始多声道信号、一个或多个下混音声道、或一个或多个参数来产生已编码的残留信号,使得使用残留信号所形成的重构多声道信号比没有使用残留信号所形成的重构多声道信号与原始多声道信号更相似,所述残留信号编码器(16)包括:多声道解码器(55),通过使用一个或多个下混音声道和一个或多个参数来产生已解码的多声道信号;差错计算器(56),用于基于已解码的多声道信号和原始多声道信号来计算多声道差错信号表示;以及残留信号处理器(57),用于对多声道差错信号表示进行处理,以获得已编码的残留信号;以及数据流成形器(18),用于形成具有已编码的残留信号和一个或多个参数的数据流。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:约纳斯·林德布罗姆
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1