产生编码多通道信号的设备和方法、对编码多通道信号进行解码的设备和方法技术

技术编号:3688579 阅读:248 留言:0更新日期:2012-04-11 18:40
在用于产生多个不同参数集的多通道编码器中,编写(25)数据流(26),以使两个参数集是彼此独立地可解码的,其中,所述参数集是用于使用至少一个传输通道来重建多通道输出信号的。因此,使多通道解码器能够在读取数据流时跳过标记为可选和/或具有更高版本号的参数集,并仍然能够使用标记为强制性的数据集或具有足够低的版本号的数据集,来执行有效的多通道重建。这实现了以向后兼容性和可靠性为特征的、适合将来的更新的灵活的编码器/解码器构思。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及参数音频多通道处理技术,具体涉及当存在可用于重建的多个不同参数集时对参数辅助信息的高效配置。
技术介绍
除了两个立体声通道之外,所推荐的多通道环绕表征还包括中央通道C和两个环绕通道,即左环绕通道L和右环绕通道R,此外,如果可应用,则还包括称作LFE通道(LFE=低频增强)的超低音扬声器通道。这种参考声音格式也称作3/2(加LFE)立体声,近来也称作5.1多通道,表示有三个前通道、两个环绕通道和一个LFE通道。一般而言,这种所推荐的多通道环绕表征需要5或6个传输通道。在再现环境中,5个各自不同的位置上至少需要5个扬声器,以获得与5个正确放置的扬声器相隔确定距离的最优的所谓最佳听音位置。然而,相对于超低音扬声器的定位,可以相对自由地使用超低音扬声器。已有多种技术用于减少传输多通道音频信号所需的数据量。这些技术也称作联合立体声技术。为此参考图5。图5示出了联合立体声设备60。例如,这种设备可以是实现强度立体声技术(IS技术)或技术心理声学编码(BCC)的设备。这种设备一般接收至少两个通道(CH1、CH2、...CHn)作为输入信号,并输出至少一个单载波通道(缩混)和参数数据(即,一个或多个参数集)。对参数数据进行定义,从而可以在解码器中计算每个原始通道(CH1、CH2、...CHn)的近似。通常,载波通道将包括子带采样、频谱系数或时域采样等,提供了下层(underlying)信号的相对精细的表征,而参数数据和/或参数集不包括任何这种采样或频谱系数。取而代之的是,参数数据包括用于对诸如乘法加权、时移、频移等确定的重建算法进行控制的控制参数。因此,参数数据只包括信号或关联通道的相对粗略的表征。当以数字表达时,载波通道所需的数据量在60到70kbit/s的范围中,而参数辅助信息所需的数据量在每通道1.5kbit/s的量级上。参数数据的一个示例是如将在以下描述的公知的缩放因子、强度立体声信息或技术心理声学参数。在AES preprint 3799中由J.Herre,K.H.Brandenburg和D.Lederer所著的题为“Intensity stereo coding”,1994年2月,Amsterdam中描述了强度立体声编码技术。一般而言,强度立体声的概念基于要应用于两个立体声音频通道数据的主轴变换。如果将大多数数据点设置在第一主轴周围,则可以通过在编码之前将两个信号均旋转确定角度来实现编码增益。但是,这并不总是适用于实际立体声再现技术。左和右通道的重建信号包括相同传输信号的不同加权或缩放的版本。虽然重建信号在幅度上不同,但是相对于相位信息是相同的。但是,两个原始音频通道的能量时间包络是通过典型地以频率选择形式而操作的选择性缩放操作来保持的。这与高频上的人类声音感知相对应,在高频上,主导空间提示由能量包络确定。此外,在实际实现中,传输信号(即,载波通道)由左通道和右通道的和信号形成,而不是通过旋转两个分量来形成。此外,以频率选择方式,即,针对每个缩放因子频带(即,针对每个编码器频率部分)彼此独立,来执行这种处理(即,用于执行缩放操作的强度立体声参数的产生)。优选地,将两个通道组合,形成组合或“载波”通道。除了组合通道之外,对强度立体声信息进行确定还取决于第一通道的能量、第二通道的能量和组合或和通道的能量。在AES convention paper 5574中的C.Faller和F.Baumgarte所著的题为“Binaural cue coding applied to stereo and multi-channel audiocompression”,2002年5月,München中描述了BCC技术。在BCC编码中,使用具有交迭窗的基于DFT的变换,将多个音频输入通道转换为频谱表征。将得到的频谱划分为非交迭部分。每个部分具有与等效矩形带宽(ERB)成比例的带宽。针对每个部分,即,针对每个频带和针对每一帧k(即,时间采样块),来计算所谓的通道间电平差(ICLD)和所谓的通道间时间差(ICTD)。对ICLD和ICTD参数进行量化和编码,以获得BCC比特流。通道间电平差和通道间时间差是相对于参考通道而给予每个通道的。具体地,取决于要处理信号的特定划分,根据预定公式计算参数。在解码器侧,解码器接收单声道信号和BCC比特流(即,针对通道间时间差的第一参数集和针对通道间电平差的第二参数集)。将单声道信号变换到频域,并输入到也接收已解码的ICLD和ICTD值的合成块中。在合成块或重建块中,使用BCC参数(ICLD和ICTD)执行对单声道信号的加权操作,以重建多通道信号,然后,在经过频率/时间转换之后,多通道信号代表原始多通道信号音频信号的重建。在BCC的情况下,联合立体声模块60进行操作,以输出通道辅助信息,从而将参数通道数据量化和编码为ICLD和ICTD参数,其中原始通道之一可以用作对通道辅助信息进行编码的参考通道。通常,载波通道由参与原始通道之和形成。当然,上述技术只为仅能够对载波通道进行解码的解码器提供了单声道表征,而无法产生用于生成多于一个输入通道的一个或多个近似的参数数据。在美国专利申请US 2003/0219130 A1、2003/0026441 A1和2003/0035553 A1中也描述了称作BCC技术的音频编码技术。此外,见C.Faller和F.Baumgarte所著的“Binaural Cue Coding.Part.IISchemes and Applications”,IEEETransactions on Audio and SpeechProc.,Vol.11,No.6,1993年11月。此外,还见C.Faller和F.Baumgarte所著的“Binaural Cue Coding applied to Stereo and Multi-Channel Audiocompression”,Preprint,112thConvention of the Audio EngineeringSociety(AES),2002年5月,以及J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer和C.Spenger所著的“MP3 SurroundEfficient andCompatible Coding of Multi-Channel Audio”,116thAES Convention,Berlin,2004,Preprint 6049。在下文中,将参考图6到8,更加详细地描述用于多通道音频编码的典型通用BCC方案。图6示出了用于多通道音频信号的编码/传输的通用BCC编码方案。在BCC编码器112的输入110处输入多通道音频输入信号,并在所谓的缩混块114中对其进行“缩混”,即,转换为单个和通道。在本示例中,输入110处的信号是5通道环绕信号,具有前左通道和前右通道、左环绕通道和右环绕通道、以及中央通道。典型地,缩混块通过将这5个通道简单地相加成单声道信号,来产生和信号。其它缩混方案在本领域中是公知的,所有方案均使用多通道输入信号来产生具有单通道或具有多个缩混通道的缩混信号,其中,缩混通道的数目无论如何都少于原始输入通道的数目。在本文档来自技高网...

【技术保护点】
一种用于产生编码多通道信号的设备,所述编码多通道信号代表包括N个原始通道的未编码多通道信号,其中,N等于或大于2,所述设备包括:提供装置(22),用于提供从M个传输通道(23)中重建K个输出通道的参数信息(24a,24b,24c),其中,M等于或大于1并等于或小于N,K大于M并等于或小于N,所述参数信息包括用于重建同一个输出通道的至少两个不同的参数集;以及编写装置(25),用于编写数据流(26),其中,所述装置(25)设计用于将所述第一和第二参数集写入数据流,从而在不使用所述第二参数集和所述M个传输通道(23)中的至少一个的情况下,来进行对所述K个输出通道中的至少一个的重建。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:于尔根赫勒拉尔夫施佩尔施奈德约翰内斯希尔珀特卡斯滕林茨迈尔哈拉尔德波普
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1