用于生成对低位速率应用的参数表示的方案制造技术

技术编号:3688629 阅读:159 留言:0更新日期:2012-04-11 18:40
为了生成对尤其适合于低位速率应用的多声道信号的参数表示,使用方向参数信息只对播放装置内的最大声能的位置进行编码和发送。为了进行多声道重构(54),由方向参数信息对由方向参数信息标识的输出声道的能量分布进行控制(57),而不由方向参数信息来对剩余环境声道(59)中的能量分布进行控制。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及使用空间参数对音频信号的多声道表示进行编码。本专利技术教导了用于对用于根据比输出声道的数量少的声道数量重新创建多声道信号的参数进行定义和估计的新方法。具体地,本专利技术旨在使得多声道表示的位速率最小化,并提供了多声道信号的编码表示,其使得能够容易地针对所有可能的声道配置对数据进行编码和解码。
技术介绍
随着对例如广播系统中的多声道音频的兴趣的增长,对数字低位速率音频编码技术的需求是明显的。在PCT/SE02/01372“Efficient andscalable Parametric Stereo Coding for Low Bitrate Audio CodingApplications”中表明,可以根据立体声声像的单声道缩混(down mix)信号和附加的非常简洁的参数表示,重新创建出与原始立体声声像非常接近地类似的立体声声像。基本原理是将输入信号分成多个频带和时间段,对于这些频带和时间段,估计声道间强度差(IID)和声道间相参性(ICC),第一个参数是对特定频带中的两个声道之间的功率分布的测度,第二个参数是对特定频带的两个声道之间的相关性的估计。在解码器侧,通过根据所发送的IID数据将单声道信号分布在两个输出声道之间,并通过添加去相关环境信号以保持原始立体声声道的声道相关性质,来根据单声道信号重新创建立体声声像。存在根据立体声信号创建多声道输出的几种矩阵化技术。这些技术通常依靠相位差来创建后置声道(back channel)。通常,与前置声道(front channel)相比,后置声道稍微延迟。为了使得性能最大化,在编码器侧使用从多声道信号到两个立体声基本声道的特殊的缩混规则来创建立体声文件。这些系统通常具有稳定的前置声像而在后置声道中具有一些环境声音,并且将复杂声音材质分离到不同扬声器中的能力有限。存在几种多声道配置。最公知的配置是5.1配置(中声道、左前/右前、左环绕/右环绕以及LFE声道)。ITU-R BS.775定义了用于获得包括比给定声道配置少的声道的声道配置的几种缩混方案。不是始终必须对所有声道进行解码并依赖于缩混,而是在对声道进行解码之前,可能期望如下多声道表示,其使得接收器能够方便地提取针对播放声道配置的相关参数。另一另选缩混方案是具有可以映射到解码器侧的任何扬声器组合的多个参数。此外,从可调节(scalable)或嵌入式编码的观点出发,期望固有地可调节的参数集合,其中例如可以将与环绕声道相对应的数据以位流形式存储在增强层中。在现有技术中,使用总和信号或缩混信号和附加的参数化侧信息的另一多声道信号表示被公知为双耳暗示编码(BCC)。在以下文献中描述了该技术“Binaural Cue Coding-Part 1Psycho-AcousticFundamentals and Design Principles”,IEEE Transactions on Speechand Audio Processing,vol.11,No.6,November 2003,F.Baumgarte,C.Faller和“Binaural Cue Coding.Part IISchemes and Applications”,IEEE Transactions on Speech and Audio Processing,vol.11,No.6,November 2003,C.Faller and F.Baumgarte。通常,双耳暗示编码是用于基于一个缩混的音频声道和侧信息进行多声道空间渲染的方法。要由BCC编码器计算并由BCC编码器使用以进行音频重构或音频渲染的几个参数包括声道间水平差、声道间时间差、以及声道间相参性参数。这些声道间暗示是用于感知空间图像的决定性因素。对原始多声道信号的时间采样的块赋予这些参数,并且这些参数是频率选择性的,以使得多声道信号采样的每个块都具有针对若干频带的若干暗示。在C播放声道的通常情况下,在多个声道对之间的每个子带中(即,针对相对于参考声道的每个声道)考虑声道间水平差和声道间时间差。将一个声道定义为对于每个声道间水平差的参考声道。根据声道间水平差和声道间时间差,可以将源渲染到所使用的播放装置的多个扬声器对中的一对之间的任何方向。为了确定所渲染的源的宽度或漫射性,针对所有音频声道,每子带考虑一个参数就足够了。该参数是声道间相参性参数。通过修改子带信号使得所有可能的声道对具有同一声道间相参性参数来控制所渲染的源的宽度。在BCC编码中,所有声道间水平差都是在参考声道1与任何其他声道之间确定的。例如,当将中声道确定为参考声道时,计算左声道与中声道之间的第一声道间水平差、右声道与中声道之间的第二声道间水平差、左环绕声道与中声道之间的第三声道间水平差、以及右环绕声道与中声道之间的第四声道间水平差。此情况描述了5声道方案。当5声道方案附加地包括低频增强声道(其也被称为“重低音(sub-woofer)”声道)时,计算该低频增强声道与中声道(其为唯一的参考声道)之间的第五声道间水平差。当使用单个缩混声道(其也被称为“单”声道)和所发送的诸如ICLD(声道间水平差)、ICTD(声道间时间差)以及ICC(声道间相参性)的暗示来重构原始多声道时,使用这些暗示来修改单声道信号的谱系数。使用确定了各谱系数的水平修改的正实数来执行水平修改。使用确定了各谱系数的相位修改的量值的复数来生成声道间时间差。另一个函数确定了相参性影响。通过首先计算参考声道的因子来计算各声道的水平修改的因子。将参考声道的因子计算成使得针对各频率划分,所有声道的功率之和等于总和信号的功率。然后,基于参考声道的水平修改因子,使用相应的ICLD参数来计算其他声道的水平修改因子。由此,为了执行BCC合成,要计算参考声道的水平修改因子。为了进行该计算,需要针对频带的所有ICLD参数。然后,基于单个声道的该水平修改,可以计算出其他声道(即,不是参考声道的声道)的水平修改因子。该方法的缺点在于,为了完全重构,需要每一个声道间水平差。当存在易出错的发送声道时,该要求更加成问题。所发送的声道间水平差中的每个错误都会导致所重构的多声道信号的错误,因为需要每一个声道间水平差来计算每一个多声道输出信号。此外,当在发送过程中丢失了声道间水平差时,不可能进行重构,尽管只有例如左环绕声道或右环绕声道需要该声道间水平差,而这些声道对于多声道重构来说不是那么重要,因为在左前声道(随后被称为左声道)、右前声道(随后被称为右声道)或中声道中包括了大部分信息。当在发送过程中丢失了低频增强声道的声道间水平差时,该情况变得更差。在此情况下,不可以进行多声道重构或者只可以进行错误的多声道重构,尽管低频增强声道对于听众的听觉舒适来说不是那么决定性的。由此,单个声道间水平差的错误被蔓延为所重构的多个输出声道中的每一个内的错误。虽然这些多声道参数化方案基于对能量分布进行充分重构的意图,但是为了对能量分布进行这种正确的重构而必须付出的代价是增大的位速率,因为必须发送用于进行空间能量分布的大量声道间水平差或平衡参数。尽管这些能量分布方案自然不会执行对原始声道的时间波形的精确重构,然而由于精确的能量分布特性,它们无论如何也会得到足够的输出声道质量。然而,对于本文档来自技高网...

【技术保护点】
一种用于生成对具有至少3个原始声道(L、R、Rs)的原始多声道信号的参数表示的设备,所述参数表示包括方向参数信息,该方向参数信息被用于连同从所述至少3个原始声道推导出的基本声道一起来对具有至少2个声道的输出信号进行重构,所述原始声道与位于播放装置中的不同空间位置处的多个声源(103、104、105)相关联,所述播放装置具有参考位置(10),该设备包括:    方向信息计算器(50),用于确定表示从所述播放装置中的所述参考位置(16)到所述至少3个原始声道的组合声能所集中(14)的区域(12)的方向的方向参数信息;和    数据输出生成器(52),用于生成所述参数表示,使得所述参数表示包括所述方向参数信息。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:弗莱德里克赫恩乔纳斯罗丹
申请(专利权)人:编码技术股份公司
类型:发明
国别省市:SE[瑞典]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1