多声道环绕声的个性化解码制造技术

技术编号:3689246 阅读:196 留言:0更新日期:2012-04-11 18:40
在多通道解码器(13)中接收参量多声道环绕音频比特流。接收到的空间参数在组合单元(37)中被变换为一组新的空间参数,该组新的空间参数被使用,以便获得对多声道环绕声的解码,该多声道环绕声并不是原始输入多声道环绕信号的简单等效物,而是例如可以通过基于从单元(43)获得的与用户头相关滤波器的表示进行变换来个性化。这样的个性化后的空间参数也可以通过将接收到的空间参数和与用户头相关滤波器的表示与一组附加渲染系数相组合而获得,所述附加渲染系数例如由用户交互式地来确定并且因此是与时间有关的。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及对多声道环绕音频比特流的解码。
技术介绍
长期以来,在全世界的电影院中,多声道环绕音频系统将电影观众置于 电影场景的音频空间的中心,这些电影场景正在观众的面前被播放并且正给 观众真实而令人信服的"身临其境"的感觉。这种音频技术已经作为家庭环绕 影院系统进入普通人的家中,并且现在正在他们自己的客厅中给他们提供"身 临其境"的感受。该音频技术将被使用的下一领域包括移动无线单元或者终端,特别是包 括诸如蜂窝电话和PDA这样的小单元。由于这些单元具有小尺寸的显示器, 所以环绕声的融入式特性(immersive nature)甚至更重要。然而,将这种技 术迁移到移动单元并不是小事。主要障碍包括1、 在无线移动通道中,可用的比特率在很多情况下低。2、 移动终端的处理能力常常有限。3、 小的移动终端通常只有两个微型扬声器和耳塞或耳机。 特别是对于诸如蜂窝电话这样的移动终端而言,这意味着用于移动终端的环绕声解决方案不得不采用比在杜比数字5.1系统中所使用的384kbhs/s低 很多的比特率。由于处理能力有限,移动终端的解码器必须在计算方面被优 化,并且由于移动终端的扬声器配置,该环绕声必须通过耳塞或耳机来输送。 通过耳机或耳塞输送多声道环绕声的标准方式是对每个扬声器信号执行3D音频或双声道立体声渲染(binaural rendering)。通常,在3D音频渲染中,使用音频场景的模型,并且每个引入的单声 道信号通过一组滤波器进行滤波,这些滤波器模型化由人的头部、躯干和耳 朵所产生的变换。这些滤波器被称为具有与头相关传递函数(HRTF)的与头 相关滤波器(HRF, head related filter),并且如果进行适当的设计,这些滤波 器给出良好的3D音频场景感知。图1的图解出了一种根据杜比数字5.1系统对音频信号进行完整的3D音 频渲染的方法。根据杜比数字5.1系统的六个多声道信号是-右环绕(SR),-右(R),-中(C),-低频(LFE),-左(L)-左环绕(SL)在图1所示的实例中,中信号和低频信号被组合成一个信号。然后,需 要五个不同的滤波器H/、 //c、 i/f和/^,以便实现与头相关滤波的这 种方法。SR信号被输入到滤波器/7f和《,R信号被输入到滤波器/ff和W , C和LFE信号被共同地输入到滤波器7/c , L信号被输入到滤波器//,和7/f , 并且SL信号被输入到滤波器/^和《。从滤波器//,、仏f、 w、 w禾口&s输出的信号在右求和元件1R中被求和,以给出意图被提供给右侧耳机(未示 出)的信号。从滤波器i^、 //f、 //c、 //f和///输出的信号在左求和元件 1L中被求和,以给出意图被提供给左侧耳机(未示出)的信号。这样的渲染的3D感知方面的质量取决于HRF有多接近地模型化或表示 在听众正在收听时与,他自己的头相关的滤波。因此,有利的是,如果希望 得到好的或者非常好的质量,则HRF能够针对每个听众被适配和被个性化。 该适配和个性化步骤可以包括模型化、测量和通常取决于用户的调谐,以便 改善所感知到的3D音频场景的质量。目前的现有技术的标准化多通道音频编解码器要求大量的带宽或高比特 率,以便达到可接受的质量,并且因此,这些要求阻止将这样的编解码器用 于诸如无线移动流的业务中。例如,即使杜比数字5.1系统(AC-3编解码器)与AAC多通道编解码 器相比具有非常低的复杂度,对于类似的质量,该杜比数字5J系统仍然要求 更高的比特率。AAC多通道编解码器和AC-3编解码器这两种编解码器直到 今天仍然不可用于无线移动领域中,因为这两种编解码器对计算复杂度和比 特率的要求都很高。已经开发出新的基于双耳线索编码(binaural cue coding)原理的参量多 通道编角军码器(parametric multi-channel codec )。最近标准化的参量立体声工 具是用于编码立体声的低复杂獻高质量参量技术的好实例。在MPEG中,参 量立体声到多声道编码的扩展目前正以空间音频编码(Spatial Audio coding) 为名而被标准化,并且其也被称为MPEG-环绕。可以根据图2的框图对参量多声道编码的原理进行解释和理解,图2示 出了一般情况。参量环绕编码器3 (也被称为多通道参量环绕编码器)接收到 多声道复合音频信号,该多声道复合音频信号包括各个信号A(n)至XN(n),其 中N是输入通道的数目。如上所述,对于杜比数字5.1环绕系统而言,N=6。 然后,该编码器3在降混单元(down-mixing unit) 5中形成复合的降混后的 信号,该复合的降混后的信号包含各个降混后的信号z"n)至ZM(n)。降混后的 通道数目M (M<N)取决于所要求的或所允许的最大比特率、所要求的质量 以及M-通道音频编码器7的可用性。编码过程的一个关键方面是降混后的复 合信号得自多声道输入信号,该降混后的复合信号通常是立体声信号但是也 可以是单声道信号,并且在音频编码器7中被压縮用于通过无线通道9传送 的信号是这个降混后的复合信号而不是原始的多声道信号。参量编码器3并 且特别是其降混单元5能够执行降混过程,以致其创建单声道的或立体声的 降混中的多声道信号的或多或少真正的等效物。该参量环绕编码器还包括空 间参数估计单元9,该空间参数估计单元9由输入信号x"n)至顺(n)计算出线 索或空间参数,这些线索或空间参数以某种方式可以被说成描述降混过程或 其中所做的假设。压縮后的音频信号从M-通道音频编码器被输出并且也是主 信号,该压缩后的音频信号与构成辅助信息(side information)的空间参数一 起通过诸如无线接口的接口 11被传送到接收侧,该接收侧在这里所考虑的情 况下通常是移动终端。可替换地,该降混可以由某个外部单元来供给,诸如由使用艺术家风格降混(Artistic Downmix)的单元来供给。在接收侧,互补的参量环绕解码器13包括音频解码器15,并且应该被 构造来能够基于在发送侧使用的降混算法的知识以及与压縮后的多声道信号 并行被接收到的编码后的空间参量或线索来产生最好的可能的多声道解码。 该音频解码器15产生信号烏(")至K打),这些信号烏(")至K,O应该尽 可能与发送侧的信号z"n)至ZM(n)對以。这些信号和空间参数一起被输入到空间合成单元17,该空间合成单元17产生输出信号烏(")至%( ),这些输出 信号应该尽可能地与发送侧的原始输入信号x"n)至w(n)类似。输出信号 乓(")至iV(")可以被输入到如图1中所示的双声道立体声渲染系统。很明显,根据接口 11上通常相对低的发送通道带宽,将会出现信息的丢失,因此在接收侧的信号為(")至4 (")以及名(打)至4 (打)不能与他们在发 送侧的配对信号相同。即使接收侧的信号并不是其配对信号的非常真实的等 效信号,这些接收侧的信号也可以是足够好的等效物。通常,这样的环绕编码过程独立于用于在图2中的音频编码器7和音频 解码器15这些单元中所使用的所发送的通道的压缩算法。该编码过程可以使 用多种高性能压缩算法中的任何算法,这些高性能压縮算法诸如AMR-WB+、 MPEG-1第三层(Layer m)、 M本文档来自技高网...

【技术保护点】
一种解码由参量多通道解码器接收到的参量多声道环绕音频比特流的方法,该方法包含以下步骤: -解复用所述比特流,以形成主比特流和空间辅助信息, -解码该空间辅助信息,以形成第一组空间参数, -修改该第一组空间参数,以形成第二组 空间参数, -基于或者使用该第二组空间参数,由所述主比特流合成要被提供给收听设备的环绕音频信号。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:A塔尔布E卡尔森
申请(专利权)人:艾利森电话股份有限公司
类型:发明
国别省市:SE[瑞典]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1