多声道音频信号的时间与空间成形制造技术

技术编号:3688440 阅读:163 留言:0更新日期:2012-04-11 18:40
由从具有高时间分辨率的采样值所组合而成的帧所表示的多声道信号的所选声道,当表示该所选声道的中间分辨率表示的波形的波形参数表示被推导出来时,该所选声道可以被编码成具有较高质量的形式;该波形参数表示包括具有比采样值的时间分辨率要低并且比帧重复率所定义的时间分辨率要高的时间分辨率的中间波形参数的序列。具有中间分辨率的波形参数表示可以用于对重建声道进行成形,以获得具有与该所选原始声道的信号包络十分接近的信号包络的声道。该成形过程是在比逐帧处理的时间刻度要短的时间刻度上执行,因此可以提高该重建声道的质量。另一方面,该成形时间刻度比采样值的时间刻度要大,因此可以显著地降低波形参数表示所需的数据总量。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术是有关于多声道音频信号的编码,特别是有关于用以改善 重建的多声道信号之空间感知性的一种概念。
技术介绍
在音频编码技术的近来发展,得以立体声(或者单音)信号以及其 对应的控制数据为基础,重建一频信号的多声道表示的能力,成为一 种现成可用的技术。这些方法,与较老式的以矩阵为基础的解决方法,例如杜比环绕逻辑(Dolby Prologic),有显著的不同,因为会传送额 外的控制数据,以依据所传送的单音或者立体声声道,控制环绕声道 的重建,也称之为上混音(up-mix)。因此,该参数多声道音频解码器,依据M个传送声道,以及依据 额外的控制数据,重建N个声道,其中N〉M。该额外的控制数据,代 表显著的小于传送所有N个声道所需要的数据率,使得该编码非常有 效,同时可以确保与M声道装置以及N声道装置两者的兼容性。M个 声道可以是单一单音、立体声或者5. l声道表示。因此,有可能在将 例如7. 2声道的原始信号下混音成5. 1声道的后向兼容信号,以及空 间音频参数使得空间音频解码器可以在仅需额外负担少量比特率的情 况下,重建与原始7.2声道非常类似的一个版本。这些参数环绕声编码方法,通常包含依据ILD(Inter channel Level Difference, 声道间水平差)以及ICC (Inter Channel Coherence ,声道间 一 致性)的环绕声信号的参数化 (parameterisation)。这些参数描述了例如原始多声道信号的声道对 之间的功率比(power ratio)以及相关性(correlation)。在解码过程 中,依据传送的ILD参数所描述的,将接收到的下混音声道的能量,分散于所有声道对之间以获得重建的多声道信号。然而,由于多声道 信号即使在不同声道中的信号差异非常大的情况下,所有声道间仍然 可以具有相同的功率分布,由此而产生十分广阔(扩散)声音的听觉印 象,因此,将信号与该相同信号的解相关版本混合,以获得正确的广 阔度(扩散性);这个混合过程由ICC参数所描述。该信号的解相关版本,是藉由将该信号通过全通滤波器,例如反射器(reverberator)而 获得。这意指该信号的解相关版本,是在解码器侧创造出来的,而非像 下混音声道那样从编码器传送至解码器。从全通滤波器(解相关器)输 出的输出信号具有通常是非常平坦的时间响应。因此,狄悦克(dirac) 输入信号会得到衰减噪声突发输出。因此,当混合解相关以及原始信 号时,对于一些信号形式,例如稠密的瞬时信号(鼓掌喝采信号),重 要的是对该解相关信号的时间包络(erwel叩e)进行成形,以使其更匹 配于该下混音声道,其通常也称为干信号(dry signal)。若无法做到 这些,将造成较大的房间尺寸的感知,以及不自然的发声瞬时信号。 在瞬时信号以及作为全通滤波器的反射器的情况下,若省略掉对解相 关信号(湿信号)的成形,甚至可能引入回声形式的伪信号(artefact)。从技术的观点来看,重建多声道信号的其中一个关键挑战性,例 如在MPEG声音合成中,是在于对于具有非常宽广的声音图像(sound image)的多声道音频的适当再现。就技术方面而言,这对应于具有低 的声道间相关性(或一致性)的、但仍然紧密控制的频谱以及时间包络 的数个信号的产生。这种信号的实例包括"鼓掌喝采"(applause)项, 其同时展现高度的解相关以及尖锐的瞬时事件(拍手声)两者。因此, 这些项对于MPEG环绕声技术是最关键的;该MPEG环绕声技术,例如 在下列文献中有更详细的描述"R印ort on MPEG Spatial Audio Coding腹O Listening Tests", IS0/IEC JTC1/SC29/WG11 (MPEG), Document N7138, Busan, Korea, 2005。 一般说来,先前技术针对与 宽阔/扩散信号,例如鼓掌喝采声的最佳再现有关的多个方面,提供解 决方案如下l.改变该解相关信号的时间(以及频谱)形状,以使其适合于被传送的下混音信号,以免前回声(pre-echo)-类似伪信号(注这并不 需要从该空间音频编码器向空间音频解码器发送任何边信息(side information))。2.使用描述原始输入信号的时间包络的边信息,以改变合成的输 出声道的时间包络,使其适合于它们的原始包络形状(出现在该对应编 码器的输入),其中该边信息是从空间音频编码器传送至空间音频解码 器。目前,该MPEG环绕声参考模型已经包含数种支持这种信号编码 的工具,例如參时域时间成形(TP) 參时间包络成形(TES)在MPEG环绕声合成系统中,产生解相关声音并且与"干"(dry) 信号混合,以依据传送的ICC值来控制合成输出声道的相关。从此处 之后,在本文章中把解相关信号称之为'扩散'(diffuse)信号,虽然 4广散'这个措辞反映出该重建的空间声音场的性质,而非信号本身 的性质。对于瞬时信号而言,在解码器中产生的扩散声音,并不会自 动匹配于干信号的精细时间形状,而且也不会与干信号在感知上融合(fuse)得很好。这造成较差的瞬时再现,类似于"前回声"问题, 这是感知音频编码中已知的问题。实现时域时间成形的该TP工具,是 经过设计藉由处理扩散声音来解决这个问题。如同在第14图中所描绘的,该TP工具应用于时域。其基本上是 由具有比MPEG环绕声编码器的滤波器组所提供的分辨率更高的时间 分辨率对干信号和扩散信号进行时间包络估计所构成。该扩散信号的 时间包络进行重新縮放,以匹配于干信号的包络。这将造成,对于在 声道之间具有宽广的空间图像/低相关性的关键瞬时信号,例如鼓掌喝 采声,声音质量的显著增加。该包络成形(调整包含在声道内的能量的时间演进),是通过该湿 信号之归一化(normalized)的短时间能量,匹配于干信号的归一化 的短时间能量而完成。这是通过时变增益函数(time varying gain function)来达成,该时变增益函数应用于该扩散信号,使得该扩散信号的时间包络被成形,以匹配于干信号的时间包络。必须注意的是,这并不需要从编码器向解码器传送任何边信息以 对该信号的时间包络进行处理(该环绕声编码器仅传送用以选择性地 启用/禁用TP的控制信息)。第14图描绘该时域时间成形,如同应用于MPEG环绕声编码之内 的。即将被成形的直达信号(direct signal)10以及扩散信号(diffuse signal) 12为将被处理的信号,两者均提供于滤波器组域中。在MPEG 环绕声中,可以有选择地把可用的剩余信号(residual signal) 14,与 该直达信号10相加,仍然在该滤波器组域之内。在MPEG环绕声解码 器的该特殊情况中,仅有扩散信号12的高频率部分会被成形,因此该 信号的低频率部分16,在该滤波器组域中,与直达信号10相加。直达信号10以及扩散信号12,通过滤波器组合成装置18a以及 18b,分别转换至时域。实际的时域时间成形在合成滤波器组之后执行。 因为仅有扩散信号12的高频率部分将会进行成形,因此,将直达信号 10以及扩散信号12的时域表示输入至高通滤波器20a以及20b,以确保在接下来的滤波本文档来自技高网...

【技术保护点】
一种解码器,用于根据基底信号和波形参数表示而产生多声道输出信号,所述基底信号从具有一个或更多个声道的原始多声道信号中导出,所述基底信号的声道个数小于原始多声道信号的声道个数,所述基底信号具有帧,所述帧包括具有高分辨率的采样值,所述波形参数表示是用来表示原始多声道信号中所选原始声道的中间分辨率表示的波形,所述波形参数表示包括具有中间时间分辨率的中间波形参数的序列,所述中间时间分辨率低于采样值的高时间分辨率,并高于由帧重复率所定义的低时间分辨率;所述解码器包括: 上混音器,用于产生具有比中间分辨率更高的时间分辨率的多个上混音声道;以及 成形器,用于使用与所选上混音声道相对应的所选原始声道的中间波形参数,对所选上混音声道进行成形。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:萨沙迪施于尔根赫勒马蒂亚斯诺伊辛格耶罗恩布里巴特杰拉德霍特胡
申请(专利权)人:弗劳恩霍夫应用研究促进协会皇家飞利浦电子股份有限公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利