音频编码和解码中相位信息的有效利用制造技术

技术编号:7139146 阅读:204 留言:0更新日期:2012-04-11 18:40
当附加地考虑指示输入音频信号的至少第一或第二不同特征的信号特征信息时,可以使用指示第一和第二输入音频信号间的相关性的相关性信息,来导出第一和第二输入音频信号的有效编码表示。当输入音频信号具有第一特征时,导出指示第一和第二输入音频信号间的相位关系的相位信息。当输入音频信号具有第一特征时,将相位信息和相关性度量包括到该编码表示中;而当输入音频信号具有第二特征时,仅将相关性信息包括在该编码表示中。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频编码和音频解码,更具体地说,涉及一种当相位信息的重建是感 知相关时选择性地提取和/或传输相位信息的编码和解码方案。
技术介绍
例如双耳线索编码(BCC)、参数立体声(PS)或MPEG环绕(MPS)的最近的参数多信 道编码方案使用人类听觉系统的针对空间感知的线索的紧凑参数表示。这允许了具有两个 或多个音频信道的音频信号的速率有效表示。为此,编码器进行从M个输入信道至N个输 出信道的降混,且将所提取的线索连同该降混信号一起传输。此外,根据人类感知的原理对 这些线索进行量化,即,人类听觉系统无法听到或无法区别的信息可被删除或粗略量化。当降混信号为“一般性”音频信号时,这种原始音频信号的编码表示所消耗的带宽 可以通过使用单信道音频压缩器对降混信号或降混信号的信道进行压缩而进一步减少。在 下文中,将各种类型的这些单信道音频压缩器概括为核心编码器。用于描述两个或多个音频信道间的空间相互关系的典型线索是将输入信道间的 电平关系进行参数化的信道间电平差(ILD)、将输入信道间的统计相依性进行参数化的信 道间互相关性/相干性(ICC),以及将输入信道的类似信号段间的时间或相位差进行参数 化的信道间时间/相位差(ITD或IPD)。为了维持由降混与先前描述的线索所表示的信号的高感知质量,通常是针对不同 频带计算个别线索。也就是,针对该信号的给定时段,传输将相同属性进行参数化的多个线 索,每个线索-参数表示信号的预定频带。可以在时间和频率上依赖于接近于人类的频率分辨率的标尺来计算这些线索。无 论何时当表示多信道音频信号时,相应的解码器基于传输的空间线索和降混传输的信号 (因此所传输的降混常被称为载波信号)进行从M信道至N信道的升混。通常,得到的升混信道可描述为传输的降混的电平和相位加权版本。如传输的相 关性参数(ICC)所指示的,通过对传输的降混信号(“干”信号)和从该降混信号导出的去 相关信号(“湿”信号)进行混合与加权,可以合成在编码信号的同时导出的去相关性。这 样,升混信道与原始信道相比具有彼此类似的相关性。通过将该降混馈送至滤波器链例如 全通滤波器和延迟线,可产生去相关信号(即,当与传输的信号互相关时具有接近于零的 互相关性系数的信号)。然而,可以使用其它导出去相关信号的方式。显然,在前述编码/解码方案的特定实现中,必须进行编码信号的传输比特率(理 想的是尽可能地低)与可实现的质量(理想的是尽可能地高)间的折衷。因此,可以决定不传输空间线索的完整集合,而忽略一个特定参数的传输。附加 地,此决定可能受到选择适当的升混的影响。例如,适当的升混可平均地再现未传输的空间 线索。也就是,至少针对完整带宽信号的长期分段,保留平均空间属性。特别地,并非所有参数多信道方案都使用信道间时间差或信道间相位差,从而避 免相应的计算或合成。例如MPEG环绕等方案仅依赖于ILD和ICC的合成。通过去相关性合成隐性地对信道间相位差进行近似,该去相关性合成将两种去相关信号的表示与所传输 的降混信号进行混合,其中两种表示具有180度的相对相移。忽略IPD的传输,从而减少参 数信息的需要量,同时接受再现质量的恶化。因此,需要提供更佳的信号重建质量而不明显增加所需的比特率。
技术实现思路
本专利技术的一个实施例通过使用相位估计器来实现上述目的,当输入音频信号之间 的相移超过预定阈值时,该相位估计器导出指示第一和第二输入音频信号间的相位关系的 相位信息。当从感知观点来看,需要传输相位信息时,用于将空间参数和降混信号包括到输 入音频信号的编码表示中的关联输出接口将仅包括导出的相位信息。为此,可连续进行相位信息的确定,且可以基于阈值仅进行是否要包括该相位信 息的判定。例如,该阈值可描述针对其不需要附加相位信息处理来实现重建后的信号的可 接受质量的最大容许相移。可选地,输入音频信号间的相移可以与相位信息的实际产生无关地导出,这样,仅 当超过相位阈值时才进行导出相位信息的正式相位分析。可选地,可以实现空间输出模式判决器,其接收连续产生的相位信息,并且仅当满 足相位信息条件时,即,例如,当输入信号间的相位差超过预定阈值时,该判决器才操控输 出接口以包括相位信息。也就是说,输出接口主要将ICC参数和ILD参数以及降混信号仅包括到输入音频 信号的编码表示中。当出现具有特定信号特征的信号时,附加地包括所确定的相位信息,从 而可以较高质量地重建使用编码表示重建的信号。但是,这可以仅以最小量附加传输信息 来实现,因为确实仅针对关键的那些信号部分传输相位信息。这一方面允许高质量重建,而另一方面允许低比特率实现。本专利技术的另一实施例对该信号进行分析来导出信号特征信息,该信号特征信息用 于在具有不同信号类型或特征的输入音频信号之间进行区分。例如,这可以是不同特征的 语音信号和音乐信号。当输入音频信号具有第一特征时,仅需要相位估计器;而当输入音频 信号具有第二特征时,相位估计可以作废。因此,当编码其中需要相位合成的信号以提供重 建后信号的可接受质量时,输出接口仅包括该相位信息。其它空间线索例如相关性信息(例如ICC参数)被持久地包括在编码表示中,因 为其存在对信号类型或信号特征这两者可能均较为重要。对于信道间电平差也一样如此, 该信道间电平差主要是描述两个重建的信道间的能量关系。在另一实施例中,可基于其它空间线索,诸如基于第一和第二输入音频信号间的 相关性ICC,来进行相位估计。当存在包括信号特征上的一些附加限制的特征信息时,这是 可行的。于是,除了统计信息之外,也可使用ICC参数来提取相位信息。根据另一个实施例,可极其比特有效地包括相位信息,因为仅实现一个相位切换, 对具有预定大小的相移的应用信号通知。虽然如此,如下文中所详细描述的,在再现中粗略 重建相位关系可能对某些信号类型就足够了。在另外的实施例中,能够以高得多的分辨率 (例如10个或20个的不同相移)来对相位信息进行信号通知,或者甚至作为用于给定-180 度至+180度的可能的相对相位角的连续参数来进行信号通知。当信号特征已知时,可仅对少数频带传输相位信息,该频带数目可能远小于用于 导出ICC参数和/或ILD参数的频带数目。例如,当已知音频输入信号具有语音特征时,对 于整个带宽仅需要一个单个相位信息。在另一附加实施例中,可以针对例如IOOHz至5kHz 间的频率范围导出单个相位信息,因为假设扬声器的信号能量主要分布于此频率范围内。 例如,当相移超过90度或超过60度时,针对全部带宽的公共相位信息参数是可行的。此外,当信号特征已知时,通过将阈值标准应用到所述参数,可以从已存在的ICC 参数或相关性参数直接导出相位信息。例如当ICC参数小于-0. 1时,可以断定此相关性参 数与固定的相移相对应,因为输入音频信号的语音特征限制了其它参数,在下文中将详细 描述的。在本专利技术的另一实施例中,当将该相位信息包括到比特流中时,还对从信号导出 的ICC参数(相关性参数)进行修改或后处理。这利用了下述事实ICC(相关性)参数实 际上可以包括与两个特征有关的信息,即,与输入音频信号间的统计相依性有关的信息、以 及与这些信号间的相移有关的信息。因此,当传输附加相位信息时,对相关性参数进行修 改,使得在重建信号时,尽可能最佳地本文档来自技高网
...

【技术保护点】
一种用于产生第一和第二输入音频信号的编码表示的音频编码器,包括:相关性估计器,所述相关性估计器适于导出指示第一和第二输入音频信号之间的相关性的相关性信息;信号特征估计器,所述信号特征估计器适于导出信号特征信息,所述信号特征信息指示所述输入音频信号的不同的第一或第二特征;相位估计器,所述相位估计器适于当所述输入音频信号具有第一特征时导出相位信息,所述相位信息指示所述第一和第二输入音频信号之间的相位关系;以及输出接口,所述输出接口适于:当所述输入音频信号具有第一特征时将所述相位信息和相关性度量包括到所述编码表示中;或者当所述输入音频信号具有第二特征时将所述相关性信息包括到所述编码表示中,其中当所述输入音频信号具有第二特征时不包括所述相位信息。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:约翰内斯·希勒佩特
申请(专利权)人:弗朗霍夫应用科学研究促进协会
类型:发明
国别省市:DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1