音频编码制造技术

技术编号:3688743 阅读:144 留言:0更新日期:2012-04-11 18:40
参数立体声编码器采用输入信号的知觉上相关的参数来描述空间特性。这些参数的其中一个是输入信号之间的相位差(ITD或IPD)。时间差只确定输入信号间的相对时间差,而没有任何关于应该如何在解码器中在输出信号上划分这些时间差的信息。在已编码信号中包含用于描述应该如何在输出信道之间分布ITD或IPD的附加参数。为此,所计算的单声道信号和其中一个输入信号之间的延迟被使用。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频编码。音频信号的参数描述在最近几年中得到关注,特别是在音频编码领域。已经表明,传输描述音频信号的(量化的)参数只需要很少的传输容量以在接收端重新合成一个知觉上相同的信号。在诸如MPEG-LII、mp3和AAC(MPEG-2高级音频编码)之类的传统的基于波形的音频编码方案中,通过把两个单声道音频信号编码成一个比特流来编码立体声信号。这里明确编码每个信道,但代价是需要双倍的编码单个信道所需的数据量。在许多情况下,两个信道所携带的内容主要是单声道的。因此,通过采用利用了诸如中/侧立体声编码和强度编码之类的技术的信道间的相关性和不相关性,可以实现比特率节省。本专利技术涉及的编码方法包括完全编码其中一个信道,以及编码关于如何能够从该完全编码的信道得出另一信道的参数描述。因此,在解码器中,通常单个音频信号是可利用的,该信号必须被修改以获得两个不同的输出信道。特别地,用于描述第二信道的参数可以包括信道间时间差(ITD)、信道间相位差(IPD)和信道间声级差(ILD)。EP-A-1107232描述了一种用于编码立体声信号的方法,其中已编码的信号包括从左信道输入信号或右信道输入信号的其中之一得出的信息和允许恢复另一个输入信号的参数信息。在如上面提到的参考文献所述的参数表示中,ITD表示输入信道间在相位或时间上的差异。因此,解码器可以通过采用已编码信道的内容并建立由ITD给出的相位差来生成非编码信道。这个过程引入了一定的自由度。例如,只有一个输出信道(即没有编码的信道)可以用规定的相位差修改。可替换地,编码的输出信道可以用负的规定相位差来修改。作为第三个例子,可以将规定相位差的一半应用于一个信道,并将负的规定相位差的一半应用于另一信道。因为只有相位差被规定,所以两个信道的相移中的偏移(或分布)是不固定的。尽管这对于解码声音的空间质量并不是个问题,但它可以导致听得见的伪信号。这些伪信号发生是因为总相移是任意的。在任意一个编码时间帧处的一个或两个输出信道的相位修改可能与前一帧的相位修改不相容。本申请的申请人发现在解码器中难以正确预测正确的总相移,并已经预先描述了一种方法,以便根据前一帧的相位修改来限制相位修改。这是对该问题的一个适用的解决方案,但并没有消除这个问题的起因。如上所述,已经表明,在解码器级确定如何将规定的相移或时移分布在两个输出信道上是非常困难的。下面的例子更清楚地解释了这个难点。假设在解码器中,单声道信号分量由单个正弦信号组成。此外,该正弦信号的ITD参数随着时间(即在分析帧上)线性增长。在这个例子中,我们把注意力集中到IPD上,记住IPD仅仅是ITD的线性变换。IPD仅被定义在区间中。附图说明图1示出了作为时间函数的IPD。尽管乍一看这似乎是一个非常理论的例子,但是实际上这种IPD特性经常发生在音频记录过程中(例如,如果左、右信道中的音调频率相位差几Hz)。解码器的基本任务是从单个输入信号中产生两个输出信号。这些输出信号必须满足IPD参数。这可以通过把单个输入信号拷贝到两个输出信号、并单独修改各输出信号的相位来完成。假设在信道上的IPD的对称分布,这意味着左输出信道用+IPD/2修改,同时右输出信道的相位旋转-IPD/2。然而,该方法导致了由在时间t发生的相位跳变导致的清晰可闻的伪信号。这可以参考图2来理解,其中显示了被表示在恰好在相位跳变发生之前的某个时刻t-和恰好在相位跳变之后的某个时刻t+上的左、右输出信道上的相位变化。关于单声道输入信号的相位变化被示为复向量(即输出和输入信号间的角度表示每一个输出信道的相位变化)。可以看到,恰好在时间t的相位跳变的前后,输出信号之间存在较大的相位不一致每个输出信道的向量被旋转了大约πrad(弧度)。如果各输出的后续帧通过重叠进行组合,则恰好位于相位跳变前后的输出信号的重叠部分将互相抵消。这导致了输出中的类似卡嗒声的伪信号。这些伪信号出现的原因是IPD参数是以2π为周期循环的,但如果IPD在信道上被分布,则每个单独信号的相位变化将变为以小于2π的周期循环(如果IPD被对称分布,则相位变化变成以π为周期循环)。因此,每个信道中的相位变化的实际周期依赖于IPD在信道上的分布方式,但它小于2π,这引起了解码器中的重叠相加(overlap-add)的问题。尽管上面的例子是一个相对简单的情况,但是我们发现,对于复杂信号(在相同的相位修改频带内具有更多的频率分量,并且在时间上具有IPD参数的更复杂的特性)来说,很难找到IPD在输出信道上的准确分布。在编码器处,规定如何在信道上分布IPD的信息是可利用的。因此,本专利技术的目的是在已编码信号中保留这些信息,而不明显已增加编码信号的大小。为此,本专利技术提供了一种编码器和相关项,如在本说明书的独立权利要求中阐明的那样。基于两个输入信道间的相对时移来估计信道间的时间差(ITD)或相位差(IPD)。在另一方面,总时移(OTD)或总相移(OPD)由完全编码的单声道输出信号和其中一个输入信号之间的最佳匹配延迟(或相位)确定。因此,在编码器级分析OTD(OPD)并将它的值添加到参数比特流中是很方便的。这种时间差编码的优点是OTD(OPD)仅需要很少的比特来编码,因为听觉系统对总的相位变化相对不敏感(尽管双声道听觉系统对ITD的变化非常敏感)。对于上面针对的问题,OPD具有如图3所示的特性。这里,OPD主要描述了左信道在时间上的相位变化,而右信道的相位变化由OPD(t)-IPD(t)给出。由于两个参数(OPD和IPD)都是以2π为周期循环的,因此所得到的各独立输出信道的相位变化也变为以2π为周期循环。这样,所得到的两个输出信道在时间上的相位变化并没有显示出不存在于输入信号中的相位不连续性。应该注意到,在这个例子中,OPD描述了左信道的相位变化,而右信道是随后利用IPD从左信道得出的。这些参数的其它线性组合原则上可用于传输。一个简单的例子是用OPD描述右输出信道的相位变化,并利用OPD和IPD得出左信道的相位变化。本专利技术的关键点是有效地描述了一对时变合成滤波器,其中,输出信道之间的相位差用一个(昂贵的)参数描述,并且相位变化的偏移用另一个(便宜得多的)参数来描述。现在将以举例的方式并参考附图来详细描述本专利技术的各实施例,其中图1说明了IPD随时间线性增长的效果,并且已被讨论过;图2说明了恰好在IPD参数中的相位跳变之前(t-,左图)和之后(t+,右图)的输出信道L和R关于输入信道的相位变化,并且已被讨论过;图3说明了在线性增长的IPD的情况下的OPD参数,并且已被讨论过;图4是体现本专利技术的一个编码器的硬件框图;和图5是体现本专利技术的一个解码器的硬件框图;和图6显示了在单声道信号的各子帧和多信道层的对应帧中编码的瞬变位置。实施例概述在本专利技术的一个实施例中的空间参数生成级将三个信号作为其输入。这些信号中的前两个(示为L和R)相应于立体声对的左、右信道。与本
内的常规方法一样,例如通过使用滤波器组或频率变换而将每一个信道分解成多个时间-频率片(tile)。到编码器的另一个输入是作为其它信号L、R的和的单声道信号S。信号S是其它信号L、R的单声道组合,并具有与其它输入信号相同的时间-频率分割。编码器的输出是一个比特流,该比特流包含本文档来自技高网
...

【技术保护点】
一种编码音频信号的方法,该方法包括:    从至少两个音频输入信道生成单声道信号;    生成包括该单声道信号和一组参数的已编码信号,该组参数允许重现分别相应于各自输入信道的两个音频输出信号;    其特征在于:    所述参数包括对总偏移的指示,这是对该已编码单声道输出信号和其中一个输入信号之间的延迟的度量。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:DJ布里巴亚特AWJ奥门
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1