多信道音频编码制造技术

技术编号:3901519 阅读:295 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及多信道音频编码。将多个音频信道合并成单声复合信号,或合并成多个音频信道,连同用于重建多个音频信道的相关辅助信息,包括改进的下混合:将多个音频信道下混合到单声音频信号或下混合到多个音频信道;和改进的解相关:将从单声音频信道或从多个音频信道得到的多个音频信道解相关。所公开的本发明专利技术的方面可用于音频编码器、解码器、编码/解码系统、下混合器、上混合器和解相关器。

【技术实现步骤摘要】

本专利技术一般涉及音频信号处理。本专利技术尤其适用于低比特率和甚 低比特率音频信号处理。具体地说,本专利技术的方面涉及编码器(或 编码过程),解码器(或解码过程),和音频信号的编码/解码系统(或 编码/解码过程),其中多个音频信道用复合单声音频信道和辅助("侧 链")信息来表示。或者,多个音频信道用多个音频信道和侧链信息来 表示。本专利技术的方面还涉及多信道-复合单声信道下混合器(或下混 合过程),单声信道-多信道上混合器(或上混合过程),和单声信道 -多信道解相关器(或解相关过程)。本专利技术其他方面涉及多信道-多信道下混合器(或下混合过程),多信道-多信道上混合器(或上混 合过程),和解相关器(或解相关过程)。
技术介绍
在AC-3数字音频编码和解码系统中,当系统缺少比特时,可以 有选择地在高频对信道进行合并或"耦合"。AC-3系统的细节在本技术 领i或是众所周知的,例如参见J7^C5V"w^w^爿52/丄'D/gZ似/爿"Wo CV 附/ r柳/ow 5Vfl/id"r^4C-", 及ev/57ow /4 , Advanced Television Systems Committee, 20 Aug. 2001。 A/52A文献可以从万维网上的 http:〃www.atse.org/standards.html得到。A/52A文献在此全部包含作 为参考。AC-3系统根据需要以高于某一频率对信道进行合并,这一频率 被称为"耦合"频率。高于耦合频率时,所耦合的信道被合并成"耦合"或复合信道。编码器为每一信道中高于耦合频率的每一子带产生"耦合 坐标"(振幅比例因子)。耦合坐标表示每一耦合信道子带的原始能量 与复合信道中相应子带的能量的比率。低于耦合频率时,信道被分立 地编码。为了减少异相信号分量抵消,耦合信道的子带的相位极性在 该信道与 一个或多个其他耦合信道合并之前可以先被反向。复合信道 与侧链信息(按每一子带含有耦合坐标以及信道相位是否反向)一起被发送到解码器。实际上,AC-3系统的商用实施方式中所用的耦合频 率的范围是从约10kHz到约3500Hz。美国专利5,583,962、 5,633,981、 5,727,119、 5,卯9,664和6,021,386包括一些教导,涉及将多个音频信道 合并成复合信道以及辅助或侧链信息,和由此恢复出原始多个信道的 近似。所述专利中的每一个在此全部包含作为参考。
技术实现思路
本专利技术的方面可以被认为是AC-3编码和解码系统的"耦合"技术 的改进,同时也是如下其他技术的改进将多个音频信道合并成单声 复合信号,或合并成多个音频信道连同相关辅助信息,以及重建多个 音频信道。本专利技术的方面还可以被认为是这样一些技术的改进将多 个音频信道下混合到单声音频信号或下混合到多个音频信道,和将从 单声音频信道或从多个音频信道得到的多个音频信道解相关。本专利技术的方面可以用于N: 1 :N的空间音频编码技术中(其中"N" 是音频信道数)或M:1:N的空间音频编码技术中(其中"M"是编码的 音频信道数而"N,,是解码的音频信道数),这些技术尤其通过提供改 进的相位补偿、解相关机制和与信号相关的可变时间常数来改进信道 耦合。本专利技术的方面还可以用于N:x:N和M:x:N的空间音频编码技术中 (其中"x,,可以是l或大于l)。目的在于,在下混合之前通过调整信道 间相对相位来减小编码过程中的耦合抵消人为产物,和通过在解码器 中恢复相角和解相关度来改进再现信号的空间维度。本专利技术的方面在 实际实施方式中体现时,应当考虑到连续不断的而不;lj清求式的信il^合 以及比例如AC-3系统中更低的耦合频率,从而降低所需的数据率。附图说明图1是示出体现本专利技术的方面的N:1编码配置的主要功能或设备 的理想化框图。图2是示出体现本专利技术的方面的1:N解码配置的主要功能或设备 的理想化框图。图3示出了下述内容的简化的概念性结构的一个例子沿(纵向) 频率轴的bin和子带,和沿(横向)时间轴的块和帧。该图没有按比例 绘制。图4具有混合流程图和功能框图的性质,示出了用于实现体现本 专利技术的方面的编码配置的功能的编码步骤或设备。图5具有混合流程图和功能框图的性质,示出了用于实现体现本 专利技术的方面的解码配置的功能的解码步骤或设备。图6是示出体现本专利技术的方面的第 一种N:x编码配置的主要功能 或设备的理想化框图。图7是示出体现本专利技术的方面的x:M解码配置的主要功能或设备 的理想化框图。图8是示出体现本专利技术的方面的笫 一种可选x:M解码配置的主要 功能或设备的理想化框图。图9是示出体现本专利技术的方面的第二种可选x:M解码配置的主要 功能或设备的理想化框图。具体实施方式 差扭.7薦竭器参照图l,示出了体现本专利技术的方面的N:1编码器功能或设备。该 图是作为体现本专利技术的方面的基本编码器所实现的功能或结构的一个 例子。实施本专利技术的方面的其他功能或结构配置也可以使用,包括如 下所述的可选和/或等价的功能或结构配置。两个或两个以上音频输入信道输入到编码器。尽管原则上本专利技术的方面可以用模拟、数字或混合模拟/数字实施方式来实施,但本文所 公开的例子是数字实施方式。因此,输入信号可以是已从模拟音频信号中得到的时间样值。时间样值可以被编码成线性脉码调制(PCM) 信号。每个线性PCM音频输入信道都由具有同相和正交输出的滤波器 组功能或设备进行处理,比如通过512点开窗的正向离散傅里叶变换 (DFT)(由快速傅里叶变换(FFT)所实现)进行处理。滤波器组 可以被认为是一种时域-频域变换。图l示出了各自输入到滤波器组功能或设备"滤波器组"2的第一 PCM信道输入(信道"l")和输入到另一滤波器组功能或设备"滤波器 組"4的第二PCM信道输入(信道"n,,)。可以有"n"个输入信道,其中 "n,,是大于等于2的正整数。因此,相应地有"n"个滤波器组,每个都 接收"n"个输入信道中的唯——个信道。为了便于说明,图l只示出了 两个输入信道"l"和"n"。当用FFT实现滤波器组时,输入时域信号被分割成连续的块,然 后通常以交叠的块进行处理。FFT的离散频率输出(变换系数)称之 为bin,每个bin都有一个具有实部和虛部(分别相应于同相和正交分 量)的复值。邻接的变换bhi可以组合成接近于人耳听觉临界带宽的子 带,并且由编码器产生的大部分侧链信息(如下所迷)可以按每一子 带进行计算和发送,以便最大限度地减少处理资源和降低比特率。多 个连续的时域块可以组合成帧,单个块的值在每帧上进行平均或反过 来进行合并或累积,以便最大限度地降低侧链数据率。在本文所述的 例子中,每一滤波器组都通过FFT实现,邻接的变换bin被組合成子带, 块被组合成帧,而侧链数据每帧发送一次。或者,侧链数据可以每帧 发送一次以上(如每块一次)。例如参见以下图3及其描述。众所周知, 在发送侧链信息的频率与所需的比特率之间有一个折衷。当使用48kHz采样率时,本专利技术的方面的一种适宜的实际实现方 式可以使用约32毫秒的固定长度帧,每一帧有6个相互间隔约为5.3毫 秒的块(例如采用持续时间约为10.6亳秒有50。/。交叠的块)。然而, 假如这里所述的按每帧发送的信息以不低于约每隔40亳秒的频率发送,那么这种时序、固定本文档来自技高网
...

【技术保护点】
一种对M个编码音频信道和一组的一个或多个空间参数进行解码的方法,该M个编码音频信道表示N个音频信道,其中N大于等于2,该方法包括以下步骤: a)接收该M个编码音频信道和该组空间参数; b)从所述M个编码音频信道中得到N个音频信号 ,其中,每个音频信号被划分为多个频带,其中,每个频带包括一个或多个频谱分量;以及 c)根据所述N个音频信号和所述空间参数产生多信道输出信号,由此M大于等于2,该N个音频信号中的至少一个是从所述M个编码音频信道中的至少两个的加权组合中得 到的相关信号,该组空间参数包括指示要与相关信号混合的不相关信号的量的第一参数,以及步骤c)包括:从所述至少一个相关信号中得到至少一个不相关信号;以及响应于所述空间参数中的一个或多个,控制所述多信道输出信号的至少一个信道中所述至少一个相关信号与所述至少一个不相关信号的比例,其中,所述控制是至少部分根据所述第一参数的。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:马克F戴维斯
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1