音频编码和解码方法、介质以及音频编码器和解码器技术

技术编号:12986667 阅读:44 留言:0更新日期:2016-03-09 18:46
本公开提供了提供较不复杂且更加灵活的对在音频编码系统中引入的去相关的控制的方法、设备和计算机程序产品。根据本公开,这通过计算并使用用于在音频编码系统中引入音频对象的去相关的两个加权因子来实现,一个加权因子用于逼近音频对象,一个加权因子用于去相关音频对象。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】用于音频编码和解码的方法、对应的计算机可读介质以及 对应的首频编码商和解码商 相关申请的交叉引用 本申请要求2013年5月24日提交的美国临时专利申请No. 61/827, 288的优先权, 该申请的全部内容在这里以引用的方式被并入。
本文中的公开通常涉及音频编码。特别地,本公开涉及使用和计算用于使音频编 码系统中的音频对象去相关的加权因子。 本公开涉及与本申请同一天提交的、标题为"CodingofAudioScenes"、专利技术人 姓名为HeikoPurnhagen等的美国临时申请No. 61/827, 246。该引用的申请的全部内容在 这里以引用的方式被包括在内。
技术介绍
在常规的音频系统中,采用基于声道的方法。每个声道可以例如表示一个扬声器 或一个扬声器阵列的内容。用于这样的系统的可能的编码方案包括离散多声道编码或参数 化编码(诸如MPEG环绕)。 最近,新方法已经被开发。该方法是基于对象的。在采用基于对象的方法的系统 中,由音频对象与它们的相关联的位置元数据来表示三维音频场景。这些音频对象在音频 信号回放期间在三维场景中四处移动。该系统还可包括所谓的床声道,这些床声道可被描 述为直接映射到例如如上所述的常规音频系统的扬声器位置的静止音频对象。在这样的系 统的解码器端,可使用下混信号和上混或重构矩阵来重构对象/床声道,其中,通过基于重 构矩阵中的对应元素的值构成下混信号的线性组合来重构对象/床声道。 在基于对象的音频系统中(特别是在低目标比特率下)可能引起的问题是,解码 的对象/床声道之间的相关性可能大于针对编码的原始对象/床声道的相关性。例如在 MPEGSA0C中,解决这样的问题并且改进音频对象的重构的常见方法是在解码器中引入去 相关器。在MPEGSA0C中,引入的去相关旨在考虑到音频对象的指定的渲染(S卩,依赖于连 接到音频系统的什么类型的回放单元)来恢复音频对象之间的正确的相关性。 然而,已知的用于基于对象的音频系统的方法对下混信号的数量和对象/床声道 的数量敏感,并且还可以是取决于音频对象的渲染的复杂操作。因此需要一种简单且灵活 的方法,此方法用于控制在这样的系统中的解码器中引入的去相关的量,从而使得可以改 进音频对象的重构。【附图说明】 现在将参照附图来描述示例实施例,其中: 图1是根据示例实施例的音频解码系统的概括框图; 图2以举例的方式示出重构矩阵和加权参数被图1的音频解码系统接收所用的格 式; 图3是用于产生在音频解码系统中的去相关过程中使用的至少一个加权参数的 音频编码器的概括框图; 图4以举例的方式示出用于产生至少一个加权参数的图3的编码器中的一部分的 概括框图; 图5a_5c以举例的方式示出在图4的编码器的所述部分中使用的映射函数。 所有附图都是示意性的,并且通常仅示出了为了阐明本公开所必需的部分,而其 他部分则可以被省略或者仅被建议。除非另有指示,相同的标号在不同的附图中指代相同 的部分。【具体实施方式】 鉴于以上,目的是提供一种提供对引入的去相关的不太复杂且更加灵活的控制、 从而使得可以改进音频对象的重构的编码器和解码器以及相关联的方法。 I.概述一一解码器 根据第一方面,示例实施例提出了用于解码的解码方法、解码器和计算机程序产 品。所提出的方法、解码器和计算机程序产品通常可以具有相同的特征和优点。 根据示例实施例,提供了 一种用于重构N个音频对象的时间/频率瓦片的方法。所 述方法包括以下步骤:接收Μ个下混信号;接收能够实现从Μ个下混信号重构N个音频对象 的逼近的重构矩阵;将重构矩阵应用于Μ个下混信号,以便产生Ν个逼近音频对象;对Ν个 逼近音频对象的至少一个子集进行去相关处理,以便产生至少一个去相关音频对象,由此 至少一个去相关音频对象中的每一个对应于Ν个逼近音频对象中的一个;对于Ν个逼近音 频对象中的不具有对应的去相关音频对象的每个逼近音频对象,通过逼近音频对象来重构 音频对象的时间/频率瓦片;并且对于Ν个逼近音频对象中的具有对应的去相关音频对象 的每个逼近音频对象,通过以下步骤来重构音频对象的时间/频率瓦片:接收表示第一加 权因子和第二加权因子的至少一个加权参数,用第一加权因子对逼近音频对象进行加权, 用第二加权因子对与逼近音频对象对应的去相关音频对象进行加权,并且将加权的逼近音 频对象与对应的加权的去相关音频对象组合。 音频编码/解码系统通常例如通过将合适的滤波器组应用于输入音频信号,来将 时间-频率空间划分为时间/频率瓦片。时间/频率瓦片通常指时间-频率空间中的与时 间间隔和频率子带对应的一部分。时间间隔通常可以对应于音频编码/解码系统中使用的 时间帧的持续时间。频率子带通常可以对应于由编码/解码系统中使用的滤波器组定义的 一个或若干相邻的频率子带。在频率子带对应于由滤波器组定义的若干相邻的频率子带的 情况下,这使得在音频信号的解码过程中可以具有不均匀的频率子带,例如,对于较高频率 的音频信号,具有较宽的频率子带。在宽频带的情况下(在该情况下,音频编码/解码系统 对整个频率范围进行操作),时间/频率瓦片的频率子带可以对应于整个频率范围。以上方 法公开了重构Ν个音频对象的这样的时间/频率瓦片的步骤。然而,要理解的是,对音频解 码系统的每个时间/频率瓦片可以重复所述方法。还要理解的是,若干时间/频率瓦片可 以被同时编码。通常,相邻的时间/频率瓦片可以在时间和/或频率上有一些重叠。例如, 时间上的重叠可以等效于重构矩阵的元素在时间上的(即,从一个时间间隔到下一个时间 间隔)线性插值。然而,本公开是以编码/解码系统的其他部分为目标,并且相邻的时间/ 频率瓦片之间的时间和/或频率上的任何重叠被留给技术人员去实施。 如本文中所使用的,下混信号是作为一个或多个床声道和/或音频对象的组合的 信号。 以上方法提供了一种用于重构N个音频对象的时间/频率瓦片的灵活的且简单的 方法,在该方法中,减小了逼近的N个音频对象之间的任何不想要的相关性。通过使用两个 加权因子,一个针对逼近音频对象,一个针对去相关音频对象,使得可以灵活地控制被引入 的去相关的量的简单的参数化被实现。 而且,所述方法中的简单的参数化不依赖于对重构音频对象进行什么类型的渲 染。这的优点是,独立于连接到实现所述方法的音频解码系统的什么类型的回放单元,相同 的方法被使用,从而导致较不复杂的音频解码系统。 根据实施例,对于N个逼近音频对象中的具有对应的去相关音频对象的每个逼近 音频对象,所述至少一个加权参数包括可以从其中推导出第一加权因子和第二加权因子的 单个加权参数。这的优点是,提出了控制在音频解码系统中引入的去相关的量的简单的参 数化。该方法使用描述每一对象和时间/频率瓦片的"干"(不是去相关的)贡献和"湿"(去 相关的)贡献的混合的单个参数。与使用若干参数(例如,一个描述湿贡献,一个描述干贡 献)相比,通过使用单个参数,可以降低所需的比特率。 根据实施例,第一加权因子和第二加权因子的平方和等于一。在这种情况下,所述 单个加权参数包括或第一加权因子,或第二加权因子。这可以是实施用于描述每一对象和 时间/频率瓦片的干贡献和湿贡献的混合的单个加权因子的简单方式。而且,这意味着重 构对象本文档来自技高网...

【技术保护点】
一种用于重构N个音频对象的时间/频率瓦片的方法,包括以下步骤:接收M个下混信号;接收重构矩阵,所述重构矩阵实现从所述M个下混信号重构所述N个音频对象的逼近;将所述重构矩阵应用于所述M个下混信号,以便产生N个逼近音频对象;对所述N个逼近音频对象的至少一个子集进行去相关处理,以便产生至少一个去相关音频对象,由此所述至少一个去相关音频对象中的每一个对应于所述N个逼近音频对象中的一个;针对所述N个逼近音频对象中的不具有对应的去相关音频对象的每个逼近音频对象,通过所述逼近音频对象来重构所述音频对象的时间/频率瓦片;和针对所述N个逼近音频对象中的具有对应的去相关音频对象的每个逼近音频对象,通过以下步骤来重构所述音频对象的时间/频率瓦片:接收表示第一加权因子和第二加权因子的至少一个加权参数;用第一加权因子对所述逼近音频对象进行加权;用第二加权因子对与所述逼近音频对象对应的去相关音频对象进行加权;以及将加权的逼近音频对象与对应的加权的去相关音频对象组合。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:H·普恩哈根L·维尔莫斯L·J·萨米尔森T·赫冯恩
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1