【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求2013年10月21日提交的美国临时专利申请No.61/893,770、2014年4月3日提交的美国临时专利申请No.61/974,544、以及2014年8月15日提交的美国临时专利申请No.62/037,693的优先权,每一专利申请的全部内容特此通过引用并入。
本文中公开的专利技术一般涉及音频信号的编码和解码,并且特别地涉及多声道音频信号从下混信号和相关联的元数据的参数化重构。
技术介绍
包括多个扬声器的音频回放系统被频繁地用于再现由多声道音频信号所表示的音频场景,其中,多声道音频信号的相应声道在相应的扬声器上被回放。多声道音频信号可能例如已经由多个声换能器被记录或者可能已通过音频制作设备被产生。在许多情形下,对于将音频信号传输到回放设备存在带宽限制,和/或对于将音频信号存储在计算机存储器中或者便携式存储设备上存在有限的空间。存在用于音频信号的参数化编码以便减少所需要的带宽或存储大小的音频编码系统。在编码器侧,这些系统通常将多声道音频信号下混为下混信号(其通常是单声道(一个声道)或立体声(两个声道)下混),并且提取通过比如水平差异(level difference)和互相关的参数描述声道的性质的边信息(side information)。下混和边信息然后被编码,并且被发送到解码器侧。在解码器侧,在边信息的参数的控制下从下混重构(即,近似)多声道音频信号。鉴于可供用于回放多声道音频内容(包括针对终端用户家庭中的
这些终端用户的新兴部分)的范围广泛的不同类型的设备和系统,需要新的、替代的方式以高效地对多声道音频内容 ...
【技术保护点】
一种用于重构N声道音频信号(X)的方法,其中,N≥3,所述方法包括:对单声道下混信号(Y)连同相关联的干上混参数和湿上混参数一起进行接收;将干上混信号计算为所述下混信号的线性映射,其中,一组干上混系数(C)被应用于所述下混信号;基于所述下混信号产生(N‑1)声道去相关信号(Z);将湿上混信号计算为所述去相关信号的线性映射,其中,一组湿上混系数(P)被应用于所述去相关信号的声道;以及组合所述干上混信号和湿上混信号以获得与要被重构的N声道音频信号对应的多维重构信号其中,所述方法进一步包括:基于接收的干上混参数确定所述一组干上混系数;基于接收的湿上混参数并且在已知具有比接收的湿上混参数的数量多的元素的中间矩阵属于预定义矩阵类的情况下,填充所述中间矩阵;以及通过将所述中间矩阵与预定义矩阵相乘来获得所述一组湿上混系数,其中,所述一组湿上混系数对应于从所述相乘得到的矩阵并且包括比所述中间矩阵中的元素的数量多的系数。
【技术特征摘要】
【国外来华专利技术】2013.10.21 US 61/893,770;2014.04.03 US 61/974,544;1.一种用于重构N声道音频信号(X)的方法,其中,N≥3,所述方法包括:对单声道下混信号(Y)连同相关联的干上混参数和湿上混参数一起进行接收;将干上混信号计算为所述下混信号的线性映射,其中,一组干上混系数(C)被应用于所述下混信号;基于所述下混信号产生(N-1)声道去相关信号(Z);将湿上混信号计算为所述去相关信号的线性映射,其中,一组湿上混系数(P)被应用于所述去相关信号的声道;以及组合所述干上混信号和湿上混信号以获得与要被重构的N声道音频信号对应的多维重构信号其中,所述方法进一步包括:基于接收的干上混参数确定所述一组干上混系数;基于接收的湿上混参数并且在已知具有比接收的湿上混参数的数量多的元素的中间矩阵属于预定义矩阵类的情况下,填充所述中间矩阵;以及通过将所述中间矩阵与预定义矩阵相乘来获得所述一组湿上混系数,其中,所述一组湿上混系数对应于从所述相乘得到的矩阵并且包括比所述中间矩阵中的元素的数量多的系数。2.根据权利要求1所述的方法,其中,接收所述湿上混参数包括接收N(N-1)/2个湿上混参数,其中,填充所述中间矩阵包括基于接收的N(N-1)/2个湿上混参数并且在已知所述中间矩阵属于预定义矩阵类的情况下获得(N-1)2个矩阵元素的值,其中,所述预定义矩阵包括N(N-1)个元素,并且其中,所述一组湿上混系数包括N(N-1)个系数。3.根据权利要求1或2所述的方法,其中,填充所述中间矩阵包
\t括利用接收的湿上混参数作为所述中间矩阵中的元素。4.根据前面的权利要求中的任何一项所述的方法,其中,接收所述干上混参数包括接收(N-1)个干上混参数,其中,所述一组干上混系数包括N个系数,并且其中,所述一组干上混系数基于接收的(N-1)个干上混参数并且基于所述一组干上混系数中的系数之间的预定义关系而确定。5.根据前面的权利要求中的任何一项所述的方法,其中,所述预定义矩阵类是以下中的一个:下三角矩阵或上三角矩阵,其中,该类中的所有矩阵的已知性质包括预定义矩阵元素为零;对称矩阵,其中,该类中的所有矩阵的已知性质包括预定义矩阵元素是相等的;以及正交矩阵和对角矩阵的乘积,其中,该类中的所有矩阵的已知性质包括预定义矩阵元素之间的已知关系。6.根据前面的权利要求中的任何一项所述的方法,其中,所述下混信号能够根据预定义规则作为要被重构的N声道音频信号的线性映射而获得,其中,所述预定义规则对预定义下混操作进行定义,并且其中,所述预定义矩阵基于跨越所述预定义下混操作的核空间的向量。7.根据前面的权利要求中的任何一项所述的方法,其中,对所述单声道下混信号连同相关联的干上混参数和湿上混参数一起进行接收包括对所述下混信号的时间段或时间/频率片连同相关联的干上混参数和湿上混参数一起进行接收,并且其中,所述多维重构信号对应于要被重构的N声道音频信号的时间段或时间/频率片。8.一种音频解码系统(200),所述音频解码系统(200)包括第
\t一参数化重构部分(100),所述第一参数化重构部分(100)被配置为基于第一单声道下混信号(Y)以及相关联的干上混参数和湿上混参数重构N声道音频信号(X),其中,N≥3,所述第一参数化重构部分包括:第一去相关部分(101),所述第一去相关部分(101)被配置为接收第一下混信号并且基于此而输出第一(N-1)声道去相关信号(Z);第一干上混部分(102),所述第一干上混部分(102)被配置为:接收干上混参数和下混信号,基于所述干上混参数确定第一组干上混系数(C),以及输出通过根据所述第一组干上混系数线性地映射所述第一下混信号而计算的第一干上混信号;第一湿上混部分(103),所述第一湿上混部分(103)被配置为:接收湿上混参数和第一去相关信号,基于接收的湿上混参数并且在已知具有比接收的湿上混参数的数量多的元素的第一中间矩阵属于第一预定义矩阵类的情况下,填充所述第一中间矩阵,通过将所述第一中间矩阵与第一预定义矩阵相乘来获得第一组湿上混系数(P),其中,所述第一组湿上混系数对应于从所述相乘得到的矩阵并且包括比所述第一中间矩阵中的元素的数量多的系数,以及输出通过根据所述第一组湿上混系数线性地映射所述第一去相关信号而计算的第一湿上混信号;和第一组合部分(104),所述第一组合部分(104)被配置为接收所述第一干上混信号和第一湿上混信号,并且组合这些信号以获得与要被重构的N声道音频信号对应的第一多维重构信号9.根据权利要求8所述的音频解码系统,进一步包括第二参数化重构部分,所述第二参数化重构部分能够独立于第一参数化重构部分操作,并且被配置为基于第二单声道下混信号以及相关联的干上混参
\t数和湿上混参数重构N2声道音频信号,其中,N2≥2,所述第二参数化重构部分包括第二去相关部分、第二干上混部分、第二湿上混部分以及第二组合部分,所述第二参数化重构部分的所述部分类似于所述第一参数化重构部分的对应部分被配置,其中,所述第二湿上混部分被配置为利用属于第二预定义矩阵类的第二中间矩阵和第二预定义矩阵。10.根据权利要求8或9所述的音频解码系统,其中,所述音频解码系统适于基于多个下混声道以及相关联的干上混参数和湿上混参数重构多声道音频信号,其中,所述音频解码系统包括:多个重构部分,所述多个重构部分包括参数化重构部分,所述参数化重构部分能够操作为基于相应的下混声道以及相应的相关联的干上混参数和湿上混参数独立地重构相应的多组音频信号声道;和控制部分,所述控制部分被配置为接收信令,所述信令指示与多声道音频信号的声道到由相应的下混声道所表示的、并且对于下混声道中的至少一些由相应的相关联的干上混参数和湿上混参数所表示的多组声道(501-504)的划分对应的所述多声道音频信号的编码格式,所述编码格式进一步对应于用于基于相应的相关联的湿上混参数获得与相应的多组声道中的至少一些相关联的湿上混系数的一组预定义矩阵,其中,所述解码系统被配置为响应于接收的指示第一编码格式的信令而使用所述多个重构部分的第一子集来重构所述多声道音频信号,其中,所述解码系统被配置...
【专利技术属性】
技术研发人员:L·维勒莫斯,HM·莱托恩,H·普恩哈根,T·赫冯恩,
申请(专利权)人:杜比国际公司,
类型:发明
国别省市:荷兰;NL
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。