对压缩的HOA表示解码的方法和装置以及对压缩的HOA表示编码的方法和装置制造方法及图纸

技术编号:14712260 阅读:55 留言:0更新日期:2017-02-26 16:07
高阶高保真立体声(HOA)信号的编码通常导致高的数据速率。用于对具有系数序列的输入的HOA信号的帧进行低比特速率编码的方法包括:计算(s110)截断的HOA表示(CT(k));确定(s111)有效系数序列(IC,ACT(k));估计(s16)候选方向(MDIR(k));将输入的HOA信号划分(s15)为多个频率子带(f1,...,fF);对于每个频率子带估计(s161)作为有效方向(MDIR(k,f1),...,MDIR(k,fF))的候选方向的子集(MDIR(k))以及对于每个有效方向估计(s161)轨迹;对于每个频率子带,根据有效方向从频率子带的系数序列计算(s17)方向子带信号;对于每个频率子带,使用相应的有效系数序列(IC,ACT(k))从频率子带的系数序列计算(s18)可以用于预测方向子带信号的预测矩阵(A(k,f1),...,A(k,fF));以及对候选方向、有效方向、预测矩阵以及截断的HOA表示进行编码(s19)。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于对具有给定数量的系数序列的输入的HOA信号的帧进行编码的方法、用于对HOA信号进行解码的方法、用于对具有给定数量的系数序列的输入的HOA信号的帧进行编码的装置以及用于对HOA信号进行解码的装置。
技术介绍
除了比如波场合成(WFS)或基于声道的方法(诸如被称为“22.2”的方法)的其它技术之外,高阶高保真立体声(HOA)提供表示三维声音的一种可能性。与基于声道的方法相反,HOA表示提供独立于特定扬声器设置的优点。该灵活性是以在特定扬声器设置上回放HOA表示所需的解码处理为代价的。与其中所需的扬声器的数量通常非常大的WFS方法相比,HOA也可以被渲染到由仅仅几个扬声器组成的设置。HOA的进一步的优点是,相同的表示也可以没有任何修改地用于双耳渲染到耳机。HOA基于所谓的复平面谐波幅度的空间密度通过截断的球谐函数(SH)展开的表示。每个展开系数是角频率的函数,其可以等同地由时域函数表示。因此,不失一般性,整个HOA声场表示实际上可以被理解为由O个时域函数组成,其中,O表示展开系数的数量。这些时域函数在下面将被等同地称为HOA系数序列或HOA通道。HOA表示的空间分辨率随着展开的最大阶数N增长而改进。不幸的是,展开系数的数量O随着阶数N二次方地增长,并且特别地,O=(N+1)2。例如,典型的使用阶数N=4的HOA表示需要O=25个HOA(展开)系数。根据以上考虑,给定期望的单声道采样速率fS和每一个采样的比特数Nb,用于传送HOA表示的总比特速率由O·fS·Nb确定。因此,利用每一个采样Nb=16个比特、以fS=48kHz的采样速率传送例如阶数N=4的HOA表示,导致19.2MBits/s的比特速率,该比特速率对于许多实际应用(诸如流传输)是非常高的。因此,HOA表示的压缩是高度期望的。[4,5,6]中提出了用于压缩HOA声场表示的各种方法。这些方法的共同之处在于,它们执行声场分析,并且将给定的HOA表示分解为方向和残留环境分量。最终的压缩的表示一方面包括若干个量化信号,这些量化信号是从所谓的方向和基于矢量的信号以及环境HOA分量的相关系数序列的感知编码得到的。另一方面,它包括与量化信号相关的附加的边信息(sideinformation),该附加的边信息对于从HOA表示的压缩版本重构HOA表示是必要的。用于方法[4、5、6]的量化信号的合理的最小数量是八个。因此,假设对于每单个感知编码器数据速率为32kbit/s,则这些方法中的一种方法的数据速率通常不低于256kbit/s。对于某些应用,像例如对移动设备的音频流传输,该总数据速率可能太高。因此,存在对于应对明显较低的数据速率(例如,128kbit/s)的HOA压缩方法的需要。
技术实现思路
公开了用于声场的高阶高保真立体声(HOA)表示的低比特速率压缩的新的方法和装置。用于声场的HOA表示的低比特速率压缩方法的一个主要方面是,将HOA表示分解为多个频率子带,并且通过截断的HOA表示和基于若干个预测的方向子带信号的表示的组合来近似每个频率子带(即,子带)内的系数。截断的HOA表示包括数量小的选择的系数序列,其中,选择被允许随时间变化。例如,对于每一个帧进行新的选择。用于表示截断的HOA表示的选择的系数序列被感知编码,并且是最终的压缩的HOA表示的一部分。在一个实施例中,在感知编码之前对选择的系数序列进行去相关,以便提高编码效率并且降低在渲染时的噪声暴露的影响。部分去相关通过将空间变换应用于预定数量的选择的HOA系数序列来实现。为了解压缩,通过再相关来使去相关反向。这样的部分去相关的很大优点是,在解压缩时不需要额外的边信息来恢复去相关。近似的HOA表示的其它分量通过若干个具有对应方向的方向子带信号表示。这些方向子带信号通过参数化表示进行编码,所述参数化表示包括来自截断的HOA表示的系数序列的预测。在实施例中,每个方向子带信号由截断的HOA表示的系数序列的缩放的和来预测(或表示),其中,缩放一般是复值。为了能够重新合成方向子带信号的HOA表示以供解压缩,压缩的表示包含复值预测缩放因子的量化版本以及方向的量化版本。在一个实施例中,用于对具有给定数量的系数序列(其中,每个系数序列具有索引)的输入的HOA信号的帧进行编码(从而进行压缩)的方法包括以下步骤:确定将被包括在截断的HOA表示中的有效的系数序列的索引的集合IC,ACT(k),计算具有数量减少的非零系数序列(即,与输入的HOA信号相比,较少的非零系数序列,因此较多的零系数序列)的截断的HOA表示CT(k),从输入的HOA信号估计候选方向的第一集合MDIR(k),将输入的HOA信号划分为多个频率子带,其中,获得这些频率子带的系数序列对于每个频率子带,估计方向的第二集合MDIR(k,f1),...,MDIR(k,fF),其中,方向的第二集合的每个元素是具有第一索引和第二索引的索引元组,第二索引是当前频率子带的有效方向的索引,而第一索引是有效方向的轨迹索引,其中,每个有效方向也包括在输入的HOA信号的候选方向的第一集合MDIR(k)中(即,方向的第二集合中的有效子带方向是全带方向的第一集合的子集),对于每个频率子带,根据相应频率子带的方向的第二集合MDIR(k,f1),...,MDIR(k,fF)从频率子带的系数序列计算方向子带信号对于每个频率子带,使用相应频率子带的有效的系数序列的索引的集合IC,ACT(k)从频率子带的系数序列计算适于预测方向子带信号的预测矩阵A(k,f1),...,A(k,fF),以及对候选方向的第一集合MDIR(k)、方向的第二集合MDIR(k,f1),...,MDIR(k,fF)、预测矩阵A(k,f1),...,A(k,fF)以及截断的HOA表示CT(k)进行编码。方向的第二集合与频率子带相关。候选方向的第一集合与全频带相关。有利地,在对每个频率子带估计方向的第二集合的步骤中,仅需要在全带HOA信号的方向MDIR(k)之中搜索频率子带的方向MDIR(k,f1),...,MDIR(k,fF),因为子带方向的第二集合是全带方向的第一集合的子集。在一个实施例中,每个元组内的第一索引和第二索引的相继次序被交换,即,第一索引是当前频率子带的有效方向的索引,而第二索引是有效方向的轨迹索引。完整HOA信号包括多个系数序列或系数通道。其中这些系数序列中的一个或多个被设置为零的HOA信号在本文中被称为截断的HOA表示。计算或产生截断的HOA表示一般包括选择将被设置为零或者将不被设置为零的系数序列。该选择可以根据各种标准(例如,通过选择包括最大能量的那些系数序列或者感知最相关的那些系数序列作为将不被设置为零的系数序列、或者任意地选择系数序列等等)来进行。将HOA信号划分为频率子带可以由包括例如正交镜像滤波器(QMF)的分析滤波器组执行。在一个实施例中,对截断的HOA表示CT(k)进行编码包括截断的HOA通道序列的部分去相关、用于将(相关的或去相关的)截断的HOA通道序列y1(k),...,yI(k)分配给传输通道的通道分配、对每个传输通道执行增益控制(其中,产生用于每个传输通道的增益控制边信息ei(k-1),βi(k-1))、在感知编码器中对增益控制的截断的HOA通道序列z1(k本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/201580033039.html" title="对压缩的HOA表示解码的方法和装置以及对压缩的HOA表示编码的方法和装置原文来自X技术">对压缩的HOA表示解码的方法和装置以及对压缩的HOA表示编码的方法和装置</a>

【技术保护点】
一种用于对压缩的HOA表示进行解码的方法,所述方法包括:‑从压缩的HOA表示提取(s41,s42,s43)多个截断的HOA系数序列指示或包含所述截断的HOA系数序列的序列索引的分配矢量(vAMB,ASSIGN(k))、子带相关的方向信息(MDIR(k+1,f1),...,MDIR(k+1,fF))、多个预测矩阵(A(k+1,f1),...,A(k+1,fF))、以及增益控制边信息(e1(k),β1(k),...,eI(k),βI(k)),其中,所述提取包括对所述压缩的HOA表示进行解复用(s41)以获得感知编码的部分和编码的边信息部分;‑从所述多个截断的HOA系数序列增益控制边信息(e1(k),β1(k),...,eI(k),βI(k))以及分配矢量(vAMB,ASSIGN(k))重构(s51,s52)截断的HOA表示‑在分析滤波器组(53)中将重构的截断的HOA表示分解(s53)为多个即F个频率子带的频率子带表示‑在方向子带合成块(54)中对于所述频率子带表示中的每一个,从所述重构的截断的HOA表示的相应频率子带表示所述子带相关的方向信息(MDIR(k+1,f1),...,MDIR(k+1,fF))以及所述预测矩阵(A(k+1,f1),...,A(k+1,fF))合成(s54)预测的方向HOA表示‑在子带组成块(55)中对于所述F个频率子带中的每一个,组成(s55)具有系数序列的解码的子带HOA表示如果所述系数序列具有包括在所述分配矢量(vAMB,ASSIGN(k))中的索引n,则所述系数序列从截断的HOA表示的系数序列获得,否则从由所述方向子带合成块(54)中的一个提供的预测的方向HOA分量的系数序列获得;以及‑在合成滤波器组(56)中合成(s56)所述解码的子带HOA表示以获得解码的HOA表示...

【技术特征摘要】
【国外来华专利技术】2014.07.02 EP 14306081.2;2014.11.20 EP 14194187.21.一种用于对压缩的HOA表示进行解码的方法,所述方法包括:-从压缩的HOA表示提取(s41,s42,s43)多个截断的HOA系数序列指示或包含所述截断的HOA系数序列的序列索引的分配矢量(vAMB,ASSIGN(k))、子带相关的方向信息(MDIR(k+1,f1),...,MDIR(k+1,fF))、多个预测矩阵(A(k+1,f1),...,A(k+1,fF))、以及增益控制边信息(e1(k),β1(k),...,eI(k),βI(k)),其中,所述提取包括对所述压缩的HOA表示进行解复用(s41)以获得感知编码的部分和编码的边信息部分;-从所述多个截断的HOA系数序列增益控制边信息(e1(k),β1(k),...,eI(k),βI(k))以及分配矢量(vAMB,ASSIGN(k))重构(s51,s52)截断的HOA表示-在分析滤波器组(53)中将重构的截断的HOA表示分解(s53)为多个即F个频率子带的频率子带表示-在方向子带合成块(54)中对于所述频率子带表示中的每一个,从所述重构的截断的HOA表示的相应频率子带表示所述子带相关的方向信息(MDIR(k+1,f1),...,MDIR(k+1,fF))以及所述预测矩阵(A(k+1,f1),...,A(k+1,fF))合成(s54)预测的方向HOA表示-在子带组成块(55)中对于所述F个频率子带中的每一个,组成(s55)具有系数序列的解码的子带HOA表示如果所述系数序列具有包括在所述分配矢量(vAMB,ASSIGN(k))中的索引n,则所述系数序列从截断的HOA表示的系数序列获得,否则从由所述方向子带合成块(54)中的一个提供的预测的方向HOA分量的系数序列获得;以及-在合成滤波器组(56)中合成(s56)所述解码的子带HOA表示以获得解码的HOA表示2.根据权利要求1所述的方法,其中,所述提取包括获得包括编码的截断的HOA系数序列的感知编码的部分,并且进一步包括在感知解码器(42)中对所述编码的截断的HOA系数序列进行感知解码(s42)以获得截断的HOA系数序列3.根据权利要求1或2所述的方法,其中,所述提取包括获得编码的边信息部分,并且进一步包括在边信息源解码器(43)中对所述编码的边信息部分进行解码(s43)以获得所述子带相关的方向信息(MDIR(k+1,f1),...,MDIR(k+1,fF))、预测矩阵(A(k+1,f1),...,A(k+1,fF))、增益控制边信息(e1(k),β1(k),...,eI(k),βI(k))以及分配矢量(vAMB,ASsIGN(k))。4.根据权利要求1-3中的一项所述的方法,其中,所述子带相关的方向信息包括有效方向的集合(MDIR(k))和元组集合(MDIR(k+1,f1),...,MDIR(k+1,fF)),所述元组集合(MDIR(k+1,f1),...,MDIR(k+1,fF))包括具有第一索引和第二索引的索引元组,所述第二索引是当前频率子带的有效方向的集合(MDIR(k))内的有效方向的索引,并且所述第一索引是所述有效方向的轨迹索引,其中,轨迹是特定声源的方向的时间序列。5.根据权利要求1-4中的一项所述的方法,其中,至少一个频率子带表示包括两个或更多个频率子带的子带组。6.根据权利要求5所述的方法,其中,从所述压缩的HOA表示接收或提取子带组配置信息,并且所述子带组配置信息用于设置所述合成滤波器组(56)。7.一种用于对具有给定数量的系数序列的输入的HOA信号的帧进行编码的方法,其中,每个系数序列具有索引,所述方法包括:-确定(s111)将被包括在截断的HOA表示中的有效系数序列的索引的集合(IC,ACT(k));-计算(s110)具有数量减少的非零系数序列的截断的HOA表示(CT(k));-从所述输入的HOA信号估计(s16)候选方向的第一集合(MDIR(k));-将所述输入的HOA信号划分(s15)为多个频率子带(f1,...,fF),其中,获得所述频率子带的系数序列-对于所述频率子带中的每一个,估计(s161)方向的第二集合(MDIR(k,f1),...,MDIR(k,fF)),其中,所述方向的第二集合的每个元素是具有第一索引和第二索引的索引元组,所述第二索引是当前频率子带的有效方向的索引,并且所述第一索引是所述有效方向的轨迹索引,其中,每个有效方向也被包括在所述输入的HOA信号的候选方向的第一集合(MDIR(k))中;-对于所述频率子带中的每一个,根据相应频率子带的方向的第二集合(MDIR(k,f1),...,MDIR(k,fF))从所述频率子带的系数序列计算(s17)方向子带信号-对于所述频率子带中的每一个,使用相应频率子带的有效系数序列的索引的集合(IC,ACT(k))从所述频率子带的系数序列计算(s18)适于预测所述方向子带信号的预测矩阵(A(k,f1),...,A(k,fF));以及-对所述候选方向的第一集合(MDIR(k))、方向的第二集合(MDIR(k,f1),...,MDIR(k,fF))、预测矩阵(A(k,f1),...,A(k,fF))以及截断的HOA表示(CT(k))进行编码(s19),其中,所述截断的HOA表示(CT(k))在感知编码器(31)被感知编码(s31)。8.根据权利要求7所述的方法,其中,创建两个或更多个子带的至少一个组,并且其中,使用所述至少一个组,而不是单个子带,并且以与单个子带相同的方式对待所述至少一个组。9.根据权利要求7或8所述的方法,其中,所述对截断的HOA表示(CT(k))进行编码包括:-截断的HOA通道序列的部分去相关(s12);-用于将所述截断的HOA通道序列(y1(k),...,yI(k))分配给传输通道的通道分配(s13);-对所述传输通道中的每一个执行增益控制(s14),其中,产生用于每个传输通道的增益控制边信息(ei(k-1),βi(k-1)),其中,增益控制的截断的HOA通道序列(z1(k),...,zI(k))在所述感知编码器(31)中被编码(s31);-在感知编码器(31)中对增益控制的截断的HOA通道序列(z1(k),...,zI(k))进行编码(s31);-在边信息源编码器(32)中对所述增益控制边信息(ei(k-1),βi(k-1))、候选方向的第一集合(MDIR(k))、方向的第二集合(MDIR(k,f1),...,MDIR(k,fF))以及预测矩阵(A(k,f1),...,A(k,fF))进行编码(s32);以及-对所述感知编码器(31)和边信息源编码器(32)的输出进行复用(s33)以获得编码的HOA信号帧10.根据权利要求7-9中的一项所述的方法,其中,在对于所述频率子带中的每一个估计(s161)方向的第二集合(MDIR(k,f1),...,MDIR(k,fF))的步骤中,仅在全带HOA信号的方向(MDIR(k))之中搜索频率子带的方向。11.根据权利要求7-10中的一项所述的方法,进一步包括确定有效方向的轨迹的步骤,其中,有效方向是声源的方向,并且其中,轨迹是特定声源的方向的时间序列。12.根据权利要求7-11中的一项所述的方法,其中,截断的HOA表示是其中一个或多个系数序列被设置为零的HOA信号。13.一种用于对HOA信号进行解码的装置(50),所述装置(50)包括:-提取模块(40),所述提取模块(40)被配置为从压缩的HOA表示提取多个截断的HOA系数序列指示或包含所述截断的HOA系数序列的序列索引的分配矢量(vAMB,ASSIGN(k))、子带相关的方向信息(MDIR(k+1,f1),...,MDIR(k+1,fF))、多个预测矩阵(A(k+1,f1),...,A(k+1,fF))、以及增益控制边信息(e1(k),β1(...

【专利技术属性】
技术研发人员:A·克鲁格S·科顿
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1