用于改善对声场的高阶高保真度立体声响复制表示进行编码所需的边信息的编码的方法和装置制造方法及图纸

技术编号:13777671 阅读:91 留言:0更新日期:2016-10-01 03:22
高阶高保真度立体声响复制代表与特定扬声器设置无关的三维声音。但是,传送HOA表示导致非常高的位速率。因此,使用具有固定数量的通道的压缩,其中,方向和环境信号成分以不同的方式被处理。对于编码,从方向信号成分预测原始HOA表示的多个部分。这种预测提供相应解码所需要的边信息。通过使用一些附加的特定目的位,已知边信息编码处理得到改善,这在于用于编码该边信息的需要的位数平均减少。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于改善对声场的高阶高保真度立体声响复制表示(Higher Order Ambisonics representation)进行编码所需的边信息的编码的方法和装置。
技术介绍
除了诸如波场合成(WFS)或诸如22.2多通道音频格式的基于通道的方法的其它技术以外,高阶高保真度立体声响复制(HOA)也提供表现三维声音的一种可能性。与基于通道的方法对照,HOA表示提供与特定扬声器设置无关的优点。但是,这种灵活性以特定扬声器设置上的HOA表示的回放所需要的解码处理为代价。与所需的扬声器的数量通常非常大的WFS方法相比,HOA信号也可被呈现给仅包含很少的扬声器的设置。HOA的另一优点在于,可以在不对头戴式耳机(headphone)的双耳呈现进行任何修改的情况下使用同一表示。HOA基于按照截短的球面谐波(SH)展开(expansion)的复杂平面谐波振幅的空间密度的表示。各展开系数是角频率的函数,该函数可以用时域函数等同地表示。由此,不失一般性,整个HOA声场表示实际上可被假定为包含O个时域函数,这里,O标记展开系数的数量。以下,这些时域函数将被等同地称为HOA系数序列或者HOA通道。随着展开的最高阶N增大,HOA表示的空间分辨率提高。不幸的是,展开系数的数量O随着阶N二次生长,具体地,O=(N+1)2。例如,利用阶N=4的典型的HOA表示需要O=25个HOA(展开)系数。根据前面所作的考虑,给定希望的单通道采样率fs和每个样本的位数Nb,传送HOA表示的总位速率由O·fs·Nb确定。因此,通过使用Nb=16位每采样、以fs=48kHz的采样率传送阶N=4的HOA表示导致19.2MBits/s的位速率,这对于诸如例如流传输的许多实际应用来说非常高。因此,非常希望压缩HOA表示。在WO 2013/171083A1、EP 13305558.2和PCT/EP2013/075559中提出HOA声场表示的压缩。这些处理的共同之处在于,它们执行声场分析并且将给定的HOA表示分解成方向成分和残留环境成分。一方面,最终的压缩表示被假定为包含由环境HOA成分的相关系数序列和方向信号的感知编码得到的数个量化信号。另一方面,假定它包含与量化信号相关的另外的边信息,该边信息是从其压缩版本重构HOA表示所需要的。该边信息的重要部分是从方向信号预测原始HOA表示的多个部分的描述。由于对于该预测来说,原始HOA表示被假定为由从空间均匀分布的方向冲击的数个空间分散的一般平面波等同地代表,因此,以下,预测被称为空间预测。在ISO/IEC JTC1/SC29/WG11,N14061,“Working Draft Text of MPEG-H 3D Audio HOA RM0”,November 2013,Geneva,Switzerland中描述了与空间预测有关的这种边信息的编码。但是,边信息的该现有技术编码相当不足。
技术实现思路
本专利技术要解决的一个问题是提供编码与该空间预测有关的边信息的更有效的方式。通过在权利要求1和6中公开的方法解决该问题。在权利要求2和7中公开了利用这些方法的装置。位被预先安排给编码的边信息表示数据ζCOD,该位用于表示是否要执行任何预测。该特征随时间减少传送ζCOD数据的平均位速率。此外,在特定的情形中,作为使用对各方向指示是否执行预测的位阵列的替代,传送或传递活动的预测的数量和各指标更有效的。单个位可用于指示被推想为执行预测的方向的指标以何种方式被编码。平均来说,该操作随时间进一步减小传送ζCOD数据的位速率。原则上,本专利技术的方法适于改善用高阶高保真度立体声响复制(标记为HOA)系数序列的输入时间帧编码声场的HOA表示所需要的边信息的编码,其中,主导方向信号以及残留环境HOA成分被确定,并且,预测被用于所述主导方向信号,由此对HOA系数的编码帧提供描述所述预测的边信息数据,并且其中,所述边信息数据可包含:-表示是否对方向执行预测的位阵列;-其中每个位对于要执行预测的方向指示预测的类型的位阵列;-其要素关于要执行的预测表示要使用的方向信号的指标的数据阵列;-其要素代表量化的缩放因子的数据阵列,所述方法包括以下步骤:-提供指示是否要执行所述预测的位值;-如果不执行预测,那么在所述边信息数据中省略所述位阵列和所述数据阵列;-如果要执行所述预测,那么,作为所述表示是否对方向执行预测的位阵列的替代,提供指示活动的预测的数量和包含要执行预测的方向的指标的数据阵列是否包含于所述边信息数据中的位值。原则上,本专利技术的装置适于改善用高阶高保真度立体声响复制(标记为HOA)系数序列的输入时间帧编码声场的HOA表示所需要的边信息的编码,其中,主导方向信号以及残留环境HOA成分被确定,并且,预测被用于所述主导方向信号,由此对HOA系数的编码帧提供描述所述预测的边信息数据,并且其中,所述边信息数据可包含:-表示是否对方向执行预测的位阵列;-其中每个位对于要执行预测的方向指示预测的类型的位阵列;-其要素关于要执行的预测表示要使用的方向信号的指标的数据阵列;-其要素代表量化的缩放因子的数据阵列,所述装置包括以下部件,其:-提供指示是否要执行所述预测的位值;-如果不执行预测,那么在所述边信息数据中省略所述位阵列和所述数据阵列;-如果要执行所述预测,那么,作为所述表示是否对方向执行预测的位阵列的替代,提供指示活动的预测的数量和包含要执行预测的方向的指标的数据阵列是否包含于所述边信息数据中的位值。本专利技术的有利的另外的实施例在各独立的权利要求中被公开。附图说明参照附图描述本专利技术的示例性实施例,其中,图1表示与在EP 13305558.2中描述的HOA压缩处理中的空间预测有关的边信息的示例性编码;图2表示与在专利申请EP 13305558.2中描述的HOA解压缩处理中的空间预测有关的边信息的示例性解码;图3表示在专利申请PCT/EP2013/075559中描述的HOA分解;图4表示代表残留信号的一般平面波的方向(示为叉)和主导声源的方向(示为圈)的示图。这些方向在三维坐标系中呈现为单位球上的采样位置;图5表示空间预测边信息的现有技术编码;图6表示空间预测边信息的本专利技术的编码;图7表示编码的空间预测边信息的本专利技术的解码;图8是图7的继续。具体实施方式以下,为了提供使用与空间预测有关的边信息的本专利技术的编码的语境,回顾一下在专利申请EP 13305558.2中描述的HOA压缩和解压缩处理。HOA压缩在图1中,示出与空间预测有关的边信息的编码如何能被嵌入到在专利申请EP 13305558.2中描述的HOA压缩处理中。对于HOA表示压缩,采用对于长度L的HOA系数序列的非重叠输入帧C(k)的帧状处理,这里,k标记帧指标。图1中的第一步骤或阶段11/12是任选的,包括将HOA系数序列C(k)的非重叠的第k个帧和第(k-1)个帧级联为长帧如下: C ~ ( k ) : = [ C ( 本文档来自技高网
...

【技术保护点】
一种用于改善用被记为HOA的高阶高保真度立体声响复制系数序列的输入时间帧编码声场的HOA表示所需要的边信息的编码的方法,其中,主导方向信号以及残留环境HOA成分被确定,并且,预测被用于所述主导方向信号,由此对HOA系数的编码帧提供描述所述预测的边信息数据,其中,所述边信息数据(ζ(k‑2))能够包含:-指示是否对方向执行预测的位阵列(ActivePred);-其要素对要执行的预测标记所要使用的方向信号的指标的数据阵列(PredDirSigIds);-其要素代表量化的缩放因子的数据阵列(QuantPredGains),所述方法包括以下步骤:-提供(19;34,384)指示是否要执行所述预测的位值(PSPredictionActive);-如果不执行预测,那么在所述边信息数据(ζ(k‑2))中省略所述位阵列和所述数据阵列;-如果要执行所述预测,那么,作为指示是否对方向执行预测的所述位阵列(ActivePred)的替代,提供(19;34,384)指示活动预测的数量(NumActivePred)和包含要执行预测的方向的指标的数据阵列(PredIds)是否包含于所述边信息数据(ζ(k‑2))中的位值(KindOfCodedPredIds)。...

【技术特征摘要】
【国外来华专利技术】2014.01.08 EP 14305022.7;2014.01.16 EP 14305061.51.一种用于改善用被记为HOA的高阶高保真度立体声响复制系数序列的输入时间帧编码声场的HOA表示所需要的边信息的编码的方法,其中,主导方向信号以及残留环境HOA成分被确定,并且,预测被用于所述主导方向信号,由此对HOA系数的编码帧提供描述所述预测的边信息数据,其中,所述边信息数据(ζ(k-2))能够包含:-指示是否对方向执行预测的位阵列(ActivePred);-其要素对要执行的预测标记所要使用的方向信号的指标的数据阵列(PredDirSigIds);-其要素代表量化的缩放因子的数据阵列(QuantPredGains),所述方法包括以下步骤:-提供(19;34,384)指示是否要执行所述预测的位值(PSPredictionActive);-如果不执行预测,那么在所述边信息数据(ζ(k-2))中省略所述位阵列和所述数据阵列;-如果要执行所述预测,那么,作为指示是否对方向执行预测的所述位阵列(ActivePred)的替代,提供(19;34,384)指示活动预测的数量(NumActivePred)和包含要执行预测的方向的指标的数据阵列(PredIds)是否包含于所述边信息数据(ζ(k-2))中的位值(KindOfCodedPredIds)。2.一种用于改善用被记为HOA的高阶高保真度立体声响复制系数序列的输入时间帧编码声场的HOA表示所需要的边信息的编码的装置,其中,主导方向信号以及残留环境HOA成分被确定,并且,预测用于所述主导方向信号,由此对HOA系数的编码帧提供描述所述预测的边信息数据(ζ(k-2)),其中,所述边信息数据(ζ(k-2))能够包含:-指示是否对方向执行预测的位阵列(ActivePred);-其要素对要执行的预测标记所要使用的方向信号的指标的数据阵列(PredDirSigIds);-其要素代表量化的缩放因子的数据阵列(QuantPredGains),所述装置包括执行以下操作的部件(19;34,384):-提供指示是否要执行所述预测的位值(PSPredictionActive);-如果不执行预测,那么在所述边信息数据(ζ(k-2))中省略所述位阵列和所述数据阵列;-如果要执行所述预测,那么,作为指示是否对方向执行预测的所述位阵列(ActivePred)的替代,提供指示活动预测的数量(NumActivePred)和包含要执行预测的方向的指标的数据阵列(PredIds)是否包含于所述边信息数据(ζ(k-2))中的位值(KindOfCodedPredIds)。3.根据权利要求1所述的方法或者根据权利要求2所述的装置,其中,在所述HOA表示的所述编码中,主导声源方向的估计(13)被实施,并且提供已被检测的方向信号的指标的数据组4.根据权利要求3所述的方法或者根据权利要求3所述的装置,其中,D是能够用于所述HOA系数序列的所述编码中的方向信号的预设最大数量,其中,对要执行的预测标记要使用的方向信号的指标的所述数据阵列(PredDirSigIds)的各要素通过使用个位而不是个位被编码,是所述已被检测的方向信号的指标的数据组的要素的数量。5.根据权利要求1、3、4中的任一项所述的方法或者根据权利要求2~4中的任一项所述的装置,其中,指示活动预测的数量NumActivePred和包含要执行预测的方向的指标的阵列(PredIds)包含于所述边信息数据(ζ(k-2))中的所述位值(KindOfCodedPredIds)仅在NumActivePred≤MM的情况下被提供,这里,MM是满足的最大整数,O=(N+1)2,其中N是所述HOA表示的阶。6.一种用于...

【专利技术属性】
技术研发人员:A·克鲁埃格尔S·科尔多恩O·伍埃博尔特
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1