声音或声场的压缩HOA表示的解码方法和装置制造方法及图纸

技术编号:39126451 阅读:14 留言:0更新日期:2023-10-23 14:48
本公开涉及声音或声场的压缩HOA表示的解码方法和装置。压缩HOA表示包括多个传输信号。该方法包括:将多个传输信号分配给多个分级层,多个分级层包括基本层和一个或多个分级增强层;对于每个层生成相应的HOA扩展有效载荷,该HOA扩展有效载荷包括用于参数化地增强从分配给相应层和低于相应层的任何层的传输信号可获得的重构的HOA表示的辅助信息,将生成的HOA扩展有效载荷分配给它们的相应的层,并且在输出位流中标示生成的HOA扩展有效载荷。本公开进一步涉及一种对声音或声场的压缩HOA表示的帧进行解码的方法、用于压缩HOA表示的分层编码的编码器和解码器、以及表示声音或声场的压缩HOA表示的帧的数据结构。的压缩HOA表示的帧的数据结构。的压缩HOA表示的帧的数据结构。

【技术实现步骤摘要】
声音或声场的压缩HOA表示的解码方法和装置
[0001]本申请是申请号为201680057989.7、申请日为2016年10月7日、专利技术名称为“用于压缩高阶高保真度立体声响复制声音或声场表示的分层编码和数据结构”的专利技术专利申请的分案申请。
[0002]相关申请的交叉引用
[0003]本申请要求2015年10月15日提交的欧洲专利申请No.15306653.5的优先权,该申请全文通过引用并入本文。


[0004]本公开涉及用于分层音频编码的方法和装置。具体地说,本公开涉及用于压缩高阶高保真度立体声响复制(HOA)声音(或声场)表示的帧的分层音频编码的方法和装置。本公开进一步涉及用于表示压缩HOA声音(或声场)表示的帧的数据结构(例如,位流)。

技术介绍

[0005]在HOA分层编码的目前定义中,创建用于HOA解码工具空间信号预测、子带方向信号合成和参数化环境复制(PAR)解码器的辅助信息(side information)来增强特定的HOA表示。也就是,在分层HOA编码的目前定义中,所提供的数据仅适当地扩展最高层(例如,最高增强层)的HOA表示。对于包括基本层的较低层,这些工具没有适当地增强部分重构的HOA表示。
[0006]工具“子带方向信号合成和参数化环境复制解码器”是专门为低数据速率设计的,在低数据速率中,只有几个传输信号是可用的。但是,在HOA分层编码中,(部分)重构的HOA表示的适当增强尤其对于低位速率层(诸如基本层)是不可能的。从低位速率时的声音质量的观点来看,很清楚这是不期望的。
[0007]另外,已经发现,如果在HOADecoderConfig()中标示(signal)了等于1的CodedVVecLength(即,如果矢量编码模式是作用的(active)),则处理基于矢量的信号的编码的V矢量元素的常规方式不导致适当的解码。在该矢量编码模式下,对于ContAddHoaCoeff集合中包括的HOA系数索引,不发送V矢量元素。该集合包括所有的HOA系数索引AmbCoeffIdx[i],该HOA系数索引具有等于零的AmbCoeffTransitionState。按照常规,不需要还添加加权的V矢量信号,因为用于这些索引的原始的HOA系数序列被显式地发送(被标示)。因此,对于这些索引,V矢量元素被设置为零。
[0008]但是,在分层编码模式下,连续HOA系数索引集合依赖于传输信道,这些传输信道是当前作用的层的一部分。在较高层中发送的附加的HOA系数索引在较低层中可能缺失。那么,矢量信号不应该对HOA系数序列做出贡献的假定对于属于被包括在较高层中的HOA系数序列的HOA系数索引是错误的。
[0009]因此,分层HOA编码中的V矢量可能不适合于最高层下面的任何层的解码。
[0010]因此,需要适于声音或声场的压缩HOA表示的分层编码的编码方案和位流。
[0011]本公开解决以上问题。具体地说,描述了用于压缩HOA声音或声场表示的帧的分层
编码的方法和编码器/解码器以及用于表示压缩HOA声音或声场表示的帧的数据结构。

技术实现思路

[0012]根据一方面,描述了一种声音或声场的压缩高阶高保真度立体声响复制(HOA)表示的帧的分层编码方法。压缩HOA表示符合草案MPEG

H 3D音频标准和任何其他的未来采用的或草案标准。压缩HOA表示可以包括多个传输信号。传输信号可以与单耳(monaural)信号有关,单耳信号例如表示HOA表示的系数序列或主导声音信号。该方法可以包括将多个传输信号分配给多个分级层。例如,传输信号可以被分布到多个层。该多个层可以包括基本层和一个或多个分级增强层。多个分级层可以按从基本层至第一增强层、第二增强层等、一直到总体最高增强层(总体最高层)的次序排序。该方法可以进一步包括对每个层生成相应的HOA扩展有效载荷,该HOA扩展有效载荷包括辅助信息(例如,增强辅助信息),该辅助信息用于参数化地增强从分配给相应层和低于该相应层的任何层的传输信号可获得的重构的HOA表示。用于较低层的重构的HOA表示可以被称为部分重构的HOA表示。该方法可以进一步包括将生成的HOA扩展有效载荷分配给它们的相应层。该方法还可以进一步包括在输出位流中标示生成的HOA扩展有效载荷。可以在HOAEnhFrame()有效载荷中标示HOA扩展有效载荷。因此,可以将辅助信息从HOAFrame()移动到HOAEnhFrame()。
[0013]如上面所配置的,所提出的方法对压缩HOA表示(的帧)应用分层编码以便使得即使在低位速率时也能够对其进行高质量解码。具体地说,所提出的方法确保每个层包括合适的HOA扩展有效载荷(例如,增强辅助信息),该HOA扩展有效载荷用于增强从一直到当前层的任何层中的传输信号获得的(部分)重构的声音表示。其中,一直到当前层的层被理解为包括例如基本层、第一增强层、第二增强层等、一直到当前层。其中,一直到当前层的层被理解为包括例如基本层、第一增强层、第二增强层等、一直到当前层。例如,将启用解码器来参考分配给基本层的HOA扩展有效载荷增强从基本层获得的(部分)重构的声音表示。在常规的方法中,只有最高增强层的重构的HOA表示才可以通过HOA扩展有效载荷被增强。因此,不管实际的最高可用层如何(例如,是低于尚未被有效地接收到的最低层的层,使得低于最高可用层的所有层和最高可用层本身已经被有效地接收到),即使(部分)重构的声音表示可能不同于完整的(例如,整个的)声音表示,都将启用解码器来改进或增强重构的声音表示。具体地说,不管实际的最高可用层如何,对于解码器来说只对单个层(即,对最高可用层)解码HOA扩展有效载荷以改进或增强(部分)重构的声音表示就足够了,该(部分)重构的声音表示可以基于被包括在一直到实际的最高可用层的层中的所有的传输信号而获得。解码较高或较低层的HOA扩展有效载荷不是必需的。另一方面,所提出的方法允许充分地利用当应用分层编码时可以实现的所需带宽的减小。
[0014]在实施例中,该方法可以进一步包括发送用于多个层的具有相应的错误保护水平的数据有效载荷。数据有效载荷可以包括相应的HOA扩展有效载荷。基本层可以具有最高的错误保护,一个或多个增强层可以具有依次降低的错误保护。从而,可以确保至少数个较低层被可靠地发送,同时另一方面通过对较高层不应用过大的错误保护来减小总体所需带宽。
[0015]在实施例中,HOA扩展有效载荷可以包括用于HOA空间信号预测解码工具的位流元素。另外地或可替代地,HOA扩展有效载荷可以包括用于HOA子带方向信号合成解码工具的
位流元素。另外地或可替代地,HOA扩展有效载荷可以包括用于HOA参数化环境复制解码工具的位流元素。
[0016]在实施例中,HOA扩展有效载荷可以具有为ID_EXT_ELE_HOA_ENH_LAYER的usacExtElementType。
[0017]在实施例中,该方法可以进一步包括生成HOA配置扩展有效载荷,该HOA配置扩展有效载荷包括用于配置HOA本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对声音或声场的压缩高阶高保真度立体声响复制HOA表示进行解码的方法,该方法包括:接收包含压缩HOA表示的位流,其中所述位流包括多个分级层,所述多个分级层包括基本层和一个或多个分级增强层;在所述多个分级层中确定用于解码的最高可用层;确定参数CodedVVecLength=2,并且基于所述确定,确定矢量元素1到MinNumOfCoeffsForAmbHOA未被传输,并且主导矢量的与大于MinNumOfCoeffsForAmbHOA的数值相对应的系数被指定,其中VVecCoeffId阵列基于MinNumOfCoeffsForAmbHOA被确定;提取分配给最高可用层的HOA扩展有效载荷,其中,HOA扩展有效载荷包括用于参数化地增强与最高可用层相对应的重构的HOA表示的辅助信息,其中与最高可用层相对应的重构的HOA表示是基于分配给最高可用层和低于最高可用层的任何层的传输信号的;基于层信息和VVecCoeffId阵列,对与最高可用层相对应的压缩HOA表示进行解码,其中层信息指示作用增强层,并且其中作用增强层可被用于确定作用增强层的当前帧中的作用方向信号的数量;以及使用分配给最高可用层的HOA扩展有效载荷中所包括的辅助信息来参数化地增强解码的HOA表示。2.根据权利要求1所述的方法,其中,层信息包括增强信息,增强信息包括以下中的至少一个:空间信号预测、子带方向信号合成和参数化环境复制解码器。3.根据权利要求1所述的方法,进一步包括v矢量元素,对于与ContAddHoaCoeff集合中所包括的附加的HOA系数的索引相等的索引,不发送该v矢量元素。4.根据权利要求1所述的方法,其中,层信息包括NumLayers元素,其中,每个元素指示一直到第i层的所有层中所包括的传输信号的数量。5.根据权利要求1所述的方法,其中,层信息包括用于第k帧的所有实际使用的层的指示符。6.一种非暂态计算机可读介质,包含指令,所述指令在被处理器执行时实现根据权利要求1
‑<...

【专利技术属性】
技术研发人员:S
申请(专利权)人:杜比国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1