用于压缩声音或声场表示的分层编解码制造技术

技术编号:37770763 阅读:17 留言:0更新日期:2023-06-06 13:35
本公开涉及用于压缩声音或声场表示的分层编解码。压缩声音表示包含包括多个分量的基本压缩声音表示、用于将基本压缩声音表示解码成声音或声场的基本重构声音表示的基本辅助信息、及包括用于改善基本重构声音表示的参数的增强辅助信息。分层编码方法包含将多个分量细分为多个分量组并将每个组分配至包括基本层及一个或多个分级增强层的多个分级层中的相应一个分级层中,将基本辅助信息添加至基本层、及从增强辅助信息确定增强辅助信息的多个部分并将增强辅助信息的多个部分中的每一个分配至多个层中的相应一个分级层,其中增强辅助信息的每一部分包括用于改善可从包括在该相应层及低于该相应层的任何层中的数据得到的重构声音表示的参数。的重构声音表示的参数。的重构声音表示的参数。

【技术实现步骤摘要】
用于压缩声音或声场表示的分层编解码
[0001]本申请是申请号为201680058435.9、申请日为2016年10月7日、专利技术名称为“用于压缩声音或声场表示的分层编解码”的专利技术专利申请的分案申请。
[0002]相关申请的交叉引用
[0003]本申请要求2015年10月8日提交的欧洲专利申请No.15306589.1和2015年10月15日提交的欧洲专利申请No.15306653.5,以及美国专利申请No.62/361461以及62/361416的优先权,这些专利申请通过引用而全文并入这里。


[0004]本文件涉及用于分层音频编解码的方法及设备。本文件特别涉及用于压缩声音(或声场)表示,例如,高阶高保真度立体声响复制(HOA)声音(或声场)表示,的分层音频编解码的方法及设备。

技术介绍

[0005]对于在时间变化条件下传输通道上的声音(或声场)的流传输,分层编解码是一种使被接收的声音表示的质量适合于传输条件,并特别适于避免不期望的信号漏失的方法。
[0006]针对分层编解码,常将声音(或声场)表示细分为相对小尺寸的高优先度基本层、及具有递减优先度及任意尺寸的附加增强层。典型地将各增强层假设成包含递增信息以补足所有较低层的信息,以改善声音(或声场)表示的质量。用于各个层的传输的错误保护量基于它们的优先度被控制。特别地,基本层设有高错误保护,由于其的小尺寸,这是合理且实惠的。
[0007]然而,仍需要用于特殊种类的声音或声场的压缩表示(的扩展版本),诸如,压缩HOA声音或声场表示,的分层编解码方案。
[0008]本文件解决了上述问题。特别描述了用于压缩声音及声场表示的分层编解码的方法及编码器/解码器。

技术实现思路

[0009]根据一个方面,描述了声音或声场的压缩声音表示的分层编码方法。该压缩声音表示可包括基本压缩声音表示,其包括多个分量。该多个分量可为补充分量。压缩声音表示可进一步包括用于将基本压缩声音表示解码为声音或声场的基本重构声音表示的基本辅助信息。该压缩声音表示可进一步包括增强辅助信息,其包括用于改善(例如,增强)基本重构声音表示的参数。该方法可包括将该多个分量细分(例如,分组)为多个分量组。该方法可进一步包括将多个组中的每一个分配(例如,添加)至多个分级层中相应的一个分级层。该分配可指示各组与层之间的对应关系。可将被分配给相应层的分量称为包括在该层中。组的数目可对应于(例如,等于)层的数目。该多个层可包括基本层及一个或多个分级增强层。该多个分级层可从基本层、经由第一增强层、第二增强层等、直到总体最高增强层(总体最高层)被排序。该方法可进一步包括将基本辅助信息添加至基本层(例如,出于传输或储存
的目的,例如,将基本辅助信息包括在基本层中,或将基本辅助信息分派至该基本层)。该方法可进一步包括从该增强辅助信息确定增强辅助信息的多个部分。该方法可进一步包括将增强辅助信息的该多个部分中的每一个分配(例如,添加)至该多个层中的相应的一个。增强辅助信息的各部分可包括用于改善可从包括在(例如,分配或添加至)相应层及低于该相应层的任何层中的数据得到的重构(例如,解压缩)声音表示的参数。分层编码可出于通过传输信道进行传输的目的或出于储存在适当存储介质(诸如,CD、DVD、蓝光光盘
TM
)中的目的而实施。
[0010]如上文所配置的,所提出的方法使得能够将分层编解码高效地应用于包含多个分量以及具有如上文设定的性质的基本及增强辅助信息(例如,独立基本辅助信息及增强辅助信息)的压缩声音表示。所提出的方法特别确保各层包括用于从包括在直至关注层的任何层中的分量重构重构声音表示的合适辅助信息。其中“直至关注层的层”理解为,例如,包括基本层、第一增强层、第二增强层等、直到该关注层。因此,不管实际最高可使用层(例如,低于未有效地接收的最低层的层,使得已有效地接收低于最高可使用层的所有层及该最高可使用层自身)如何,即使重构声音表示可能与完全(例如,完整)声音表示不同,解码器仍将能够改善或增强重构声音表示。特别地,不管实际最高可用层如何,解码器仅针对单一层(即,针对最高可使用层)解码增强辅助信息的有效载荷(payload)以改善或增强基于包括在直至实际最高可使用层的层中的所有分量可得到的重构声音表示就足够了。即,针对各时间区间(例如,帧),仅需解码增强辅助信息的单一有效载荷。另一方面,所提出的方法允许充分利用在施用分层编解码时可实现的所需带宽的降低的优点。
[0011]在实施例中,基本压缩声音表示的分量可对应于单声道信号(例如,传送信号或单声道传送信号)。该单声道信号可代表HOA表示的系数序列或主要声音信号。可将单声道信号量化。
[0012]在实施例中,基本辅助信息可包括与其他分量无关地、单独地指定该多个分量中的一或多者的解码(例如,解压缩)的信息。例如,基本辅助信息可代表与个体单声道信号有关、而与其他单声道信号无关的辅助信息。因此,基本辅助信息可称为独立基本辅助信息。
[0013]在实施例中,增强辅助信息可代表增强辅助信息。增强辅助信息可包括用于改善(例如,增强)可从基本压缩声音表示及基本辅助信息得到的基本重构声音表示的基本压缩声音表示的预测参数。
[0014]在实施例中,该方法可进一步包括产生用于多个层的数据(例如,分配或添加至各层或另外包括在各层中的数据)的传输的传送流。基本层可具有最高的传输优先度且分级增强层可具有递减的传输优先度。即,传输的优先度可从基本层减小至第一增强层,从第一增强层减小至第二增强层,并依此类推。用于该多个层的数据的传输的错误保护量可根据传输的相应优先度被控制。因此,能确保可靠地传输至少若干较低层,同时在另一方面通过不对于较高层应用过度错误保护而降低总体所需带宽。
[0015]在实施例中,该方法可进一步包括针对多个层中的每一个,产生包括相应层的数据的传送层包。例如,针对各时间区间(例如,帧),可对多个层中的每一个产生相应传送层包。
[0016]在实施例中,压缩声音表示可进一步包括用于将基本压缩声音表示解码为基本重构声音表示的附加基本辅助信息。附加基本辅助信息可包括指定多个分量中的一个或多个
的依赖于各其他分量的解码的信息。该方法可进一步包括将附加基本辅助信息分解为附加基本辅助信息的多个部分。该方法可进一步包括将附加基本辅助信息的部分添加至基本层(例如,出于传输或储存的目的,例如,将附加基本辅助信息的部分包括在基本层中、或将附加基本辅助信息的部分分派至基本层)。附加基本辅助信息的各部分可对应于相应层并可包括如下信息,该信息指定分配给该相应层中的一或多个分量的(仅)依赖于分配给该相应层及低于该相应层的任何层的各其他分量的解码。即,附加基本辅助信息的各部分指定该附加基本辅助信息的该部分所对应的该相应层中的分量,而没有参考分配给比该相应层更高的层的任何其他分量。
[0017]在如此配置的情况下,所提出的方法通过将所有部分添加至基本层而避免附加基本辅助信息碎片化。换言之,将附加基本辅助信息的所有部分包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对通过使用分层编码被编码为多个分级层的声音或声场的压缩高阶高保真度立体声响复制HOA声音表示进行解码的方法,该方法包含:接收包含该压缩HOA表示的位流,该压缩HOA表示对应于包括基本层及至少一个增强层的所述多个分级层,其中该多个分级层中的至少一个分级层包括该声音或声场的基本压缩声音表示的分量,该分量对应于多个单声道信号,确定参数CodedVVecLength不等于1,并且基于此确定,确定与所述压缩HOA表示对应的向量的所有分量被提供;以及基于与该基本层关联的基本辅助信息并基于与该增强层关联的增强辅助信息解码该压缩HOA表示,其中该基本辅助信息指示至少一个个体单声道信号代表具有入射方向的方向信号,并且其中该增强辅助信息包括允许预测该声音或声场的缺失部分的信息。2.根据权利要求1所述的方法,其中该增强辅助信息包括与以下中的至少一者有关的参数:空间预测、子带方向信号合成、及参数环境复制。3.一种非暂态计算机可读存储介质,包括指令,所述指令在由处理器执行时...

【专利技术属性】
技术研发人员:S
申请(专利权)人:杜比国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1