以信号表示用于高阶立体混响音频数据的可缩放译码的层制造技术

技术编号:15530016 阅读:37 留言:0更新日期:2017-06-04 17:13
大体来说,本发明专利技术描述用于以信号表示用于高阶立体混响音频数据的可缩放译码的层的技术。一种包括存储器和处理器的装置可经配置以执行所述技术。所述存储器可经配置以存储所述位流。所述处理器可经配置以从所述位流获得在所述位流中指定的层的数目的指示,且基于层的所述数目的所述指示获得所述位流的所述层。

A signal indicating layer for scalable decoding of higher-order stereo reverberant audio data

In general, the present invention describes techniques for representing scalable decoding layers for high order stereo reverberant audio signals. A device comprising a memory and a processor may be configured to perform the technique. The memory can be configured to store the bit stream. The processor may be configured to obtain an indication of the number of layers specified in the bit stream from the bit stream, and to obtain the layer of the bit stream based on the number of instructions in the layer.

【技术实现步骤摘要】
【国外来华专利技术】以信号表示用于高阶立体混响音频数据的可缩放译码的层本申请案主张以下临时申请案的权益:2014年10月10日申请的标题为“高阶立体混响音频数据的可缩放译码(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/062,584号美国临时申请案;2014年11月25日申请的标题为“高阶立体混响音频数据的可缩放译码(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/084,461号美国临时申请案;2014年12月3日申请的标题为“高阶立体混响音频数据的可缩放译码(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/087,209号美国临时申请案;2014年12月5日申请的标题为“高阶立体混响音频数据的可缩放译码(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/088,445号美国临时申请案;2015年4月10日申请的标题为“高阶立体混响音频数据的可缩放译码(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/145,960号美国临时申请案;2015年6月12日申请的标题为“高阶立体混响音频数据的可缩放译码(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/175,185号美国临时申请案;2015年7月1日申请的标题为“降低高阶立体混响(HOA)背景声道之间的相关(REDUCINGCORRELATIONBETWEENHIGHERORDERAMBISONIC(HOA)BACKGROUNDCHANNELS)”的第62/187,799号美国临时申请案,以及2015年8月25日申请的标题为“传输经译码可缩放音频数据(TRANSPORTINGCODEDSCALABLEAUDIODATA)”的第62/209,764号美国临时申请案,所述申请案中的每一者的全部内容以引用的方式并入本文中。
本专利技术涉及音频数据,且更具体来说,涉及高阶立体混响音频数据的可缩放译码。
技术介绍
高阶立体混响(HOA)信号(通常由多个球谐系数(SHC)或其它阶层元素表示)是声场的三维表示。HOA或SHC表示可以独立于用以回放从SHC信号渲染的多声道音频信号的局部扬声器几何布置的方式来表示声场。SHC信号还可促进向后兼容性,因为可将SHC信号渲染为众所周知的且被广泛采用的多声道格式(例如,5.1音频声道格式或7.1音频声道格式)。SHC表示因此可实现对声场的更好表示,其也适应向后兼容性。
技术实现思路
一般来说,描述用于高阶立体混响音频数据的可缩放译码的技术。高阶立体混响音频数据可包括对应于具有大于一的阶数的球谐基底函数的至少一个高阶立体混响(HOA)系数。所述技术可通过使用例如基础层和一个或多个增强层等多个层对HOA系数进行译码来提供HOA系数的可缩放译码。所述基础层可允许再现由所述HOA系数表示的声场,所述声场可由所述一个或多个增强层增强。换句话说,所述增强层(与所述基础层组合)可提供允许与单独所述基础层相比更完整(或,更准确)地再现所述声场的额外分辨率。在一个方面中,一种装置经配置以对表示高阶立体混响音频信号的位流进行解码。所述装置包括:存储器,其经配置以存储所述位流;以及一个或多个处理器,其经配置以从所述位流获得在所述位流中指定的层的数目的指示,且基于层的所述数目的所述指示而获得所述位流的所述层。在另一方面中,一种对表示高阶立体混响音频信号的位流进行解码的方法,所述方法包括:从所述位流获得在所述位流中指定的层的数目的指示,且基于层的所述数目的所述指示而获得所述位流的所述层。在另一方面中,一种设备经配置以对表示高阶立体混响音频信号的位流进行解码。所述设备包括:用于存储所述位流的装置;用于从所述位流获得在所述位流中指定的层的数目的指示的装置;以及用于基于层的所述数目的所述指示而获得所述位流的所述层的装置。在另一方面中,一种非暂时性计算机可读存储媒体上存储有指令,所述指令在执行时致使一个或多个处理器从位流获得在所述位流中指定的层的数目的指示,且基于层的所述数目的所述指示而获得所述位流的所述层。在另一方面中,一种装置经配置以对高阶立体混响音频信号进行编码以产生位流。所述装置包括:存储器,其经配置以存储所述位流;以及一个或多个处理器,其经配置以在所述位流中指定层的数目的指示,且输出包含所述层的所述所指示数目的所述位流。在另一方面中,一种产生表示高阶立体混响音频信号的位流的方法,所述方法包括:在所述位流中指定层的数目的指示;以及输出包含所述层的所述所指示数目的所述位流。在另一方面中,一种装置经配置以对表示高阶立体混响音频信号的位流进行解码。所述装置包括:存储器,其经配置以存储所述位流;以及一个或多个处理器,其经配置以从所述位流获得在所述位流中的一个或多个层中指定的声道的数目的指示,且基于声道的所述数目的所述指示而获得在所述位流中的所述一个或多个层中指定的所述声道。在另一方面中,一种对表示高阶立体混响音频信号的位流进行解码的方法,所述方法包括:从所述位流获得在所述位流中的一个或多个层中指定的声道的数目的指示;以及基于声道的所述数目的所述指示而获得在所述位流中的所述一个或多个层中指定的所述声道。在另一方面中,一种装置经配置以对表示高阶立体混响音频信号的位流进行解码。所述装置包括:用于从所述位流获得在所述位流中的一个或多个层中指定的声道的数目的指示的装置;以及用于基于声道的所述数目的所述指示而获得在所述位流中的所述一个或多个层中指定的所述声道的装置。在另一方面中,一种非暂时性计算机可读存储媒体上存储有指令,所述指令在执行时致使一个或多个处理器从表示高阶立体混响音频信号的位流获得在所述位流中的一个或多个层中指定的声道的数目的指示,且基于声道的所述数目的所述指示而获得在所述位流中的所述一个或多个层中指定的所述声道。在另一方面中,一种装置经配置以对高阶立体混响音频信号进行编码以产生位流。所述装置包括:一个或多个处理器,其经配置以在所述位流中指定在所述位流的一个或多个层中指定的声道的数目的指示,且在所述位流的所述一个或多个层中指定所述声道的所述所指示数目;以及存储器,其经配置以存储所述位流。在另一方面中,一种对高阶立体混响音频信号进行编码以产生位流的方法,所述方法包括:在所述位流中指定在所述位流的一个或多个层中指定的声道的数目的指示;以及在所述位流的所述一个或多个层中指定所述声道的所述所指示数目。在附图和以下描述中陈述所述技术的一个或多个方面的细节。所述技术的其它特征、目标和优点将从所述描述和附图以及权利要求而显而易见。附图说明图1是说明具有各种阶数及子阶数的球谐基底函数的图。图2是说明可执行本专利技术中所描述的技术的各种方面的系统的图。图3是更详细说明可执行本专利技术中描述的技术的各种方面的图2的实例中所示的音频编码装置的一个实例的框图。图4是更详细地说明图2的音频解码装置的框图。图5是更详细地说明在经配置以执行本专利技术中描述的可缩放音频译码技术的潜在版本本文档来自技高网
...
以信号表示用于高阶立体混响音频数据的可缩放译码的层

【技术保护点】
一种经配置以对表示高阶立体混响音频信号的位流进行解码的装置,所述装置包括:存储器,其经配置以存储所述位流;以及一个或多个处理器,其经配置以:从所述位流获得在所述位流中指定的层的数目的指示;以及基于层的所述数目的所述指示获得所述位流的所述层。

【技术特征摘要】
【国外来华专利技术】2014.10.10 US 62/062,584;2014.11.25 US 62/084,461;1.一种经配置以对表示高阶立体混响音频信号的位流进行解码的装置,所述装置包括:存储器,其经配置以存储所述位流;以及一个或多个处理器,其经配置以:从所述位流获得在所述位流中指定的层的数目的指示;以及基于层的所述数目的所述指示获得所述位流的所述层。2.根据权利要求1所述的装置,其中所述一个或多个处理器进一步经配置以获得在所述位流中指定的声道的数目的指示,且其中所述一个或多个处理器经配置以基于层的所述数目的所述指示和声道的所述数目的所述指示获得所述位流的所述层。3.根据权利要求1所述的装置,其中所述一个或多个处理器进一步经配置以获得所述位流中针对所述层中的至少一者指定的前景声道的数目的指示,且其中所述一个或多个处理器经配置以基于前景声道的所述数目的所述指示获得所述位流的所述层中的所述至少一者的所述前景声道。4.根据权利要求1所述的装置,其中所述一个或多个处理器进一步经配置以获得所述位流中针对所述层中的至少一者指定的背景声道的数目的指示,且其中所述一个或多个处理器经配置以基于背景声道的所述数目的所述指示获得所述位流的所述层中的所述至少一者的所述背景声道。5.根据权利要求1所述的装置,其中所述层的所述数目的所述指示指示层的所述数目为二,其中所述两个层包括基础层和增强层,且其中所述一个或多个处理器进一步经配置以获得前景声道的数目对于所述基础层为零且对于所述增强层为二的指示。6.根据权利要求1或5所述的装置,其中所述层的所述数目的所述指示指示层的所述数目为二,其中所述两个层包括基础层和增强层,且其中所述一个或多个处理器进一步经配置以获得背景声道的数目对于所述基础层为四且对于所述增强层为零的指示。7.根据权利要求1所述的装置,其中所述层的所述数目的所述指示指示层的所述数目为三,其中所述三个层包括基础层、第一增强层和第二增强层,且其中所述一个或多个处理器进一步经配置以获得前景声道的数目对于所述基础层为零,对于所述第一增强层为二且对于所述第三增强层为二的指示。8.根据权利要求1或7所述的装置,其中所述层的所述数目的所述指示指示层的所述数目为三,其中所述三个层包括基础层、第一增强层和第二增强层,且其中所述一个或多个处理器进一步经配置以获得背景声道的数目对于所述基础层为二,对于所述第一增强层为零且对于所述第三增强层为零的指示。9.根据权利要求1所述的装置,其中所述层的所述数目的所述指示指示层的所述数目为三,其中所述三个层包括基础层、第一增强层和第二增强层,且其中所述一个或多个处理器经配置以获得前景声道的数目对于所述基础层为二,对于第一增强层为二且对于第三增强层为二的指示。10.根据权利要求1或9所述的装置,其中所述层的所述数目的所述指示指示层的所述数目为三,其中所述三个层包括基础层、第一增强层和第二增强层,且其中所述一个或多个处理器进一步经配置以获得指示背景声道的所述数目对于所述基础层为零,对于所述第一增强层为零且对于所述第三增强层为零的背景语法元素。11.根据权利要求1所述的装置,其中层的所述数目的所述指示包括所述位流在前一帧中的层的数目的指示,且其中所述一个或多个处理器进一步经配置以:获得所述位流的层的数目当与所述位流在所述前一帧中的层的所述数目相比时在当前帧中是否已改变的指示;以及基于所述位流的层的所述数目在所述当前帧中是否已改变的所述指示获得所述位流在所述当前帧中的层的所述数目。12.根据权利要求11所述的装置,其中所述一个或多个处理器进一步经配置以在所述指示指示所述位流的层的所述数目当与所述位流在所述前一帧中的层的所述数目相比时在所述当前帧中尚未改变时,确定所述位流在所述当前帧中的层的所述数目等于所述位流在所述前一帧中的层的所述数目。13.根据权利要求11所述的装置,其中所述一个或多个处理器进一步经配置以在所述指示指示所述位流的层的所述数目当与所述位流在所述前一帧中的层的所述数目相比时在所述当前帧中尚未改变时,获得所述当前帧的所述层中的一者或多者的分量的当前数目等于所述前一帧的所述层中的一个或多个中的分量的先前数目的指示。14.根据权利要求1所述的装置,其中层的所述数目的所述指示指示在所述位流中指定了三个层,且其中所述一个或多个处理器经配置以:获得指示所述高阶立体混响音频信号的提供立体声声道回放的背景分量的所述位流的所述层中的第一者;获得指示所述高阶立体混响音频信号的提供由布置在一个或多个水平面上的三个或更多个扬声器进行三维回放的背景分量的所述位流的所述层中的第二者;以及获得指示所述高阶立体混响音频信号的前景分量的所述位流的所述层中的第三者。15.根据权利要求1所述的装置,其中层的所述数目的所述指示指示在所述位流中指定了三个层,且其中所述一个或多个处理器经配置以:获得指示所述高阶立体混响音频信号的提供单声道回放的背景分量的所述位流的所述层中的第一者;获得指示所述高阶立体混响音频信号的提供由布置在一个或多个水平面上的三个或更多个扬声器进行三维回放的背景分量的所述位流的所述层中的第二者;以及获得指示所述高阶立体混响音频信号的前景分量的所述位流的所述层中的第三者。16.根据权利要求1所述的装置,其中层的所述数目的所述指示指示在所述位流中指定了三个层,且其中所述一个或多个处理器经配置以:获得指示所述高阶立体混响音频信号的提供立体声声道回放的背景分量的所述位流的所述层中的第一者;获得指示所述高阶立体混响音频信号的提供由布置在单个水平面上的三个或更多个扬声器进行多声道回放的背景分量的所述位流的所述层中的第二者;以及获得指示所述高阶立体混响音频信号的提供由布置在两个或更多个水平面上的三个或更多个扬声器进行三维回放的背景分量的所述位流的所述层中的第三者;以及获得指示所述高阶立体混响音频信号的前景分量的所述位流的所述层中的第四者。17.根据权利要求1所述的装置,其中层...

【专利技术属性】
技术研发人员:金墨永尼尔斯·京特·彼得斯迪潘让·森
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1