环境高阶立体混响音频数据的归一化制造技术

技术编号:15530014 阅读:121 留言:0更新日期:2017-06-04 17:13
一般来说,技术是针对相对于环境高阶立体混响音频数据执行归一化。经配置以对高阶立体混响音频数据进行解码的装置可执行所述技术。所述装置可包含存储器和一或多个处理器。所述存储器可经配置以存储音频声道,所述音频声道提供表示声场的环境分量的至少一部分的经归一化的环境高阶立体混响系数。所述一或多个处理器可经配置以相对于所述音频声道执行反归一化。

Normalization of environment high order stereo reverberation audio data

In general, the technique is implemented for normalization of audio data relative to ambient high order stereo reverberation. The apparatus configured to decode higher-order stereo reverberant audio data may perform the technique. The device may include a memory and one or more processors. The memory can be configured to store an audio channel that provides at least a portion of the normalized environmental high-order reverberation coefficient representing an environmental component of the sound field. The one or more processors may be configured to perform an inverse normalization relative to the audio channel.

【技术实现步骤摘要】
【国外来华专利技术】环境高阶立体混响音频数据的归一化本申请案主张2014年10月7日申请的名称为“环境高阶立体混响音频数据的归一化(NOMALIZATIONOFAMBIENTHIGHERORDERAMBISONICAUDIODATA)”的第62/061,068号美国临时申请案的权益,所述申请案的全部内容以引用的方式并入本文中。
本专利技术涉及音频数据,并且更确切地说,涉及音频数据的压缩。
技术介绍
高阶立体混响(HOA)信号(常由多个球面谐波系数(SHC)或其它分层元素表示)是声场的三维(3D)表示。HOA或SHC表示可以独立于用以重放从此SHC信号渲染的多声道音频信号的本地扬声器几何结构的方式来表示此声场。SHC信号还可促进向后兼容性,因为可将SHC信号渲染为众所周知的且被广泛采用的多声道格式,例如,5.1音频声道格式或7.1音频声道格式。SHC表示因此可实现对声场的更好表示,其也适应向后兼容性。
技术实现思路
一般来说,描述用于相对于环境高阶立体混响音频数据执行归一化的技术。在一个方面,方法包括相对于音频声道执行归一化,所述音频声道提供环境高阶立体混响系数,所述环境高阶立体混响音频系数表示声场的环境分量的至少一部分。在一个方面,装置包括经配置以存储音频声道的存储器,所述音频声道提供表示声场的环境分量的至少一部分的环境高阶立体混响系数,以及一或多个处理器,所述处理器经配置以相对于音频声道执行归一化。在一个方面,装置包括用于存储音频声道的装置,所述音频声道提供表示声场的环境分量的至少一部分的环境高阶立体混响系数,以及用于相对于音频声道执行归一化的装置。在一个方面,非暂时性计算机可读储存媒体上面存储有指令,所述指令在经执行时,使一或多个处理器相对于音频声道执行归一化,所述音频声道提供环境高阶立体混响系数,所述环境高阶立体混响音频系数表示声场的环境分量的至少一部分。在一个方面,方法包括相对于音频声道执行反归一化,所述音频声道提供经归一化的环境高阶立体混响系数,所述环境高阶立体混响音频系数表示声场的环境分量的至少一部分。在一个方面,装置包括经配置以存储音频声道的存储器,所述音频声道提供表示声场的环境分量的至少一部分的经归一化的环境高阶立体混响系数,以及一或多个处理器,所述处理器经配置以相对于音频声道执行反归一化。在一个方面,装置包括用于存储音频声道的装置,所述音频声道提供表示声场的环境分量的至少一部分的经归一化的环境高阶立体混响系数,以及用于相对于音频声道执行反归一化的装置。在一个方面,非暂时性计算机可读储存媒体上面存储有指令,所述指令在经执行时,使一或多个处理器相对于音频声道执行反归一化,所述音频声道提供经归一化的环境高阶立体混响系数,所述环境高阶立体混响音频系数表示声场的环境分量的至少一部分。在一个方面,方法包括相对于音频声道执行归一化,所述音频声道提供环境高阶立体混响系数,所述环境高阶立体混响音频系数表示声场的环境分量的至少一部分且与具有大于零的阶数的球面基函数相关联。在一个方面,装置包括经配置以存储音频声道的存储器,所述音频声道提供表示声场的环境分量的至少一部分且与具有大于零的阶数的球面基函数相关联的环境高阶立体混响系数,以及一或多个处理器,所述处理器经配置以相对于音频声道执行归一化。在一个方面,装置包括用于存储音频声道的装置,所述音频声道提供表示声场的环境分量的至少一部分且与具有大于零的阶数的球面基函数相关联的环境高阶立体混响系数,以及用于相对于音频声道执行归一化的装置。在一个方面,非暂时性计算机可读储存媒体上面存储有指令,所述指令在经执行时,使一或多个处理器相对于音频声道执行归一化,所述音频声道提供环境高阶立体混响系数,所述环境高阶立体混响音频系数表示声场的环境分量的至少一部分且与具有大于零的阶数的球面基函数相关联。在一个方面,方法包括相对于音频声道执行反归一化,所述音频声道提供经归一化的环境高阶立体混响系数,所述经归一化的环境高阶立体混响音频系数表示声场的环境分量的至少一部分且与具有大于零的阶数的球面基函数相关联。在一个方面,装置包括经配置以存储音频声道的存储器,所述音频声道提供表示声场的环境分量的至少一部分且与具有大于零的阶数的球面基函数相关联的经归一化的环境高阶立体混响系数,以及一或多个处理器,所述处理器经配置以相对于音频声道执行反归一化。在一个方面,装置包括用于存储音频声道的装置,所述音频声道提供表示声场的环境分量的至少一部分且与具有大于零的阶数的球面基函数相关联的经归一化的环境高阶立体混响系数,以及用于相对于音频声道执行反归一化的装置。在一个方面,非暂时性计算机可读储存媒体上面存储有指令,所述指令在经执行时,使一或多个处理器相对于音频声道执行反归一化,所述音频声道提供经归一化的环境高阶立体混响系数,所述环境高阶立体混响音频系数表示声场的环境分量的至少一部分且与具有大于零的阶数的球面基函数相关联。在附图和以下描述中陈述所述技术的一或多个方面的细节。这些技术的其它特征、目标及优点将从所述描述及图式以及所附权利要求书中显而易见。附图说明图1是说明具有各种阶数及子阶数的球面谐波基函数的图。图2是说明可执行本专利技术中描述的技术的各个方面的系统的图。图3是说明图2的实例中所示的系统的不同实例的框图。图4A和4B是各自更详细地说明可执行本专利技术中描述的技术的各个方面的图2和3的实例中所示的空间音频编码装置的实例的框图。图5A和5B是更详细地说明图2和3的空间音频解码装置410的框图。图6A和6B是各自更详细地说明图2和3的实例中所示的音频解码装置24的不同实例的框图。图7是说明音频编码装置在执行本专利技术中描述的基于向量的合成技术的各个方面中的例示性操作的流程图。图8是说明音频解码装置在执行本专利技术中描述的技术的各个方面中的例示性操作的流程图。图9是说明可执行本专利技术中描述的技术的各个方面的另一系统的图式。图10是说明示出了测试项目的四阶表示的峰值归一化的图的图式。图11是说明示出了从表示主导声音切换到提供额外的HOA声道的声道的图的图式。图12是大体上示出了当信息由空间音频编码装置进行处理时的信息流动和由规范化编码器应用的增益控制的相对位置的图式。图13是说明示出了将归一化因数应用到先前在图中示出为额外的HOA声道帧的额外HOA声道帧的结果的图的图式。具体实施方式环绕声的演进已使得许多输出格式可用于娱乐。此类消费者环绕声格式的实例大部分为基于“声道”的,这是因为其以某些几何坐标隐含地指定到扩音器的馈送。消费者环绕声格式包含普遍的5.1格式(其包含以下六个声道:左前(FL)、右前(FR)、中心或前中心、左后或左环绕、右后或右环绕,以及低频效果(LFE))、发展中的7.1格式、包含高度扬声器的各种格式,例如7.1.4格式和22.2格式(例如,用于与超高清电视标准一起使用)。非消费者格式可跨越任何数目的扬声器(成对称和非对称几何结构),其常常称为“环绕阵列”。此类阵列的一个实例包含定位在截角二十面体的拐角上的坐标处的32个扩音器。到未来MPEG编码器的输入任选地为三个可能格式中的一个:(i)传统的基于声道的音频(如上文所论述),其意图通过处于预先指定的位置处的扩音器播放;(ii)基于对象的音频,其涉及用于单个音频对象的具有含有其本文档来自技高网...
环境高阶立体混响音频数据的归一化

【技术保护点】
一种经配置以对高阶立体混响音频数据进行解码的装置,所述装置包括:经配置以存储音频声道的存储器,所述音频声道提供表示声场的环境分量的至少一部分的经归一化的环境高阶立体混响系数;以及一或多个处理器,所述处理器经配置以相对于所述音频声道执行反归一化。

【技术特征摘要】
【国外来华专利技术】2014.10.07 US 62/061,068;2015.10.06 US 14/876,5831.一种经配置以对高阶立体混响音频数据进行解码的装置,所述装置包括:经配置以存储音频声道的存储器,所述音频声道提供表示声场的环境分量的至少一部分的经归一化的环境高阶立体混响系数;以及一或多个处理器,所述处理器经配置以相对于所述音频声道执行反归一化。2.根据权利要求1所述的装置,其中所述一或多个处理器经配置以相对于所述音频声道执行反三维归一化,所述音频声道提供所述经归一化的环境高阶立体混响系数。3.根据权利要求1所述的装置,其中所述一或多个处理器经配置以相对于所述音频声道执行反半三维归一化,所述音频声道提供所述经归一化的环境高阶立体混响系数。4.根据权利要求1所述的装置,其中所述经归一化的环境高阶立体混响系数与具有大于零的阶数的球面基函数相关联。5.根据权利要求1所述的装置,其中所述经归一化的环境高阶立体混响系数包含经归一化的环境高阶立体混响系数,在多个不同音频声道中除了指定多个环境高阶立体混响系数之外还指定所述经归一化的环境高阶立体混响系数,并且所述经归一化的环境高阶立体混响系数用于在表示所述声场的所述环境分量的过程中扩增所述多个环境高阶立体混响系数。6.根据权利要求1所述的装置,其中所述一或多个处理器经配置以将反归一化因数应用到所述经归一化的环境高阶立体混响系数。7.根据权利要求1所述的装置,其中所述一或多个处理器经配置以确定随与所述经归一化的环境高阶立体混响系数相关联的球面基函数的至少一个阶数而变的反归一化因数,并且将所述反归一化因数应用到所述经归一化的环境高阶立体混响系数。8.根据权利要求1所述的装置,其中所述经归一化的环境高阶立体混响系数通过表示所述声场的多个高阶立体混响系数的线性分解进行识别。9.根据权利要求1所述的装置,其中所述经归一化的环境高阶立体混响系数符合中间压缩格式。10.根据权利要求9所述的装置,其中所述中间压缩格式包括供广播网络使用的夹层压缩格式。11.一种对高阶立体混响音频数据进行解码的方法,所述方法包括:相对于音频声道执行反归一化,所述音频声道提供经归一化的环境高阶立体混响系数,所述环境高阶立体混响音频系数表示声场的环境分量的至少一部分。12.根据权利要求11所述的方法,其中执行所述反归一化包括在将反增益控制应用到所述音频声道之后,相对于所述经归一化的环境高阶立体混响系数执行所述反归一化。13.根据权利要求11所述的方法,其中执行所述反归一化包括相对于所述经归一化的环境高阶立体混响系数执行所述反归一化,以便减少反增益控制到所述音频声道的应用。14.根据权利要求11所述的方法,其中执行所述反归一化包括相对于所述经归一化的环境高阶立体混响系数执行所述反归一化,以便避免反增益控制到所述音频声道的应用。15.根据权利要求11所述的方法,其中执行所述反归一化包括相对于所述经归一化的环境高阶立体混响系数执行所述反归一化,而不是将反增益控...

【专利技术属性】
技术研发人员:尼尔斯·京特·彼得斯
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1