在多个转变期间译码高阶立体混响系数制造技术

技术编号:18180583 阅读:55 留言:0更新日期:2018-06-09 23:17
一般来说,描述用于在多个转变期间译码高阶立体混响系数的技术。一种包括处理器和耦合到所述处理器的存储器的装置可经配置以执行所述技术。所述处理器可经配置以获得环境HOA系数在所述位流的与前景音频信号处于转变中相同的帧期间是否处于转变中的多转变指示。所述处理器还可经配置以基于所述多转变指示获得描述对应前景音频信号的空间特性的向量,所述向量和所述对应HOA音频信号两者从所述HOA音频数据分解。所述存储器可经配置以存储所述向量。

【技术实现步骤摘要】
【国外来华专利技术】在多个转变期间译码高阶立体混响系数本申请案主张标题为“在多个转变期间译码高阶立体混响系数(CODINGHIGHER-ORDERAMBISONICCOEFFICIENTSDURINGMULTIPLETRANSITIONS)”且在2015年10月14日申请的第62/241,665号美国临时申请案的权益,以上申请案的整个内容以引用的方式并入本文中。
本专利技术涉及音频数据,且更具体来说,涉及高阶立体混响音频数据的压缩。
技术介绍
高阶立体混响(HOA)信号(常常由多个球面谐波系数(SHC)或其它分层元素表示)是声场的三维表示。HOA或SHC表示可以独立于用以重放从SHC信号渲染的多声道音频信号的局部扬声器几何布置的方式来表示声场。SHC信号也可促进向后兼容性,因为所述SHC信号可被渲染为众所周知的且被高度采用的多声道格式(例如,5.1音频声道格式或7.1音频声道格式)。因此,所述SHC表示可实现也适应向后兼容性的对声场的更好表示。
技术实现思路
一般来说,描述用于压缩高阶立体混响音频数据的技术。高阶立体混响音频数据可包括对应于具有大于一的阶数的球谐基础函数的至少一个球谐系数。在一个方面,一种经配置以解码表示高阶立体混响(HOA)音频数据的位流的装置,所述装置包括一或多个处理器,其经配置以获得环境HOA系数在位流的与前景音频信号处于转变中相同的帧期间是否处于转变中的多转变指示,且基于所述多转变指示,获得描述对应前景音频信号的空间特性的向量,所述向量和所述对应前景音频信号两者均已从HOA音频数据分解。所述装置还包括存储器,其耦合到所述一或多个处理器,且经配置以存储所述向量。另一方面,一种解码表示高阶立体混响(HOA)音频数据的位流的方法,所述方法包括:获得环境HOA系数在位流的与当前景音频信号处于转变中相同的帧期间是否处于转变中的多转变指示;以及基于所述多转变指示,获得描述对应前景音频信号的空间特性的向量,所述向量和所述对应前景音频信号所述已从所述HOA音频数据分解。另一方面,一种非暂时性计算机可读存储媒体上面存储有指令,所述指令在被执行时,致使一或多个处理器:获得环境HOA系数在位流的与前景音频信号处于转变中相同的帧期间是否处于转变中的多转变指示;且基于所述多转变指示,获得描述对应前景音频信号的空间特性的向量,所述向量和所述对应前景音频信号两者已从HOA音频数据分解。另一方面,一种用于解码表示高阶立体混响(HOA)音频数据的位流的装置,所述装置包括:用于获得环境HOA系数在位流的与当前景音频信号处于转变中相同的帧期间是否处于转变中的多转变指示的装置;以及用于基于所述多转变指示,获得描述对应前景音频信号的空间特性的向量的装置,所述向量和所述对应前景音频信号所述已从所述HOA音频数据分解。在附图和以下描述中陈述所述技术的一或多个方面的细节。这些技术的其它特征、目标和优点将从所述描述和图式以及从所附权利要求书而显而易见。附图说明图1是说明具有各种阶和子阶的球面谐波基础函数的图。图2是说明可执行本专利技术中所描述的技术的各个方面的系统的图。图3是更详细说明可执行本专利技术中描述的技术的各个方面的图2的实例中所示的音频编码装置的一个实例的框图。图4是更详细地说明图2的音频解码装置的框图。图5A是说明当同一帧期间出现多个转变时位流中的帧的信令的图。图5B是说明根据本专利技术中描述的技术的各个方面当同一帧期间出现多个转变时位流中的帧的信令的图。图6到9是说明图2中示出的音频编码装置在执行本专利技术中描述的技术的各个方面时的实例操作的流程图。图10到13是说明图2中示出的音频解码装置在执行本专利技术中描述的技术的各个方面时的实例操作的流程图。具体实施方式环绕声音的演变现今已使许多娱乐输出格式可用。此类消费型环绕声格式的实例大部分为基于“声道”的,这是因为其以某些几何坐标隐含地指定到扩音器的馈入。消费型环绕声格式包含普遍的5.1格式(其包含以下六个声道:左前(FL)、右前(FR)、中心或前中心、左后或左环绕、右后或右环绕,以及低频效应(LFE))、发展中的7.1格式、包含高度扬声器的各种格式,例如7.1.4格式以及22.2格式(例如,用于结合超高清晰电视标准使用)。非消费型格式可跨越任何数量的扬声器(成对称和非对称几何布置),其往往被称为“环绕阵列”。此阵列的一个实例包含定位在截头二十面体的拐角上的坐标处的32个扩音器。到未来MPEG编码器的输入视情况为三个可能格式中的一者:(i)传统的基于声道的音频(如上文所论述),其意图由在预先指定的位置的扩音器播放;(ii)基于对象的音频,其涉及用于单个音频对象的具有含有其位置坐标(除了其它信息之外)的相关联元数据的离散脉冲代码调制(PCM)数据;以及(iii)基于场景的音频,其涉及使用球面谐波基础函数的系数(也称为“球面谐波系数”或SHC、“高阶立体混响”或HOA和“HOA系数”)来表示声场。所述未来MPEG编码器可在由国际标准化组织/国际电工委员会(ISO)/(IEC)JTC1/SC29/WG11/N13411在2013年1月在瑞士日内瓦发布的标题为“对3D音频的提议的要求(CallforProposalsfor3DAudio)”的文献中更详细地描述,并且该文献可在http://mpeg.chiariglione.org/sites/default/files/files/standards/parts/docs/w13411.zip获得。在市场中存在各种基于“环绕声”声道的格式。它们的范围(例如)是从5.1家庭影院系统(其在使起居室享有立体声方面已获得最大成功)到NHK(日本广播协会或日本广播公司)所开发的22.2系统。内容创建者(例如,好莱坞工作室)将希望一次产生电影的音轨,而不用花费精力来针对每个扬声器配置对其进行再混合。近来,标准开发组织(StandardsDevelopingOrganizations)一直在考虑如下方式:将编码和后续解码(适合于且不知晓重放位置(涉及渲染器)处的扬声器几何形状(及数目)和声学条件)提供于标准化位流中。为了向内容创建者提供此灵活性,可使用分层元素集合来表示声场。所述分层元素集合可指的是元素被排序以使得较低阶元素的基础集合提供模型化声场的完整表示的一组元素。在所述集合扩展以包含高阶元素时,所述表示变得更详细,从而增加分辨率。分层元素集合的一个实例为球面谐波系数(SHC)的集合。以下表达式示范使用SHC对声场的描述或表示:此表达式示出可由唯一地表示在时间t声场在任何点处的压力pi。此处,c为声速(约343m/s),为参考点(或观测点),jn(·)为具有阶数n的球面贝塞耳函数(sphericalBesselfunction),且为具有阶数n和子阶数m的球面谐波基础函数。可认识到,方括号中的术语为信号的频域表示(即,其可由各种时频变换近似表示,例如离散傅里叶变换(DFT)、离散余弦变换(DCT)或小波变换。分层集合的其它实例包含小波变换系数的集合和多分辨率基础函数的系数的其它集合。图1是说明从零阶(n=0)到四阶(n=4)的球面谐波基础函数的图。如可看出,对于每一阶,存在子阶m的扩展,出于易于说明的目的,在图1的实例中示出所述子阶但未明确提到。可通过各种麦克风阵列本文档来自技高网...
在多个转变期间译码高阶立体混响系数

【技术保护点】
一种经配置以解码表示高阶立体混响HOA音频数据的位流的装置,所述装置包括:一或多个处理器,其经配置以:获得环境HOA系数在所述位流的与前景音频信号处于转变中相同的帧期间是否处于转变中的多转变指示;以及基于所述多转变指示获得描述对应前景音频信号的空间特性的向量,所述向量和所述对应前景音频信号两者已从所述HOA音频数据分解;存储器,其耦合到所述一或多个处理器,且经配置以存储所述向量。

【技术特征摘要】
【国外来华专利技术】2015.10.14 US 62/241,665;2016.10.11 US 15/290,2291.一种经配置以解码表示高阶立体混响HOA音频数据的位流的装置,所述装置包括:一或多个处理器,其经配置以:获得环境HOA系数在所述位流的与前景音频信号处于转变中相同的帧期间是否处于转变中的多转变指示;以及基于所述多转变指示获得描述对应前景音频信号的空间特性的向量,所述向量和所述对应前景音频信号两者已从所述HOA音频数据分解;存储器,其耦合到所述一或多个处理器,且经配置以存储所述向量。2.根据权利要求1所述的装置,其中所述一或多个处理器进一步经配置以获得在所述位流的所述帧期间处于转变中的环境HOA系数的数目的背景指示,且其中所述一或多个处理器经配置以基于所述背景指示获得所述多转变指示。3.根据权利要求2所述的装置,其中所述一或多个处理器经配置以响应于指示相对于所述环境HOA系数中的一者已发生转变的指示,获得所述背景指示。4.根据权利要求2所述的装置,其中所述一或多个处理器经配置以获得指示所述环境HOA系数中的哪些在所述位流的所述帧期间处于转变中的指示。5.根据权利要求1所述的装置,其中所述一或多个处理器进一步经配置以获得前景音频信号在所述位流的所述帧期间是否处于转变中的前景指示,且其中所述一或多个处理器经配置以基于所述前景指示获得所述多转变指示。6.根据权利要求1所述的装置,其中所述多转变指示指示所述环境HOA系数在所述位流的与所述前景音频信号淡入相同的帧期间是否淡入。7.根据权利要求1所述的装置,其中所述多转变指示指示所述环境HOA系数在所述位流的与所述前景音频信号淡出相同的帧期间是否淡出。8.根据权利要求1所述的装置,其中所述一或多个处理器进一步经配置以:基于所述向量重构所述HOA音频数据;以及基于所述HOA音频数据,渲染一或多个扩音器馈送。9.根据权利要求8所述的装置,其进一步包括一或多个扩音器,其中所述一或多个处理器进一步经配置以输出所述一或多个扩音器馈送,以驱动所述一或多个扩音器。10.根据权利要求8所述的装置,其中所述装置包括电视机,所述电视机包含一或多个集成扩音器,且其中所述一或多个处理器进一步经配置以输出所述一或多个扩音器馈送,以驱动所述一或多个扩音器。11.根据权利要求8所述的装置,其中所述装置包括接收器,所述接收器耦合到一或多个扩音器,且其中所述一或多个处理器进一步经配置以输出所述一或多个扩音器馈送,以驱动所述一或多个扩音器。12.一种解码表示高阶立体混响HOA音频数据的位流的方法,所述方法包括:获得环境HOA系数在所述位流的与前景音频信号处于转变中相同的帧期间是否处于转变中的多转变指示;以及基于所述多转变指示,获得描述对应前景音频信号的空间特性的向量,所述向量和所述对应前景音频信号两者已从所述HOA音频数据分解。13.根据权利要求12所述的方法,其进一步包括:获得在所述位流的所述帧期间处于转变中的环境HOA系数的数目的背景指示;以及获得前景音频信号在所述位流的所述帧期间是否处于转变中的前景指示,其中获得所述多转变指示包括基于所述前景指示和所述背景指示,获得所述多转变指示。14.根据权利要求13所述的方法,其中获得所述背景指示包括响应于指示相对于所述环境HOA系数中的一者已发生转变的指示,获得所述背景指示。15.根据权利要求13所述的方法,其进一步包括获得指示所述环境HOA系数中的哪些在所述位流的所述帧期间处于转变中的指示。16.根据权利要求13所述的方法,其中获得所述前景指示包括在对应于所述前景音频信号的所述向量的译码模式指示所述向量是减小的向量时,基于所述位流的不同帧的输送声道的类型的指示,获得所述前景指示。17.根据权利要求13所述的方法,其进一步包括从所述位流的所述帧,获得所述第一帧是否为使所述帧能够不参考所述位流的不同帧来解码的独立帧的独立帧指示。18.根据权利要求17所述的方法,其中获得所述前景指示包括响应于所述独立帧指示指示所述第一帧是独立帧,从所述位流获得所述前景指示。19.根据权利要求17所述的方法,其进一步包括响应于所述独立帧指示指示所述第一帧不是独立帧,获得所述不同帧的所述输送声道的类型的指示。20.根据权利要求19所述的方法,其中获得所述前景指示包括基于所述不同帧的所述输送声道的所述类型的所述指示,获得所述帧的所述输送声道的所述前景指示,其指示所述不同帧的所述相同输送声道是否包含所述基于向量的音频信号。21.根据权利要求19所述的方法,其中获得所述前景指示包括在对应于所述前景音频信号的向量的译码模式指示所述向量是减小的向量时,基于所述不同帧的所述输送声道的所述类型的所述指示,获得所述帧的所述输送声道的所述前景指示,其指示所述不同帧的所述相同输送声道是否包含所述基于向量的音频信号。22.根据权利要求19所述的方法,其中获得所述独立帧指示包括在对应于所述前景音频信号的所述向量的译码模式指示所述向量是减小的向量时,获得所述帧的所述输送声道的所述独立帧指示,其指示所述不同帧的所述相同输送声道是否包含所述基于向量的音频信号。23.根据权利要求12所述的方法,其中所述方法由耦合到一或多个扩音器的装置执行,其中所述方法进一步包括:基于所述向量来重构所述HOA音频数据;基于所述HOA音频数据,渲染一或多个扩音器馈送;以及输出所述一或多个扩音器馈送以驱动所述一或多个扩音器。24.根据权利要求23所述的方法,其中所述装置包括电视机,且其中所述一或多个扩音器包括集成在所述电视机内的一或多个扩音器。其中所述一或多个处理器进一步经配置以输出所述一或多个扩音器馈送,以驱动所述一或多个扩音器。25.根据权利要求23所述的方...

【专利技术属性】
技术研发人员:N·G·彼得斯D·森金墨永
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1