较高阶立体混响信号压缩制造技术

技术编号:14707517 阅读:56 留言:0更新日期:2017-02-25 20:09
本发明专利技术大体上揭示用于音频数据的压缩和解码的系统和技术。用于压缩表示声场的较高阶立体混响HOA系数的实例装置包含:存储器,其经配置以存储音频数据;以及一或多个处理器,其经配置以:基于一或多个奇异值确定何时使用所述HOA系数中的环境HOA系数来增强通过所述HOA系数的分解获得的一或多个前景音频对象,所述一或多个奇异值也是通过所述HOA系数的所述分解获得,所述环境HOA系数表示所述声场的环境分量。

【技术实现步骤摘要】
【国外来华专利技术】本申请案主张以下各者的权益:2014年5月16日申请的第61/994,800号美国临时申请案;以及2014年5月28日申请的第62/004,145号美国临时申请案,以上申请案中的每一者的整个内容以引用的方式并入本文中。
本专利技术涉及音频数据,并且更具体来说涉及音频数据的压缩。
技术介绍
较高阶立体混响(HOA)信号(常由多个球谐系数(SHC)或其它阶层元素表示)是声场的三维表示。HOA或SHC表示可以独立于用以重放从SHC信号再现的多信道音频信号的局部扬声器几何布置的方式来表示声场。SHC信号还可促进向后兼容性,因为可将SHC信号再现为众所周知的且被广泛采用的多信道格式(例如,5.1音频信道格式或7.1音频信道格式)。SHC表示因此可实现对声场的更好表示,其也适应向后兼容性。
技术实现思路
一般来说,描述用于较高阶立体混响(HOA)压缩的技术。在各种实例中,所述技术是基于与音频对象相关联的能量(或能量值)中的一或多者以及位分配机制。在一个方面中,一种压缩表示声场的较高阶立体混响(HOA)系数的方法包含:基于一或多个奇异值确定何时使用所述HOA系数中的环境HOA系数来增强通过所述HOA系数的分解获得的一或多个前景音频对象,所述一或多个奇异值也是通过所述HOA系数的所述分解获得,所述环境HOA系数表示所述声场的环境分量。在另一方面,用于对表示声场的经编码较高阶立体混响(HOA)系数进行解码的方法包含基于与所述声场的音频对象相关联的能量而对所述音频对象分配位,所述音频对象是通过所述经编码HOA系数的分解而获得。在另一方面,用于压缩表示声场的较高阶立体混响(HOA)系数的装置包含:存储器,其经配置以存储音频数据;以及一或多个处理器,其经配置以:基于一或多个奇异值确定何时使用所述HOA系数中的环境HOA系数来增强通过所述HOA系数的分解获得的一或多个前景音频对象,所述一或多个奇异值也是通过所述HOA系数的所述分解获得,所述环境HOA系数表示所述声场的环境分量。在另一方面,用于压缩表示声场的较高阶立体混响(HOA)系数的装置包含:用于基于一或多个奇异值确定何时使用所述HOA系数中的环境HOA系数来增强通过所述HOA系数的分解获得的一或多个前景音频对象的装置,所述一或多个奇异值也是通过所述HOA系数的所述分解获得,所述环境HOA系数表示所述声场的环境分量。在附图和以下描述中陈述所述技术的一或多个方面的细节。所述技术的其它特征、目标及优点将从所述描述及图式以及权利要求书中显而易见。附图说明图1是说明具有各种阶数及子阶数的球谐基底函数的图。图2是说明可执行本专利技术中所描述的技术的各种方面的系统的图。图3是更详细说明可执行本专利技术中描述的技术的各种方面的图2的实例中所示的音频编码装置的一个实例的框图。图4是更详细说明图2的音频解码装置的框图。图5A是说明音频编码装置执行本专利技术中所描述的分解技术的各种方面的示范性操作的流程图。图5B是说明音频编码装置执行本专利技术中所描述的译码技术的各种方面的示范性操作的流程图。图6是说明音频解码装置在执行本专利技术中描述的技术的各种方面中的示范性操作的流程图。图7是说明用于各种音频对象的奇异值的线图集合的概念图。图8是说明根据本文所描述的技术的音频对象信令方案的概念图。图9A到9D是说明可执行本专利技术中描述的技术的各种方面的系统以及图9A的广播网络中心的概念图。图10是更详细说明可执行本专利技术中描述的技术的各种方面的图9A的实例中所示的空间音频编码装置的一个实例的框图。图11是更详细说明图9A的音频解码装置的框图。具体实施方式环绕声的演进现今已使得许多输出格式可用于娱乐。此等消费型环绕声格式的实例大部分为“信道”式的,这是因为其以某些几何坐标隐含地指定到扩音器的馈入。消费型环绕声格式包含普遍的5.1格式(其包含以下六个信道:左前(FL)、右前(FR)、中心或前中心、左后或左环绕、右后或右环绕,及低频效应(LFE))、发展中的7.1格式、包含高度扬声器的各种格式,例如7.1.4格式及22.2格式(例如,用于供超高清晰电视标准使用)。非消费型格式可涵括任何数目的扬声器(成对称和非对称几何形状),其常常称为“环绕阵列”。此种阵列的一个实例包含定位在截角二十面体的拐角上的坐标处的32个扩音器。到未来MPEG编码器的输入任选地为三个可能格式中的一者:(i)传统的基于信道的音频(如上文所论述),其意图由处于预先指定的位置处的扩音器重放;(ii)基于对象的音频,其涉及用于单个音频对象的具有含有其位置坐标(以及其它信息)的相关联元数据的离散脉码调制(PCM)数据;及(iii)基于场景的音频,其涉及使用球谐基底函数的系数(也称为“球谐系数”或SHC、“较高阶立体混响”或HOA及“HOA系数”)来表示声场。此未来MPEG编码器可更详细地描述于国际标准化组织/国际电工委员会(ISO)/(IEC)JTC1/SC29/WG11/N13411的标题为“要求对于3D音频的提议(CallforProposalsfor3DAudio)”的文献中,该文献于2013年1月在瑞士日内瓦发布,且可在http://mpeg.chiariglione.org/sites/default/files/files/standards/parts/docs/w13411.zip获得。在市场中存在各种“环绕声”基于信道的格式。它们的范围(例如)是从5.1家庭影院系统(其在使起居室享有立体声方面已获得最大成功)到NHK(日本广播协会或日本广播公司)所开发的22.2系统。内容创建者(例如,好莱坞工作室)将希望产生电影的声迹一次,而不花费精力来针对每一扬声器配置对其进行重混。近来,标准开发组织(StandardsDevelopingOrganizations)一直在考虑如下方式:提供到标准化位流中的编码,以及后续解码,其可调适且不知晓重放位置(涉及再现器)处的扬声器几何形状(和数目)以及声学条件。为向内容创建者提供此种灵活性,可使用阶层元素集合来表示声场。所述阶层元素集合可指其中元素经排序以使得较低阶元素的基础集合提供模型化声场的完整表示的一组元素。在所述集合扩展以包含高阶元素时,所述表示变得更详细,从而增加分辨率。阶层元素集合的一个实例为球谐系数(SHC)的集合。以下表达式示范使用SHC对声场的描述或表示:所述表达式展示了在时间t处在声场的任一点处的压力pi可以通过SHC,唯一地表示。此处,c是声速(~343m/s),是参考点(或观察点),jn(·)是阶数n的球面贝塞尔函数,且是阶数n且子阶数m的球谐基底函数。可以认识到,在方括号中的项是信号的频域表示(即,),其可由各种时频变换近似表示,例如离散傅里叶变换(DFT)、离散余弦变换(DCT)或小波变换。基层集合的其它实例包含小波变换系数的集合和多分辨率基底函数的系数的其它集合。图1是说明从零阶(n=0)到四阶(n=4)的球谐基底函数的图。如可看出,对于每一阶,存在子阶m的扩展,出于易于说明的目的,在图1的实例中展示所述子阶但未明确注释。SHC可由各种麦克风阵列配置物理获取(例如,记录),或者,其可从声场的基于信道或基于对象的描述导出。SHC表示基于场景的音频,其中SH本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/21/201580025867.html" title="较高阶立体混响信号压缩原文来自X技术">较高阶立体混响信号压缩</a>

【技术保护点】
一种压缩表示声场的较高阶立体混响HOA系数的方法,所述方法包括:基于一或多个奇异值确定何时使用所述HOA系数中的环境HOA系数来增强通过所述HOA系数的分解获得的一或多个前景音频对象,所述一或多个奇异值也是通过所述HOA系数的所述分解获得,所述环境HOA系数表示所述声场的环境分量。

【技术特征摘要】
【国外来华专利技术】2014.05.16 US 61/994,800;2014.05.28 US 62/004,145;1.一种压缩表示声场的较高阶立体混响HOA系数的方法,所述方法包括:基于一或多个奇异值确定何时使用所述HOA系数中的环境HOA系数来增强通过所述HOA系数的分解获得的一或多个前景音频对象,所述一或多个奇异值也是通过所述HOA系数的所述分解获得,所述环境HOA系数表示所述声场的环境分量。2.根据权利要求1所述的方法,其中所述HOA系数还包含表示所述声场的一或多个前景音频对象的一或多个前景HOA系数。3.根据权利要求1所述的方法,其中确定何时使用所述环境HOA系数来增强所述一或多个前景音频对象包括分析通过所述HOA系数的所述分解获得的所述一或多个奇异值。4.根据权利要求1所述的方法,其中确定何时使用所述环境HOA系数来增强所述一或多个前景音频对象包括:确定所述一或多个奇异值中的一或多个环境奇异值是否小于阈值,其中所述环境奇异值与所述声场的所述环境分量相关联;以及当与所述环境分量相关联的所述一或多个环境奇异值小于所述阈值时,确定不使用所述环境HOA系数来增强所述前景音频对象。5.根据权利要求4所述的方法,其中确定何时使用所述环境HOA系数来增强所述一或多个前景音频对象包括:当所述一或多个环境奇异值等于或大于所述阈值时,确定使用所述环境HOA系数来增强所述前景音频对象。6.根据权利要求1所述的方法,其中所述一或多个奇异值中的每一者表示对应能量值的平方根。7.根据权利要求1所述的方法,其中所述一或多个奇异值中的每一者表示对应本征值的平方根。8.根据权利要求1所述的方法,其进一步包括对包含所述一或多个奇异值的一或多个S矩阵进行译码。9.根据权利要求1所述的方法,其中确定何时使用所述环境HOA系数来增强所述一或多个前景音频对象是基于对应于所述一或多个奇异值中的一或多个环境奇异值的一或多个振幅,所述环境奇异值与所述声场的所述环境分量相关联。10.根据权利要求1所述的方法,其中确定何时使用所述环境HOA系数来增强所述一或多个前景音频对象包括:确定使用所述环境HOA系数来增强所述前景音频对象;以及确定将指派给所述环境分量的位的数目。11.一种用于压缩表示声场的较高阶立体混响HOA系数的装置,所述装置包括:存储器,其经配置以存储所述声场的所述HOA系数;以及一或多个处理器,其经配置以:基于一或多个奇异值确定何时使用所述HOA系数中的环境HOA系数来增强通过所述HOA系数的分解获得的一或多个前景音频对象,所述一或多个奇异值也是通过所述HOA系数的所述分解获得,所述环境HOA系数表示所述声场的环境分量。12.根据权利要求11所述的装置,其中所述一或多个处理器进一步经配置以处理所述HOA系数,所述HOA系数包括表示所述声场的所述一或多个前景音频对象的一或多个前景HOA系数。13.根据权利要求11所述的装置,其中为了确定何时使用所述环境HOA系数来增强所述一或多个前景音频对象,所述一或多个处理器经配置以分析通过所述HOA系数的所述分解获得的所述一或多个奇异值。14.根据权利要求11所述的装置,其中为了确定何时使用所述环境HOA系数来增强所述一或多个前景音频对象,所述一或多个处理器经配置以:确定所述一或多个奇异值中的一或多个环境奇异值是否小于阈...

【专利技术属性】
技术研发人员:金墨永
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1