音频信号解码器和编码器、提供上混和下混信号表示型态的方法、计算机程序及使用共用对象间相关参数值的位流技术

技术编号:7775639 阅读:234 留言:0更新日期:2012-09-15 17:52
一种用于基于下混信号表示型态和对象相关参数信息并根据渲染信息来提供上混信号表示型态的音频信号解码器,包括对象参数确定器。该对象参数确定器被构造为获得多对音频对象的对象间互相关值。该对象参数确定器被构造为评估位流信令参数以决定是评估单个对象间互相关位流参数值来获得多对相关音频对象的对象间互相关值,还是使用共用对象间互相关位流参数值来获得多对相关音频对象的对象间互相关值。音频信号解码器还包括信号处理器,其被构造为基于下混信号表示型态并使用多对相关音频对象的这些对象间互相关值以及渲染信息来获得上混信号表示型态。

【技术实现步骤摘要】
【国外来华专利技术】
根据本专利技术的实施方式涉及一种用于基于下混信号表示型态及对象相关参数信息且根据渲染信息来提供上混信号表示型态的音频信号解码器。根据本专利技术的其它实施方式涉及一种用于基于多个音频对象信号来提供位流表示型态的音频信号编码器。根据本专利技术的其它实施方式涉及一种用于基于下混信号表示型态及对象相关参数信息且根据渲染信息来提供上混信号表示型态的方法。根据本专利技术的其它实施方式涉及一种用于基于多个音频对象信号来提供位流表示型态的方法。根据本专利技术的其它实施方式涉及一种用于执行该方法的计算机程序。根据本专利技术的其它实施方式涉及表示一种多信道音频信号的位流。
技术介绍

技术介绍
在已知的音频处理、音频传输与音频储存技术中,越发期望处理多信道内容以提高听觉印象。多信道音频内容的使用为用户带来显著的改善。例如,获得3维听觉印象,其在娱乐应用中提高用户的满意度。然而,多信道音频内容在例如电话会议应用的专业环境中也是有用的,因为扬声器可懂度可通过使用多信道音频播放来提高。然而,也期望在音频质量与位率要求之间有一良好折衷以避免由于多信道应用而导致过度资源加载。最近,已提出了针对包括多个音频对象的音频场景的位率有效传输和/或储存的参数技术,例如,双耳线索编码(类型I)(参见,例如参考文献[BCC])、联合源编码(参见,例如参考文献[JSC])、以及MPEG空间音频对象编码(SAOC)(参见,例如参考文献[SA0C1]、[SA0C2]和未公开的参考文献[SA0C])。这些技术旨在感知地重构期望的输出音频场景而非利用波形匹配。图8示出了这一系统的系统概述(这里MPEG SAOO0此外,图9a示出了这一系统(这里MPEG SAOC)的系统概述。图8所示的MPEG SAOC系统800包括SAOC编码器810和SAOC解码器820。SAOC编码器810接收多个对象信号X1至xn,它们可被表示为例如时域信号或时间-频率-域信号(例如,为傅立叶变换的一组变换系数的形式,或为QMF子频带信号的形式)。SAOC编码器810通常也接收下混系数Cl1至dn,它们与对象信号X1至Xn相关联。各组下混系数可分别用于下混信号的每个信道。SAOC编码器810通常被构造为通过根据相关联的下混系数Cl1至dn组合对象信号X1至Xn来获得下混信号的信道。典型地,下混信道比对象信号X1至Xn少。为了在SAOC解码器820端(至少近似)容许分离(或分开处理)对象信号,SAOC编码器810提供一个以上的下混信号(表示为下混信道)812和旁侧信息814。旁侧信息814描述对象信号X1至Xn的特性以容许解码器端的特定对象处理。SAOC解码器820被构造为接收这一个以上的下混信号812和旁侧信息814。另外,SAOC解码器820通常被构造为接收描述期望的渲染设置的用户互动信息和/或用户控制信息822。例如,用户互动信息/用户控制信息822可描述扬声器设置并提供对象信号X1至xN的对象的期望空间布局。SAOC解码器820被构造为提供例如多个解码上混信道信号yi至yM上混信道信号可例如与多扬声器渲染配置的单个扬声器相关联。SAOC解码器820可例如包括对象分离器820a,该对象分离器820a被构造为基于一个以上的下混信号812和旁侧信息814来至少近似重构对象信号X1至xN,借此获得重构对象信号820b。然而,重构对象信号820b可能略微偏离原始对象信号X1至xN,例如,因为旁侧信息814由于比特流限制而不太够进行完美重构。SAOC解码器820可进一步包括混合器820c,该混合器820c可被构造为接收重构对象信号820b和用户互动信息/用户控制信息822并基于它们来提供上混信道信号”至 Pm。混合器820可被构造为使用用户互动信息/用户控制信息822来判定单个重构对象信号820b对上混信道信号f I至的贡献。用户互动信息/用户控制信息822可例如包括渲染参数(也被表示为渲染系数),该渲染参数判定单个重构对象信号822对上混信道信号%至夕M的贡献。然而,应该注意的是,在许多实施方式中,在单一步骤中执行由图8中的对象分离器820a指示的对象分离和由图8中的混合器820c指示的混合。为实现此目的,可计算描述一个以上的下混信号812到上混信道信号yiSyM上的直接映射的总参数。这些参数可基于旁侧信息和用户互动信息/用户控制信息820来计算。现参照图9a、图9b和图9c,将描述用于基于下混信号表示型态(representation,表示)和对象相关旁侧信息来获得上混信号表示型态的不同装置。图9a示出了包括SAOC解码器920的MPEG SAOC系统900的示意性框图。SAOC解码器920包括作为分离功能块的对象解码器922和混合器/渲染器926。对象解码器922根据下混信号表示型态(例如,为在时域或时间-频率-域中表示的一个以上的下混信号的形式)和对象相关旁侧信息(例如,为对象元数据的形式)提供多个重构对象信号924。混合器/渲染器924接收与N个对象相关联的重构对象信号924并基于它们提供一个以上的上混信道信号928。在SAOC解码器920中,对象信号924的撷取与混合/渲染分开执行,这允许将对象解码功能与混合/渲染功能分离但却带来相当高的计算复杂度。现参照图9b,将简要讨论另一 MPEG SAOC系统930,该MPEG SAOC系统930包括SAOC解码器950。SAOC解码器950根据下混信号表不型态(例如,为一个以上的下混信号的形式)和对象相关旁侧信息(例如,为对象元数据的形式)提供多个上混信道信号958。SAOC解码器950包括组合的对象解码器和混合器/渲染器,该组合的对象解码器和混合器/渲染器被构造为在联合混合处理中获得上混信道信号958而无需将对象解码与混合/渲染分开,其中,该联合上混过程的参数取决于对象相关旁侧信息和渲染信息。联合上混过程也取决于被视为对象相关旁侧信息的一部分的下混信息。综上所述,可在一个单步骤过程或一个两步骤过程中执行上混信道信号928、958的提供。现参照图9c,将描述MEPG SAOC系统960。SAOC系统960包括SAOC至MPEG环绕转码器而非SAOC解码器。SAOC至MPEG环绕转码器包括旁侧信息转码器982,该旁侧信息转码器982被构造为接收对象相关旁侧信息(例如,为对象元数据的形式)和可选地关于一个以上的下混信号的信息及渲染信息。旁侧信息转码器也被构造为基于接收数据来提供MPEG环绕旁侧信息(例如,为MPEG环绕位流的形式)。因此,旁侧信息转码器982被构造为在计入渲染信息和可选地有关一个以上的下混信号内容的信息的情况下将从对象编码器出来的对象相关(参 数)旁侧信息转换成信道相关(参数)旁侧信息。可选地,SAOC至MPEG环绕转码器980可被构造为操控例如下混信号表示型态所描述的一个以上的下混信号以获得经操控的下混信号表示型态988。然而,下混信号操控器986可被省略使得SAOC至MPEG环绕转码器980的输出下混信号表示型态988与SAOC至MPEG环绕转码器的输入下混信号表示型态相同。例如,如果信道相关MPEG环绕旁侧信息984基于SAOC至MPEG环绕转码器980的输入下混信号表示型态可能不能提供期望的听觉印象(这在一些渲染群集(本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.07.30 EP 10171406.1;2009.09.29 US 61/246,681;1.一种用于基于下混信号表示型态(110 ;430)和对象相关参数信息(112 ;432)并根据渲染信息(120 ;482)来提供上混信号表示型态(130 ;484a 484M)的音频信号解码器(100 ;.420),该装置包括 对象参数确定器(140 ;464,468,474),其被构造为获得多对音频对象的对象间互相关值(142 JOCij), 其中,所述对象参数确定器被构造为评估位流信令参数(bsOneIOC)以决定是评估单个对象间互相关位流参数值来获得多对相关音频对象的对象间互相关值,还是使用共用对象间互相关位流参数值来获得多对相关音频对象的对象间互相关值;以及信号处理器(150 ;.480),其被构造为基于所述下混信号表示型态并使用多对相关音频对象的所述对象间互相关值和所述渲染信息来获得所述上混信号表示型态。2.根据权利要求I所述的音频信号解码器,其中,所述对象参数确定器(140;464,468,.474)被构造为评估对象关系[目息(bsRelatedTo),其描述是否两首频对象彼此相关;以及 其中,所述对象参数确定器被构造为使用所述共用对象间互相关位流参数值选择性获得所述对象关系信息指示有关系的各对音频对象的对象间互相关值,并将所述对象关系信息指示没有关系的各对音频对象的对象间互相关值设为预定值。3.根据权利要求I或2所述的音频解码器,其中,所述对象参数确定器(140;464,468,.474)被构造为评估对不同音频对象的每一组合包括一个一位标志的对象关系信息,其中,与不同音频对象的指定组合相关联的所述一位标志指示所述指定组合的所述音频对象是否相关。4.根据权利要求I至3中任一项所述的音频解码器,其中,所述对象参数确定器(140;.464,468,474)被构造为将针对所有对不同相关音频对象的所述对象间互相关值设定为由所述共用对象间互相关位流参数值所定义的共用值,或由所述共用对象间互相关位流参数值所定义的所述共用值推导出的值。5.根据权利要求I至4中任一项所述的音频解码器,其中,所述对象参数确定器(140;.464,468,474)包括位流剖析器,其被构造为剖析音频内容的位流表示型态,以获得所述位流信令参数(bsOneIOC)以及所述单个对象间互相关位流参数值或所述共用对象间互相关位流参数值。6.根据权利要求I至5中任一项所述的音频解码器,其中,所述音频信号解码器被构造为,将与一对相关音频对象相关联的对象间互相关值(I0Ci; j),与描述该对相关音频对象的第一音频对象的对象层级的对象层级差值(OLDi),以及与描述该对相关音频对象的第二音频对象的对象层级的对象层级差值(OLDp组合,以获得与该对相关音频对象相关联的协方差值Gi,」)。7.根据权利要求I至6中任一项所述的音频解码器,其中,所述音频信号解码器被构造为处理三个以上音频对象;以及 其中,所述对象参数确定器(140 ;464,468,474)被构造为对每对不同音频对象提供对象间互相关值。8.根据权利要求I至7中任一项所述的音频解码器,其中,所述对象参数确定器(140;.464,468,474)被构造为评估包括在组态位流部分(SAOCSpecificConfig)中的位流信令参数,以决定是评估单个对象间互相关参数值来获得多对相关音频对象的对象间互相关值,还是使用共用对象间互相关位流参数值来获得多对相关音频对象的对象间互相关值;以及 其中,所述对象参数确定器被构造为评估包括在所述组态位流部分中的对象关系信息CbsRelatedTo [i] [j]),以确定两音频对象是否相关;以及 其中,所述对象参数确定器被构造为,如果确定使用共用对象间互相关位流参数值来获得多对相关音频对象的对象间互相关值,...

【专利技术属性】
技术研发人员:于尔根·赫莱约翰内斯·希尔珀特安德烈亚斯·赫尔策约纳斯·恩格德加德海科·普尔纳根
申请(专利权)人:弗兰霍菲尔运输应用研究公司杜比AB国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1