基于对象的音频编码系统中利用旁路音频对象信号的通知响度估计的解码器、编码器及方法技术方案

技术编号:12492704 阅读:160 留言:0更新日期:2015-12-11 15:07
提供一种用于产生包括一个或更多个音频输出声道的音频输出信号的解码器。解码器包括接收接口(110),接收接口(110)用于接收包括多个音频对象信号的音频输入信号、关于音频对象信号的响度信息、以及指示音频对象信号中的一个或更多个是否应放大或衰减的呈现信息。此外,解码器包括用于产生音频输出信号的一个或更多个音频输出声道的信号处理器(120)。信号处理器(120)被配置成根据响度信息且根据呈现信息确定响度补偿值。此外,信号处理器(120)被配置成根据呈现信息且根据响度补偿值从音频输入信号产生音频输出信号的一个或更多个音频输出声道。利用一个或更多个旁路音频对象信号产生音频输出信号。此外,提供一种编码器。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】基于对象的音频编码系统中利用旁路音频对象信号的通知 响度估计的解码器、编码器及方法 本专利技术设及音频信号编码、处理及解码,特别地,设及用于基于对象的音频编码系 统中的通知响度估计的解码器、编码器及方法。 近来,在音频编码怔CC、JSC、SA0C、SA0C1、SA0C2]及通知源分离的领域中已提出用于包括多个音频对象信号的音频场景的具比特 率效益的传输/储存的参数技术。运些技术旨在基于描述所传输/储存的音频场景和/或 该音频场景中的源对象的附加边信息(sidein化rmation)来重构希望的输出音频场景或 音频源对象。此重构使用通知源分离方案而发生于解码器中。可W对重构的对象进行组合 W产生输出音频场景。取决于组合对象的方式,输出场景的感知响度可W不同。 在TV及无线电广播中,可基于各个方面诸如峰值信号水平或响度水平来规范化 各个节目的音轨的音量水平。取决于信号的动态特性,具有相同峰值水平的两个信号可能 具有大不相同的感知响度水平。现在,在节目或频道之间切换,信号响度的差异非常恼人, 且已成为终端用户对广播的抱怨的主要来源。 在现有技术中,已提出使用基于感知信号响度的测量将所有频道上的所有节目类 似地规范化至共同基准水平。在欧洲的一个此种推荐为邸U推荐R128圧脚](后文称为 R128)。 该推荐称,"节目响度",例如一个节目(或一个广告或某其他有意义的节目实体) 的平均响度应等于指定水平(允许有小的偏差)。当愈来愈多的广播台符合此推荐及所要 求的规范化时,应最小化节目及频道之间的平均响度的差异。 可WW若干方式进行响度估计。存在用于估计音频信号的感知响度的若干数学模 型。邸U推荐R128依赖于口U-RBS. 1770(后文称为BS. 1770)(参见)中提出的模型 用于响度估计。 如前所述,例如根据邸U推荐R128,节目响度例如一个节目的平均响度应等于指 定水平,允许有小的偏差。然而,运导致了进行音频呈现时的显著问题,迄今在现有技术中 仍未解决。在解码器侧进行音频呈现对所接收音频输入信号的总体/总响度具有显著影 响。然而,尽管进行场景呈现,所接收音频信号的总响度应保持相同。 当前,对于此问题不存在特定的解码器侧解决方案。 EP2 146 522Al(圧門)设及使用基于对象的元数据产生音频输出信号的构思。 其生成表示至少两个不同音频对象信号的叠加的至少一个音频输出信号,但未提供对此问 题的解决方案。 WO2008/035275A2(怔RE])描述了一种包括编码器的音频系统,该编码器在编码 单元中编码音频对象,该编码单元产生下混音频信号及表示多个音频对象的参数数据。该 下混音频信号及参数数据被传输至包括解码单元及呈现单元的解码器,该解码单元产生音 频对象的近似复本且该呈现单元根据该音频对象产生输出信号。此外,该解码器含有用于 产生被发送至编码器的编码修改数据的处理器。然后,该编码器响应于该编码修改数据而 修改该音频对象的编码,且特别是修改该参数数据。该方法允许由解码器控制对音频对象 的操纵但完全或部分地由编码器进行对音频对象的操纵。因此,可对实际的独立的音频对 象而非对近似复本进行操纵,藉此提高效能。 EP2 146 522Al([SC田)公开了一种用于产生表示至少两个不同音频对象的叠 加的至少一个音频输出信号的设备,其包括用于处理音频输入信号W提供音频输入信号的 对象表示的处理器,其中此对象表示可通过使用对象下混信号对原始对象进行参数导引近 似而产生。对象操纵器使用设及各个音频对象的基于音频对象的元数据来单独地操纵对 象,W获得经操纵的音频对象。使用对象混合器对经操纵的音频对象进行混合W取决于特 定呈现设定而最终获得具有一个或若干个声道信号的音频输出信号。 WO2008/046531Al(圧NG])描述了一种使用多个音频对象生成编码对象信号的 音频对象编码器,其包含:下混信息产生器,其用于产生指示多个音频对象至至少两个下混 声道的分配的下混信息;音频对象参数产生器,其用于产生音频对象的对象参数;W及输 出接口,其用于使用该下混信息及对象参数来产生导入的音频输出信号。音频合成器使用 下混信息来产生可用于建立预定义音频输出配置的多个输出声道的输出数据。 希望的是无延迟地具有对输出平均响度或平均响度改变的准确估计,且当节目不 改变或呈现场景不改变时,平均响度估计也应该保持静态。 本专利技术的目标是提供改进的音频信号编码、处理及解码构思。本专利技术的目标通过 W下来解决:根据权利要求1所述的解码器、根据权利要求9所述的编码器、根据权利要求 11所述的系统、根据权利要求12所述的方法、根据权利要求13所述的方法及根据权利要求 15所述的计算机程序。 提供了用于估计基于对象的音频编码系统中的输出的响度的通知方式。所提供的 构思依赖于关于待提供至解码器的音频混合中的对象的响度的信息。解码器使用此信息连 同呈现信息用于估计输出信号的响度。例如,此举允许接着估计默认下混与呈现的输出之 间的响度差异。接着可W补偿该差异W无关于呈现信息而获得输出中的大致恒定的响度。 解码器中的响度估计W全参数方式发生,且与基于信号的响度估计构思相比,其在计算上 非常轻便且准确。 提供了用于使用纯参数概念获得关于特定输出场景的响度的信息的构思,其因此 允许在不进行解码器中的明确的基于信号的响度估计的情况下进行响度处理。此外,描述 了通过MPEG[SA0幻标准化的空间音频对象编码(SAOC)的特定技术,但所提供的构思亦可 结合其他音频对象编码技术来使用。 提供了用于产生包括一个或更多个音频输出声道的音频输出信号的解码器。该解 码器包括接收接口,该接收接口用于接收包括多个音频对象信号的音频输入信号,用于接 收关于该音频对象信号的响度信息,且用于接收指示该音频对象信号中的一个或更多个应 放大还是衰减的呈现信息。此外,该解码器包括用于产生该音频输出信号的一个或更多个 音频输出声道的信号处理器。该信号处理器被配置成取决于该响度信息且取决于该呈现信 息来确定响度补偿值。此外,该信号处理器被配置成取决于该呈现信息且取决于该响度补 偿值而自该音频输入信号产生该音频输出信号的所述一个或更多个音频输出声道。 根据一实施方式,该信号处理器可被配置成取决于该呈现信息且取决于该响度补 偿值而自该音频输入信号产生该音频输出信号的一个或更多个音频输出声道,使得该音频 输出信号的响度等于该音频输入信号的响度,或使得该音频输出信号的响度比经修改音频 信号的响度更接近于该音频输入信号的响度,该经修改音频信号是通过根据该呈现信息放 大或衰减该音频输入信号的音频对象信号而修改该音频输入信号来产生。 根据另一实施方式,可将音频输入信号的音频对象信号中的每个指派给两个或更 多个组中的确切的一个组,其中所述两个或更多个组中的每个可包括该音频输入信号的音 频对象信号中的一个或更多个。在此实施方式中,该接收接口可被配置成接收所述两个或 更多个组中的每一个组的响度值作为响度信息,其中该响度值指示该组的所述一个或更多 个音频对象信号的原始总响度。此外,该接收接口可被配置成接收针对所述两个或更多个 组中的至少一个组通过指示该组的一个或更多个音频对象信号的经修改总响度而指示应 放本文档来自技高网...

【技术保护点】
一种用于产生包括一个或更多个音频输出声道的音频输出信号的解码器,其中,所述解码器包括:接收接口(110),用于接收包括多个音频对象信号的音频输入信号、用于接收关于所述音频对象信号的响度信息、以及用于接收指示所述音频对象信号中的一个或更多个是应放大还是衰减的呈现信息;以及信号处理器(120),用于产生所述音频输出信号的所述一个或更多个音频输出声道,其中,所述接收接口(110)被配置成接收包括一个或更多个下混声道的下混信号作为所述音频输入信号,其中所述一个或更多个下混声道包括所述音频对象信号,并且其中所述一个或更多个下混声道的数目小于所述音频对象信号的数目,其中,所述接收接口(110)被配置成接收指示所述音频对象信号如何混合在所述一个或更多个下混声道内的下混信息,其中,所述接收接口(110)被配置成接收一个或更多个其他旁路音频对象信号,其中所述一个或更多个其他旁路音频对象信号未混合在所述下混信号内,其中,所述接收接口(110)被配置成接收所述响度信息,所述响度信息指示关于混合在所述下混信号内的所述音频对象信号的响度的信息且指示关于未混合在所述下混信号内的所述一个或更多个其他旁路音频对象信号的响度的信息,其中,所述信号处理器(120)被配置成根据关于混合在所述下混信号内的所述音频对象信号的响度的信息且根据关于未混合在所述下混信号内的所述一个或更多个其他旁路音频对象信号的响度的信息来确定响度补偿值,并且其中,所述信号处理器(120)被配置成根据所述下混信息、根据所述呈现信息且根据所述响度补偿值,从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道。...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:约尼·保卢斯萨沙·迪施哈拉尔德·富克斯伯恩哈德·格里尔奥利弗·赫尔穆特阿德里安·穆尔塔扎法尔科·里德布施莱昂·特伦提夫
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1