解码器及方法、编码器及编码方法、系统以及计算机程序技术方案

技术编号:24582818 阅读:24 留言:0更新日期:2020-06-21 01:21
提供一种用于产生包括一个或更多个音频输出声道的音频输出信号的解码器及方法、编码器及用于编码的方法、系统及计算机程序。解码器包括接收接口(110),接收接口用于接收包括多个音频对象信号的音频输入信号、关于音频对象信号的响度信息、以及指示音频对象信号中的一个或更多个是否应放大或衰减的呈现信息。此外,解码器包括用于产生音频输出信号的一个或更多个音频输出声道的信号处理器(120)。信号处理器(120)被配置成根据响度信息且根据呈现信息确定响度补偿值。此外,信号处理器(120)被配置成根据呈现信息且根据响度补偿值从音频输入信号产生音频输出信号的一个或更多个音频输出声道。此外,提供一种编码器。

Decoder and method, encoder and coding method, system and computer program

【技术实现步骤摘要】
解码器及方法、编码器及编码方法、系统以及计算机程序本申请为于2016年5月25日提交、申请号为201480064443.5、专利技术名称为“基于对象的音频编码系统中的通知响度估计的解码器、编码器及方法”的中国专利申请的分案申请。上述母案申请对应的PCT国际申请的国际申请日为2014年11月27日,国际申请号为PCT/EP2014/075787。本申请要求于2013年11月27日提交的欧洲专利申请第13194664.2号的优先权和权益,其全部内容通过引用并入本文。
本专利技术涉及音频信号编码、处理及解码,特别地,涉及用于基于对象的音频编码系统中的通知响度估计的解码器、编码器及方法。
技术介绍
近来,在音频编码[BCC、JSC、SAOC、SAOC1、SAOC2]及通知源分离[ISS1、ISS2、ISS3、ISS4、ISS5、ISS6]的领域中已提出用于包括多个音频对象信号的音频场景的具比特率效益的传输/储存的参数技术。这些技术旨在基于描述所传输/储存的音频场景和/或该音频场景中的源对象的附加边信息(sideinformation)来重构希望的输出音频场景或音频源对象。此重构使用通知源分离方案而发生于解码器中。可以对重构的对象进行组合以产生输出音频场景。取决于组合对象的方式,输出场景的感知响度可以不同。在TV及无线电广播中,可基于各个方面诸如峰值信号水平或响度水平来规范化各个节目的音轨的音量水平。取决于信号的动态特性,具有相同峰值水平的两个信号可能具有大不相同的感知响度水平。现在,在节目或频道之间切换,信号响度的差异非常恼人,且已成为终端用户对广播的抱怨的主要来源。在现有技术中,已提出使用基于感知信号响度的测量将所有频道上的所有节目类似地规范化至共同基准水平。在欧洲的一个此种推荐为EBU推荐R128[EBU](后文称为R128)。该推荐称,“节目响度”,例如一个节目(或一个广告或某其他有意义的节目实体)的平均响度应等于指定水平(允许有小的偏差)。当愈来愈多的广播台符合此推荐及所要求的规范化时,应最小化节目及频道之间的平均响度的差异。可以以若干方式进行响度估计。存在用于估计音频信号的感知响度的若干数学模型。EBU推荐R128依赖于ITU-RBS.1770(后文称为BS.1770)(参见[ITU])中提出的模型用于响度估计。如前所述,例如根据EBU推荐R128,节目响度例如一个节目的平均响度应等于指定水平,允许有小的偏差。然而,这导致了进行音频呈现时的显著问题,迄今在现有技术中仍未解决。在解码器侧进行音频呈现对所接收音频输入信号的总体/总响度具有显著影响。然而,尽管进行场景呈现,所接收音频信号的总响度应保持相同。当前,对于此问题不存在特定的解码器侧解决方案。EP2146522A1([EP])涉及使用基于对象的元数据产生音频输出信号的构思。其生成表示至少两个不同音频对象信号的叠加的至少一个音频输出信号,但未提供对此问题的解决方案。WO2008/035275A2([BRE])描述了一种包括编码器的音频系统,该编码器在编码单元中编码音频对象,该编码单元产生下混音频信号及表示多个音频对象的参数数据。该下混音频信号及参数数据被传输至包括解码单元及呈现单元的解码器,该解码单元产生音频对象的近似复本且该呈现单元根据该音频对象产生输出信号。此外,该解码器含有用于产生被发送至编码器的编码修改数据的处理器。然后,该编码器响应于该编码修改数据而修改该音频对象的编码,且特别是修改该参数数据。该方法允许由解码器控制对音频对象的操纵但完全或部分地由编码器进行对音频对象的操纵。因此,可对实际的独立的音频对象而非对近似复本进行操纵,藉此提高效能。EP2146522A1([SCH])公开了一种用于产生表示至少两个不同音频对象的叠加的至少一个音频输出信号的设备,其包括用于处理音频输入信号以提供音频输入信号的对象表示的处理器,其中此对象表示可通过使用对象下混信号对原始对象进行参数导引近似而产生。对象操纵器使用涉及各个音频对象的基于音频对象的元数据来单独地操纵对象,以获得经操纵的音频对象。使用对象混合器对经操纵的音频对象进行混合以取决于特定呈现设定而最终获得具有一个或若干个声道信号的音频输出信号。WO2008/046531A1([ENG])描述了一种使用多个音频对象生成编码对象信号的音频对象编码器,其包含:下混信息产生器,其用于产生指示多个音频对象至至少两个下混声道的分配的下混信息;音频对象参数产生器,其用于产生音频对象的对象参数;以及输出接口,其用于使用该下混信息及对象参数来产生导入的音频输出信号。音频合成器使用下混信息来产生可用于建立预定义音频输出配置的多个输出声道的输出数据。希望的是无延迟地具有对输出平均响度或平均响度改变的准确估计,且当节目不改变或呈现场景不改变时,平均响度估计也应该保持静态。
技术实现思路
本专利技术的目标是提供改进的音频信号编码、处理及解码构思。本专利技术的目标通过以下来解决:根据实施方式的一个方面所述的解码器、根据实施方式的其他方面所述的编码器、根据实施方式的其他方面所述的系统、根据实施方式的其他方面所述的方法、根据实施方式的其他方面所述的方法及根据实施方式的其他方面所述的计算机程序。提供了用于估计基于对象的音频编码系统中的输出的响度的通知方式。所提供的构思依赖于关于待提供至解码器的音频混合中的对象的响度的信息。解码器使用此信息连同呈现信息用于估计输出信号的响度。例如,此举允许接着估计默认下混与呈现的输出之间的响度差异。接着可以补偿该差异以无关于呈现信息而获得输出中的大致恒定的响度。解码器中的响度估计以全参数方式发生,且与基于信号的响度估计构思相比,其在计算上非常轻便且准确。提供了用于使用纯参数概念获得关于特定输出场景的响度的信息的构思,其因此允许在不进行解码器中的明确的基于信号的响度估计的情况下进行响度处理。此外,描述了通过MPEG[SAOC]标准化的空间音频对象编码(SAOC)的特定技术,但所提供的构思亦可结合其他音频对象编码技术来使用。提供了用于产生包括一个或更多个音频输出声道的音频输出信号的解码器。该解码器包括接收接口,该接收接口用于接收包括多个音频对象信号的音频输入信号,用于接收关于该音频对象信号的响度信息,且用于接收指示该音频对象信号中的一个或更多个应放大还是衰减的呈现信息。此外,该解码器包括用于产生该音频输出信号的一个或更多个音频输出声道的信号处理器。该信号处理器被配置成取决于该响度信息且取决于该呈现信息来确定响度补偿值。此外,该信号处理器被配置成取决于该呈现信息且取决于该响度补偿值而自该音频输入信号产生该音频输出信号的所述一个或更多个音频输出声道。根据一实施方式,该信号处理器可被配置成取决于该呈现信息且取决于该响度补偿值而自该音频输入信号产生该音频输出信号的一个或更多个音频输出声道,使得该音频输出信号的响度等于该音频输入信号的响度,或使得该音频输出信号的响度比经修改音频信号的响度更接近于该音频输入信号的响度,该经修改音频信本文档来自技高网
...

【技术保护点】
1.一种用于产生包括一个或更多个音频输出声道的音频输出信号的解码器,其中,所述解码器包括:/n接收接口(110),用于接收包括多个音频对象信号的音频输入信号、用于接收关于所述音频对象信号的响度信息、以及用于接收指示所述音频对象信号中的一个或更多个是应放大还是衰减的呈现信息;以及/n信号处理器(120),用于产生所述音频输出信号的所述一个或更多个音频输出声道,/n其中,所述信号处理器(120)被配置成根据所述响度信息且根据所述呈现信息来确定响度补偿值,并且/n其中,所述信号处理器(120)被配置成根据所述呈现信息且根据所述响度补偿值,从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道。/n

【技术特征摘要】
20131127 EP 13194664.21.一种用于产生包括一个或更多个音频输出声道的音频输出信号的解码器,其中,所述解码器包括:
接收接口(110),用于接收包括多个音频对象信号的音频输入信号、用于接收关于所述音频对象信号的响度信息、以及用于接收指示所述音频对象信号中的一个或更多个是应放大还是衰减的呈现信息;以及
信号处理器(120),用于产生所述音频输出信号的所述一个或更多个音频输出声道,
其中,所述信号处理器(120)被配置成根据所述响度信息且根据所述呈现信息来确定响度补偿值,并且
其中,所述信号处理器(120)被配置成根据所述呈现信息且根据所述响度补偿值,从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道。


2.根据权利要求1所述的解码器,其中,所述信号处理器(120)被配置成根据所述呈现信息且根据所述响度补偿值从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道,使得所述音频输出信号的响度等于所述音频输入信号的响度,或使得所述音频输出信号的响度比经修改音频信号的响度更接近于所述音频输入信号的响度,所述经修改音频信号是通过根据所述呈现信息放大或衰减所述音频输入信号的所述音频对象信号而修改所述音频输入信号来产生的。


3.根据权利要求2所述的解码器,
其中,所述信号处理器(120)被配置成通过修改所述音频输入信号来产生所述经修改音频信号,其中通过根据所述呈现信息放大或衰减所述音频输入信号的所述音频对象信号而修改所述音频输入信号,并且
其中,所述信号处理器(120)被配置成通过将所述响度补偿值应用于所述经修改音频信号而产生所述音频输出信号,使得所述音频输出信号的响度等于所述音频输入信号的响度,或使得所述音频输出信号的响度比所述经修改音频信号的响度更接近于所述音频输入信号的响度。


4.根据权利要求1所述的解码器,
其中,所述音频输入信号的所述音频对象信号中的每个被指派给两个或更多个组中确切的一个组,其中,所述两个或更多个组中的每个组包括所述音频输入信号的所述音频对象信号中的一个或更多个,
其中,所述接收接口(110)被配置成接收所述两个或更多个组中的每个组的响度值作为所述响度信息,
其中,所述信号处理器(120)被配置成根据所述两个或更多个组中的每个组的响度值来确定所述响度补偿值,并且
其中,所述信号处理器(120)被配置成根据所述响度补偿值从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道。


5.根据权利要求4所述的解码器,其中,所述两个或更多个组中的至少一个组包括所述音频对象信号中的两个或更多个。


6.根据权利要求1所述的解码器,
其中,所述音频输入信号的所述音频对象信号中的每个被指派给多于两个组中的确切的一个组,其中所述多于两个组中的每个组包括所述音频输入信号的所述音频对象信号中的一个或更多个,
其中,所述接收接口(110)被配置成接收所述多于两个组中的每个组的响度值作为所述响度信息,
其中,所述信号处理器(120)被配置成根据所述多于两个组中的每个组的响度值来确定所述响度补偿值,并且
其中,所述信号处理器(120)被配置成根据所述响度补偿值从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道。


7.根据权利要求6所述的解码器,其中,所述多于两个组中的至少一个组包括所述音频对象信号中的两个或更多个。


8.根据权利要求4所述的解码器,
其中,所述信号处理器(120)被配置成根据下式确定所述响度补偿值



或者根据下式确定所述响度补偿值



其中,ΔL是所述响度补偿值,
其中,i指示所述音频对象信号中的第i个音频对象信号,
其中,Li是所述第i个音频对象信号的响度,
其中,gi是所述第i个音频对象信号的第一混合权重,
其中,hi是所述第i个音频对象信号的第二混合权重,
其中,c是常数值,并且
其中,N是数目。


9.根据权利要求4所述的解码器,
其中,所述信号处理器(120)被配置成根据下式确定所述响度补偿值



其中,ΔL是所述响度补偿值,
其中,i指示所述音频对象信号中的第i个音频对象信号,
其中,gi是所述第i个音频对象信号的第一混合权重,
其中,hi是所述第i个音频对象信号的第二混合权重,
其中,N是数目,并且
其中,Ki是根据下式定义的
Ki=Li-LREF,
其中,Li是所述第i个音频对象信号的响度,并且
其中,LREF是基准对象的响度。


10.根据权利要求4所述的解码器,
其中,所述音频输入信号的所述音频对象信号中的每个被指派给作为所述两个或更多个组的确切的两个组中的确切的一个组,
其中,所述音频输入信号的所述音频对象信号中的每个被指派给所述确切的两个组中的前景对象组或所述确切的两个组中的背景对象组,
其中,所述接收接口(110)被配置成接收所述前景对象组的响度值,
其中,所述接收接口(110)被配置成接收所述背景对象组的响度值,
其中,所述信号处理器(120)被配置成根据所述前景对象组的响度值且根据所述背景对象组的响度值来确定所述响度补偿值,并且
其中,所述信号处理器(120)被配置成根据所述响度补偿值从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道。


11.根据权利要求10所述的解码器,
其中,所述信号处理器(120)被配置成根据下式确定所述响度补偿值



其中,ΔL是所述响度补偿值,
其中,KFGO指示所述前景对象组的响度值,
其中,KBGO指示所述背景对象组的响度值,
其中,mFGO指示所述前景对象组的呈现增益,且
其中,mBGO指示所述背景对象组的呈现增益。


12.根据权利要求10所述的解码器,
其中,所述信号处理器(120)被配置成根据下式确定所述响度补偿值

【专利技术属性】
技术研发人员:约尼·保卢斯萨沙·迪施哈拉尔德·富克斯伯恩哈德·格里尔奥利弗·赫尔穆特阿德里安·穆尔塔扎法尔科·里德布施莱昂·特伦提夫
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1