解码器、编码器、产生音频输出信号的方法及编码方法技术

技术编号:26893005 阅读:36 留言:0更新日期:2020-12-29 16:14
提供了解码器、编码器、产生音频输出信号的方法及编码方法。提供用于产生包括一个或更多个音频输出声道的音频输出信号的解码器。解码器包括接收接口,接收接口用于接收包括多个音频对象信号的音频输入信号、关于音频对象信号的响度信息、以及指示音频对象信号中的一个或更多个是否应放大或衰减的呈现信息。此外,解码器包括用于产生音频输出信号的一个或更多个音频输出声道的信号处理器。信号处理器被配置成根据响度信息且根据呈现信息确定响度补偿值。此外,信号处理器被配置成根据呈现信息且根据响度补偿值从音频输入信号产生音频输出信号的一个或更多个音频输出声道。利用一个或更多个旁路音频对象信号产生音频输出信号。此外,提供编码器。

【技术实现步骤摘要】
解码器、编码器、产生音频输出信号的方法及编码方法本专利技术申请是申请日为2014年11月27日,并于2015年9月23日进入中国国家阶段的专利技术名称为“解码器、编码器及用于编码的方法”的第201480017668.5号专利技术专利申请的分案申请。
本专利技术涉及音频信号编码、处理及解码,特别地,涉及用于基于对象的音频编码系统中的通知响度估计的解码器、编码器及方法。
技术介绍
近来,在音频编码[BCC、JSC、SAOC、SAOC1、SAOC2]及通知源分离[ISS1、ISS2、ISS3、ISS4、ISS5、ISS6]的领域中已提出用于包括多个音频对象信号的音频场景的具比特率效益的传输/储存的参数技术。这些技术旨在基于描述所传输/储存的音频场景和/或该音频场景中的源对象的附加边信息(sideinformation)来重构希望的输出音频场景或音频源对象。此重构使用通知源分离方案而发生于解码器中。可以对重构的对象进行组合以产生输出音频场景。取决于组合对象的方式,输出场景的感知响度可以不同。在TV及无线电广播中,可基于各个方面诸如峰值信本文档来自技高网...

【技术保护点】
1.一种用于产生包括一个或更多个音频输出声道的音频输出信号的解码器,其中,所述解码器包括:/n接收接口(110),用于接收包括多个音频对象信号的音频输入信号、用于接收关于所述音频对象信号的响度信息、以及用于接收指示所述音频对象信号中的一个或更多个是应放大还是衰减的呈现信息;以及/n信号处理器(120),用于产生所述音频输出信号的所述一个或更多个音频输出声道,/n其中,所述接收接口(110)被配置成接收包括一个或更多个下混声道的下混信号作为所述音频输入信号,其中所述一个或更多个下混声道包括所述音频对象信号,并且其中所述一个或更多个下混声道的数目小于所述音频对象信号的数目,/n其中,所述接收接口(...

【技术特征摘要】
20131127 EP 13194664.21.一种用于产生包括一个或更多个音频输出声道的音频输出信号的解码器,其中,所述解码器包括:
接收接口(110),用于接收包括多个音频对象信号的音频输入信号、用于接收关于所述音频对象信号的响度信息、以及用于接收指示所述音频对象信号中的一个或更多个是应放大还是衰减的呈现信息;以及
信号处理器(120),用于产生所述音频输出信号的所述一个或更多个音频输出声道,
其中,所述接收接口(110)被配置成接收包括一个或更多个下混声道的下混信号作为所述音频输入信号,其中所述一个或更多个下混声道包括所述音频对象信号,并且其中所述一个或更多个下混声道的数目小于所述音频对象信号的数目,
其中,所述接收接口(110)被配置成接收指示所述音频对象信号如何混合在所述一个或更多个下混声道内的下混信息,其中,所述接收接口(110)被配置成接收一个或更多个其他旁路音频对象信号,其中所述一个或更多个其他旁路音频对象信号未混合在所述下混信号内,
其中,所述接收接口(110)被配置成接收所述响度信息,所述响度信息指示关于混合在所述下混信号内的所述音频对象信号的响度的信息且指示关于未混合在所述下混信号内的所述一个或更多个其他旁路音频对象信号的响度的信息,
其中,所述信号处理器(120)被配置成根据关于混合在所述下混信号内的所述音频对象信号的响度的信息且根据关于未混合在所述下混信号内的所述一个或更多个其他旁路音频对象信号的响度的信息来确定响度补偿值,并且
其中,所述信号处理器(120)被配置成根据所述下混信息、根据所述呈现信息且根据所述响度补偿值,从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道。


2.根据权利要求1所述的解码器,其中,所述信号处理器(120)被配置成根据所述呈现信息且根据所述响度补偿值从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道,使得所述音频输出信号的响度等于所述音频输入信号的响度,或使得所述音频输出信号的响度比经修改音频信号的响度更接近于所述音频输入信号的响度,所述经修改音频信号是通过根据所述呈现信息放大或衰减所述音频输入信号的所述音频对象信号而修改所述音频输入信号来产生的。


3.根据权利要求2所述的解码器,
其中,所述信号处理器(120)被配置成通过根据所述呈现信息放大或衰减所述音频输入信号的所述音频对象信号而修改所述音频输入信号来产生所述经修改音频信号,并且
其中,所述信号处理器(120)被配置成通过将所述响度补偿值应用于所述经修改音频信号而产生所述音频输出信号,使得所述音频输出信号的响度等于所述音频输入信号的响度,或使得所述音频输出信号的响度比所述经修改音频信号的响度更接近于所述音频输入信号的响度。


4.根据权利要求1所述的解码器,
其中,所述音频输入信号的所述音频对象信号中的每个被指派给两个或更多个组中确切的一个组,其中,所述两个或更多个组中的每个组包括所述音频输入信号的所述音频对象信号中的一个或更多个,
其中,所述接收接口(110)被配置成接收所述两个或更多个组中的每个组的响度值作为所述响度信息,
其中,所述信号处理器(120)被配置成根据所述两个或更多个组中的每个组的响度值来确定所述响度补偿值,并且
其中,所述信号处理器(120)被配置成根据所述响度补偿值从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道。


5.根据权利要求1所述的解码器,其中,所述两个或更多个组中的至少一个组包括所述音频对象信号中的两者或更多个。


6.根据权利要求1所述的解码器,
其中,所述音频输入信号的所述音频对象信号中的每个被指派给作为所述两个或更多个组的确切的两个组中的确切的一个组,
其中,所述音频输入信号的所述音频对象信号中的每个被指派给所述确切的两个组中的前景对象组或所述确切的两个组中的背景对象组,
其中,所述接收接口(110)被配置成接收所述前景对象组的响度值,
其中,所述接收接口(110)被配置成接收所述背景对象组的响度值,
其中,所述信号处理器(120)被配置成根据所述前景对象组的响度值且根据所述背景对象组的响度值来确定所述响度补偿值,并且
其中,所述信号处理器(120)被配置成根据所述响度补偿值从所述音频输入信号产生所述音频输出信号的所述一个或更多个音频输出声道。


7.根据权利要求6所述的解码器,
其中,所述信号处理器(120)被配置成根据下式确定响度补偿值ΔL



其中,KFGO指示所述前景对象组的响度值,
其中,KBGO指示所述背景对象组的响度值,
其中,mFGO指示所述前景对象组的呈现增益,且
其中,mBGO指示所述背景对象组的呈现增益。


8.根据权利要求6所述的解码器,
其中,所述信号处理器(120)被配置成根据下式确定响度补偿值ΔL



其中,LFGO指示所述前景对象组的响度值,
其中,LBGO指示所述背景对象组的响度值,
其中,gFGO指示所述前景对象组的呈现增益,且
其中,gBGO指示所述背景对象组的呈现增益。


9.一种编码器,包括:
基于对象的编码单元(210;710),用于对多个音频对象信号进行编码以获得包括所述多个音频对象信号的编码音频信号;以及
对象响度编码单元(220;720;820),用于对关于所述音频对象信号的响度信息进行编码,
其中,所述响度信息包括一个或更多个响度值,其中所述一个或更多个响度值中的每个取决于所述音频对象信号中的一个或更多个,
其中,所述基于对象的编码单元(210;710)被配置成接收所述音频对象信号,其中所述音频对象信号中的每个被指派给两个或更多个组中的确切的一个组,其中所述两个或更多个组中的每个组包括所述音频对象信号中的一个或更多个,
其中,所述基于对象的编码单元(210;710)被配置成对所述两个或更多个组包括的所述音频对象信号进行下混以获得包括一个或更多个下混音频声道的下混信号作为所述编码音频信号,其中所述一个或更多个下混声道的数目小于所述两个或更多个组所包括的所述音频对象信号的数目,
其中,所述对象响度编码单元(220;720;82...

【专利技术属性】
技术研发人员:约尼·保卢斯萨沙·迪施哈拉尔德·富克斯伯恩哈德·格里尔奥利弗·赫尔穆特阿德里安·穆尔塔扎法尔科·里德布施莱昂·特伦提夫
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1