用于对多声道信号进行编码或解码的装置与方法制造方法及图纸

技术编号:17058765 阅读:37 留言:0更新日期:2018-01-17 21:02
实施例提供了一种对具有至少三个声道的多声道信号进行编码的装置。该装置包括迭代处理器、声道编码器和输出接口。迭代处理器被配置为在第一迭代步骤中计算所述至少三个声道中的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,并且使用多声道处理操作处理所选择的对,以导出针对所选择的对的第一多声道参数并导出第一处理声道。此外,迭代处理器被配置为在第二迭代步骤中通过使用所述处理声道的至少一个而执行所述计算、所述选择和所述处理,以导出第二多声道参数和第二处理声道。声道编码器被配置为对根据通过所述迭代处理器执行的迭代处理得到的声道进行编码以获得编码声道。输出接口被配置为产生具有所述编码声道以及第一多声道参数和第二多声道参数的编码多声道信号。

A device and method used to encode or decode multichannel signals

【技术实现步骤摘要】
【国外来华专利技术】用于对多声道信号进行编码或解码的装置与方法
本专利技术涉及音频编码/解码,具体地,涉及利用声道间信号依赖性的音频编码。
技术介绍
音频编码是关于处理音频信号中的冗余和无关的压缩的领域。在MPEGUSAC[ISO/IEC23003-3:2012–Informationtechnology–MPEGaudiotechnologiesPart3:Unifiedspeechandaudiocoding]中,两声道的联合立体声编码通过使用复预测、MPS2-1-2或具有有限频带或全频带残差信号的统一立体声来进行。MPEGsurround[ISO/IEC23003-1:2007-Informationtechnology–MPEGaudiotechnologiesPart1:MPEGSurround]在有或没有残差信号传输的情况下针对多声道音频的联合编码分层地结合OTT与TTT盒。MPEG-H四声道元素分层地应用MPS2-1-2立体声盒,之后是构建固定的4×4再混合树的复预测/MS立体声盒。AC4[ETSITS103190V1.1.1(2014-04)–DigitalAudioCompression(AC-4)Standard]引入了新的3-声道、4-声道、5-声道元素,所述元素考虑经由被传输的混合矩阵与后续的联合立体声编码信息而对被传输声道进行再混合。此外,现有出版物建议使用正交变换,如针对增强的多声道音频编码的Karhunen-Loeve变换(KLT)[Yang,DaiandAi,HongmeiandKyriakakis,ChrisandKuo,C.-C.Jay,2001:AdaptiveKarhunen-LoeveTransformforEnhancedMultichannelAudioCoding,http://ict.usc.edu/pubs/Adaptive%20Karhunen-Loeve%20Transform%20for%20Enhanced%20Multichannel%20Audio%20Coding.pdf]。在3D音频上下文中,扬声器声道分布在多个高度层中,导致水平与竖直的声道对。如在USAC中所定义的仅两个声道的联合编码不足以考虑声道之间的空间和感知关系。MPEG环绕被应用于附加的预/后处理步骤,残差信号在没有联合立体声编码的可能性的情况下被单独传输,以例如利用左与右竖直残差信号之间的依赖性。在AC-4中,专用的N声道元素被引入以考虑联合编码参数的高效率编码,但无法考虑针对新的浸入回放场景(7.1+4,22.2)而提出的具有更多声道的一般扬声器设定。MPEG-H四声道元素还被限制为仅仅4个声道并且无法动态地应用于任意的声道而只能应用于预配置且固定数量的声道。
技术实现思路
本专利技术的目的在于提供改善的编码/解码构思。该目的通过根据权利要求1的用于对具有至少三个声道的多声道信号进行编码的装置而达到;或通过根据权利要求12的用于对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的装置而达到;或通过根据权利要求21的用于对具有至少三个声道的多声道信号进行编码方法而达到;或通过根据权利要求22的用于对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的方法而达到;或通过根据权利要求23的计算机程序而达到。实施例提供了一种对具有至少三个声道的多声道信号进行编码的装置。所述装置包括迭代处理器、声道编码器和输出接口。迭代处理器被配置为在第一迭代步骤中计算在至少三个声道的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,并且通过使用多声道处理操作而处理所选择的对,以导出针对所选择的对的第一多声道参数并导出第一处理声道。此外,迭代处理器被配置为在第二迭代步骤中通过使用所述处理声道的至少一个而执行所述计算、所述选择和所述处理,以导出第二多声道参数和第二处理声道。声道编码器被配置为对根据通过迭代处理器执行的迭代处理得到的声道进行编码以获得编码声道。输出接口被配置为产生具有编码声道以及第一和第二多声道参数的编码多声道信号。另外,实施例提供了一种用于对编码多声道信号进行解码的装置,所述编码多声道信号具有编码声道以及至少第一和第二多声道参数。所述装置包括声道解码器以及多声道处理器。声道解码器被配置为对编码声道进行解码以获得解码声道。多声道处理器被配置为通过使用由第二多声道参数标识的解码声道的第二对和通过使用第二多声道参数来执行多声道处理,以获得处理声道,并通过使用由第一多声道参数标识的声道的第一对和使用第一多声道参数来执行进一步的多声道处理,其中声道的第一对包括至少一个处理声道。与使用固定信号路径(例如立体声编码树)的常见多声道编码构思相比,本专利技术的实施例使用动态信号路径,其适应多声道输入信号的至少三个输入声道的特性。具体地说,迭代处理器102可适于在第一迭代步骤中基于至少三个声道CH1至CH3中的每对之间的声道间相关值建立信号路径(例如立体声树),以在第一迭代步骤中选择具有最高值或高于阈值的值的对,并且在第二迭代步骤中基于在所述至少三个声道的每对与相应的先前处理声道之间的声道间相关值,在第二迭代步骤中选择具有最高值或高于阈值的值的对。进一步的实施例提供了一种用于对具有至少三个声道的多声道信号进行编码的方法。该方法包括:-在第一迭代步骤中计算至少三个声道中的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,并且通过使用多声道处理操作而处理所选择的对,以导出针对所选择的对的第一多声道参数并导出第一处理声道;-在第二迭代步骤中通过使用所述处理声道的至少一个而执行所述计算、所述选择和所述处理,以导出第二多声道参数和第二处理声道;-对根据通过迭代处理器执行的迭代处理得到的声道进行编码以获得编码声道;以及-产生具有编码声道以及第一和第二多声道参数的编码多声道信号。进一步的实施例提供了一种用于对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的方法。该方法包括:-对编码声道进行解码以获得解码声道;和-通过使用由第二多声道参数标识的解码声道的第二对和通过使用第二多声道参数来执行多声道处理,以获得处理声道,并通过使用由第一多声道参数标识的声道的第一对和使用第一多声道参数来执行进一步的多声道处理,其中声道的第一对包括至少一个处理声道。附图说明这里通过参考附图来描述本专利技术的实施例。图1示出了根据实施例的对具有至少三个声道的多声道信号进行编码的装置的示意性框图。图2示出了根据实施例的对具有至少三个声道的多声道信号进行编码的装置的示意性框图。图3示出了根据实施例的立体声盒的示意性框图。图4示出了根据实施例的对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的装置的示意性框图。图5示出了根据实施例的对具有至少三个声道的多声道信号进行编码的方法的流程图。图6示出了根据实施例的对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的方法的流程图。具体实施方式具有相同或等效功能的相同或等效组件在下面的描述中由相同或等效的附图标记来表示。在下面的描述中,阐述多个细节以提供对本专利技术的实施例的更完全的解释。然而,本领域技本文档来自技高网
...
用于对多声道信号进行编码或解码的装置与方法

【技术保护点】
一种用于对具有至少三个声道(CH1至CH3)的多声道信号(101)进行编码的装置(100),包括:迭代处理器(102),用于在第一迭代步骤中计算所述至少三个声道(CH1至CH3)中的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,以及使用多声道处理操作(110、112)处理所选择的对,以导出针对所选择的对的第一多声道参数(MCH_PAR1)并导出第一处理声道(P1、P2),其中,所述迭代处理器(102)被配置为在第二迭代步骤中使用处理声道(P1)中的至少一个执行所述计算、所述选择和所述处理,以导出第二多声道参数(MCH_PAR2)和第二处理声道(P3、P4);声道编码器,用于对从根据所述迭代处理器(104)执行的迭代处理得到的声道(P2至P4)进行编码以获得编码声道(E1至E3);以及输出接口(106),用于产生具有所述编码声道(E1至E3)以及第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)的编码多声道信号(107)。

【技术特征摘要】
【国外来华专利技术】2015.03.09 EP 15158234.3;2015.06.17 EP 15172492.91.一种用于对具有至少三个声道(CH1至CH3)的多声道信号(101)进行编码的装置(100),包括:迭代处理器(102),用于在第一迭代步骤中计算所述至少三个声道(CH1至CH3)中的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,以及使用多声道处理操作(110、112)处理所选择的对,以导出针对所选择的对的第一多声道参数(MCH_PAR1)并导出第一处理声道(P1、P2),其中,所述迭代处理器(102)被配置为在第二迭代步骤中使用处理声道(P1)中的至少一个执行所述计算、所述选择和所述处理,以导出第二多声道参数(MCH_PAR2)和第二处理声道(P3、P4);声道编码器,用于对从根据所述迭代处理器(104)执行的迭代处理得到的声道(P2至P4)进行编码以获得编码声道(E1至E3);以及输出接口(106),用于产生具有所述编码声道(E1至E3)以及第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)的编码多声道信号(107)。2.根据权利要求1所述的装置(100),其中,所述输出接口(106)被配置为将所述编码多声道信号(107)产生为串行比特流,使得第二多声道参数(MCH_PAR2)在所述编码信号中位于第一多声道参数(MCH_PAR1)之前。3.根据权利要求1或2所述的装置(100),其中,所述迭代处理器(102)被配置为执行包括包含以下各项的组中的至少一项在内的立体声处理:使用根据所选择的对的旋转角度计算的旋转处理以及预测处理。4.根据前述权利要求之一所述的装置(100),其中,第一多声道参数(MCH_PAR1)包括在第一迭代步骤中所选择的对中的声道的第一标识,并且第二多声道参数(MCH_PAR2)包括在第二迭代步骤中所选择的对中的声道的第二标识。5.根据前述权利要求之一所述的装置(100),其中,所述迭代处理器(102)被配置为使用包括多个频带的每个声道的帧计算声道间相关性,以便获得针对所述多个频带的单个声道间相关值,并且其中,所述迭代处理器(104)被配置为针对所述多个频带中的每个频带执行所述多声道处理,从而针对所述多个频带中的每个频带获得第一多声道参数或第二多声道参数(MCH_PAR1、MCH_PAR2)。6.根据前述权利要求之一所述的装置(100),其中,所述迭代处理器(102)被配置为针对第一帧导出多个选择对指示,并且所述输出接口(106)被配置为针对第一帧之后的第二帧在所述多声道信号(107)中包括保持指示符,所述保持指示符指示第二帧与第一帧具有相同的多个选择对指示。7.根据前述权利要求之一所述的装置(100),其中,所述迭代处理器(102)被配置为仅在对的电平差小于阈值时才选择所述对,所述阈值小于40dB或25dB或12dB,或者小于6dB。8.根据前述权利要求之一所述的装置(100),其中,所述迭代处理器(102)被配置为计算归一化相关值,并且所述迭代处理器(102)被配置为在所述相关值大于0.2并且优选为0.3时选择对。9.根据前述权利要求之一所述的装置(100),其中,所述迭代处理器(102)被配置为在所述多声道处理中计算立体声参数,并且所述迭代处理器(102)被配置为仅在立体声参数高于由立体声参数量化器定义的量化到零阈值的频带中执行立体声处理。10.根据前述权利要求之一所述的装置(100),其中,所述迭代处理器(102)被配置为在所述多声道处理中计算旋转角度,并且所述迭代处理器(102)被配置为仅在旋转角度高于解码器侧去量化到零阈值的频带中执行旋转处理。11.根据前述权利要求之一所述的装置(100),其中,所述迭代处理器(102)被配置为在第二迭代步骤中不选择在第一迭代步骤中所选择的对,并且如果可行的话,在任何进一步的迭代步骤中也不选择该所选择的对。12.根据前述权利要求之一所述的装置(100),其中,所述迭代处理器(102)被配置为执行迭代步骤直到达到迭代终止标准,其中,所述迭代终止标准是迭代步骤的最大数量等于所述多声道信号(101)的声道的总数量或比所述多声道信号(101)的声道的总数量大两个,或者所述迭代终止标准是当所述声道间相关值不具有大于所述阈值的值时。13.根据前述权利要求之一所述的装置(100),其中,所述迭代处理器(102)被配置为在第一迭代步骤中使用所述多声道处理来处理所选择的对,使得所述处理声道(P1、P2)是中声道(P1)和侧声道(P2);以及其中,所述迭代处理器(102)被配置为在第二迭代步骤中通过仅使用所述处理声道(P1、P2)的中声道(P1)作为所述处理声道(P1、P2)的所述至少一个来执行所述计算、所述选择和所述处理,以导出第二多声道参数(MCH_PAR2)与第二处理声道(P3、P4)。14.根据前述权利要求之一所述的装置(100),其中,所述声道编码器包括用于对根据所述迭代处理得到的声道(P2至P4)进行编码的声道编码器(120_1至120_3),其中,所述声道编码器被配置为对声道(P2至P4)进行编码,使得与对具有较多能量的声道进行编码相比,使用较少的比特来对具有较少能量的声道进...

【专利技术属性】
技术研发人员:萨沙·迪克弗洛里安·舒尼古拉斯·里特尔博谢托比亚斯·施威格勒理查德·福格约翰内斯·希尔珀特马蒂亚斯·诺伊辛格
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国,DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1