用于对多声道信号进行编码或解码的装置与方法制造方法及图纸

技术编号：17058765 阅读：37 留言：0更新日期：2018-01-17 21:02

实施例提供了一种对具有至少三个声道的多声道信号进行编码的装置。该装置包括迭代处理器、声道编码器和输出接口。迭代处理器被配置为在第一迭代步骤中计算所述至少三个声道中的每对之间的声道间相关值，在第一迭代步骤中选择具有最高值或具有高于阈值的值的对，并且使用多声道处理操作处理所选择的对，以导出针对所选择的对的第一多声道参数并导出第一处理声道。此外，迭代处理器被配置为在第二迭代步骤中通过使用所述处理声道的至少一个而执行所述计算、所述选择和所述处理，以导出第二多声道参数和第二处理声道。声道编码器被配置为对根据通过所述迭代处理器执行的迭代处理得到的声道进行编码以获得编码声道。输出接口被配置为产生具有所述编码声道以及第一多声道参数和第二多声道参数的编码多声道信号。

A device and method used to encode or decode multichannel signals

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于对多声道信号进行编码或解码的装置与方法
本专利技术涉及音频编码/解码，具体地，涉及利用声道间信号依赖性的音频编码。
技术介绍
音频编码是关于处理音频信号中的冗余和无关的压缩的领域。在MPEGUSAC[ISO/IEC23003-3：2012–Informationtechnology–MPEGaudiotechnologiesPart3：Unifiedspeechandaudiocoding]中，两声道的联合立体声编码通过使用复预测、MPS2-1-2或具有有限频带或全频带残差信号的统一立体声来进行。MPEGsurround[ISO/IEC23003-1：2007-Informationtechnology–MPEGaudiotechnologiesPart1：MPEGSurround]在有或没有残差信号传输的情况下针对多声道音频的联合编码分层地结合OTT与TTT盒。MPEG-H四声道元素分层地应用MPS2-1-2立体声盒，之后是构建固定的4×4再混合树的复预测/MS立体声盒。AC4[ETSITS103190V1.1.1(2014-04)–DigitalAudioCompression(AC-4)Standard]引入了新的3-声道、4-声道、5-声道元素，所述元素考虑经由被传输的混合矩阵与后续的联合立体声编码信息而对被传输声道进行再混合。此外，现有出版物建议使用正交变换，如针对增强的多声道音频编码的Karhunen-Loeve变换(KLT)[Yang,DaiandAi,HongmeiandKyriakakis,ChrisandKuo,C.-C.Jay,2...
用于对多声道信号进行编码或解码的装置与方法

【技术保护点】
一种用于对具有至少三个声道(CH1至CH3)的多声道信号(101)进行编码的装置(100)，包括：迭代处理器(102)，用于在第一迭代步骤中计算所述至少三个声道(CH1至CH3)中的每对之间的声道间相关值，在第一迭代步骤中选择具有最高值或具有高于阈值的值的对，以及使用多声道处理操作(110、112)处理所选择的对，以导出针对所选择的对的第一多声道参数(MCH_PAR1)并导出第一处理声道(P1、P2)，其中，所述迭代处理器(102)被配置为在第二迭代步骤中使用处理声道(P1)中的至少一个执行所述计算、所述选择和所述处理，以导出第二多声道参数(MCH_PAR2)和第二处理声道(P3、P4)；声道编码器，用于对从根据所述迭代处理器(104)执行的迭代处理得到的声道(P2至P4)进行编码以获得编码声道(E1至E3)；以及输出接口(106)，用于产生具有所述编码声道(E1至E3)以及第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)的编码多声道信号(107)。

【技术特征摘要】
【国外来华专利技术】2015.03.09 EP 15158234.3;2015.06.17 EP 15172492.91.一种用于对具有至少三个声道(CH1至CH3)的多声道信号(101)进行编码的装置(100)，包括：迭代处理器(102)，用于在第一迭代步骤中计算所述至少三个声道(CH1至CH3)中的每对之间的声道间相关值，在第一迭代步骤中选择具有最高值或具有高于阈值的值的对，以及使用多声道处理操作(110、112)处理所选择的对，以导出针对所选择的对的第一多声道参数(MCH_PAR1)并导出第一处理声道(P1、P2)，其中，所述迭代处理器(102)被配置为在第二迭代步骤中使用处理声道(P1)中的至少一个执行所述计算、所述选择和所述处理，以导出第二多声道参数(MCH_PAR2)和第二处理声道(P3、P4)；声道编码器，用于对从根据所述迭代处理器(104)执行的迭代处理得到的声道(P2至P4)进行编码以获得编码声道(E1至E3)；以及输出接口(106)，用于产生具有所述编码声道(E1至E3)以及第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)的编码多声道信号(107)。2.根据权利要求1所述的装置(100)，其中，所述输出接口(106)被配置为将所述编码多声道信号(107)产生为串行比特流，使得第二多声道参数(MCH_PAR2)在所述编码信号中位于第一多声道参数(MCH_PAR1)之前。3.根据权利要求1或2所述的装置(100)，其中，所述迭代处理器(102)被配置为执行包括包含以下各项的组中的至少一项在内的立体声处理：使用根据所选择的对的旋转角度计算的旋转处理以及预测处理。4.根据前述权利要求之一所述的装置(100)，其中，第一多声道参数(MCH_PAR1)包括在第一迭代步骤中所选择的对中的声道的第一标识，并且第二多声道参数(MCH_PAR2)包括在第二迭代步骤中所选择的对中的声道的第二标识。5.根据前述权利要求之一所述的装置(100)，其中，所述迭代处理器(102)被配置为使用包括多个频带的每个声道的帧计算声道间相关性，以便获得针对所述多个频带的单个声道间相关值，并且其中，所述迭代处理器(104)被配置为针对所述多个频带中的每个频带执行所述多声道处理，从而针对所述多个频带中的每个频带获得第一多声道参数或第二多声道参数(MCH_PAR1、MCH_PAR2)。6.根据前述权利要求之一所述的装置(100)，其中，所述迭代处理器(102)被配置为针对第一帧导出多个选择对指示，并且所述输出接口(106)被配置为针对第一帧之后的第二帧在所述多声道信号(107)中包括保持指示符，所述保持指示符指示第二帧与第一帧具有相同的多个选择对指示。7.根据前述权利要求之一所述的装置(100)，其中，所述迭代处理器(102)被配置为仅在对的电平差小于阈值时才选择所述对，所述阈值小于40dB或25dB或12dB，或者小于6dB。8.根据前述权利要求之一所述的装置(100)，其中，所述迭代处理器(102)被配置为计算归一化相关值，并且所述迭代处理器(102)被配置为在所述相关值大于0.2并且优选为0.3时选择对。9.根据前述权利要求之一所述的装置(100)，其中，所述迭代处理器(102)被配置为在所述多声道处理中计算立体声参数，并且所述迭代处理器(102)被配置为仅在立体声参数高于由立体声参数量化器定义的量化到零阈值的频带中执行立体声处理。10.根据前述权利要求之一所述的装置(100)，其中，所述迭代处理器(102)被配置为在所述多声道处理中计算旋转角度，并且所述迭代处理器(102)被配置为仅在旋转角度高于解码器侧去量化到零阈值的频带中执行旋转处理。11.根据前述权利要求之一所述的装置(100)，其中，所述迭代处理器(102)被配置为在第二迭代步骤中不选择在第一迭代步骤中所选择的对，并且如果可行的话，在任何进一步的迭代步骤中也不选择该所选择的对。12.根据前述权利要求之一所述的装置(100)，其中，所述迭代处理器(102)被配置为执行迭代步骤直到达到迭代终止标准，其中，所述迭代终止标准是迭代步骤的最大数量等于所述多声道信号(101)的声道的总数量或比所述多声道信号(101)的声道的总数量大两个，或者所述迭代终止标准是当所述声道间相关值不具有大于所述阈值的值时。13.根据前述权利要求之一所述的装置(100)，其中，所述迭代处理器(102)被配置为在第一迭代步骤中使用所述多声道处理来处理所选择的对，使得所述处理声道(P1、P2)是中声道(P1)和侧声道(P2)；以及其中，所述迭代处理器(102)被配置为在第二迭代步骤中通过仅使用所述处理声道(P1、P2)的中声道(P1)作为所述处理声道(P1、P2)的所述至少一个来执行所述计算、所述选择和所述处理，以导出第二多声道参数(MCH_PAR2)与第二处理声道(P3、P4)。14.根据前述权利要求之一所述的装置(100)，其中，所述声道编码器包括用于对根据所述迭代处理得到的声道(P2至P4)进行编码的声道编码器(120_1至120_3)，其中，所述声道编码器被配置为对声道(P2至P4)进行编码，使得与对具有较多能量的声道进行编码相比，使用较少的比特来对具有较少能量的声道进...

【专利技术属性】
技术研发人员：萨沙·迪克，弗洛里安·舒，尼古拉斯·里特尔博谢，托比亚斯·施威格勒，理查德·福格，约翰内斯·希尔珀特，马蒂亚斯·诺伊辛格，
申请(专利权)人：弗劳恩霍夫应用研究促进协会，
类型：发明
国别省市：德国,DE

全部详细技术资料下载我是这个专利的主人