用于编码多声道信号的音频编码器及用于解码经编码的音频信号的音频解码器制造技术

技术编号:16708287 阅读:27 留言:0更新日期:2017-12-02 23:38
展示用于编码多声道音频信号(4)的音频编码器(2)的示意性框图。音频编码器包括线性预测域编码器(6)、频域编码器(8)以及用于在线性预测域编码器(6)与频域编码器(8)之间切换的控制器(10)。控制器被配置为使得多声道信号的部分由线性预测域编码器的编码帧表示或由频域编码器的编码帧表示。线性预测域编码器包括用于对多声道信号(4)进行降混以获得降混信号(14)的降混频器(12)。线性预测域编码器还包括用于编码降混信号的线性预测域核心编码器(16),此外,线性预测域编码器包括用于从多声道信号(4)生成第一多声道信息(20)的第一联合多声道编码器(18)。

【技术实现步骤摘要】
【国外来华专利技术】用于编码多声道信号的音频编码器及用于解码经编码的音频信号的音频解码器
本专利技术涉及一种用于编码多声道音频信号的音频编码器及用于解码经编码的音频信号的音频解码器。实施例涉及包括波形保持及参数化立体声编码的切换式感知音频编解码器。
技术介绍
音频信号的感知编码出于用于此等信号的高效存储或传输的数据缩减的目的而被广泛实际应用。特别地,当将达到最高效率时,使用紧密适合于信号输入特性的编解码器。一个示例为MPEG-DUSAC核心编解码器,其可用于主要对语音信号使用代数码本激励线性预测(ACELP,AlgebraicCode-ExcitedLinearPrediction)编码、对背景噪声及混合信号使用变换编码激励(TCX,TransformCodedExcitation)以及对音乐内容使用高级音频编码(AAC,AdvancedAudioCoding)。所有的三个内部编解码器配置可响应于信号内容以信号自适应方式被立即切换。此外,使用联合多声道编码技术(中间/侧编码等)或为了最高效率而使用参数化编码技术。参数化编码技术基本上以感知等同音频信号的再造而非给定波形的忠实重建为目标。示例包括噪声填充、带宽扩展以及空间音频编码。在现有技术水平的编解码器中,当将信号自适应核心编码器与联合多声道编码或参数化编码技术进行组合时,核心编解码器被切换以匹配信号特性,但多声道编码技术(如,M/S立体声、空间音频编码或参数化立体声)的选择保持固定且独立于信号特性。这些技术通常被用于核心编解码器以作为核心编码器的预处理器及核心解码器的后处理器,这两种处理器不知道核心编解码器的实际选择。另一方面,用于带宽扩展的参数化编码技术的选择有时是信号相依地做出的。举例而言,应用于时域中的技术对于语音信号更有效率,而频域处理对于其他信号更相关。在此情况下,所采用的多声道编码技术必须与两种带宽扩展技术兼容。现有技术水平中的相关话题包括:作为MPEG-DUSAC核心编解码器的预处理器/后处理器的PS及MPSMPEG-DUSAC标准MPEG-H3D音频标准在MPEG-DUSAC中,描述了可切换核心编码器。然而,在USAC中,多声道编码技术被定义为整个核心编码器常见的固定选择,与其编码原理的内部切换为ACELP或TCX(“LPD”)或AAC(“FD”)无关。因此,若期望切换式核心编解码器配置,编解码器被限制为针对整个信号始终使用参数化多声道编码(parametricmultichannelcoding,PS)。然而,为了编码(例如)音乐信号,使用联合立体声编码将更恰当,其可每频带及每帧地在L/R(左/右)与M/S(中间/侧)方案之间动态地切换。因此,需要经改良的方法。
技术实现思路
本专利技术的目标为提供用于处理音频信号的经改良的概念。通过独立权利要求的主题实现此目标。本专利技术基于如下发现:使用多声道编码器的(时域)参数化编码器对参数化多声道音频编码是有利的。多声道编码器可以是多声道残余编码器,其与用于每个声道的单独编码相比可减小用于编码参数的传输的带宽。(例如)结合频域联合多声道音频编码器此可被有利地使用。时域及频域联合多声道编码技术可被组合,以使得(例如)基于帧的决策可将当前帧引导至基于时间或基于频率的编码周期。换言之,实施例展示用于将使用联合多声道编码及参数化空间音频编码的可切换核心编解码器组合成完全可切换感知编解码器的经改良的概念,完全可切换感知编解码器允许依据核心编码器的选择而使用不同的多声道编码技术。此概念是有利的,因为与已经存在的方法相比,实施例展示可与核心编码器一起被立即切换且因此紧密匹配于且适合于核心编码器的选择的多声道编码技术。因此,可避免由于多声道编码技术的固定选择而出现的所描绘的问题。此外,实现给定核心编码器与其相关联且经调适的多声道编码技术的完全可切换组合。举例而言,此种编码器(例如,使用L/R或M/S立体声编码的AAC(高级音频编码))能够使用专用联合立体声或多声道编码(例如,M/S立体声)在频域(FD)核心编码器中对音乐信号进行编码。此决策可单独地应用于每个音频帧中的每个频带。在(例如)语音信号的情况下,核心编码器可立即切换至线性预测性解码(linearpredictivedecoding,LPD)核心编码器及其相关联的不同技术(例如,参数化立体声编码技术)。实施例展示对于单声道LPD路径而言是唯一的立体声处理,及将立体声FD路径的输出与来自LPD核心编码器及其专用立体声编码的输出进行组合的基于立体声信号的无缝切换方案。此情况是有利的,因为实现了无伪声(artifact)的无缝编解码器切换。实施例涉及一种用于编码多声道信号的编码器。编码器包括线性预测域编码器及频域编码器。此外,编码器包括用于在线性预测域编码器与频域编码器之间进行切换的控制器。此外,线性预测域编码器可包括:用于对多声道信号进行降混以获得降混信号的降混频器;用于编码降混信号的线性预测域核心编码器;以及用于从多声道信号生成第一多声道信息的第一多声道编码器。频域编码器包括用于从多声道信号生成第二多声道信息的第二联合多声道编码器,其中第二多声道编码器不同于第一多声道编码器。控制器被配置为使得多声道信号的部分由线性预测域编码器的编码帧表示或由频域编码器的编码帧表示。线性预测域编码器可包括ACELP核心编码器及(例如)作为第一联合多声道编码器的参数化立体声编码算法。频域编码器可包括(例如)作为第二联合多声道编码器的使用(例如)L/R或M/S处理的AAC核心编码器作为第二联合多声道编码器。控制器可关于(例如)帧特性而分析多声道信号(例如,语音或音乐),且用于针对每帧或帧的序列或多声道音频信号的部分,决定是线性预测域编码器还是频域编码器应被用于编码多声道音频信号的此部分。实施例进一步展示一种用于解码经编码的音频信号的音频解码器。音频解码器包括线性预测域解码器及频域解码器。此外,音频解码器包括:用于使用线性预测域解码器的输出及使用多声道信息生成第一多声道表示的第一联合多声道解码器;以及用于使用频域解码器的输出及第二多声道信息生成第二多声道表示的第二多声道解码器。此外,音频解码器包括用于将第一多声道表示及第二多声道表示进行组合以获得经解码的音频信号的第一组合器。组合器可在作为(例如)经线性预测的多声道音频信号的第一多声道表示与作为(例如)频域经解码的多声道音频信号的第二多声道表示之间执行无缝无伪声切换。实施例展示可切换音频编码器内的LPD路径中的ACELP/TCX编码与频域路径中的专用立体声编码及独立AAC立体声编码的组合。此外,实施例展示LPD与FD立体声之间的无缝瞬时切换,其中其他实施例涉及用于不同信号内容类型的联合多声道编码的独立选择。举例而言,针对主要使用LPD路径编码的语音,使用参数化立体声,而对于在FD路径中被编码的音乐,使用更加自适应的立体声编码,其可每频带及每帧地在L/R方案与M/S方案之间动态地切换。根据实施例,针对主要使用LPD路径来编码且通常位于立体声影像的中心的语音,简单的参数化立体声是恰当的,而在FD路径中被编码的音乐通常具有更复杂的空间分布且可利用更加自适应的立体声编码,该更加自适应的立体声编码可每频带及每帧地在L/R方案与M/S方案之间动态地切换。其他实本文档来自技高网
...
用于编码多声道信号的音频编码器及用于解码经编码的音频信号的音频解码器

【技术保护点】
一种用于编码多声道信号的音频编码器(2),包括:线性预测域编码器(6);频域编码器(8);用于在所述线性预测域编码器(6)与所述频域编码器(8)之间切换的控制器(10),其中所述线性预测域编码器(6)包括用于对所述多声道信号(4)进行降混以获得降混信号(14)的降混频器(12)、用于编码所述降混信号(14)的线性预测域核心编码器(16)以及用于从所述多声道信号生成第一多声道信息(20)的第一联合多声道编码器(18),其中所述频域编码器(8)包括用于对来自所述多声道信号的第二多声道信息(24)进行编码的第二联合多声道编码器(22),其中所述第二联合多声道编码器(22)不同于所述第一联合多声道编码器(18),以及其中所述控制器(10)被配置为使得所述多声道信号的部分由所述线性预测域编码器的编码帧表示或由所述频域编码器的编码帧表示。

【技术特征摘要】
【国外来华专利技术】2015.03.09 EP 15158233.5;2015.06.17 EP 15172594.21.一种用于编码多声道信号的音频编码器(2),包括:线性预测域编码器(6);频域编码器(8);用于在所述线性预测域编码器(6)与所述频域编码器(8)之间切换的控制器(10),其中所述线性预测域编码器(6)包括用于对所述多声道信号(4)进行降混以获得降混信号(14)的降混频器(12)、用于编码所述降混信号(14)的线性预测域核心编码器(16)以及用于从所述多声道信号生成第一多声道信息(20)的第一联合多声道编码器(18),其中所述频域编码器(8)包括用于对来自所述多声道信号的第二多声道信息(24)进行编码的第二联合多声道编码器(22),其中所述第二联合多声道编码器(22)不同于所述第一联合多声道编码器(18),以及其中所述控制器(10)被配置为使得所述多声道信号的部分由所述线性预测域编码器的编码帧表示或由所述频域编码器的编码帧表示。2.根据权利要求1所述的音频编码器(2),其中所述第一联合多声道编码器(18)包括第一时间-频率转换器(82),其中所述第二联合多声道编码器(22)包括第二时间-频率转换器(66),且其中所述第一时间-频率转换器和所述第二时间-频率转换器彼此不同。3.根据权利要求1或2所述的音频编码器(2),其中所述第一联合多声道编码器(18)为参数化联合多声道编码器;或其中所述第二联合多声道编码器(22)为波形保持联合多声道编码器。4.根据权利要求3所述的音频编码器,其中所述参数化联合多声道编码器包括立体声产生编码器、参数化立体声编码器或基于旋转的参数化立体声编码器,或其中所述波形保持联合多声道编码器包括频带选择性切换中间/侧或左/右立体声编码器。5.根据前述权利要求中任一项所述的音频编码器,其中所述线性预测域编码器(6)包括ACELP处理器(30)及TCX处理器(32),其中所述ACELP处理器用于对经降取样的降混信号(34)进行操作,且其中时域带宽扩展处理器(36)用于对通过第三降取样从ACELP输入信号中移除的所述降混信号的部分的频带进行参数化编码,以及其中所述TCX处理器(32)用于对未被降取样或以小于用于所述ACELP处理器的降取样的程度被降取样的降混信号(14)进行操作,所述TCX处理器包括第一时间-频率转换器(40)、用于生成第一频带集合的参数化表示(46)的第一参数生成器(42)以及用于生成用于第二频带集合的经量化的编码器频谱线的集合(48)的第一量化器编码器(44)。6.根据前述权利要求中任一项所述的音频编码器(2),其中所述频域编码器(8)包括用于将所述多声道信号(4)的第一声道(4a)及所述多声道信号(4)的第二声道(4b)转换成频谱表示(72a,b)的第二时间-频率转换器(66)、用于生成第二频带集合的参数化表示的第二参数生成器(68)以及用于生成第一频带集合的经量化且经编码的表示(80)的第二量化器编码器(70)。7.根据前述权利要求中任一项所述的音频编码器(2),其中所述线性预测域编码器包括具有时域带宽扩展的ACELP处理器及具有MDCT操作和智能间隙填充功能的TCX处理器,或其中所述频域编码器包括用于第一声道和第二声道的MDCT操作和AAC操作以及智能间隙填充功能,或其中所述第一联合多声道编码器用于以得出用于多声道音频信号的全带宽的多声道信息的方式进行操作。8.根据前述权利要求中任一项所述的音频编码器(2),进一步包括:用于对所述降混信号(14)进行解码以获得经编码且经解码的降混信号(54)的线性预测域解码器(50);以及用于使用经编码且经解码的降混信号(54)计算和编码表示使用第一多声道信息(20)的经解码的多声道表示与降混之前的多声道信号(4)之间的误差的多声道残余信号(58)的多声道残余编码器(56)。9.根据权利要求8所述的音频编码器(2),其中所述降混信号具有低频带和高频带,其中所述线性预测域编码器用于施加用于对高频带进行参数化编码的带宽扩展处理,其中所述线性预测域解码器用于仅获得表示所述降混信号的低频带的低频带信号以作为经编码且经解码的降混信号(54),且其中经编码的多声道残余信号(58)仅具有在降混之前的多声道信号的低频带内的频率。10.根据权利要求8或9所述的音频编码器(2),其中所述多声道残余编码器(56)包括:用于使用所述第一多声道信息(20)及所述经编码且经解码的降混信号(54)生成经解码的多声道信号(64)的联合多声道解码器(60);以及用于形成所述经解码的多声道信号与降混之前的多声道信号之间的差异以获得多声道残余信号的差异处理器(62)。11.根据前述权利要求中任一项所述的音频编码器(2),其中所述降混频器(12)用于将所述多声道信号转换成频谱表示,且其中使用频谱表示或使用时域表示来执行降混,且其中所述第一多声道编码器用于使用频谱表示生成用于频谱表示的各个频带的单独第一多声道信息。12.根据前述权利要求中任一项所述的音频编码器(2),其中所述控制器(10)用于在所述多声道音频信号的当前帧(204)内从使用所述频域编码器(8)对先前帧进行编码切换至使用所述线性预测域编码器对即将到来的帧进行解码;其中第一联合多声道编码器(18)用于从用于所述当前帧的多声道音频信号计算合成多声道参数(210a,210b,212a,212b);其中所述第二联合多声道编码器(22)用于使用停止窗口对所述第二多声道信号进行加权。13.一种用于对经编码的音频信号(103)进行解码的音频解码器(102),包括:线性预测域解码器(104);频域解码器(106);用于使用所述线性预测域解码器(104)的输出和使用第一多声道信息(20)生成第一多声道表示(114)的第一联合多声道解码器(108);用于使用所述频域解码器(106)的输出和第二多声道信息(22,2...

【专利技术属性】
技术研发人员:萨沙·迪施纪尧姆·福克斯伊曼纽尔·拉韦利克里斯蒂安·诺伊卡姆康斯坦丁·施密特康拉德·本多尔夫安德烈·尼德迈尔本杰明·舒伯特拉尔夫·盖革
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国,DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1