使用自适应相位校准的多声道降混的梳型滤波器的伪迹消除制造技术

技术编号:14557613 阅读:87 留言:0更新日期:2017-02-05 12:02
一种音频信号处理解码器,包含至少一个频带(36),且所述音频信号处理解码器用于处理在至少一个频带(36)内具有多个输入声道(38)的输入音频信号(37),其中所述解码器(2)被配置用于分析所述输入音频信号(37),识别所述输入声道(38)之间的声道间依赖性;被配置用于根据所述识别的声道间依赖性(39)以校准所述输入声道(38)的相位,其中所述输入声道(38)的相位互相之间被校准得越多,其声道间依赖性(39)越高;以及被配置用于将所述校准的输入音频信号降混至输出音频信号(40),所述输出音频信号(40)具有数目比所述输入声道(38)的数目少的输出声道(41)。

Artifact removal of a multichannel mixer comb filter using adaptive phase calibration

An audio signal decoder, comprising at least one band (36), and the audio signal decoder for processing at least one band (36) having a plurality of input channels (38) of the input audio signal (37), wherein the decoder (2) configured to analyze the the input audio signal (37), the identification of the input channels (38) dependence between inter channel; configured for the identification according to the dependence of inter channel (39) input channel to calibrate the phase (38), wherein the input channels (38) phase between each other by calibration the more dependent the inter channel (39) is higher; and configured for the calibration of the input audio signal to output audio signal downmixes (40), the output audio signal (40) with the number than the input channel (38) output channel number (41).

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号处理,特别地,涉及一种使用自适应相位校准的多声道降混的梳型滤波器的伪迹消除
技术介绍
至今为止,一些多声道声音格式被采用,从典型的电影声轨5.1环绕音效至更广泛的3D环绕音效格式。在某些情况下,声音内容必须通过数目较少的扬声器进行传递。此外,在近期的低比特率音频解码方法中,如在J.Breebaart,S.vandePar,A.Kohlrausch,andE.Schuijers,“Parametriccodingofstereoaudio,”EURASIPJournalonAppliedSignalProcessing,vol.2005,pp.1305–1322,2005以及在J.Herre,K.J.Breebaart,C.Faller,S.Disch,H.Purnhagen,J.Koppens,J.Hilpert,J.W.Oomen,K.Linzmeier,andK.S.Chong,“MPEGSurround-TheISO/MPEGstandardforefficientandcompatiblemultichannelaudiocoding,”J.AudioEng.Soc,vol.56,no.11,pp.932–955,2008所描述,较高数量的声道被以一组降混信号和空间辅助边信息的形式被传送,使得原始声道配置的多声道信号被还原。这些使用的案例促进了降混方法的发展,很好地保留了声音品质。最简单的降混方法是使用静态降混矩阵的声道总和。然而,若输入声道包含连贯的声音但在时间上未经过校准,所述降混信号可能达到感知的光谱偏差,例如梳型滤波器的特征。在J.Breebaart和C.Faller,“Spatialaudioprocessing:MPEGSurroundandotherapplications”.Wiley-Interscience,2008中,描述了一种校准两个输入信号的相位校准方法,其根据在频带所估计的声道间相位差异参数(ICPD)来调整输入声道的相位。此方案提供了如论文里提及的方法的类似基本功能,但却无法应用于多于两个内部相关声道的降混。在WO2012/006770,PCT/CN2010/075107(Huawei,Faller,Lang,Xu)中,描述了一种二对一声道(立体声至单声道)情况的相位校准处理。此处理并未直接应用在多声道的音频。在Wuetal,“ParametricStereoCodingSchemewithanewDownmixMethodandwholeBandInterChannelTime/PhaseDifferences”,ProceedingsoftheICASSP,2013中,提出一种针对降混立体声的使用全频带内部声道相位差异的方法。单声道信号的相位被配置在左声道以及所有相位差异间的相位差异。同时,此方法仅适用于立体声至单声道的降混。多于两个的内部依赖声道在此方法中无法被降混。
技术实现思路
本专利技术的目的在于提供对音频信号处理的改进的概念。本专利技术的目的通过权利要求1所述的编码器、权利要求12所述的解码器、权利要求13所述的系统、权利要求14所述的方法以及权利要求15所述的计算机程序来实现。提出一种音频信号处理解码器,包含至少一个频带,且所述音频信号处理解码器用于处理在至少一个频带内具有多个输入声道的输入音频信号。所述解码器被配置用于根据所述输入声道之间的声道间依赖性校准所述输入声道的相位,其中所述输入声道的相位互相之间被校准得越多,其声道间依赖性越高。另外,所述解码器用于将所述校准的输入音频信号降混至输出音频信号,所述输出音频信号具有数目比所述输入声道的数目少的输出声道。所述解码器的基本工作原理为在特定频带的相位中,所述输入音频信号的互依赖(相干)输入声道彼此相互吸引,而所述输入音频信号的相互独立(非相干)的那些输入声道是不受影响的。本文所提出解码器的目的在于改进相对于临界信号抵消条件的后均衡方法的降混品质,同时在非临界条件下提供相同的表现。另外,所述解码器的至少一些函数可以被传送至所述外部装置,例如编码器,所述外部装置提供所述输入音频信号。这可以提供与信号交互的可能性,在现有技术中解码器可能会产生伪迹。另外,有可能在不改变解码器的情形下更新降混处理规则,并确保高级的降混品质。所述解码器的函数的传送将在下文中详细地进行描述。在一些实施例中,为了识别在输入音频声道间的声道间依赖性,所述解码器用来分析在频带中的输入音频信号。在这种情况下,当输入音频信号的分析是由解码器本身完成时,提供输入音频信号的编码器可以是标准的编码器。在一些实施例中,所述解码器可从提供所述输入音频信号的外部装置,例如编码器接收输入声道间的所述声道间依赖性。这个版本允许在解码器里有弹性渲染设置,但在编码器和解码器之间需要更多额外的数据传输,通常在比特流包含所述解码器的输入信号。在一些实施例中,所述解码器用于根据所述输入音频信号的确定能量,归一化所述输出音频信号的能量,其中所述解码器用于确定所述输入音频信号的所述信号能量。在一些实施例中,所述解码器用于根据所述输入音频信号的确定能量,归一化所述输出音频信号的所述能量,其中所述解码器用于从提供所述输入音频信号的外部装置,例如编码器接收所述输入音频信号的所述确定能量。通过确定所述输入音频信号的所述信号能量以及归一化所述输出音频信号的所述能量,可确保所述输出音频信号的所述能量与其他频带相比具有相当的水平。举例而言,所述归一化可用以下方式完成:每个频带的音频输出信号的能量与频带的输入音频信号的能量乘以相对应的降混增益的平方的总和相同。在各种实施例中,所述解码器可以包含根据降混矩阵用于降混输入音频信号的降混器,其中所述解码器用于计算所述降混矩阵,使得根据识别的声道间依赖性以校准输入声道的相位。矩阵操作是有效解决多维问题的一种数学工具。因此,降混矩阵的使用提供了一种降混所述输入音频信号至输出音频信号的灵活且简单的方法,其中输出音频信号具有的输出声道的数目少于输入音频信号的输入声道的数目。在一些实施例中,所述解码器包含降混器,所述降混器用于根据降混矩阵降混输入音频信号,其中所述解码器用于接收所述降混矩阵,降混矩阵被计算使得根据来自于提供所述输入音频信号的外部装置,例如编码器的所述识别的声道间依赖性校准输入声道的相位。在此,解码器里的输出音频信号的处理复杂度可大幅地降低。在一些特定实施例中,所述解码器可用于计算所述降混矩阵,使得根据所述输入音频信号的所述确定能量,所述输出音频信号的本文档来自技高网
...

【技术保护点】
一种音频信号处理解码器,包含至少一个频带(36),且所述音频信号处理解码器用于处理在至少一个频带(36)内具有多个输入声道(38)的输入音频信号(37),其中所述解码器(1)被配置用于根据所述输入声道(38)之间的声道间依赖性(39)校准所述输入声道(38)的相位,其中所述输入声道(38)的相位互相之间被校准得越多,其声道间依赖性(39)越高;以及将所述校准的输入音频信号降混至输出音频信号(40),所述输出音频信号(40)具有数目比所述输入声道(38)的数目少的输出声道(41)。

【技术特征摘要】
【国外来华专利技术】2013.07.22 EP 13177358.2;2013.10.18 EP 13189287.91.一种音频信号处理解码器,包含至少一个频带(36),且所述音频信号处理解
码器用于处理在至少一个频带(36)内具有多个输入声道(38)的输入音频信号(37),
其中所述解码器(1)被配置用于
根据所述输入声道(38)之间的声道间依赖性(39)校准所述输入声道(38)的相
位,其中所述输入声道(38)的相位互相之间被校准得越多,其声道间依赖性(39)越
高;以及
将所述校准的输入音频信号降混至输出音频信号(40),所述输出音频信号(40)具有
数目比所述输入声道(38)的数目少的输出声道(41)。
2.如权利要求1所述的解码器,其中为了识别所述输入音频声道(38)之间的所
述声道间依赖性(39)或为了接收来自提供所述输入音频信号(37)的外部装置,例如
编码器(1)的输入声道(38)之间的所述声道间依赖性(39),所述解码器(2)被配
置用于分析在所述频带(36)内的所述输入音频信号(37)。
3.如权利要求1或2所述的解码器,其中所述解码器(2)被配置用于根据所述输
入音频信号(37)的已经确定的能量,归一化所述输出音频信号(40)的所述能量,其
中所述解码器(2)被配置用于确定所述输入音频信号(37)的所述信号能量或用于接
收来自于提供所述输入音频信号(37)的外部装置,例如编码器(1)的所述输入音频
信号(37)的已经确定的能量。
4.如权利要求1至3中任一项所述的解码器,其中所述解码器(2)包含降混器(42),
所述降混器(42)用于根据降混矩阵(M,MPA)降混所述输入音频信号(37),其中所述
解码器(1)被配置用于计算所述降混矩阵(M,MPA),使得根据所述识别的声道间依赖性
(39)校准所述输入声道(38)的所述相位,或所述解码器(1)被配置用于接收计算得到
的所述降混矩阵(M,MPA),使得根据来自于提供所述输入音频信号(37)的外部装置,例
如编码器(1)的所述识别的声道间依赖性(39)校准所述输入声道(38)的所述相位。
5.如权利要求4所述的解码器,其中所述解码器(2)被配置用于计算所述降混矩
阵(M,MPA),使得根据所述输入音频信号(37)的已经确定的能量归一化所述输出音
频信号(41)的能量,或被配置用于接收所述降混矩阵(M,MPA),所述降混矩阵(M,MPA)

\t被计算使得根据来自于提供所述输入音频信号(37)的外部装置,例如编码器(1)的所
述输入音频信号(37)的所述已经确定的能量归一化所述输出音频信号(41)的能量。
6.如权利要求1至5中任一项所述的解码器,其中所述解码器(2)被配置用于使
用窗口函数分析所述输入音频信号(37)的时间间隔(43),其中所述声道间依赖性(39)
对于每一个时间帧(43)都被确定,或其中所述解码器(2)被配置用于使用窗口函数
从提供所述输入音频信号(37)的外部装置,例如编码器(1)接收所述输入音频信号
(37)的时间间隔(43)的分析,其中所述声道间依赖性(39)对于每一个时间帧(43)
都被确定。
7.如权利要求1至6中任一项所述的解码器,其中所述解码器(2)用于计算协方
差值矩阵(C,Cy),其中所述协方差值(ci,j,Cy,A,B)表示一对输入音频声道(38)的声
道间依赖性(39),或其中所述解码器(2)用于从提供所述输入音频信号(37)的外
部装置,例如编码器(1)接收协方差值矩阵(C,Cy),其中所述协方差值(ci,j,Cy,A,B)
表示一对输入音频声道(38)的声道间依赖性(39)。
8.如权利要求7所述的解码器,其中所述解码器(2)用于通过应用映射函数
(f(c′i,j),TA,B)至所述协方差值矩阵(C,Cy)或从所述协方差值矩阵(C,Cy)所得到的
矩阵(C′)而建立吸引力值矩阵(A,P),或用于接收吸引力值矩阵(A,P),所述吸引
力值矩阵(A,P)是通过应用映射函数(f(c′i,j),TA,B)至所述协方差值矩阵(C,Cy)或
从所述协方差值矩阵(C,Cy)所得到的矩阵(C′)而建立的,其中对于所有的协方差值
(ci,j,Cy,A,B)或从所述协方差值(ci,j,Cy,A,B)所得到的数值(c′i,j,ICCA,B),所述映射函
数(f(c′i,j),TA,B)的梯度优选地大于或等于0,且其中对于0至1之间的输入数值,所
述映射函数(f(c′i,j),TA,B)优选地达到0至1之间的数值。
9.如权利要求8所述的解码器,其中所述映射函数(f(c′i,j),TA,B)为非线性函数
(f(c′i,j),TA,B)。
10.如权利要求8或9所述的解码器,其中对于小于第一映射阈值的所述协方差值
(ci,j,Cy,A,B)或从所述协方差值(ci,j,Cy,A,B)得到的数值(c′i,j,ICCA,B),所述映射函数
(f(c′i,j),TA,B)等于0;和/或其中对于大于第二映射阈值的所述协方差值(ci,j,Cy,A,B)
或从所述协方差值(ci,j,Cy,A,B)所得到的数值(c′i,j,ICCA,B),所述映射函数(f(c′i,j),TA,B)等

\t于1。
11.如权利要求8至10中任一项所述的解码器,其中所述映射函数(f(c′i,j),TA,B)
由形成S形曲线的函数表示。
12.如权利要求7至11中任一项所述的解码器,其中所述解码器(2)用于计算相
位校准系数矩阵(V,Mint),其中所述相位校准系数矩阵(V,Mint)以所述协方差值矩阵
(C,Cy)及原型降混矩阵(Q,MDMX)为基础或用于接收来自提供所述输入音频信号(37)
的外部装置,例如来自编码器(1)的相位校准系数矩阵(V,Mint),其中所述相位校准
系数矩阵(V,Mint)是以所述协方差值矩阵(C,Cy)及原型降混矩阵(Q,MDMX)为基础。
13.如权利要求12所述的解码器,其中所述降混矩阵(M,MPA)的所述降混系数
(mi,j,MPA,A,B)的所述...

【专利技术属性】
技术研发人员:西蒙·法格阿西姆·孔茨迈克尔·卡拉舒曼威尔卡莫·尤哈
申请(专利权)人:弗朗霍夫应用科学研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1