用于使用谐波后置滤波器来处理音频信号的装置及方法制造方法及图纸

技术编号:15287548 阅读:145 留言:0更新日期:2017-05-10 11:26
一种用于处理具有相关联的音调滞后信息和增益信息的音频信号的装置,包括:域转换器(100),用于将音频信号的第一域表示转换为音频信号的第二域表示;以及谐波后置滤波器(104),用于对音频信号的所述第二域表示进行滤波,其中所述后置滤波器基于包括分子和分母在内的传递函数,其中所述分子包括由所述增益信息指示的增益值,并且所述分母包括由所述音调滞后信息指示的音调滞后的整数部分和取决于所述音调滞后的小数部分的多抽头滤波器。

Apparatus and method for processing audio signal using harmonic post filter

An apparatus for processing an audio signal having an associated gain information and pitch lag information includes a converter (100), domain for the first domain audio signal indicates the conversion of the second domain of the audio signal; and the harmonic post filter (104), for the second domain of audio signal representation filter, wherein the post filter transfer function including the numerator and denominator, based on which the molecules including indicated by the information gain value of the gain, and the denominator includes fractional part of the multi tap filter the integer part by the pitch lag information indicating the pitch lag and depends on the pitch lag.

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频处理,且具体地涉及使用谐波后置滤波器的音频处理。
技术介绍
基于变换的音频编解码器在处理谐波音频信号时,特别是在低比特率时,一般引入间谐波噪声(inter-harmonicnoise)。由于由较短的变换大小和/或较差的窗口频率响应引入的较差的频率分辨率和/或选择性,当基于变换的音频编解码器以低延迟操作时,这种影响进一步恶化。这种间谐波噪声一般被感知为非常恼人的失真(artifact),当在高度音音频材料上主观评估时,其显著降低基于变换的音频编解码器的性能。存在若干种解决方案来改善基于变换的音频编解码器对于谐波音频信号的主观质量。所有这些都以基于预测的技术为基础,无论是在变换域中还是在时域中。变换域方法的示例如下:●[1]H.Fuchs,“ImprovingMPEGAudioCodingbyBackwardAdaptiveLinearStereoPrediction”,99thAESConvention,NewYork1995,Preprint4086.●[2]L.Yin,M.Suonio,M.“ANewBackwardPredictorforMPEGAudioCoding”,103rdAESConvention,NewYork1997,Preprint4521●[3]JuhaMauriLinYin,“LongTermPredictorforTransformDomainPerceptualAudioCoding”,107thAESConvention,NewYork1999,Preprint5036.时域方法的示例如下:●[4]PhilipJ.Wilson,HarpritChhatwal,“Adaptivetransformcoderhavinglongtermpredictor”,U.S.Patent5,012,517,April30,1991.●[5]JeongookSong,Chang-HeonLee,Hyen-OOh,Hong-GooKang,“HarmonicEnhancementinLowBitrateAudioCodingUsingandEfficientLong-TermPredictor”.EURASIPJournalonAdvancesinSignalProcessing2010.●[6]Juin-HweyChen,“Pitch-basedpre-filteringandpost-filteringforcompressionofaudiosignals”,U.S.Patent8,738,385,May27,2014.
技术实现思路
本专利技术的目的是提供用于处理音频信号的改善型构思。通过权利要求1的用于处理音频信号的装置、权利要求12的用于处理音频信号的方法、权利要求13的系统、权利要求17的用于操作系统的方法或权利要求18的计算机程序来实现该目的。本专利技术基于如下发现:通过使用具有包括分子和分母在内的传递函数的谐波后置滤波器,可以充分地改善音频信号的主观质量。传递函数的分子包括由发送增益信息指示的增益值,并且分母包括由音调滞后信息指示的音调滞后的整数部分和取决于音调滞后的小数部分的多抽头滤波器。因此,可以去除由典型的域变化音频解码器引入的作为失真的间谐波噪声。这种谐波后置滤波器的特别有用之处在于其依赖于发送的信息,即在解码器中始终可用的音调增益和音调滞后,因为该信息是经由解码器输入信号从相应的编码器接收的。此外,后置滤波因为以下事实而具有特定的精度:不仅考虑音调滞后的整数部分,而且还考虑音调滞后的小数部分。音调滞后的小数部分可以经由多抽头滤波器特别地引入到后置滤波器中,其中该多抽头滤波器具有实际上取决于音调滞后的小数部分的滤波器系数。该滤波器可以实现为FIR滤波器,或者也可以实现为诸如IIR滤波器之类的任何其他滤波器或不同的滤波器实现。可以通过本专利技术的后置滤波器概念来有利地改进任何域变化,诸如时间到频率变化或LPC到时间变化或时间到LPC变化或频率到时间变化。然而,优选地,域变化是频率到时间域变化。因此,本专利技术的实施例降低了由基于在时域中工作的长期预测器的变换音频编解码器所引入的间谐波噪声。与使用变换编码之前的前置滤波器和变换解码之后的后置滤波器二者的[04]-[6]相比,本专利技术优选地仅应用后置滤波器。此外,已经注意到,在[04]-[6]中采用的前置滤波器具有在给予变换编码器的输入信号中引入不稳定性的趋势。这些不稳定性是由于帧之间的增益和/或音调滞后的变化所引起的。变换编码器难以对这种不稳定性进行编码,特别是在低比特率下,并且与没有任何前置或后置滤波器的情况相比,有时在解码信号中将引入更多的噪声。优选地,本专利技术根本不采用任何前置滤波器,因此完全避免了涉及前置滤波器的问题。此外,本专利技术依赖于在变换编码之后应用于解码信号的后置滤波器。该后置滤波器基于考虑音调滞后的整数部分和小数部分的长期预测滤波器,这减少了由变换音频编解码器引入的间谐波噪声。为了更好的鲁棒性,后置滤波器参数音调滞后和音调增益在编码器侧被估计,并在比特流中被发送。然而,在其他实现中,还可以基于由音频解码器获得的解码音频信号在解码器侧估计音调滞后和音调增益,其中所述音频解码器包括用于将音频信号的频率表示转换为音频信号的时域表示的频率-时间转换器。在优选实施例中,分子还包括用于音调滞后的零小数部分的多抽头滤波器,以便补偿由分母中的多抽头滤波器引入的取决于音调滞后的小数部分的频谱倾斜。优选地,后置滤波器被配置为抑制帧中谐波之间的能量的量,其中抑制的能量的量小于帧中的时域表示的总能量的20%。在另一实施例中,分母包括多抽头滤波器和增益值之间的乘积。在另一实施例中,滤波器分子还包括第一标量值和第二标量值的乘积,其中分母仅包括第二标量值而非第一标量值。这些标量值被设置为预定值,并且具有大于0且小于1的值;并且另外,第二标量值低于第一标量值。因此,可以以非常有效的方式来设置通常不期望的能量移除特性,并且附加地设置滤波器强度,即滤波器对变换域解码器输出信号中的间谐波失真加以衰减的强度。在优选实施例中,该装置还包括滤波器控制器,用于根据比特率来设置至少第二标量值,使得对较低比特率设置较高的值,反之亦然。此外,滤波器控制器被配置为根据音调滞后的小数部分以信号相关的方式来选择相应的多抽头滤波器,以便信号自适应地(即依赖于实际提供的音调滞后的小数部分值)设置谐波后置滤波器。附图说明以下在附图的上下文中讨论本专利技术的优选实施例,附图中:图1示出了用于对音频信号进行处理的本专利技术装置的实施例;图2示出了表示为z域中的传递函数的谐波后置滤波器的优选实现;图3示出了由z域中的传递函数表示的谐波后置滤波器的另一优选实施例;图4示出了用于生成要由图1所示的变换域音频解码器来解码的编码信号的编码器的优选实现;图5示出了作为由滤波器控制器控制的FIR滤波器的多抽头滤波器的优选实现;图6示出了滤波器控制器和具有根据小数部分预先存储的抽头权重的存储器之间的协作;图7a示出了具有零α值的滤波器的频率响应;图7b示出了α值等于1的优选谐波后置滤波器的频率响应;图7c示出了α值为0.8的优选谐波后置滤波器的频率响应;图8a示出了β值等于0.4的本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/201580040785.html" title="用于使用谐波后置滤波器来处理音频信号的装置及方法原文来自X技术">用于使用谐波后置滤波器来处理音频信号的装置及方法</a>

【技术保护点】
一种用于处理具有相关联的音调滞后信息和增益信息的音频信号的装置,包括:域转换器(100),用于将音频信号的第一域表示转换为音频信号的第二域表示;以及谐波后置滤波器(104),用于对音频信号的所述第二域表示进行滤波,其中所述后置滤波器基于包括分子和分母在内的传递函数,所述分子包括由所述增益信息指示的增益值,并且所述分母包括由所述音调滞后信息指示的音调滞后的整数部分和取决于所述音调滞后的小数部分的多抽头滤波器。

【技术特征摘要】
【国外来华专利技术】2014.07.28 EP 14178820.81.一种用于处理具有相关联的音调滞后信息和增益信息的音频信号的装置,包括:域转换器(100),用于将音频信号的第一域表示转换为音频信号的第二域表示;以及谐波后置滤波器(104),用于对音频信号的所述第二域表示进行滤波,其中所述后置滤波器基于包括分子和分母在内的传递函数,所述分子包括由所述增益信息指示的增益值,并且所述分母包括由所述音调滞后信息指示的音调滞后的整数部分和取决于所述音调滞后的小数部分的多抽头滤波器。2.根据权利要求1所述的装置,其中,所述后置滤波器的传递函数在分子中包括用于所述音调滞后的零小数部分的另一多抽头FIR滤波器。3.根据权利要求1或2所述的装置,其中,所述分母包括所述多抽头滤波器和所述增益值之间的乘积。4.根据前述权利要求之一所述的装置,其中,所述分子还包括第一标量值和第二标量值的乘积,所述分母包括所述第二标量值而不是所述第一标量值,所述第一标量值和所述第二标量值是预定的并且具有大于0且小于的值,并且所述第二标量值低于所述第一标量值。5.根据权利要求4所述的装置,还包括:滤波器控制器(114),被配置用于根据比特率来设置所述第二标量值,其中频率-时间转换器(100)按所述比特率操作,当所述比特率具有第一值时,所述第二标量值被设置为第一值,当所述比特率具有第二值时,所述第二标量值被设置为第二值,所述比特率的所述第二值低于所述比特率的所述第一值,并且所述第二标量值的所述第二值大于所述第二标量值的所述第一值。6.根据权利要求4或5所述的装置,其中,所述第一标量值被设置在0.6和1.0之间,并且所述第二标量值被设置在0.1和0.5之间。7.根据前述权利要求之一所述的装置,其中,所述后置滤波器具有基于以下等式的极-零表示中的传递函数H(z):H(z)=1-αβgB(z,0)1-βgB(z,Tfr)z-Tint]]>其中,α是第一标量值,β是第二标量值,B(z,0)是用于零小数部分音调滞后的多抽头滤波器,B(z,Tfr)是取决于音调滞后的小数部分的多抽头滤波器,Tint是音调滞后的整数部分,Tfr是音调滞后的小数部分,并且g是由增益信息指示的增益值,z是z平面中的变量。8.根据前述权利要求之一所述的装置,其中,所述多抽头滤波器是有限冲激响应(FIR)滤波器并且具有至少三个抽头。9.根据前述权利要求之一所述的装置,其中,所述分母中的多抽头滤波器包括四个抽头,对于零小数部分,第一抽头在0.0和0.1之间,第二抽头在0.2和0.3之间,第三抽头在0.5和0.6之间,并且第四抽头在0.2和0.3之间,其中,对于第一小数部分,所述多抽头滤波器包括四个滤波器抽头,第一抽头在0.0和0.1之间,第二抽头在0.3和0.4之间,第三抽头在0.45和0.55之间,并且第四抽头在0.1和0.2之间,其中,对于第二小数部分,所述多抽头...

【专利技术属性】
技术研发人员:以马利·拉韦利克里斯汀·赫姆瑞希戈兰·马尔科维奇马蒂亚斯·诺伊辛格萨沙·迪施曼努埃尔·扬德尔马丁·迪茨
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1