选择性低音后置滤波器制造技术

技术编号:12705570 阅读:93 留言:0更新日期:2016-01-14 01:59
本发明专利技术提供一种解码器系统,用于将比特流信号解码为音频时间信号,所述解码器系统包括:解码部,用于将比特流信号解码为初级音频时间信号,其中所述解码部包括代码激励线性预测CELP解码模块和变换编码激励TCX解码模块;以及谐波间噪声衰减后置滤波器,适于接收所述初级音频时间信号,以及提供所述音频时间信号,其中所述后置滤波器包括控制部,所述控制部用于选择性地以下列模式之一操作所述后置滤波器:i)滤波模式;以及ii)旁路模式,其中,谐波间噪声衰减依赖于可变增益的值,并且所述控制部可操作用于通过将所述可变增益的值设置为零来启用所述旁路模式。

【技术实现步骤摘要】
选择性低音后置滤波器本申请是申请日为2011年6月23日、申请号为201180033082.4(PCT/EP2011/060555)、专利技术名称为“选择性低音后置滤波器”的专利申请的分案申请。
本专利技术主要涉及数字音频编码,更准确地说,涉及对于包含具有不同特性的分量的音频信号的编码技术。
技术介绍
对于包含说话或者歌声的音频信号的普遍类别的编码方法包括与不同的编码方法在时间上交替应用的代码激励线性预测(CELP),这些不同的编码方法包括特别适于音乐的频域编码方法或者用于解释音频信号的连续时间段之间的特性变化的具有普通性质的方法。例如,如附图2的上部所示,简化运动图片专家组(MPEG)联合语音和音频编码(USAC;参见标准ISO/IEC23003-3)解码器在至少三种解码方法:高级音频编码(AAC;参见标准ISO/IEC13818-7)、代数CELP(ACELP)和变换编码激励(TCX)中可操作。CELP的各种实施例被适配于人的语音器官的属性,并且尽可能地被适配于人的听觉。如在该应用中所使用的,CELP是指所有可能的实施例和变化,包括、但不限于ACELP、宽带和窄带CELP、SB-CELP(子带CELP)、低速率和高速率CELP、RCELP(松弛CELP)、LD-CELP(低延迟low-delayCELP)、CS-CELP(共轭结构CELP)、CS-ACELP(共轭结构ACELP)、PSI-CELP(音高同步革新CELP)以及VSELP(矢量和激励线性预测)。R.Schroeder和S.Atal在ProceedingsoftheIEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing(ICASSP),vol.10,pp.937-940,1985中讨论了CELP的原理,并且在ChenandGersho,IEEETransactionsonSpeechandAudioProcessing,vol.3,no.1,1995中引用的参考文献25-29中描述了某些它的应用。如在前者的论文中进一步详细描述的,CELP解码器(或者类似地,CELP语音合成器)可以包括恢复编码语音信号的周期分量的音高预测器和用来添加革新序列(innovation)的脉冲代码本。音高预测器依次可以包括通过频谱包络成形来恢复音高的长延迟预测器和恢复共振峰的短延迟预测器。在该情境中,通常将音高理解为由声带生成并且通过声道的共振部分进一步进行了润色的有声调声音分量的基频。该频率将与其谐波一起对说话或者歌唱进行主导。通常来说,CELP方法最适合于对良好限定了音高频率并且音高频率相对容易确定的独唱或者一个声部的歌唱进行处理。为了提高CELP编码语音的感知质量,共同的作法是将其与后置滤波(或者音高增强(另一术语))组合。美国专利第4969192号和Chen和Gersho的论文的第II部分公开了这种后置滤波器的理想属性,即其抑制处于检测到的语音音高(长期部分;参见第IV部分)的谐波之间的噪声分量的能力。相信该噪声的重要部分来源于频谱包络成形。简单的后置滤波器的长期部分可以被设计为具有下面的传递函数:其中,T是按照样本数量估计的音高周期,α是后置滤波器的增益,如图1和2所示。以与梳状滤波器类似的方式,这种滤波器对位于音高频率的谐波之间的中途的频率1/(2T)、3/(2T)、5/(2T)、…以及相邻的频率进行衰减。衰减取决于增益α的值。稍微复杂一些的后置滤波器仅对最容易感知噪音的低频应用该衰减-因此有常用术语低音后置滤波器。这可以通过将上述传递函数HE和低通滤波器HLP进行级联来表示。因此,通过下式在变换域中给出由后置滤波器提供的后置处理后的解码SE:SE(z)=S(z)-αS(z)PLT(z)HLP(z),其中,并且,S是作为对后置滤波器的输入而提供的解码信号。图3示出了具有这些特征的后置滤波器的实施例,其还在section6.1.3oftheTechnicalSpecificationETSITS126290,version6.3.0,release6中进一步进行了讨论。如该图所表示的,音高信息被编码作为比特流信号中的参数,并且由可通信地连接到进行由PLT表示的运算的长期预测滤波器的音高跟踪模块对音高信息进行检索。在前面的段落中描述的长期部分可以单独使用。可选地,其被布置为与噪声成形滤波器串联,噪声成形滤波器以与共振峰相应的频率间隔保存分量,并且在其它频谱区域(短期部分;参见第III部分)中,即在共振峰包络的“频谱谷”中使噪声衰减。作为其它可能的变化,由逐步高通型滤波器进一步补充该滤波器集合,以减小由于短期部分的频谱倾斜而感知到的劣化。包含不同来源的分量的混合的音频信号-例如有声调、无声调、声乐(vocal)、器乐、非音乐-不总是能由可用数字编码技术以令人满意的方式进行再现。更准确地注意到,可用技术在处理这种非同种音频材料时有缺陷,通常有利于这些分量中的一个,而损害另一个。特别地,经常伴随着破坏一部分收听体验的可感知的杂音,对通过具有上述性质的方法编码的、包括由一个或更多个乐器或者合唱团声部伴奏的歌唱的音乐进行解码。
技术实现思路
为了减轻在前面的部分中概括的缺点中的至少一部分,本专利技术的目的是提供被适配用于对包含具有不同来源的分量的混合信号进行音频编码和解码的方法和设备。作为特别目的,本专利技术试图提供从编码效率或者(感知)再现逼真度或者两者的观点来看适合的这些方法和设备。本专利技术通过提供如在所附权利要求中限定的编码器系统、解码器系统、编码方法、解码方法以及用于进行这些方法中的每一个的计算机程序产品,来实现这些目的中的至少一个。由所附权利要求来限定本专利技术的实施例。专利技术人认识到,在具有非同种来源的解码音频信号中感知到的一些杂音来自于几个编码模式的不适当切换,在这几个编码模式中,至少一个在解码器处包括后置滤波,并且至少一个在解码器处不包括后置滤波。更准确地说,可用后置滤波器不仅去除谐波间噪声(并且在适用的情况下,频谱谷中的噪声),还去除表示乐器或者人声伴奏以及其它具有‘理想’性质的材料的信号分量。在频谱谷中恰能注意到的差别可能如10dB大的事实(如由GhitzaandGoldstein,IEEETrans.Acoust,Speech,SignalProcessing,vol.ASSP-4,pp.697-708,1986所指出的),已经被许多设计者用作正当理由,来对这些频带进行严格滤波。然而,由谐波间(以及频谱谷)衰减本身引起的质量劣化可能比切换情景的质量劣化较不重要。当接通后置滤波器时,歌唱语音声音的背景突然减弱,而当使滤波器无效时,背景瞬间变得更响亮。如果切换频繁发生,则由于音频信号的性质或者由于编码设备的配置,将存在切换杂音。作为一个示例,USAC解码器可以在与后置滤波组合的ACELP模式下或者在没有后置滤波的TCX模式下可操作。在存在主导声乐分量的片段中使用ACELP模式。因此,可以由歌唱的开始来触发到ACELP模式的切换,例如在新的音乐段落的开始、在新的节的开始或者简单地在声乐分量不再突出的意义上伴奏被视为淹没歌唱的声音的片段之后。试验已经证实,因为出现混响状杂音,因此全面使用本文档来自技高网
...

【技术保护点】
一种解码器系统,用于将比特流信号解码为音频时间信号,所述解码器系统包括:解码部,用于将比特流信号解码为初级音频时间信号,其中所述解码部包括代码激励线性预测CELP解码模块和变换编码激励TCX解码模块;以及谐波间噪声衰减后置滤波器,适于接收所述初级音频时间信号,以及提供所述音频时间信号,其中所述后置滤波器包括控制部,所述控制部用于选择性地以下列模式之一操作所述后置滤波器:i)滤波模式,其中,所述后置滤波器对所述初级音频时间信号进行滤波,以获得滤波信号,并且提供该滤波信号作为音频时间信号;以及ii)旁路模式,其中,所述后置滤波器提供所述初级音频时间信号作为音频时间信号,其中,谐波间噪声衰减依赖于可变增益的值,并且所述控制部可操作用于通过将所述可变增益的值设置为零来启用所述旁路模式。

【技术特征摘要】
2010.07.02 US 61/361,2371.一种解码器系统,用于将比特流信号解码为音频时间信号,所述解码器系统包括:解码部,用于将比特流信号解码为初级音频时间信号,其中所述解码部包括代码激励线性预测CELP解码模块和变换编码激励TCX解码模块;以及谐波间噪声衰减后置滤波器,适于接收所述初级音频时间信号,以及提供所述音频时间信号,其中所述后置滤波器包括控制部,所述控制部用于选择性地以下列模式之一操作所述后置滤波器:i)滤波模式,其中,所述后置滤波器对所述初级音频时间信号进行滤波,以获得滤波信号,并且提供该滤波信号作为音频时间信号;以及ii)旁路模式,其中,所述后置滤波器提供所述初级音频时间信号作为音频时间信号,其中,谐波间噪声衰减依赖于可变增益的值,并且所述控制部可操作用于通过将所述可变增益的值设置为零来启用所述旁路模式。2.根据权利要求1所述的解码器系统,其中,所述解码部选择性地以下列模式之一进行操作:a)启用所述TCX解码模块,并且以所述旁路模式操作所述后置滤波器;b)启用所述CELP解码模块,并且响应于后置滤波信号,以滤波模式操作所述后置滤波器;以及c)启用所述CELP解码模块,并且响应于后置滤波信号,以旁路模式操作所述后置滤波器。3.根据权利要求2所述的解码器系统,其中,所述解码部还包括高级音频编码AAC解码模块,所述AAC解码模块用于将比特流信号解码为音频时间信号,所述控制部适于也以下面的模式操作所述解码部:d)启用所述AAC解码模块,并且禁用所述后置滤波器。4.根据权利要求1至3中的任意一项所述的解码器系统,其中,所述后置滤波器适于仅对位于预定截止频率以下的这些频谱分量进行衰减。5.根据权利要求1至3中的任意一项所述的解码器系统,其中,所述比特流信号是运动图片专家组MPEG比特流,并且所述比特流信号被分割为时间帧,并且所述控制部适于禁用整个时间帧或者整个时间帧的序列;以及所述控制部还适于针对每个时间帧,接收与该时间帧相关联的数据字段,并且所述控制部可操作用于响应于所述数据字段的值使所述后置滤波器禁用,由此所述初级...

【专利技术属性】
技术研发人员:巴尔巴拉·雷施克里斯托弗·薛林拉尔斯·维尔默斯
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1