用于感知音频编/解码的低延时、自适应的多分辨率滤波器组制造技术

技术编号:3046915 阅读:188 留言:0更新日期:2012-04-11 18:40
一种用于感知音频编/解码的低延时、自适应的多分辨率滤波器组,其特征在于:利用余弦调制滤波和多分辨率分析构造多种不同时频划分的滤波结构,并且,该滤波结构可以实时的根据当前编码信号的变化自适应的切换。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及信号处理中数据压缩及信号处理用滤波器组,更详细地说,它用于音频信号的解相关,从而提供一个消解冗余度的方法和装置,除此之外,基于心理声学模型,本专利技术还可用于分离具有不同重要性的信号分量。众所周知,一些线性变换能够导致接近于零的高频系数,换句话说,时域信号包含的大部分信息能够被转换或集中到频域或时--频域系数的一个子集中,于是,信号压缩技术广泛地采用不同滤波结构作为提高编码效率的手段。在心理声学中,一个纯音可以被以它为中心,且具有一定带宽的连续噪声所掩蔽,若在这一频带内噪声功率等于该纯音的功率,此时该纯音处于刚好能被听到的临界状态,即称这一频带为临界带宽(单位为Bark)。临界频带是编码中子带划分的心理学依据。人耳对音频信号的分析以临界频带为基础,类似一个非等带宽滤波器组,在不同的子带中差异很大。因此,临界频带是编码中子带划分的心理声学依据。在感知音频编码中,子带的划分应尽量与人耳临界频带的宽度接近,以便更好的适应人耳的听觉特性。但是,在实际的编码中,考虑到实现的代价,这一要求并不能得到完全的满足。原因在于,能够接近人耳的听觉特性的非等带宽滤波器组设计、相关的心理声学分析和量化设计存在技术方面的困难。一般地,知觉音频编码器的一个基本操作是把输入的音频信号从时间域映射到频率域或者时--频域,其基本的思路为把信号分解为各频率带上的成分;一旦输入信号在频域上得以表达,心理声学模型就可以用来去除枝节信息;进一步,把各频带上的成份分组。最后,通过合理地分配比特数以表达各组频率参数。由于音频信号展现出强烈的准周期性,这一过程可大大降低数据量、提升编码效率。最近的几年里,一系列可用于信号成份分离和冗余度提取的时--频域映射(也被称为变换和滤波)算法被开发出来。这些性能各异的方法包括(1)离散傅立叶变换(Discrete Fourier transform,DFT)。(2)离散余弦变换(Di screte cosine transform,DCT)。(3)镜像滤波器(Quadrature mirror filters,QMF)。(4)伪镜像滤波器(Pseudo QMF,PQMF)。(5)余弦调制滤波器(Cosine Modulated Filters,CMF)。(其中包括离散余弦变换,即MDCT)(6)离散小波(包)变换(Discrete Wavelet(Packet)Transform,DW(P)T)。上述各种变换具有不同的优缺点,不同的系统根据需要选用适当的变换作为其滤波器组的基本构成。MPEG-1,2 Layers I和II采用了PQMF作为滤波器组。该滤波器组的优点为结构相对简单、时间分辨率很好。其缺点为邻近子带之间存在明显的频率重叠;单一频率信号的变化可影响与其相邻的二个子带。2000Hz以下的频带宽度远大于心理声学带宽值,从而无法实现比特数的最优分配。实时运算量偏大。MPEG-1,2 Layer III采用了PQMF和MDCT的级联作为其滤波器组。虽然MDCT的引入可提升频率分辨率从而改进编码效率,PQMF在邻近子带之间的频率重叠仍然会导致信号的混迭,频域量化噪声在时间域上的扩散比较严重。MPEG-2,4 AAC采用了MDCT作为滤波器组(稳态信号1024-点MDCT,暂态信号128-点MDCT),该滤波器组使用了二种重叠窗形状SINE和KBD。其优点为频率分辨率很好;其缺点为时间分辨率偏低。MPEG-4 Twin VQ的滤波器组与MPEG-2,4 AAC相似,除此之外,它采用了线性滤波器组以白化频谱系数并在量化级之前执行归一化操作。AC-3的滤波器组对稳态信号使用256-点MDCT,对暂态信号使用128-点MDCT,其块长选择机制比较简单,选择效果为次最优。上述系统或者只采用一种变换配置去压缩表达一个输入信号帧,或者采用时域分析区间较小的滤波器组或变换压缩表达变化剧烈的信号(或称快变信号),以消除前回声对解码信号的影响。当一个信号帧包含不同暂态特性的成份时,单一的变换配置不足以满足不同信号子帧对优化压缩的基本需求;而简单的采用时域作用区间较小的滤波器组或变换来处理快变信号,则所得系数的频率分辨率较低,使得低频部分的频率分辨率远大于人耳临界子带带宽,因而严重影响编码效率。ATRAC的滤波器组由前回声增益控制、QMF和MDCT级联而成。它还采用了窗转换机制以根据输入信号的特性调整时频分辨率。DTS的滤波器组由512-tap 32子带PQMF构成。为了进一步提取冗余度,一个线性滤波器组可被级联在PQMF之后。Deepen Sinha和J.D.Johnston提出了一种基于MDCT和小波变换信号自适应切换的编码技术(Deepen Sinha和J.D.Johnston“Audiocompression at low bit rates using a signal adaptiVe switchedfilterbank”,In Proc.IEEE Int.Conf.Acoust.,Speech,SignalProcessing,volume 2,pages 1053-1056,Atlanta,USA,1996.),对缓变信号,采用频率分辨率较高的MDCT变换,对变换剧烈的信号,采用小波变换,获得了较高的编码效率。Marcus Purat和Peter Noll通过对余弦调制滤波器组的输出进行再滤波,提供了一种新的用于音频编码的多分辨率的滤波技术(MarcusPurat和Peter Noll,“A new orthonormal wavelet packetdecomposition for audio coding using frequency-varying modulatedlapped transforms”,IEEE 1995 Workshop on Applications of SignalProcessing to Audio and Acoustics,New Paltz,N.Y.(USA),1995),也获得了较高的编码效率。(2)采用尽可能长的改进余弦形式的基函数,有效的去除或削弱音频信号中统计冗余。(3)通过滤波器组时频分辨率的自适应切换,以及相邻帧间的重叠加窗技术,尽可能减小了前回声(Pre Echo)噪声和由边界之不连续性所导致的听觉块效应(Blocking Effect)。(4)由于有效的去除了音频信号的统计冗余和感知无关冗余,在保持音频信号品质的前提下,有效提高了音频信号的压缩效率。(5)采用的滤波技术可以产生较小的编/解延迟。(6)采用快速算法,运算量较小。为了实现上述目标,本专利技术采用余弦调制滤波器组技术,设计一组根据音频输入信号的暂态性度量切换的滤波器组结构,在消除或削弱符号间的统计冗余的同时,充分利用人耳听觉特性,以提高编码效率。本专利技术所提出的低延时、自适应的多分辨率滤波器组结构,是指在音频编码中,根据当前编码信号的类型,动态调整滤波结构的技术。根据信号性质,动态调节滤波器组的时间--频率分辨率,获得信号的优化滤波和时频表示。以最大限度的降低编码比特率,或者在确定的比特率下获得尽可能高的编码主观质量。本专利技术所述的多分辨率滤波结构的信号自适应调节是通本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于感知音频编/解码的低延时、自适应的多分辨率滤波器组,其特征在于利用余弦调制滤波和多分辨率分析构造多种不同时频划分的滤波结构,并且,该滤波结构可以实时的根据当前编码信号的变化自适应的切换。2.根据权利要求1所述的滤波器组,其特征在于根据当前信号帧包含不同暂态性度量Z=(Σj=1N|sj-1NΣj=1Nsj|2+λ)/Σj=1N|sj|2+λ]]>特性,自适应切换用于编码的滤波器组结构,对缓变信号,采用等带宽的余弦调制滤波器组;对快变信号,采用和缓变信号相同的等带宽的余弦调制滤波器组滤波所获得系数,再进行多分辨率分析,从而调节不同成分的时--频分辨率。3.根据权利要求2所述的滤波器组,其特征在于基于余弦调制的多分辨率时频划分滤波器组,可以根据hk(n)=pa(n)2Mcos(πM(k+0.5)(n+M+12))---(5)]]>fk(n)=ps(n)2Mcos(πM(k+0.5)(n+M+12))---(6)]]>其中0≤k<M-1,0≤n<2KM-1,K为大于零的整数,构造满足不同性能要求的多分辨率滤波结构。4.根据权利要求2所述的滤波器组,其特征在于多分辨率滤波结构的信号自适应调节是通过对余弦调制滤波得到的频域系数进行小波变换实现的。5.根据权利要求2所述的滤波器组,其特征在于满足不同性能要求的多分辨率滤波结构,可以根据当前信号的统计特性、掩蔽特性和/或时频特性,滤波结构的自适应调节。6.根据权利要求2所述的滤波器组,其特征在于基于余弦调制的多分辨率时频划分滤波器组,在对输入信号变换/滤波时,在不同频率区间,采用不同时频分辨率的余弦调制滤波器组,获得多分辨率的时频划分,并使系统满足完全重构,其完全重构条件为Σm=02K-1-2sps(mM+n)pa((m+2s)M+n)=δ(s)---(10)]]>Σm=02K-1-2s(-1)mps(mM+n)pa((m+2s)M+(M-n-1))=0---(11)]]>其中s=0,…,K-1,n=0,…,M-1。7...

【专利技术属性】
技术研发人员:潘兴德
申请(专利权)人:北京阜国数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1