用于知觉音频编码的信号处理方法及其柔性滤波器技术

技术编号:3047210 阅读:218 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及信号处理中数据压缩及信号处理用滤波器,更详细地说,它用于音频信号的解相关,从而提供一个消解冗余度的方法和装置,除此之外,基于心理声学模型,本发明专利技术还可用于分离具有不同重要性的信号分量。本发明专利技术其特征在于变换配置包括:1024-点MDCT、512-点MDCT、256-点MDCT、128-点64-子带PQMF以及128-点16-子带WAVELET。本发明专利技术通过提高滤波器组配置的自由度,取得了很高编码效率。所需要的运算量没有增加。由于各种信号成份可采用不同的变换配置,本发明专利技术柔性滤波器组合所需要的存储量有一定程度的增加。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及信号处理中数据压缩及信号处理用滤波器,更详细地说,它用于音频信号的解相关,从而提供一个消解冗余度的方法和装置,除此之外,基于心理声学模型,本专利技术还可用于分离具有不同重要性的信号分量。
技术介绍
通常,知觉音频编码器的第一步操作是把输入音频信号从时间域映射到频率域,其基本的思路为把信号过滤成各频率带上的成分;一旦输入信号在频域上得以表达,心理声学模型就可以用来去除枝节信息;进一步,把各频带上的成份分组。最后,通过合理地分配比特数以表达各组频率参数。由于音频信号展现出强烈的准周期性,这一过程可大大降低数据量、提升编码效率。最近的几年里,一系列可用于信号成份分离和冗余度提取的时一频域映射算法被开发出来。这些性能各异的方法包括(1)Discrete Fourier transform(DFT),(2) iscrete cosine transform(DCT),(3) uadrature mirror filters(QMF),(4) Pseudo QMF(PQMF),(5) Modified DCT(MDCT),(6) Wavelet上述各种变换具有不同的优缺点,不同的系统均是根据需要选用适当的变换作为其滤波器组的基本构成。MPEG-1,2 Layers I和II采用了PQMF作为滤波器组。该滤波器组的优点为结构相对简单、时间分辨率很好。其缺点为邻近子带之间存在明显的频率重叠;单一频率信号的变化可影响与其相邻的二个子带。2000Hz以下的频带宽度远大于心理声学带宽值,从而无法实现比特数的最优分配。实时运算量偏大。MPEG-1,2 Layer III采用了PQMF和MDCT的级联作为其滤波器组。虽然MDCT的引入可提升频率分辨率从而改进编码效率,PQMF在邻近子带之间的频率重叠仍然会导致信号的混迭,频域量化噪声在时间域上的扩散比较严重。MPEG-2,4 AAC采用了MDCT作为滤波器组(稳态信号1024-点MDCT,暂态信号128-点MDCT),该滤波器组使用了二种重叠窗形状SINE和KBD。其优点为频率分辨率很好;其缺点为时间分辨率偏低。MPEG-4 Twin VQ的滤波器组与MPEG-2,4 AAC相似,除此之外,它采用了线性滤波器以白化频谱系数并在量化级之前执行归一化操作。AC-3的滤波器组对稳态信号使用256-点MDCT,对暂态信号使用128-点MDCT,其块长选择机制比较简单,选择效果为次最优。ATRAC的滤波器组由前回波增益控制、PQF和MDCT级联而成。它还采用了窗转换机制以根据输入信号的特性调整时频分辨率。DTS的滤波器组由512-tap 32子带PQMF构成。为了进一步提取冗余度,一个线性滤波器可被级联在PQMF之后。上述所有的系统只采用一种变换配置去压缩表达一个输入信号幀。当一个信号幀包含不同暂态特性的成份时,单一的变换配置不足以满足不同信号子幀对优化压缩的基本需求。
技术实现思路
为了提高音频编码的品质,必需消除信号中的不必要信息以及听众觉察不到的成份。滤波器组的使用提供了一种去除冗余信息和枝节数据的最佳途径。根据其功能,本专利技术目的包括(1)优化分离具有不同知觉特性的信号成分。(2)最小化前回波噪声和由边界之不连续性所导致的听觉块毛刺。(3)在保持音频信号品质的前提下,最小化数据量。(4)实现精密抽样(critically sampled)和完全重构或准完全重构(perfectreconstruction,or nearly perfect reconstruction.) (5)最小化时间延迟和运算量。为了实现上述目标,一些参数和机制必须被合理地制定。这些参数和机制包括(a)重叠窗的形状极其优选机制(b)重叠窗的长度极其优选机制在实际运作中,单一的滤波器组不能够满足或基本满足所有的信号成份对上述目标的要求。本专利技术通过柔性组合多种滤波器及参数以优化表达一个输入信号幀所包含的各种成份。本专利技术所提出柔性滤波器组合包括五种变换配置,这五种变换配置为1024-点MDCT、512-点MDCT、256-点MDCT、128-点64-子带PQMF以及128-点16-子带WAVELET。显然,这五种变换配置的频率分辨率、时间分辨率、块长、时延以及邻近子带之间频率重叠的程度都不相同。对一输入信号幀,所专利技术的柔性滤波器组合从上述五种变换及参数之中选择出最恰当的一个或几个;通过分解信号幀,允许不同的信号子幀选用不同的变换及参数从而优化编码效率。有关的选择判据包括(1)评估当前输入信号幀的暂态性程度;(2)根据暂态性程度,排除不恰当的变换配置;(3)评估当前输入信号幀在频域上能量分布的均匀程度;(4)根据频域上能量分布的均匀程度,从候选的变换之中排除那些会导致过度频率重叠噪声的变换配置;原则上,频域能量均匀分布的信号对频率重叠的敏感性较低;(5)据前一信号幀或子幀的编码失真状态,排除那些不具备恰当时延的变换及参数,以合理地控制编码噪声的扩散。本专利技术的信号处理方法为首先评估当前输入信号幀的暂态程度,对暂态性较大的信号,排除频率分辨率较高的变换配置;接着,评估当前输入信号幀在频域上能量分布的均匀程度,对能量分布较不均匀的信号,排除子带频率重迭较严重的变换;然后,评估前一信号幀的编码失真状态。如果前一信号幀的编码失真较大,排除时延较大的变换,最后,根据输入幀是否存在突跃信号成份,排除具有不恰当块长的变换。根据上述初步筛选出来的变换之最大块长,把当前输入信号幀分解成等长子幀;对各子幀,判断是否可采用同样块长的候选变换,若不可以,进一步将其分解成2个等长的子幀,对进一步分解后的子幀,判断候选变换之中具有同样块长者是否为最恰当的配置;若不是,再进一步将当前子幀分解成2个等长度子幀;重复这种“判断—分解”的操作,直到合适的变换配置被选择或者子幀长度达到128;每个128样本的子幀必须在64-子带PQMF和16-子带WAVELET之间作出较合理的抉择。上述输入信号幀暂态性的程度分析方法为Z=(Σj=1N|sj-1NΣj=1Nsj|2+λ)/Σj=1N|sj|2+λ]]>sj为当前幀第j个信号样本;N为幀长,λ为大于零小于一的实数;λ的引入是为了突显变化的重要性。上述输入信号幀在频域上能量分布的均匀性度量判据F=(Σj=1N|xj2-1NΣj=1Nxj2|α)/Σj=1Nxj2·α]]>xj为输入信号幀经过FFT变换后得到的第j个系数;N为幀长;α为大于一的实数。α的引入是为了强化能量变化的敏感性。本专利技术通过提高滤波器组配置的自由度,取得了很高编码效率。所需要的运算量没有增加。由于各种信号成份可采用不同的变换配置,本专利技术柔性滤波器组合所需要的存储量有一定程度的增加。附图说明图1本专利技术的流程框图;图2本专利技术的实现平台的示意图。具体实现方式本专利技术的实现平台如图2所示。一个输入音频信号被以44.1kHz采样。采样信号被划分成幀。每幀由1024个样本组成(约23.2本文档来自技高网
...

【技术保护点】
一种用于知觉音频编码的信号处理方法的柔性滤波器,其特征在于变换配置包括:1024-点MDCT、512-点MDCT、256-点MDCT、128-点64-子带PQMF以及128-点16-子带WAVELET。

【技术特征摘要】
1.一种用于知觉音频编码的信号处理方法的柔性滤波器,其特征在于变换配置包括1024-点MDCT、512-点MDCT、256-点MDCT、128-点64-子带PQMF以及128-点16-子带WAVELET。2.一种用于知觉音频编码的信号处理方法,其特征在于采用“判断一等分”的二级优选结构于变换配置的选择,根据当前输入信号幀(1024个样本)之特性,首先判断1024-点MDCT是否最为合适;如果1024-点MDCT不合适,把输入信号幀分解成2个等长的子幀;接着,判断512-点MDCT是否适用于各个512样本子幀;对不适合于512-点MDCT的子幀,进一步将其分解成2个256样本的子幀;然后,判断256-点MDCT是否适用于各个256样本子幀;对不适合于256-点MDCT的子幀,再进一步将其分解成2个128样本子幀;每个128样本子幀必须在64-子带PQMF和16-子带WAVELET之间作出抉择。3.根据权利要求1所述的用于知觉音频编码的信号处理方法,其特征在于a)评估当前输入信号幀的暂态性程度;b)根据暂态性程度,排除不恰当的变换配置;c)评估当前输入信号幀在频域上能量分布的均匀程度;d)根据频域上能量分布的均匀程度,从候...

【专利技术属性】
技术研发人员:陈常谦
申请(专利权)人:北京阜国数字技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1