一种基于伪小波滤波的音频编/解码方法技术

技术编号:3047113 阅读:199 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及现代信息处理领域中一个快速发展的分枝——音频信号的压缩技术。本发明专利技术音频信号分解成长度为L的帧,将上面的得到的帧序列送入信号类型判断单元,将当前帧序列并行送入对应类型信号的心理声学分析单元和伪小波滤波单元;对伪小波系数按子带顺序进行组织,并按其时频特性划分成尺度因子带;对重组织后的伪小波系数做压扩处理,将压扩处理后的伪小波系数送入全局感知失真最小的量化单元,将量化结果输入自适应的Huffman编码器,进行熵编码,形成音频压缩码流。伪小波滤波器具有能够实时地实现快变信号滤波和缓变信号滤波的切换,实现了从对缓变信号的滤波到对快变信号的滤波和从对快变信号的滤波到对缓变信号的滤波的无缝连接。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及现代信息处理领域中一个快速发展的分枝——音频信号的压缩技术。目前大部分音频信号编解码方案都采用Modulated Discrete CosineTransform(MDCT)作为其滤波器组,MDCT是由Princen和Bradley于1987年提出的(“Subband/Transform Coding Using Filter Bank Designs Basedon Time Domain Aliasing Cancellation”,Proceedings of the ICASSP 1987,pp2161-2164),它以重叠块和动态窗把一个信号分解成等长的子带,由于cosine系列函数之特质和编解码过程中的量化噪声,系数重构和反向MDCT的使用会在合成出的突跃信号周围形成波纹。人类听觉系统的后向掩蔽时效远长于前向掩蔽时效,PCM(脉码调制)帧的后端通常处于后向掩蔽时效内,因此,突越信号之后的波纹不会被听到,如果前向掩蔽时效不能覆盖PCM帧的前端,突越信号前面的波纹会形成可感知的噪声,这种噪声被称为预回声。为抑制或消除这种前回声,较小的MDCT块长应被使用以便把突越信号前面的波纹限制在前向掩蔽时效内,由于块长与编码效率成正比,一种自动而精确地选择MDCT块长的算法可消除或抑制前回声并优化编解码器的率失真性能。在过去的几年里,一些用于抑制或消除前回声的块长选择方法被提出并使用于不同的系统,例如SONY公司用于ATRAC编码技术中连续子帧的峰值辨别策略和MPEG AAC的感知熵判决策略等。这两种策略都尤其自身的局限,详细请参见(专利一种基于自适应阀值和典型样本预测的块长选择方法;申请号01134556.x)。如上所述,在使用块变换的音频编码器时,输入信号在时域上短暂而显著的变化(突跃信号)在前向掩蔽时效不能覆盖PCM帧的前端时会导致前回波噪音;为了抑制或消除这种前回声,较短的块应被使用以便把突跃信号前面的波纹限制在前向掩蔽时效内,然而,较小的块长不可避免地导致频域分辨率的下降、从而降低编码效率,对具有突跃性的输入信号而言,在编码效率和前回声消除之间存在一个平衡问题。对人类听觉特点的大量实验研究表明,人类的听觉系统可以按频率分布划分出一个非等带宽的频带组合,在各个频带范围内人耳对声音的敏感程度有明显的不同,把这些频带范围称为临界子带(critical subband)。MDCT作为等带宽的滤波器组的一个缺陷在于不能充分的利用人耳的听觉特性实现冗余信息的最大限度的去除,即实现更高压缩比下的无失真编码。利用小波和小波包变换的时频局域化和多分辨率分析性质,构造基于人类听觉特征的非等宽子带滤波器以取代现有算法中的等带宽子带滤波器。在得到更为贴近临界子带的子带划分后,可以更好地利用心理声学模型进行压缩,为在保证重构音质透明的情况下进一步提高压缩比提供了可能。但是,小波变换的滤波器级连特性使得小波滤波器组的频率选择性能不会很高,限制了基于小波变换的音频编码方案的效率。本专利技术的内容本专利技术的目的在于(1)在充分利用块变换的计算和编码效率的同时,利用伪小波滤波器的多分辨率性能,对编码音频信号进行更贴近人类听觉特征的频带划分,从而有效提高编码效率;(2)采用高效的信号类型辨别技术,提高信号类型的辨别精度,并同时提高心理声学模型的计算效率;(3)采用更稳健的量化优化策略,提高量化质量和优化速度;(4)采用更优化的噪声定型技术,有效减少信号的动态范围的同时,使量化噪声更利于感知掩蔽。本专利技术为实现专利技术目的所提出的技术方案伪小波音频编/解码器采用了性能优异的伪小波滤波器,并且设计了适合伪小波滤波器的量化器和熵编码器。其编码器的核心特征为a)音频信号分解成长度为L的帧,并做延迟处理;b)将上面的得到的帧序列送入信号类型判断单元,分析当前信号类型,根据其变化剧烈程度分为缓变信号和快变信号;c)根据b)的结果,将当前帧序列并行送入对应类型信号的心理声学分析单元和伪小波滤波单元,计算听觉掩蔽量和计算伪小波滤波系数;d)对伪小波系数按子带顺序进行组织,并按其时频特性划分成尺度因子带;e)对重组织后的伪小波系数做压扩处理,压扩函数如下x′=sign(x)|xl|α,---(1)]]>其中l是正整数,α是小于1的实数;f)将压扩处理后的伪小波系数送入全局感知失真最小的量化单元,每个尺度因子带对应一个线性量化器,量化公式为q(x)=x′·2β·scale_fac, (2)其中l,α同(1)式,β是小于1的实数,尺度因子scale_fac是正整数。量化过程为包括一个量化循环,每次循环是选出当前噪声掩蔽比最大的尺度因子带,然后在原来分配给该子带的比特数基础上额外分配给该子带最小可能的比特数,并且更新该子带的噪声掩蔽比;如此循环直至所需比特超过目标比特。g)将量化结果(尺度因子和量化系数)输入自适应的Huffman编码器,编码器根据当前帧序列的统计特性选择Huffman码表,进行熵编码,形成音频压缩码流。其解码器的核心特征为a)将压缩码流输入自适应Huffman解码器,解出当前帧的尺度因子和量化系数、以及当前帧的型号类型。b)将尺度因子和量化系数输入反量化器,计算反量化的伪小波系数,反量化的公式为iq(x)=sign(q(x))·l·(|q(x)·2-β·scale_fac|)1α---(3)]]>其中l、α、β意义同公式(1)、(2),q(x)和iq(x)分别为量化系数和反量化系数。c)将当前帧信号类型和刚得到的反量化系数输入伪小波逆滤波单元,计算重构时域序列。d)对得到的重构时域序列进行延迟补偿,计算重构时域音频序列。伪小波滤波器时频选择特性技术方案中所要求的伪小波滤波器具有这样的特性,它是一种有类似小波的多分辨率分析性能的非等带宽滤波器组技术,既成功的克服了小波变换计算效率和频率选择能力不高的弱点,同时拥有类似小波多分辨率分析的优异性能,使得对稳态信号和暂态信号都能保持高的编码效率。以下的实验可以清楚的说明伪小波滤波器的优异性能。取冲击响应长度仅为64的四个伪小波滤波器,计算它们的频率响应。然后,我们利用Daubechies正交小波基函数和小波包技术构造对应频带范围的四个小波滤波器,其中最长的小波滤波器的冲击响应长度为1000,并计算四个小波滤波器的频率响应。可以清楚的看到,响应长度仅为64的伪小波滤波器的幅度响应的旁瓣比响应长度为1000的小波滤波器的幅度响应的旁瓣低9个dB左右,也就是说,伪小波滤波器的频率选择性高于小波滤波器,通过计算编码增益也不难证明这一结论。根据人耳的听觉特性,伪小波的这一特性有助于音频编码性能的提高。伪小波滤波器处理快变信号和缓变信号的灵活性与mpeg中的AAC标准相比,伪小波滤波器还具有这样的优点,能够实时地实现快变信号滤波和缓变信号滤波的切换,具体来说,伪小波滤波器不需要AAC标准中的长短帧和短长帧的过渡块,而是实现了从对缓变信号的滤波到对快变信号的滤波和从对快变信号的滤波到对本文档来自技高网...

【技术保护点】
一种基于伪小波滤波的音频编/解码技术,其特征在于编码器的信号处理方法为: a)音频信号分解成长度为L的帧,并做延迟处理; b)将上面的得到的帧序列送入信号类型判断单元,分析当前信号类型,根据其变化剧烈程度分为缓变信号和快变信号; c)根据b)的结果,将当前帧序列并行送入对应类型信号的心理声学分析单元和伪小波滤波单元,计算听觉掩蔽量和计算伪小波滤波系数; d)对伪小波系数按子带顺序进行组织,并按其时频特性划分成尺度因子带; e)对重组织后的伪小波系数做压扩处理,压扩函数如下 x′=sign(x)│x/l│↑[α], (1) 其中l是正整数,α是小于1的实数; f)将压扩处理后的伪小波系数送入全局感知失真最小的量化单元,每个尺度因子带对应一个线性量化器,量化公式为: q(x)=x′.2↑[β.scale_fac], (2) 其中l,α同(1)式,β是小于1的实数,尺度因子scale_fac是正整数; 量化过程为包括一个量化循环,每次循环是选出当前噪声掩蔽比最大的尺度因子带,然后在原来分配给该子带的比特数基础上额外分配给该子带最小可能的比特数,并且更新该子带的噪声掩蔽比;如此循环直至所需比特超过目标比特; g)将量化结果(尺度因子和量化系数)输入自适应的Huffman编码器,编码器根据当前帧序列的统计特性选择Huffman码表,进行熵编码,形成音频压缩码流; 其解码器的信号处理方法为: a)将压缩码流输入自适应Huffman解码器,解出当前帧的尺度因子和量化系数、以及当前帧的型号类型; b)将尺度因子和量化系数输入反量化器,计算反量化的伪小波系数,反量化的公式为 iq(x)=sign(q(x)).l.(│q(x).2↑[-β.scale_fac]│)↑[1/α] (3) 其中l、α、β意义同公式(1)、(2),q(x)和iq(x)分别为量化系数和反量化系数; c)将当前帧信号类型和刚得到的反量化系数输入伪小波逆滤波单元,计算重构时域序列; d)对得到的重构时域序列进行延迟补偿,计算重构时域音频序列。...

【技术特征摘要】
1.一种基于伪小波滤波的音频编/解码技术,其特征在于编码器的信号处理方法为a)音频信号分解成长度为L的帧,并做延迟处理;b)将上面的得到的帧序列送入信号类型判断单元,分析当前信号类型,根据其变化剧烈程度分为缓变信号和快变信号;c)根据b)的结果,将当前帧序列并行送入对应类型信号的心理声学分析单元和伪小波滤波单元,计算听觉掩蔽量和计算伪小波滤波系数;d)对伪小波系数按子带顺序进行组织,并按其时频特性划分成尺度因子带;e)对重组织后的伪小波系数做压扩处理,压扩函数如下x′=sign(x)|xl|α,---(1)]]>其中l是正整数,α是小于1的实数;f)将压扩处理后的伪小波系数送入全局感知失真最小的量化单元,每个尺度因子带对应一个线性量化器,量化公式为q(x)=x′·2β·scale_fac, (2)其中l,α同(1)式,β是小于1的实数,尺度因子scale_fac是正整数;量化过程为包括一个量化循环,每次循环是选出当前噪声掩蔽比最大的尺度因子带,然后在原来分配给该子带的比特数基础上...

【专利技术属性】
技术研发人员:潘兴德朱晓明
申请(专利权)人:北京阜国数字技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1