利用自适应噪声本底相加和噪声替换限制,增强信源编码和解码的方法和系统技术方案

技术编号:3047063 阅读:166 留言:0更新日期:2012-04-11 18:40
本发明专利技术利用高频重建(HFR)提出用于增强源编码系统的新方法和设备。通过自适应噪声本底相加,它解决重建的高频带中噪声含量不足的问题。借助于限制无用噪声,内插和包络调整放大因子的平滑,它还引入增强性能的新方法。本发明专利技术可应用于语音编码系统和自然音频编码系统。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及利用诸如频谱带复制SBR[WO98/57436]的高频重建(HFR)或有关方法的源编码系统。它改进高质量方法(SBR)以及低质量复制方法的性能[U.S.Pat.5,127,054]。它可应用于语音编码系统和自然音频编码系统。此外,利用自适应噪声本底相加,本专利技术可以有利地与有高频重建或没有高频重建的自然音频编解码器结合使用,以减小通常在低比特率条件下发生的频带关闭的音响效应。随机信号分量的存在是许多乐器以及人们声音的重要性质。若被感知的信号是自然发声,则重现这些噪声分量是很重要的,这些噪声分量往往与其他的信号分量相混合。在高频重建中,在某些条件下,必须增加噪声到重建的高频带中,为的是获得类似于原始信号中的噪声含量。这种必要性源于这样一个事实,与低频区域中的噪声电平比较,例如,簧片或弓弦乐器发出的大多数谐音在高频区域中有相对高的噪声电平。此外,发出的谐音中有时包含高频噪声,导致信号中高频带噪声电平与低频带噪声电平之间没有相似性。在任何一种情况下,频率置换,即,高质量SBR,以及任何低质量复制过程,在复制的高频带中有时会遇到缺少噪声。甚至于,高频重建过程常常包括某种包络调整,其中需要避免无用噪声替换谐波。因此,重要的是,在解码器中能够增加和控制高频再生过程中的噪声电平。在低比特率条件下,自然音频编译码器通常显示严重的频带关闭。这是在帧到帧的基础上完成的,导致以任意方式在整个编码频率范围内出现频谱空洞。这种情况可以造成听觉上的假象。利用自适应噪声本底相加方法可以减轻这种效应。一些现有技术编码系统包括这样一种装置,用于在解码器中重建噪声分量。这可以使编码器在编码过程中省略噪声分量,因此使它更加有效。然而,要使这种方法获得成功,在编码过程中被编码器排除的噪声必须不包含其他的信号分量。由于大多数噪声分量在时间和/或频率上与其他信号分量相混合,这种硬判决基噪声编码方案导致相对低的占空因数。而且,这种方案无论如何不能解决重建高频带中噪声含量不足的问题。本专利技术利用自适应增加噪声本底解决再生高频带中噪声含量不足的问题以及在低比特率条件下由于频带关闭引起的频谱空洞。它还避免无用噪声替换谐波。这是借助于在编码器中估算噪声本底电平,以及自适应噪声本底相加和在解码器中无用噪声替换限制完成的。自适应噪声本底相加和噪声替换限制方法包括以下的步骤-在编码器中,利用加到原始信号频谱表示上的谷值踪迹(dip-follower)和峰值踪迹(peak-follower),估算该原始信号的噪声本底电平;-在编码器中,把噪声本底电平变换到几个频带,或利用LPC或任何其他多项式代表它;-在编码器或解码器中,在时间和/或频率上平滑该噪声本底电平;-在解码器中,按照原始信号的频谱包络表示整形随机噪声,并按照在编码器中估算的噪声本底电平调整该噪声;-在解码器中,在时间和/或频率上平滑该噪声电平;-在再生的高频带或关闭的频带中,给高频重建信号增加该噪声电平。-在解码器中,利用包络调整放大因子限制,调整高频重建信号的频谱包络。-在解码器中,利用接收频谱包络的内插,增大频率分辨率,因此,改进限幅器的性能。-在解码器中,应用平滑操作到包络调整放大因子。-在解码器中,产生高频重建信号,该信号是源于不同低频带频率范围的几个高频重建信号的和值,并分析该低频带以提供控制数据给这个和值。现在,参照附图并借助于几个说明性例子描述本专利技术,这些例子并不限制本专利技术的范围或精神,其中附图说明图1表示按照本专利技术加到高分辨率和中分辨率频谱的峰值踪迹和谷值踪迹,以及噪声本底到频带的变换;图2表示按照本专利技术在时间和频率上平滑的噪声本底;图3表示原始输入信号的频谱;图4表示没有自适应噪声本底相加的SBR过程的输出信号频谱;图5表示按照本专利技术有SBR和自适应噪声本底相加的输出信号频谱;图6表示按照本专利技术的频谱包络调整滤波器组的放大因子;图7表示按照本专利技术的频谱包络调整滤波器组中的平滑放大因子;图8表示在源编码系统中编码器一侧的本专利技术可行的实施方案;图9表示在源编码系统中解码器一侧的本专利技术可行的实施方案。以下描述的实施例仅仅说明改进高频重建系统的本专利技术原理。应当明白,此处描述的布置和细节中各种改动和变化对于本领域的其他专业人员是显而易见的。所以,本专利技术仅受所申请专利的权利要求书范围的限制,而不是受所描述和解释的实施例中具体细节的限制。噪声本底电平估算在利用足够的频率分辨率分析音频信号频谱时,可以清晰地见到共振峰,单个正弦波,等等,这在以下称之为精细结构频谱包络。然而,若利用低分辨率,则不可能观察到细节,这在以下称之为粗略结构频谱包络。噪声本底电平,虽然它未必是定义中的噪声,在本专利技术的整个使用过程中,它是指高分辨率频谱中沿局部最小点内插的粗略结构频谱包络与高分辨率频谱中沿局部最大点内插的粗略结构频谱包络之比率。这个测量值是通过计算信号段的高分辨率FFT并应用峰值踪迹和谷值踪迹得到的,如图1所示。然后,计算噪声本底电平作为峰值踪迹与谷值踪迹之差。在时间和频率上适当地平滑这个信号,得到噪声本底电平的量度。可以按照公式1和公式2描述峰值踪迹函数和谷值踪迹函数,Ypeak(X(k))=max(Y(X(k-1))-T,X(k))∀1≤k≤fftSize2]]>公式1Ydip(X(k))=min(Y(X(k-1))+T,X(k))∀1≤k≤fftSize2]]>公式2其中T是延迟因子,X(k)是k线处频谱的对数绝对值。计算两个不同FFT大小的一对,一个是高分辨率,另一个是中分辨率,为的是得到在颤音和准静态声音期间一个良好的估算值。加到高分辨率FFT的峰值踪迹和谷值踪迹是LP滤波的,为的是丢弃极端值。在得到两个噪声本底电平估算值之后,选取一个最大值。在本专利技术的一个实施方案中,把噪声本底电平值变换到多个频带,然而,也可以利用其他的变换,例如,曲线拟合多项式或LPC系数。应当指出,在确定音频信号中的噪声含量时,还可以利用几种不同的方法。然而,如上所述,本专利技术的目的是估算高分辨率频谱中局部最小值与局部最大值之差,虽然这未必是真实噪声电平的一个准确测量值。其他可行的方法是线性预测,自相关,等等,这些方法通常用于硬判决噪声/无噪声算法[“Improving Audio Codecs by Noise Substitution”D.Schultz,JAES,Vol.44,No.7/8,1996]。虽然这些方法力图测量信号中真实的噪声量,但是它们可应用于测量本专利技术中定义的噪声本底电平,虽然它们没能给出与上述方法相同的良好结果。还可以利用一种合成方法的分析,即,解码器置于编码器中,并按照这种方式评定所需自适应噪声量的准确值。自适应噪声本底相加为了加上自适应噪声本底,必须有信号的频谱包络表示。这可以是滤波器组装置的线性PCM值或LPC表示。在调整它到解码器接收值的准确电平之前,按照这个包络整形噪声本底。也可以利用解码器中给出的附加偏移调整该电平。在本专利技术的一个解码器实施方案中,把接收的噪声本底电平与解码器中给出的上限值进行比较,再变换到几个滤波器组信道,随后在时间和频率上通过LP滤波进行本文档来自技高网...

【技术保护点】
一种利用高频重建增强源编码系统的方法,其中所述源编码系统包括:编码器,代表存储或传输之前完成的所有操作;和解码器,代表存储或传输之后完成的所有操作,其特征是: 在所述编码器中,估算原始信号的噪声本底电平; 在所述解码器中,按照频谱包络表示整形随机噪声,并按照所述编码器中估算的所述噪声本底电平调整所述噪声; 在所述解码器中,给高频重建信号增加所述噪声。

【技术特征摘要】
SE 1999-1-27 9900256-0;SE 1999-10-1 9903553-71.一种利用高频重建增强源编码系统的方法,其中所述源编码系统包括编码器,代表存储或传输之前完成的所有操作;和解码器,代表存储或传输之后完成的所有操作,其特征是在所述编码器中,估算原始信号的噪声本底电平;在所述解码器中,按照频谱包络表示整形随机噪声,并按照所述编码器中估算的所述噪声本底电平调整所述噪声;在所述解码器中,给高频重建信号增加所述噪声。2.按照权利要求1的方法,其特征是,所述噪声本底电平变换到几个频带。3.按照权利要求1的方法,其特征是,所述噪声本底电平是利用LPC或任何其他多项式代表的。4.按照权利要求1的方法,其特征是,利用加到所述原始信号频谱表示上的谷值踪迹和峰值踪迹估算所述噪声本底电平。5.按照权利要求1的方法,其特征是,在时间和/或频率上平滑所述噪声本底电平。6.按照权利要...

【专利技术属性】
技术研发人员:克里斯托弗克约尔林佩尔艾克斯特兰德弗雷德里克海恩
申请(专利权)人:编码技术股份公司
类型:发明
国别省市:SE[瑞典]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1