有效频谱包络编码方法及其编解码设备技术

技术编号:3047148 阅读:191 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种用于进行频谱包络编码的新型方法和设备。本发明专利技术说明了如何实现包络表示的时间/频率映射以及如何发送包络表示的时间/频率映射,此外,还利用自适应时间/频率定向编码对频谱包络数据进行有效编码。该方法可以应用于自然音频编码系统和语言编码系统,并且该方法特别适于采用SBR[WO 98/57436]或其它高频重构的编码器。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种在音频编码系统中对频谱包络进行有效编码的新型方法和设备。该方法既可以应用于自然音频编码过程,也可以应用于语音编码过程,并且该方法特别适于采用SBR[WO 98/57436]或其它高频重构方法的编码器。
技术介绍
可以将音源编码技术分为两种自然音编码和语音编码。自然音编码通常以中等位速率用于音乐信号或任意信号,通常提供宽音频带宽。语音编码器基本限制在语音重现,但是从另一方面来说,即使具有低音频带宽,但可以以非常低的位速率使用它。在这两种技术中,通常将信号分离为两个主要信号分量“频谱包络”信号和相应的“剩余”信号。在以下说明中,在一般意义上,术语“频谱包络”指信号的粗频谱分布,例如,基于线性预测的编码器内的滤波因数,或子带滤波器内的一组子带采样时频平均值。在一般意义上,术语“剩余”指细频谱分布,例如,利用上述时频平均值归一化的LPC误差信号或子带采样。“包络数据”指被量化、被编码的频谱包络,“剩余数据”指被量化、被编码的剩余。在中等位速率和高位速率情况下,剩余数据构成位流的主要部分。在非常低位速率情况下,包络数据构成大部分位流。因此,在采用低位速率时,用压缩方法表示频谱包络的确重要。为了实现良好时间分辨率,现有技术的音频编码器和大多数语言编码器均采用固定长度、相对较短的时段来产生包络数据。然而,这样就防碍对由心理声学所得知的频域屏蔽的最佳利用。为了提高利用具有陡倾斜窄滤波器频带的编码增益,并在瞬时频段时仍实现良好时间分辨率,当前的音频编码器均采用自适应窗口转换,也就是说,它们根据信号统计量转换时间段长度。显然,短时间段的最少使用量是最大编码增益的先决条件。不幸的是,需要长变迁窗口来改变时间段的长度,这样就限制了转换的适应性。频谱包络是两个变量,时间和频率,的函数。通过在时频平面的两个方向上使用冗余码,可以进行编码。通常,利用增量编码过程(DPCM)或向量量化过程(VQ),在频率方向对频谱包络进行编码。
技术实现思路
本专利技术提供了一种用于频谱包络编码的新型方法和设备。该编码方法用于满足其特定频率范围内的剩余信号被排斥在发射数据外的系统的特殊要求。例如,采用HFR(高频重构),特别是SBR(频谱带复制),或者参量编码器的系统。在一种实施过程中,通过将固定大小滤波器频带内的子带采样自适应分组为分别产生一个包络采样的频带和时间段,获得频谱包络的非均匀时间采样和非均匀频率采样。这样就允许在有限滤波器频带内瞬时选择任意时间和频率分辨率。在接近变迁时,使用较短时间段,从而使用较大频率级以使数据量保持在限制范围内。为了使时间上的非均匀采样的益处实现最大化,采用可变长度位流帧或区组(granule)。可变时间/频率分辨率方法还可以应用于基于预测的包络编码过程。不是对子带采样进行分组,而是根据系统,对可变长度时间段产生预测因数。本专利技术描述了两种用于发送所采用的时间分辨率和频率分辨率的方法。通过显式发送时间段边缘分辨率和频率分辨率,第一种方法允许进行任意选择。为了降低发送开销,使用4级区组,从而提供不同成本/适应性折衷方案。第二种方法采用典型节目内容性质,至少由时间Tnmin将各瞬间分开以进一步减少控制位的数量。编码器内、以等于正常区组长度的Tdet<=Tnmin的时间间隔运行的瞬态检测器确定可能瞬态的开始位置。对间隔内的此位置进行编码并发送到解码器。编码器和解码器共同遵守规定频谱包络采样的时间/频率分布给出连续控制信号的特定组合、确保对包络数据进行无歧义解码的规则。本专利技术提供了一种用于进行比例因数冗余编码的新型有效方法。时域内的狄拉克脉冲转换为频域内的常数,并且频域内的狄拉克,即单个正弦波对应于频域内具有固定振幅的信号。具体地说,在短时间内,信号在一种域内比在另一种域内显式较小的变化。因此,利用预测编码过程或增量编码过程,如果根据信号特性在时间方向或频率方向对频谱包络进行编码,则可以提高编码效率。附图说明现在,将参考附图,利用不限制本专利技术实质或范围的说明性实例对本专利技术进行说明,附图包括图1a至图1b示出频谱包络均匀时间采样和相应非均匀时间采样;图2a至图2b定义、说明4级区组的用途;图3a至图3b示出区组的两个例子以及相应的控制信号;图4a至图4c示出位置发送系统;图5示出时间/频率转换增量编码;图6示出根据本专利技术采用包络编码过程的编码器的方框图;图7示出根据本专利技术采用包络编码保持的解码器的方框图。优选实施例的说明以下说明的优选实施例仅用于说明进行有效包络编码的本专利技术原理。显然,本
内的其它熟练技术人员可以对其设置和细节进行调整和变换。因此,只有之后的本专利技术权利要求来限定本专利技术的实质范围,而在此对各实施例所做的说明和解释中的特定细节对本专利技术实质范围没有限制意义。包络数据的产生过程大多数音频编码器和语言编码器在解码器进行合成期间,共同发送并合并包络数据和剩余数据。两个例外是采用PNS[“ImprovingAudio Codecs by Noise Substitution”,D.Schultz,JAES,vol.44,no.7/8,1996]的编码器和采用SBR的编码器。对于SBR,关于高频带,只有频谱粗结构需要被发送,因为剩余信号是由低频带重构的。因此非常需要知道如何产生包络数据,特别是因为在初始剩余信号内没有“时间”信息。现在将利用实例说明此问题。图1示出持续和弦与主要为高频内容的尖锐瞬态组合在一起的音乐信号的时间/频率图。在低频带,和弦功率高,瞬态功率低,而在高频带则恰好相反。利用高间歇瞬态功率对在出现瞬态的时间间隔期间产生的包络数据进行控制。在解码器进行SBR处理时,使用与对初始高频带进行分析所使用的相同瞬时时间分辨率/频率分辨率,估计转置信号的频谱包络。然后,根据各频谱包络内的不同之处,对转置信号进行均衡处理。例如,利用初始信号与转置信号平均功率的商数的平方根计算包络调节滤波器频带内的放大系数。对于这种信号,产生的问题是转置信号与低频带具有相同“和弦-瞬态”功率比。对于含有瞬态能量的包络数据的整个时长,为了将转置瞬态调节到正确电平所需的增益会相对于初始高频带电平放大转置和弦。如图1a所示,会将这些瞬间太高和弦片段感觉为瞬态的超前回声和滞后回声。以下将这种失真称为“增益诱导超前回声和滞后回声”。通过以这样的高速率,即保证更新与任意位置瞬态之间的时间短到足以不被人耳所分辨,持续更新包络数据,就可以消除这种现象。然而,这种方法显著提高待发送的数据量,因此不可行。因此提出了一种新型包络数据产生方法。该方法是在音频频段期间保持低更新速率,音频频段构成典型节目内容的主要部分,利用瞬态检测器确定瞬态位置,对靠近脉冲前沿的包络数据进行更新,参考图1b。这样就消除了增益诱导超前回声。为了很好地表示瞬态衰变,在瞬态开始后的时间间隔内瞬间提高更新速率。这样就可以消除增益诱导滞后回声。衰变期间进行时间分段不象发现瞬态开始那么重要,如下所述。为了补偿小时间步长,在瞬态期间使用大频率级,从而使数据量保持在限制范围内。上述在时间上和频率上的非均匀采样可以应用于基于滤波器组和线性预测的包络编码过程。可以对瞬态时段和准稳(音频)时段采用不同预测顺序。对于基于预测的编码器,已知现有技术中没有实现时间/频率分辨率转换的方本文档来自技高网
...

【技术保护点】
一种在信源编码系统中进行频谱包络编码的方法,其中所述系统包括:编码器,表示在存储或传输之前执行的所有操作;以及解码器,表示在存储或传输之后执行的所有操作,并且其中对应于特定频率范围的剩余信号被排除在发送数据或存储数据之外,并在所述解码器内合成一个新剩余信号,其特征在于: 所述编码器对输入信号进行统计分析; 根据所述分析的结果,选择用于频谱包络表示的栅格; 利用所述栅格,产生表示所述频谱包络的数据; 将所述数据与描述所述栅格的控制信号一起发送;以及 所述解码器将所述控制信号和所述数据用于分析输出信号。

【技术特征摘要】
SE 1999-10-1 9903552-9;WO 2000-1-26 PCT/SE00/001581.一种在信源编码系统中进行频谱包络编码的方法,其中所述系统包括编码器,表示在存储或传输之前执行的所有操作;以及解码器,表示在存储或传输之后执行的所有操作,并且其中对应于特定频率范围的剩余信号被排除在发送数据或存储数据之外,并在所述解码器内合成一个新剩余信号,其特征在于所述编码器对输入信号进行统计分析;根据所述分析的结果,选择用于频谱包络表示的栅格;利用所述栅格,产生表示所述频谱包络的数据;将所述数据与描述所述栅格的控制信号一起发送;以及所述解码器将所述控制信号和所述数据用于分析输出信号。2.根据权利要求1所述的方法,其特征在于,通过将单元分组为所述输入信号的时间/频率表示,可以获得所述瞬时时间分辨率和频率分辨率,并对每个所述组计算比例因数。3.根据权利要求2所述的方法,其特征在于,利用滤波器组产生所述时间/频率表示。4.根据权利要求3所述的方法,其特征在于,所述滤波器组具有固定大小。5.根据权利要求1所述的方法,其特征在于,利用线性预测器产生所述数据。6.根据权利要求1所述的方法,其特征在于,所述分析过程采用瞬态检测器。7.根据权利要求6所述的方法,其特征在于,在瞬态开始时,将所述瞬时分辨率从高频率分辨率与低时间分辨率的默认组合转换为低频率分辨率与高时间分辨率的组合。8.根据权利要求1所述的方法,其特征在于,所述控制信号描述位于固定更新速率区组内的、通过进行所述分析产生的位置,并且根据当前区组和相邻区组内的位置,利用对所述编码器和所述解码器均有效的规则,选择所述瞬时分辨率。9.根据权...

【专利技术属性】
技术研发人员:拉尔斯G李杰德克里斯托弗科林伯埃斯特兰德弗里德里克亨恩
申请(专利权)人:编码技术股份公司
类型:发明
国别省市:SE[瑞典]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1