用于使用次频带时间平滑技术产生频率增强信号的装置及方法制造方法及图纸

技术编号:12742749 阅读:91 留言:0更新日期:2016-01-21 04:47
本发明专利技术提供一种用于产生频率增强信号的装置,其包含:信号产生器,其用于从核心信号产生增强信号,该增强信号包含不包括在该核心信号中的增强频率范围,其中该增强信号或该核心信号的当前时间部分包含用于多个次频带的次频带信号;控制器,其用于针对该增强频率范围或该核心信号的该多个次频带信号计算相同平滑信息,且其中该信号产生器配置为用于使用该相同平滑信息使该增强频率范围或该核心信号的该多个次频带信号平滑。

【技术实现步骤摘要】
【国外来华专利技术】用于使用次频带时间平滑技术产生频率增强信号的装置及方法
本专利技术基于音频编码,且详言的,基于诸如带宽扩展、频谱带复制或智能间隙填充的频率增强程序。本专利技术尤其关于非导引式频率增强(non-guidedfrequencyenhancement)程序,即,其中译码器侧在不具有边信息或仅具有最少量边信息的情况下操作。
技术介绍
感知性音频编码译码器常常仅量化及编码音频信号的整个可感知频率范围的低通部分,尤其在以(相对)低比特率操作时。尽管此方法保证了经编码低频信号的可接受质量,但大多数接听者感知到作为质量降低的高通部分的遗漏。为了克服此问题,可通过带宽扩展方案来合成遗漏的高频部分。目前最先进的编码译码器常常使用波形保持编码器(诸如,AAC)或参数编码器(诸如,语音编码器)以编码低频信号。这些编码器操作直至某一终止频率。此频率被称作交叉频率。低于该交叉频率的频率部分被称作低频带。借助于带宽扩展方案合成的高于交叉频率的信号被称作高频带。带宽扩展通常借助于所传输信号(低频带)及额外边信息来合成遗漏的带宽(高频带)。若应用于低比特率音频编码的领域中,则额外信息应尽可能少地消耗额外比特率。因此,通常为额外信息选择参数表示。以相对低的比特率自编码器传输该参数表示(导引式带宽扩展),或者在译码器处基于特定信号特性估计此参数表示(非导引式带宽扩展)。在后一状况下,这些参数完全不消耗比特率。高频带的合成通常由以下两个部分组成:高频内容的产生。可通过将(部分)低频内容向上复制或翻转至高频带抑或将白色或成形噪声或其他人工信号部分插入至高频带中来进行此产生。根据参数信息对所产生的高频内容的调整。此调整包括根据参数表示对形状、调性/噪度及能量的操纵。合成程序的目标通常为实现在感知上接近原始信号的信号。若此目标无法达到,则经合成部分应最小程度地扰乱接听者。不同于导引式BWE方案,非导引式带宽扩展不能依赖于额外信息来合成高频带。实情为,非导引式带宽扩展通常使用经验规则以利用低频带与高频带的间的相关性。大多数音乐段及有声语音片段展现高频带与低频带的间的高度相关性,而对于无声或摩擦语音片段通常并非如此状况。摩擦音在较低频率范围中具有极少能量,而在高于某一频率的范围中具有高能量。若此频率接近交叉频率,则产生高于交叉频率的人工信号会成为问题,这是因为在该状况下,低频带含有很少的相关信号部分。为了解决此问题,对此类声音的良好侦测是有帮助的。HE-AAC为熟知的编码译码器,其由用于低频带的波形保持编码译码器(AAC)及用于高频带的参数编码译码器(SBR)组成。在译码器侧,通过使用QMF滤波器组将译码的AAC信号变换至频域中来产生高频带信号。随后,将低频带信号的次频带复制至高频带(产生高频内容)。接着基于所传输的参数边信息调整此高频带信号的频谱包络、调性及噪声底限(调整所产生的高频内容)。由于此方法使用导引式BWE方法,因此高频带与低频带的间的弱相关性大体上不构成问题,且可通过传输适当参数集来克服。然而,此传输需要额外比特率,此情形对于给定应用情形可能为不可接受的。ITU标准G.722.2为仅在时域中操作(即,不在频域中执行任何计算)的语音编码译码器。此译码器以12.8kHz的采样率输出时域信号,该采样率随后被上采样至16kHz。高频内容(6.4至7.0kHz)的产生是基于插入带通噪声。在大多数操作模式下,在不使用任何边信息的情况下进行噪声的频谱成形,仅在具有最高比特率的操作模式下,才在比特流中传输关于噪声能量的信息。出于简单性原因且由于并非所有应用情形皆可负担得起额外参数集的传输,在下文中仅描述不使用任何边信息的高频带信号的产生。为了产生高频带信号,按比例调整噪声信号以具有与核心激励信号相同的能量。为了将更多能量给予信号的无声部分,计算频谱倾斜量e:其中s为具有400Hz的截止频率的经高通滤波的译码的的核心信号。n为样本索引。在较少能量存在于高频处的有声片段的状况下,e逼近1,而对于无声片段,e接近零。为了在高频带信号中具有更多能量,对于无声语音,将噪声的能量乘以(1-e)。最终,通过滤波器对经按比例调整的噪声信号进行滤波,该滤波器是通过在线频谱频率(LSF)域中差值而从核心线性预测编码(LPC)滤波器导出的。完全在时域中操作的来自G.722.2的非导引式带宽扩展具有以下缺点:1.所产生的HF内容是基于噪声。此情形在HF信号与音调、谐波低频信号(例如,音乐)组合的情况下产生听得见的伪声。为了避免此等伪声,G.722.2竭力限制所产生的HF信号的能量,此也限制带宽扩展的潜在益处。因此,不幸地是,也限制了声音的亮度的最大可能改良或语音信号的可解度的最大可获得的增加。2.由于该非导引式带宽扩展在时域中操作,因此滤波器操作引起额外算法延迟。此额外延迟降低在双向通讯情形中的用户体验的质量,或给定通信技术标准的要求条款可能不允许此额外延迟。3.又,由于在时域中执行信号处理,因此滤波器操作倾向于具有不稳定性。此外,时域滤波器具有高计算复杂度。4.由于仅将高频带信号的能量的总和调适至核心信号的能量(且进一步通过频谱倾斜量加权),因此在核心信号(恰好低于交叉频率的信号)的较高频率范围与高频带信号之间的交叉频率处可存在显著的局部能量失配。例如,对于在极低频率范围中展现能量集中但在较高频率范围中含有很少能量的音调信号,将尤其为如此状况。5.此外,估计在时域表示中的频谱斜率为计算上复杂的。在频域中,可极有效率地进行频谱斜率的外插。由于(例如)摩擦音的大多数能量集中于高频范围中,因此若应用如G.722.2中的守恒能量及频谱斜率估计策略(参见1.),则此等摩擦音可听起来沉闷。为了进行概述,先前技术非导引式或盲带宽扩展方案可要求译码器侧上的显著计算复杂度,然而尤其对于诸如摩擦音的有问题语音,仍导致有限的音频质量。此外,尽管导引式带宽扩展方案提供较好音频质量且有时需要译码器侧上的较低计算复杂度,但归因于关于高频带的额外参数信息可需要关于经编码核心音频信号的大量的额外比特率的事实,导引式带宽扩展方案不可提供实质的比特率减少。
技术实现思路
因此,本专利技术的目标为提供用于在非导引式频率增强技术的背景中的音频处理的改良概念。此目标通过以下各者达成:如权利要求1的用于产生频率增强信号的装置、如权利要求11的用于产生频率增强信号的方法、如权利要求12的包含编码器及用于产生频率增强信号的装置的系统、如权利要求13的相关方法,或如权利要求14的计算机程序。本专利技术提供频率增强方案,诸如用于音频编码译码器的带宽扩展方案。此方案旨在扩展音频编码译码器的带宽,此扩展不需要额外边信息或仅需要与如在导引式带宽扩展方案中的遗漏频带的全参数描述相比显著减少的最少量边信息。一种用于产生频率增强信号的装置包含:一计算器,其用于计算描述核心信号中的关于频率的能量分布值。用于产生包含不包括于核心信号中的增强频率范围的增强信号的信号产生器使用核心信号来操作,且接着执行增强信号或核心信号的成形,使得增强信号的频谱包络取决于描述能量分布的值。因此,基于描述能量分布的所述值使增强信号的包络或增强信号成形。可易于计算所述值,且所述值接着界定增强信号的完整包络形状或完整形状。因此,译码器可以低复杂度操作,且同时获得良好音频质本文档来自技高网
...

【技术保护点】
一种用于产生频率增强信号(130)的装置,包括:信号产生器(200),用于从核心信号(120,110)产生增强信号,所述增强信号包含不包括在所述核心信号中的增强频率范围,其中所述增强信号或所述核心信号的当前时间部分(320,340)包含用于多个次频带的次频带信号;控制器(800),用于针对所述增强频率范围或所述核心信号的所述多个次频带信号计算相同平滑信息(802),且其中所述信号产生器(200)配置为用于使用所述相同平滑信息(802)使所述增强频率范围或所述核心信号的所述多个次频带信号平滑。

【技术特征摘要】
【国外来华专利技术】2013.01.29 US 61/758,0901.一种用于产生频率增强信号(130)的装置,包括:信号产生器(200),用于从核心信号(120,110)产生频率增强信号(130),所述频率增强信号(130)包含不包括在所述核心信号中的增强频率范围,其中所述频率增强信号(130)或所述核心信号的当前时间部分(320,340)包含用于多个次频带的多个次频带信号;控制器(800),用于针对所述增强频率范围或所述核心信号的所述多个次频带信号计算相同平滑信息(802),且其中所述信号产生器(200)配置为用于使用所述相同平滑信息(802)使所述增强频率范围或所述核心信号的所述多个次频带信号平滑,其中其中,所述控制器(800)配置为使用所述核心信号及所述频率增强信号(130)的所述多个次频带信号的组合能量或仅使用所述当前时间部分的所述频率增强信号(130)来计算所述相同平滑信息(802),且其中,所述控制器(800)配置为使用所述核心信号及所述频率增强信号(130)的所述多个次频带信号的平均能量或仅使用在所述当前时间部分之前的一个或多个较早时间部分或在所述当前时间部分之后的一个或多个稍后时间部分的所述核心信号的平均能量来计算所述相同平滑信息。2.根据权利要求1所述的装置,其中所述相同平滑信息(802)为用于所述增强频率范围的所述多个次频带信号的单一校正因子(1402b,1401b,1400b),且其中所述信号产生器(200)配置为将所述单一校正因子应用于所述增强频率范围的所述多个次频带信号。3.根据权利要求1所述的装置,进一步包含用于提供用于多个时间后续滤波器组时隙的所述核心信号的所述多个次频带信号的滤波器组或提供器(100),其中所述信号产生器(200)配置为使用所述核心信号(120)的所述多个次频带信号导出用于所述多个时间后续滤波器组时隙(340)的所述增强频率范围的所述多个次频带信号,且其中所述控制器(800)配置为针对每一滤波器组时隙(340)计算单个平滑信息。4.根据权利要求1所述的装置,其中所述控制器(800)配置为基于所述当前时间部分及一个或多个先前时间部分的所述核心信号或所述频率增强信号(130)来计算平滑强度控制值(1040),且其中所述控制器(800)配置为以使得所述平滑强度取决于以下两者之间的差值而变化的方式使用所述平滑强度控制值(1040)来计算所述相同平滑信息(802):当前时间部分中的所述核心信号或所述频率增强信号的能量,及一个或多个先前时间部分的所述核心信号或所述频率增强信号(130)中的平均能量。5.根据权利要求1所述的装置,其中所述控制器(800)配置为基于以下方程序来计算所述相同平滑信息(802):其中Ecurrt为所述当前时间部分中的能量,其中Eavgt为一个或多个先前或稍后时间部分的平均能量,且其中a为控制所述平滑强度的参数,且其中所述信号产生器配置为对所述频率增强信号(130)的所述多个次...

【专利技术属性】
技术研发人员:萨沙·迪施拉尔夫·盖尔克里斯蒂安·赫尔姆里希马库斯·穆赖特鲁斯康斯坦丁·施密特
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1