用于使用独立噪声填充生成增强信号的装置和方法制造方法及图纸

技术编号:15530021 阅读:208 留言:0更新日期:2017-06-04 17:14
用于从输入信号(600)生成增强信号的装置,其中增强信号具有用于增强谱区域的谱值,用于增强谱区域的谱值不包含在输入信号(600)中,该装置包括映射器(602),用于映射输入信号的源谱区域至增强谱区域中的目标区域,源谱区域包括噪声填充区域(302);以及噪声填充器(604),用于生成用于输入信号的源谱区域中的噪声填充区域(302)的第一噪声值,并用于生成用于目标区域中的噪声区域的第二噪声值,其中第二噪声值与第一噪声值解相关,或用于生成用于目标区域中的噪声区域的第二噪声值,其中第二噪声值与在源区域中的第一噪声值解相关。

Apparatus and method for generating enhanced signals using independent noise

For the input signal from the signal generating device (600) which is used for enhancing signal enhancement, enhanced spectral spectrum region, to enhance regional spectrum spectrum values are not included in the input signal (600), the device includes a mapping device (602), is used to map the input signal source area to the target area enhanced spectral spectrum in the region, including the noise source spectrum region filling region (302); and the noise filler (604), used to generate the input signal for the source region of the spectrum and noise fill region (302) of the first noise value, and used to generate noise for second areas in the region of the target value, of which second noise the solution value associated with the first noise value, or used to generate noise for second regions in the target region of the value, of which second noise solutions associated with the first noise in the source value in the region.

【技术实现步骤摘要】
【国外来华专利技术】用于使用独立噪声填充生成增强信号的装置和方法
本专利技术涉及信号处理,尤其涉及音频信号处理。
技术介绍
以用于音频信号的高效存储或传输的数据缩减为目的的音频信号的感知编码被广泛地实践使用。特别是在要实现最低比特率时,所应用的编码导致音频质量的下降,其经常主要是由待传输的音频信号带宽的编码器侧的限制引起。在现代的编解码器中,存在已知方法用于通过诸如谱带复制(SBR)的音频信号带宽扩展(BWE)的解码器侧信号恢复。在低比特率编码中,也经常应用所谓的噪声填充。在解码器中,由于严格的比特率限制而已被量化为零的突出的谱区域以合成噪声而被填充。通常,在低比特率编码应用中结合两种技术。此外,存在结合音频编码、噪声填充和谱间隙填充的集成解决方案,例如智能间隙填充(IGF)。然而,所有的这些方法具有如下共同之处:在第一步骤中,使用波形解码和噪声填充重构基带或核心音频信号,以及在第二步骤中,使用快速重构的信号执行BWE或IGF处理。这导致如此事实:在重构期间通过噪声填充已被填充到基带中的相同噪声值被用于再生高频带中的缺失部分(在BWE中)或用于填充剩余的谱间隙(在IGF中)。在BWE或IGF中,使用高度相关的噪声用以重构多个谱区域可能导致感知损伤。现有技术中相关主题包括:·SBR作为至波形解码的后置处理器[1-3]·ACCPNS[4]·MPEG-DUSAC噪声填充[5]·G.719以及G.722.1C[6]·MPEG-H3DIGF[8]下面的论文和专利申请描述被视为与本申请相关的方法:[1]M.Dietz,L.Liljeryd,K.andO.Kunz,“SpectralBandReplication,anovelapproachinaudiocoding,”in112thAESConvention,Munich,Germany,2002.[2]S.Meltzer,R.andF.Henn,“SBRenhancedaudiocodecsfordigitalbroadcastingsuchas“DigitalRadioMondiale”(DRM),”in112thAESConvention,Munich,Germany,2002.[3]T.Ziegler,A.Ehret,P.EkstrandandM.Lutzky,“Enhancingmp3withSBR:FeaturesandCapabilitiesofthenewmp3PROAlgorithm,”in112thAESConvention,Munich,Germany,2002.[4]J.Herre,D.Schulz,ExtendingtheMPEG-4AACCodecbyPerceptualNoiseSubstitution,AudioEngineeringSociety104thConvention,Preprint4720,Amsterdam,Netherlands,1998[5]EuropeanPatentapplicationEP2304720USACnoise-filling[6]ITU-TRecommendationsG.719andG.221C[7]EP2704142[8]EP13177350以这些方法处理的音频信号遭受人为现象(artifact)如粗糙、调制失真以及被视为使人不愉快的音色,特别是在低比特率处及由此的低带宽处,和/或在LF范围内的谱孔(spectralhole)的发生。如下面所解释,对此的原因主要是这样的事实:扩展的或间隙填充的谱的重构分量基于来自基带的包含噪声的一个或多个直接副本。由重构噪声中的所述不需要的相关性引起的时间调制以感知粗糙或令人反感的失真的干扰方式是可听的。所有现有方法如mp3+SBR、AAC+SBR、USAC、G.719和G.722.1C,以及MPEG-H3DIGF在以来自核心的复制或镜象的谱数据填充谱间隙或高频带之前首先进行包括噪声填充的完整核心解码。
技术实现思路
本专利技术的目的是提供生成增强信号的改进的概念。通过权利要求1所述的用于生成增强信号的装置、权利要求11所述的用于生成增强信号的方法、权利要求13所述的编码和解码系统、权利要求14所述的编码和解码方法或权利要求15所述的计算机程序实现此目的。本专利技术基于如下发现:通过生成用于输入信号的源谱区域中的噪声填充区域的第一噪音值并随后生成用于目的或目标区域(即,在此刻具有噪声值即与第一噪声值相独立的第二噪声值的增强区域中)中的噪声区域的第二独立噪声值,获得通过带宽扩展或智能间隙填充或生成具有用于未包含在输入信号中的增强谱区域的谱值的增强信号的任意其他方法生成的增强信号的音频质量的显著提升。因此,消除归因于谱值映射的在基带和增强带中具有相依噪声的在先技术问题,并消除关于如粗糙、调制失真以及被视为使人不愉快的音色(特别是在低比特率处)的人为现象的相关问题。换言之,与第一噪声值解相关的第二噪声值(即与第一噪声值至少部分地相独立的噪声值)的噪声填充确保不再出现人为现象或相对于在先技术至少减少人为现象。因此,通过简单带宽扩展或智能间隙填充操作的将谱值噪声填充到基带中的在先技术处理并不能将噪声与基带解相关,而(例如)仅改变水平(level)。然而,一方面在源带中以及另一方面在目标带中引入解相关的噪声值(优选地,得自分离噪声处理),提供最好结果。然而,即使是未完全解相关或未完全相独立的而是在零的解相关值表示完全解相关时如以0.5或更小的解相关值至少部分地解相关的噪声值的引入也改善了在先技术的完全相关性问题。因此,实施例涉及在感知解码器中的波形解码、带宽扩展或间隙填充以及噪声填充的结合。进一步的优点是,对比已存在的概念,避免了信号失真和感知粗糙的人为现象(对于在波形解码和噪声填充之后计算带宽扩展或间隙填充,其通常是典型的)的出现。在一些实施例中,此归因于所提及的处理步骤的顺序的改变。优选地,在波形解码后直接执行带宽扩展或间隙填充,更优选地,随后使用不相关噪声对已经重构的信号计算噪声填充。在另外的实施例中,波形解码和噪声填充可以以传统顺序并在处理中的更下游执行,可以以适当缩放的不相关噪声替换噪声值。因此,通过将噪声填充步骤移位至处理链的最末端以及使用用于修补(patching)或间隙填充的不相关噪声,本专利技术解决了由于对经噪声填充的谱的复制操作或镜象操作而发生的问题。附图说明随后,关于附图讨论本专利技术的优选实施例,其中:图1a示出用于编码音频信号的装置;图1b示出与图1a的编码器匹配的用于解码经编码的音频信号的解码器;图2a示出解码器的优选实施;图2b示出编码器的优选实施;图3a示出由图1b的谱域解码器生成的谱的示意性表示;图3b示出指示用于缩放因子带的缩放因子与用于重构带的能量以及用于噪声填充带的噪声填充信息之间的关系的表;图4a示出用于应用谱部分至第一集合的谱部分和第二集合的谱部分的选择的谱域编码器的功能;图4b示出图4a的功能的实施;图5a示出MDCT编码器的功能;图5b示出利用MDCT技术的解码器的功能;图5c示出频率再生器的实施;图6示出依照本专利技术的用于生成增强信号的装置的框图;图7示出依照本专利技术的实施例的由解码器中的选择信息控制的独立噪声填充的信号流;图8示出通过解码器中的间隙填本文档来自技高网
...
用于使用独立噪声填充生成增强信号的装置和方法

【技术保护点】
一种用于从输入信号(600)生成增强信号的装置,其中所述增强信号具有用于增强谱区域的谱值,所述用于增强谱区域的谱值未包含在所述输入信号(600)中,所述装置包括:映射器(602),用于将所述输入信号的源谱区域映射至所述增强谱区域中的目标区域,所述源谱区域包括噪声填充区域(302);以及噪声填充器(604),用于生成用于所述输入信号的源谱区域中的噪声填充区域(302)的第一噪声值,并用于生成用于所述目标区域中的噪声区域的第二噪声值,其中所述第二噪声值与所述第一噪声值解相关;或用于生成用于所述目标区域中的噪声区域的第二噪声值,其中所述第二噪声值与所述源区域中的第一噪声值解相关,其中所述噪声填充器(604)用于使用仅具有用于源谱区域中的谱位置的条目或具有用于所述源谱区域中的谱位置和所述目标谱区域中的谱位置的条目的识别向量(706)识别噪声位置;其中所述噪声填充器(604)用于计算关于由所述识别向量(706)指示的噪声值的能量信息;其中所述噪声填充器(604)用于计算关于用于所述目标区域的插入的随机值的能量信息;其中所述噪声填充器用于计算用于对随机值进行缩放的增益因子;以及其中所述噪声填充器用于将所述增益因子应用至所述插入的随机值。...

【技术特征摘要】
【国外来华专利技术】2014.07.28 EP 14178777.01.一种用于从输入信号(600)生成增强信号的装置,其中所述增强信号具有用于增强谱区域的谱值,所述用于增强谱区域的谱值未包含在所述输入信号(600)中,所述装置包括:映射器(602),用于将所述输入信号的源谱区域映射至所述增强谱区域中的目标区域,所述源谱区域包括噪声填充区域(302);以及噪声填充器(604),用于生成用于所述输入信号的源谱区域中的噪声填充区域(302)的第一噪声值,并用于生成用于所述目标区域中的噪声区域的第二噪声值,其中所述第二噪声值与所述第一噪声值解相关;或用于生成用于所述目标区域中的噪声区域的第二噪声值,其中所述第二噪声值与所述源区域中的第一噪声值解相关,其中所述噪声填充器(604)用于使用仅具有用于源谱区域中的谱位置的条目或具有用于所述源谱区域中的谱位置和所述目标谱区域中的谱位置的条目的识别向量(706)识别噪声位置;其中所述噪声填充器(604)用于计算关于由所述识别向量(706)指示的噪声值的能量信息;其中所述噪声填充器(604)用于计算关于用于所述目标区域的插入的随机值的能量信息;其中所述噪声填充器用于计算用于对随机值进行缩放的增益因子;以及其中所述噪声填充器用于将所述增益因子应用至所述插入的随机值。2.根据权利要求1所述的装置,其中所述输入信号是包括用于所述输入信号的源谱区域的噪声填充参数的经编码的信号,其中所述噪声填充器用于使用所述噪声填充参数生成所述第一噪声值,并用于使用关于所述第一噪声值的能量信息生成所述第二噪声值。3.根据权利要求1或2所述的装置,其中所述噪声填充器用于使用关于源范围中的噪声的能量信息以及关于用于所述目标区域的所述随机值的能量信息计算用于对所述随机值进行缩放的增益因子。4.根据前述权利要求中的任一项所述的装置,其中所述噪声填充器(604)用于在所述映射器(602)的操作之后生成所述第二噪声值,或用于在所述映射器(602)的操作之后生成(604)所述第一噪声值和所述第二噪声值。5.根据前述权利要求中的任一项所述的装置,其中所述映射器(602)用于将所述源谱区域映射至所述目标区域,以及其中所述噪声填充器(604)用于通过使用噪声填充和在所述输入信号中作为辅助信息传输的噪声填充参数生成所述第一噪声值而在谱区域中执行噪声填充,并用于在所述目标区域中执行噪声填充,以使用关于所述第一噪声值的能量信息生成所述第二谱值。6.根据前述权利要求中的任一项所述的装置,还包括:包络调节器,用于使用作为辅助信息包含在所述输入信号中的谱包络信息调节(1202)所述增强谱区域中的第二噪声值。7.根据前述权利要求中的任一项所述的装置,其中所述噪声填充器(604)用于仅使用所述输入信号的辅助信息以识别用于噪声填充的谱位置,或其中所述噪声填充器(604)用于分析具有或不具有噪声填充区域中的谱值的所述输入信号的时间或谱特性,以识别用于噪声填充的谱位置。8.根据前述权利要求中的任一项所述的装置,其中所述映射器(602)用于执行用于生成所述目标谱区域的间隙填充操作,所述装置包括:谱域音频解码器(112),用于生成第一集合的第一谱部分的第一解码表示,解码表示具有第一谱分...

【专利技术属性】
技术研发人员:萨沙·迪施拉尔夫·盖格安德烈·尼德迈尔马蒂亚斯·诺伊辛格康斯坦丁·施密特斯蒂芬·王尔德本杰明·舒伯特克里斯蒂安·诺伊卡姆
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国,DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1