噪声填充技术制造技术

技术编号:12576411 阅读:101 留言:0更新日期:2015-12-23 16:28
藉由以相依于一音频信号的一音调的一方式来执行该音频信号的一频谱的噪声填充,关于该噪声填充式频谱而在质量上改良该噪声填充,使得该噪声填充式音频信号的重现较不烦人。

【技术实现步骤摘要】
【国外来华专利技术】噪声填充技术
本申请涉及音频编码(audiocoding),且尤其涉及结合音频编码的噪声填充。
技术介绍
在转换编码中,常常认识到(对照[1]、[2]、[3]),将频谱的部分量化至零会导致感知降级。量化至零的该部分被称作频谱洞(spectrumhole)。[1]、[2]、[3]及[4]中呈现的针对此问题的解决方案是用噪声来替换零量化谱线。有时,在低于某一频率的情况下避免噪声的插入。用于噪声填充的开始频率是固定的,但在已知先前技术之间是不同的。有时,使用频域噪声整形(FrequencyDomainNoiseShaping,FDNS)以用于整形频谱(包括插入的噪声)且用于控制量化噪声,如在USAC中(对照[4])。使用LPC滤波器的量值响应来执行FDNS。使用经预强调输入信号来计算LPC滤波器系数。在[1]中注意到,在音调分量的紧接邻域中添加噪声会导致降级,且因此,正如在[5]中,用噪声来仅填充长系列零,以避免注入的周围噪声将非零量化值隐蔽。在[3]中注意到,存在噪声填充的粒度与所需旁侧信息的大小之间的折衷的问题。在[1]、[2]、[3]及[5]中,传输每完整频谱一个噪声填充参数。如在[2]中使用LPC或如在[3]中使用比例因子,来频谱地整形插入的噪声。[3]中描述如何针对整个频谱,使比例因子适应于具有一个噪声填充水平的噪声填充。在[3]中,修改用于完全地量化至零的频带的比例因子,以避免频谱洞且具有正确噪声水平。即使[1]及[5]中的解决方案因其建议不填充小频谱洞,而避免音调分量的降级,仍需要进一步改良使用噪声填充而编码的音频信号的质量,尤其是在极低比特率下。
技术实现思路
本专利技术的目标在于提供一种用于具有改良特性的噪声填充的概念。此目标藉由同此附入的独立权利要求的主题而达成,其中本申请的有利方面为从属权利要求的主题。本申请的一基本发现为:藉由以相依于一音频信号的一音调的一方式来执行该音频信号的一频谱的噪声填充,可关于该噪声填充式频谱而在质量上改良该噪声填充,使得该噪声填充式音频信号的重现较不烦人。根据本申请的一实施例,藉由使用一函数而频谱上整形的噪声来填充该音频信号的频谱的一相连频谱零部分,该函数在该相连频谱零部分的一内部中采取一最大值,且具有向外下降边缘,该向外下降边缘的一绝对斜率负相依于该音调,亦即,该斜率随着音调递增而递减。另外或替代地,用于填充的该函数在该相连频谱零部分的一内部中采取一最大值,且具有向外下降边缘,该向外下降边缘的一频谱宽度正相依于该音调,亦即,该频谱宽度随着音调递增而递增。更进一步,另外或替代地,可将一常数或单峰函数用于填充,该常数或单峰函数对该相连频谱零部分的外部四等份(outerquarter)的一积分——标准化为1的一积分——负相依于该音调,亦即,该积分随着音调递增而递减。藉由所有措施,噪声填充倾向于对于该音频信号的音调部分较不有害,然而,在频谱洞的缩减方面,对于该音频信号的非音调部分仍然有效。换言之,无论何时该音频信号具有一音调内容,填充至该音频信号的频谱中的该噪声皆离开通过保持与其相隔足够距离而未受到影响的该频谱的音调峰,然而,其中仍然藉由该噪声填充来满足具有作为非音调的音频内容的该音频信号的时间相位的非音调特性。根据本申请的一实施例,识别该音频信号的频谱的相连频谱零部分,且用藉由函数而频谱上整形的噪声来填充所识别的零部分,使得对于每一相连频谱零部分,相依于一相应的相连频谱零部分的宽度及该音频信号的一音调来设定相应的函数。出于实施简易起见,可藉由在函数的一查找表中的一查找来达成该相依性,或可相依于该相连频谱零部分的宽度及该音频信号的该音调而使用一数学公式来以分析方式计算函数。在任何状况下,相比于由该相依性引起的优势,用于实现该相依性的努力相对微小。具体地,该相依性可使得:相依于该相连频谱零部分的宽度来设定该各自函数,使得该函数限于该各自相连频谱零部分;及相依于该音频信号的该音调来设定该各自函数,使得对于该音频信号的一较高音调,一函数的群体(mass)在该各自相连频谱零部分的该内部中变得更紧凑,且远离于该各自相连频谱零部分的边缘。根据一另外实施例,通常使用一频谱上全局噪声填充水平来按比例调整经频谱上整形且填充至相连频谱零部分中的该噪声。具体地,按比例调整该噪声,使得在相连频谱零部分中对该噪声的一积分或对相连频谱零部分的函数的一积分相当于(例如,等于)一全局噪声填充水平。有利地,无论如何皆在现有音频编码译码器内编码一全局噪声填充水平,使得不必针对这种音频编码译码器提供额外语法。亦即,可以以少量努力明确地在该音频信号被编码至的数据流中传信该全局噪声填充水平。实际上,可按比例调整供频谱上整形该相连频谱零部分的噪声所使用的函数,使得对填充所有相连频谱零部分所使用的该噪声的一积分对应于该全局噪声填充水平。根据本申请的一实施例,该音调自一编码参数导出,该音频信号使用该编码参数予以编码。藉由此措施,无需在一现有音频编码译码器内传输额外信息。根据具体实施例,该编码参数为一长期预测(Long-TermPrediction,LTP)旗标或增益、一时间噪声整形(TemporalNoiseShaping,TNS)启用旗标或增益,及/或一频谱重新配置启用旗标(spectrumrearrangementenablementflag)。根据一另外实施例,该噪声填充的执行限于一高频频谱部分上,其中对应于一数据流中的一明确传信来设定该高频频谱部分的一低频开始位置,且将该音频信号编码至该数据流。藉由此措施,执行该噪声填充的该高频频谱部分的下限的一信号自适应性设定是可行的。藉由此措施,又可增加由该噪声填充引起的该音频质量。又由该明确传信造成的所必要的额外旁侧信息比较小。根据本申请的一另外实施例,装置被配置为使用一频谱低通滤波器来执行该噪声填充,以便抵消由用以编码该音频信号的频谱的一预强调造成的一频谱倾斜。藉由此措施,更进一步增加该噪声填充质量,这是因为进一步缩减剩余频谱洞的深度。更一般而言,除了在频谱洞内相依于音调频谱上整形该噪声以外,亦可藉由运用一频谱上全局倾斜而非以一频谱上平坦方式来执行感知转换音频编码译码器中的噪声填充而改良该噪声填充。举例来说,该频谱上全局倾斜可具有一负斜率,亦即,展现自低频至高频的一递减,以便至少部分地反转由使噪声填充式频谱经受频谱感知加权函数造成的频谱倾斜。一正斜率亦可为可想象的,例如,在该经编码频谱展现一类似高通特性的状况下。具体地,频谱感知加权函数通常倾向于展现自低频至高频率的一递增。因此,以一频谱上平坦方式填充至感知转换音频编码器的频谱中的噪声将在经最终重新建构的频谱中以一倾斜噪声底限而终结。然而,本申请的专利技术者已认识到,最终重新建构的频谱中的该倾斜负面地影响音频质量,这是因为其导致在该频谱的噪声填充式部分中保留有频谱洞。因此,运用一频谱上全局倾斜来插入该噪声以使得噪声水平自低频至高频递减,会使用该频谱感知加权函数来至少部分地补偿由该噪声填充式频谱的后续整形造成的此频谱倾斜,藉此改良该音频质量。相依于情况,一正斜率可较佳,例如,在某些类似高通频谱上。根据一实施例,该频谱上全局倾斜的该斜率响应于该频谱被编码至的数据流中的一传信而变化。该传信可(例如)明确地传信陡度,且本文档来自技高网
...

【技术保护点】
一种装置,被配置为以相依于一音频信号的一音调的方式来对所述音频信号的一频谱(34)执行噪声填充。

【技术特征摘要】
【国外来华专利技术】2013.01.29 US 61/758,2091.一种被配置为以相依于一音频信号的一音调的方式来对所述音频信号的一频谱(34)执行噪声填充的装置,其中,所述装置被配置为使用经由一线性预测频谱包络而控制的一频谱上变化且信号自适应的量化步长或关于比例因子频带(110)的比例因子(112),来使在所述噪声填充之后得到的所述频谱(34)去量化(132;174),在所述频谱(34)被编码至的一数据流中传信所述比例因子,所述线性预测频谱包络经由所述频谱(34)被编码(164)至的所述数据流中的线性预测系数(162)来传信,其中,所述装置被配置为使用藉由以下函数而频谱上整形的噪声来填充所述音频信号的频谱(34)的一相连频谱零部分(40):一函数(48,50),该函数在所述相连频谱零部分(40)的一内部(52)中取一最大值,且具有向外下降边缘(58,60),所述向外下降边缘的一频谱宽度(54,56)正相依于所述音调。2.根据权利要求1所述的装置,其中,所述装置被配置为使用一标量全局噪声水平来按比例调整填充所述相连频谱零部分所用的所述噪声,所述标量全局噪声水平在以频谱上全局方式将所述频谱编码至的数据流中传信。3.根据权利要求1所述的装置,其中,所述装置被配置为使用一随机或伪随机程序,来产生填充所述相连频谱零部分所用的所述噪声。4.根据权利要求1所述的装置,其中,所述装置被配置为自编码在所述数据流中的一编码参数导出所述音调。5.根据权利要求4所述的装置,其中,所述装置被配置为使得所述编码参数为一长期预测(LTP)或时间噪声整形(TNS)启用旗标或增益,及/或一频谱重新配置启用旗标,所述频谱重新配置启用旗标传信一编码选项,根据所述编码选项,频谱上重新配置量化频谱值,其中另外在所述数据流内传输重新配置规定。6.根据权利要求1所述的装置,其中,所述装置被配置为将所述噪声填充的执行限于所述音频信号的频谱的一高频频谱部分上。7.根据权利要求6所述的装置,其中,所述装置被配置为根据所述数据流中的一明确传信,设定所述高频频谱部分的一低频开始位置。8.根据权利要求1所述的装置,其中,所述装置被配置为在执行所述噪声填充时,用一水平表现为自低频至高频的一递减的噪声来填充所述频谱(34)的相连频谱零部分(40),从而抵消由用以编码所述音频信号的频谱的一预强调造成的一频谱倾斜。9.根据权利要求8所述的装置,其中,所述装置被配置为使所述递减的一陡度适应于所述预强调的一预强调因子。10.一种支持噪声填充的音频译码器,包含一根据前述权利要求中任一项的装置。11.一种感知转换音频译码器,包含:一根据权利要求1至9中任一项的被配置为对一音频信号的一频谱(34)执行噪声填充的装置;以及一频域噪声整形器,被配置为使用一频谱感知加权函数来使噪声填充式频谱经受频谱整形。12.一种支持噪声填充的音频编码器,包含根据权利要求1-9中任一项所述的装置,所述编码器被配置为使用由所述装置填充有噪声的频谱执行合成式分析。13.一种支持噪声填充的音频编码器,被配置为使一音频信号的一频谱量化且将所述频谱编码至一数据流中,以及以相依于所述音频信号的一音调的方式,来设定用于对所述音频信号的所述频谱执行噪声填充的一频谱上全局噪声填充水平且将所述频谱上全局噪声填充水平编码...

【专利技术属性】
技术研发人员:萨沙·迪施马克·伽依尔克里斯蒂安·赫尔姆里希戈兰·马尔科维奇玛丽亚·路易斯瓦莱罗
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1