感知转换音频编码中的噪声填充制造技术

技术编号:12731800 阅读:99 留言:0更新日期:2016-01-20 15:20
通过利用频谱上全局倾斜而非以频谱上平坦方式来执行噪声填充以改良感知转换音频编码解码器中的噪声填充。

【技术实现步骤摘要】
【国外来华专利技术】
本申请是关于感知转换音频编码中的噪声填充
技术介绍
在转换编码中,常常认识到(对照[1]、[2]、[3]),将频谱的一部分量化至零会导致感知降级。量化至零的这种部分被称作频谱洞(spectrumhole)。[1]、[2]、[3]及[4]中呈现的针对此问题的解决方案是利用噪声来替换零量化谱线。有时,在低于某一频率的情况下避免噪声的插入。用于噪声填充的开始频率固定,但在已知现有技术之间不同。有时,使用频域噪声整形(FrequencyDomainNoiseShaping,FDNS)以用于整形(包括插入噪声的)频谱且用于控制量化噪声,如在USAC中(对照[4])。使用LPC滤波器的幅值响应来执行FDNS。使用经预强调输入信号来计算LPC滤波器系数。在[1]中注意到,在音调分量的紧接邻域中添加噪声会导致降级,且因此,正如在[5]中,利用噪声来填充仅长是列零以避免由经注入周围噪声隐蔽非零量化值。在[3]中注意到,存在噪声填充的粒度与所需旁侧信息的大小之间的折衷的问题。在[1]、[2]、[3]及[5]中,传输每完整频谱一个噪声填充参数。如在[2]中使用LPC或如在[3]中使用比例因子来频谱上整形经插入噪声。[3]中描述如何针对整个频谱使比例因子适应于具有一个噪声填充水平的噪声填充。在[3]中,修改用于完全地量化至零的频带的比例因子以避免频谱洞且具有正确噪声水平。即使[1]及[5]中的解决方案因其建议不填充小频谱洞而避免音调分量的降级,仍需要进一步改良使用噪声填充而编码的音频信号的质量,尤其是在极低位速率下。存在除了上文所论述的问题以外的其它问题,其是由至此所知的噪声填充概念引起,根据这些噪声填充概念,以频谱上平坦方式将噪声填充至频谱中。将有利的是具有即将到来的一种改良型噪声填充概念,其至少结合感知转换音频编码来增加由音频填充式频谱引起的可达成的音频质量。
技术实现思路
因此,本专利技术的一目标是提供一种具有改良型特性的用于感知转换音频编码中的噪声填充的概念。此目标是通过同此附入的独立权利要求的主题而达成,其中本申请的有利方面为从属权利要求的主题。本申请的一基本发现为:可通过利用一频谱上全局倾斜而非以一频谱上平坦方式来执行感知转换音频编码解码器中的噪声填充而改良该噪声填充。举例来说,该频谱上全局倾斜可具有一负斜率,亦即,展现自低频至高频的一递减,以便至少部分地反转由使噪声填充频谱经受频谱感知加权函数而造成的频谱倾斜。一正斜率亦可为可想象的,例如,在该经编码频谱展现一似高通特性的状况下。详言之,频谱感知加权函数通常倾向于展现自低频至高频的一递增。因此,以一频谱上平坦方式填充至感知转换音频编码器的频谱中的噪声将在经最终重新建构频谱中以一倾斜噪声底面而完结。然而,本申请的专利技术者已认识到,该经最终重新建构频谱中的此倾斜负面地影响音频质量,此是因为其导致频谱洞剩余于该频谱的噪声填充式部分中。因此,利用一频谱上全局倾斜来插入该噪声以使得噪声水平自低频至高频递减会使用该频谱感知加权函数来至少部分地补偿由该噪声填充式频谱的后续整形造成的此频谱倾斜,藉此改良该音频质量。取决于情况,一正斜率可能是优选的,如上文所提到。根据一实施例,该频谱上全局倾斜的该斜率是响应于该频谱被编码至的数据流中的一信令而变化。该信令可(例如)明确地信号通知陡度,且可在编码侧适应于由该频谱感知加权函数造成的频谱倾斜的量。举例来说,由该频谱感知加权函数造成的频谱倾斜的量可源于在对音频信号应用LPC分析之前该音频信号所经受的一预强调。根据一实施例,通过以依赖于一音频信号的音调的一方式来执行该音频信号的一频谱的噪声填充,关于该噪声填充式频谱而在质量上更进一步改良该噪声填充,使得该噪声填充式音频信号的重现较不烦人。根据本申请的一实施例,通过使用一函数而以频谱上整形的噪声来填充该音频信号的频谱的一相连频谱零部分,该函数在该相连频谱零部分的一内部中采取一最大值,且具有向外下降边缘,该向外下降边缘的一绝对斜率是负依赖于该调性,亦即,该斜率随着调性递增而递减。另外或替代地,用于填充的该函数在该相连频谱零部分的一内部中采取一最大值,且具有向外下降边缘,该向外下降边缘的一频谱宽度是正依赖于该调性,亦即,该频谱宽度随着调性递增而递增。更进一步,另外或替代地,可将一常数或单峰函数用于填充,该常数或单峰函数对该相连频谱零部分的外部四等份部(outerquarter)的一积分——归一化至为1的一积分——是负依赖于该调性,亦即,该积分随着调性递增而递减。通过所有这种措施,噪声填充倾向于对于该音频信号的音调部分较不有害,然而,在频谱洞的缩减方面对于该音频信号的非音调部分仍然有效。换言之,无论何时该音频信号具有一音调内容,填充至该音频信号的频谱中的该噪声皆离开未受到保持与其相隔足够距离影响的该频谱的音调峰,然而,其中仍然通过该噪声填充来满足具有作为非音调的音频内容的该音频信号的时间相位的非音调特性。根据本申请的一实施例,识别该音频信号的频谱的相连频谱零部分,且利用通过函数而频谱上整形的噪声来填充所识别的该零部分,使得对于每一相连频谱零部分,依赖于一相应相连频谱零部分的宽度及该音频信号的音调来设定该相应函数。出于实施简易起见,可通过在函数的一查找表中的一查找来达成该依赖性,或可使用依赖于该相连频谱零部分的宽度及该音频信号的该调性的一数学公式来分析地计算该函数。在任何状况下,相比于由该依赖性引起的优势,用于实现该依赖性的努力相对微小。详言之,该依赖性可使得:依赖于该相连频谱零部分的宽度来设定该相应函数,使得该函数限于该相应相连频谱零部分;及依赖于该音频信号的该调性来设定该各函数,使得对于该音频信号的一较高调性,一函数的群体(mass)在该各相连频谱零部分的该内部中变得更紧凑,且远离于该各相连频谱零部分的边缘。根据一另外实施例,通常使用一频谱上全局噪声填充水平来按比例调整经频谱上整形且填充至该相连频谱零部分中的该噪声。详言之,按比例调整该噪声,使得在该相连频谱零部分中对该噪声的一积分或对该相连频谱零部分的该函数的一积分对应于(例如,等于)一全局噪声填充水平。有利地,无论如何皆在现有音频编码解码器内编码一全局噪声填充水平,使得不必针对这种音频编码解码器提供额外语法。亦即,可以少量努力明确地在该音频信号被编码至的数据流中信令该全局噪声填充水平。实际上,可按比本文档来自技高网
...

【技术保护点】
一种感知转换音频解码器,包含:噪声填充器,被配置为通过利用展现频谱上全局倾斜的噪声来填充音频信号的频谱(34)对所述频谱执行噪声填充,以便获得噪声填充式频谱;以及频域噪声整形器,被配置为使用频谱感知加权函数来使所述噪声填充式频谱经受频谱整形。

【技术特征摘要】
【国外来华专利技术】2013.01.29 US 61/758,2091.一种感知转换音频解码器,包含:
噪声填充器,被配置为通过利用展现频谱上全局倾斜的噪声来
填充音频信号的频谱(34)对所述频谱执行噪声填充,以便获得噪
声填充式频谱;以及
频域噪声整形器,被配置为使用频谱感知加权函数来使所述噪
声填充式频谱经受频谱整形。
2.根据权利要求1所述的感知转换音频解码器,其中,所述噪声填充
器被配置为使得所述频谱上全局倾斜具有负斜率。
3.根据权利要求1或2所述的感知转换音频解码器,
其中,所述噪声填充器被配置为在执行所述噪声填充时识别所
述频谱(34)的频谱零部分(40)且将所述噪声填充限于所述频谱
(34)的所述频谱零部分(40)上。
4.根据权利要求1至3中任一项所述的感知转换音频解码器,其中,
所述频域噪声整形器被配置为:
自在所述频谱(34)被编码至的数据流中信号通知的线性预测
系数信息(162)中判定所述频谱感知加权函数(164),或
自在所述频谱(34)被编码至的所述数据串流中信号通知的关
于比例因子频带(110)的比例因子(112)中判定所述频谱感知加
权函数。
5.根据权利要求1至4中任一项所述的感知转换音频解码器,其中,
所述噪声填充器被配置为响应于所述频谱(34)被编码至的数据串
流中的隐含或明确信令而变化所述频谱上全局倾斜的陡度。
6.根据权利要求1至4中任一项所述的感知转换音频解码器,其中,
所述噪声填充器被配置为自信号通知所述频谱感知加权函数的所述
数据流的一部分或自所述数据流中的转换窗长度信令推断所述频谱
上全局倾斜的陡度。
7.根据权利要求1至6中任一项所述的感知转换音频解码器,进一步
包含:
逆转换器,被配置为逆转换由所述频域噪声整形器频谱上整形
的所述噪声填充式频谱,以获得逆转换,且使所述逆转换经受重迭
相加处理。
8.根据权利要求1至7中任一项所述的感知转换音频解码器,其中,
所述噪声填充器被配置为执行中间噪声信号与单调递增或单调递减
函数之间的逐频谱线相乘,以便获得填充所述频谱所利用的所述噪
声。
9.根据权利要求8所述的感知转换音频解码器,其中,所述噪声填充
器被配置为依赖于所述频谱被编码至的数据流中的噪声水平参数来
设定所述中间噪声信号的水平。
10.根据权利要求8或9所述的感知转换音频解码器,其中,所述噪声
填充器被配置为:
识别所述音频信号的频谱的相连频谱零部分;
依赖于以下各项而针对每一相连频谱零部分判定一函数:
各所述相连频谱零部分的宽度,使得所述函数限于各所述
相连频谱零部分,和
所述音频信号的音调,使得一函数的群体在各所述相连频
谱零部分的内部中变得更紧凑,且远离于各所述相连频谱零部
分的外部边缘;以及
对于每一相连频谱零部分,使用针对各所述相连频谱零部分所
判定的所述函数来频谱上整形所述中间噪声信号。
11.根据权利要求1至10中任一项所述的感知转换音频解码器,其中,
所述噪声填充器被配置为:
识别所述音频信号的频谱的相连频谱零部分;
依赖于以下各项而针对每一相连频谱零部分判定一函数:
各所述相连频谱零部分的宽度,使得所述函数限于各所述
相连频谱零部分,和
所述音频信号的音调,使得一函数的群体在各所述相连频
谱零部分的所述内部中变得更紧凑,且远离于各所述相连频谱
零部分的外部边缘;以及
对于每一相连频谱零部分,使用针对各所述相连频谱零部分所
判定的所述函数来频谱上整形所述噪声。
12.根据权利要求1至7中任一项所述的感知转换音频解码器,其中,
所述噪声填充器被配置为:
产生中间噪声信号;
识别所述音频信号的频谱的相连频谱零部分;
依赖于以下各项而针对每一相连频谱零部分判定一函数:
各所述相连频谱零部分的宽度,使得所述函数限于各所述
相连频谱零部分,
各所述相连频谱零部分的频谱位置,使得所述函数的按比
例调整依赖于各所述相连频谱零部分的频谱位置,使得所述按
比例调整的量随着各所述相连频谱零部分的频谱位置的频率递
增而单调地递增或递减;以及
对于每一相连频谱零部分,使用针对各所述相连频谱零部分所
判定的所述函数来频谱上整形所述中间噪声信号。
13.根据权利要求1至12中任一项所述的感知转换音频解码器,其中,
所述噪声填充器被配置为将所述噪声填充至所述音频信号的频谱
(34)的相连频谱零部分(40)中,其中,所述噪声是在每一相连
频谱零部分中使用一函数(48,50)予以频谱上整形,所述函数在所
述相连频谱零部分(40)的内部(52)中采取最大值,且具有向外
下降边缘(58,60),所述向外下降边缘的绝对斜率是负依赖于所述
调性。
14.根据权利要求1至13中任一项所述的感知转换音频解码器,其中,
所述噪声填充器被配置为将所述噪声填充至所述音频信号的频谱
(34)的相连频谱零部分(40)中,其中,所述噪声是在每一相连
频谱零部分中使用一函数(48,50)予以频谱上整形,所述函数在所
述相连频谱零部分(40)的内部中采取最大值,且具有向外下降边
缘(58,60),所述向外下降边缘的频谱宽度是正依赖于所述调性。
15.根据权利要求1至12中任一项所述的感知转换音频解码器,其中,
所述噪声填充器被配置为将所述噪声填充至所述音频信号的频谱
(34)的相连频谱零部分(40)中,其中,所述噪声是在每一相连
频谱零部分中使用一常数或单峰函数(48,50)予以频谱上整形,所
述常数或单峰函数对所述相连频谱零部分(40)的外部四等份部(a,
d)的、积分归一化至为1的积分是负依赖于所述调性。
16.根据权利要求1至12中任一项所述的感知转换音频解码器,其中,
所述噪声填充器被配置为将所述噪声填充至所述音频信号的频谱的
相连频谱零部分中,其中,所述噪声是在每一相连频谱零部分中利
用一函数(80)予以频谱上整形,所述函数是依赖于各相连频谱零
部分的宽度而设定,使得所述函数限于各所述相连频谱零部分,且

\t所述函数是依赖于所述音频信号的所述调性而设定,使得若所述音
频信号的所述调性递增,则一函数的群体在各所述相连频谱零部分
的所述内部中变得更紧凑,且远离于各所述相连频谱零部分的外部
边缘。
17.根据权利要求1至16中任一项所述的感知转换音频解码器,其中,
所述噪声填充器被配置为以一频谱上全局方式使用在所述频谱被编
码...

【专利技术属性】
技术研发人员:萨沙·迪施马克·伽依尔克里斯蒂安·赫尔姆里希戈兰·马尔科维奇玛丽亚·路易斯瓦莱罗
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1