【技术实现步骤摘要】
【国外来华专利技术】用于确定与音频信号的频谱增强处理有关的预定特性的装置和方法
技术介绍
在多媒体应用中,音频信号通常使用专用感知编码方法,如MPEG1/2层3(“mp3”)、MPEG2/4高级音频编码(AAC)等被编码。当解码编码的音频信号时,可以应用各种处理方法以便重构初始被编码的音频信号。然而,由于诸如感知自适应量化的有损编码操作或诸如频谱带宽复制(SBR)的参数编码技术,有可能在解码的音频信号中获得可能是令人烦扰的伪像。很长时间以来,已经开发了感知音频编码器以首先保持原始信号的感知质量。如果编码和非编码信号在感知上是不可区分的,则这个特性被称为“感知透明度”。然而,只有在可用比特率(即,使用的数据量)足够高时才能实现透明度。近年来,认识到的是,在低比特率下,在透明意义上感知愉悦变得比接近原始信号更重要。因此,与以感知愉悦为目标的现代编码方法相比,诸如MP3或AAC等沿用已久的感知编码方案可能听起来不是最理想的。下面,简要描述一些编码伪像。鸟伪像在低比特率转换编码中,通常必须将用于频谱线的编码的量化器设置为非常粗糙的精度,使得它们的动态范围适应于信号。结果,许多频谱线由量化器的死区量化为0,或量化为值1,对应于第一量化器步长。随着时间的过去,频谱线或线群可能在0和1之间切换,从而引入不希望的时间调制。这种伪像被称为“鸟”,使人联想到鸟的吱吱叫。因此,频谱空洞和频谱岛的这种强时变存在是导致令人反感的感知伪像的不希望的编解码器行为,参见[2]和[3]。带宽限制另一种熟知的编码伪像是带宽限制。如果在低比 ...
【技术保护点】
1.一种用于确定与音频信号(12)的频谱增强处理有关的预定特性的装置,所述装置包括:/n推导器(14),被配置用于获得所述音频信号(12)的频谱(12')以及用于得出与所述频谱(12')的精细结构有关的信息(Z(k));/n确定器(24),被配置用于确定所述精细结构中的相似性;/n处理器(32),用于取决于所述相似性的评估提供指示所述音频信号(12)包括所述预定特性的信息(34)。/n
【技术特征摘要】
【国外来华专利技术】20170331 EP 17164360.4;20170907 EP 17189988.31.一种用于确定与音频信号(12)的频谱增强处理有关的预定特性的装置,所述装置包括:
推导器(14),被配置用于获得所述音频信号(12)的频谱(12')以及用于得出与所述频谱(12')的精细结构有关的信息(Z(k));
确定器(24),被配置用于确定所述精细结构中的相似性;
处理器(32),用于取决于所述相似性的评估提供指示所述音频信号(12)包括所述预定特性的信息(34)。
2.如权利要求1所述的装置,其中所述频谱的精细结构与所述频谱的局部最大值和/或最小值有关。
3.如权利要求1或2所述的装置,其中所述推导器被配置用于从所述频谱(12')得出局部最大信号(Z(k)),以便得出与所述精细结构有关的所述信息,其中所述确定器被配置用于确定所述局部最大信号(Z(k))的段之间的相似性。
4.如前述权利要求中任一项所述的装置,还包括频谱计算器(44),所述频谱计算器(44)被配置用于接收所述音频信号(12)以及从所述音频信号(12)计算所述频谱(12')。
5.如前述权利要求中任一项所述的装置,其中所述确定器(24)被配置为使用与所述精细结构有关的所述信息的第一段和第二段确定所述相似性,其中所述第一段和所述第二段被移位所述频谱(12')的数个(τ)样本。
6.如前述权利要求中任一项所述的装置,
其中,所述确定器(24)被配置为用于确定所述相似性,以确定与所述精细结构有关的所述信息的第一段和第二段之间的相似性值(C(τ)),其中,所述第一段和第二段相对于彼此被移位关于样本的数量(τ)的参数;
其中所述确定器(24)被配置用于针对所述参数的多个值确定所述相似性值;以及
其中所述确定器被配置用于从所述相似性值或从相似性值得出的值(C(τ))中选择至少一个局部最大值(26i,mi)。
7.如权利要求6所述的装置,其中所述确定器(24)包括被配置用于对所述相似性值(C(τ))进行滤波以便获得经滤波的相似性值(H(C(τ)))的滤波器,其中所述确定器被配置用于从所述经滤波的相似性值(H(C(τ)))中选择所述至少一个局部最大值(mi)。
8.如权利要求6或7所述的装置,其中所述确定器被配置用于基于如下表示的确定规则确定所述相似性值(C(τ)):
其中C(τ)是用于所述参数τ的所述相似性值,k是从k0到kl的范围内的所述频谱中的样本并且具有l+1个样本的长度,其中Z(k)是样本k的局部最大函数。
9.如前述权利要求中任一项所述的装置,其中所述处理器(32)被配置为用于评估与和所述精细结构有关的信息有关的相似性值(C(τ))或从其得出的值(H(C(τ)))的局部最大值(26i,mi)的数量,以及用于评估局部最大值(26i,mi)的幅度,以及用于当包括至少幅度阈值(27)的最大值(26i,mi)的数量低于数量阈值时提供指示所述音频信号(12)包括所述预定特性的所述信息(34)。
10.如前述权利...
【专利技术属性】
技术研发人员:帕特里克·甘普,克里斯蒂安·乌勒,萨沙·迪施,安东尼奥·卡拉姆伯尼欧蒂斯,茱莉亚·哈文斯坦,奥利弗·赫尔穆特,于尔根·赫勒,彼得·普罗肯,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。