用于在过渡频率附近使用交叉滤波器对编码音频信号进行解码的设备及方法技术

技术编号:13247008 阅读:68 留言:0更新日期:2016-05-15 11:10
一种用于对包括编码核心信号(1)的编码音频信号进行解码的设备,包括:核心解码器(1400),用于对编码核心信号(1401)进行解码以获得解码核心信号;铺片生成器(1404),用于使用解码核心信号的频谱部分来生成一个或更多个频谱铺片,所述一个或更多个频谱铺片具有未包括在解码核心信号中的频率;以及交叉滤波器(1406),用于对解码核心信号和具有从间隙填充频率(309)延伸至上边界频率的频率的第一频率铺片进行频谱交叉滤波,或者用于对第一频率铺片和第二频率铺片进行频谱交叉滤波。

【技术实现步骤摘要】
【国外来华专利技术】用于在过渡频率附近使用交叉滤波器对编码音频信号进行解码的设备及方法
本专利技术涉及音频编码/解码,并且特别地涉及使用智能间隙填充(IGF)的音频编码。
技术介绍
音频编码为使用心理声学知识处理音频信号中的冗余及无关部分的信号压缩领域。如今音频编解码器通常需要大约60kbps/声道以对几乎任何类型的音频信号进行感知透明编码。较新的编解码器旨在使用如带宽扩展(BWE)的技术通过利用信号中的频谱相似度来降低编码比特率。BWE方案使用低比特率参数集来表示音频信号的高频(HF)分量。HF频谱填充有来自低频(LF)区域的频谱内容,并且频谱形状、倾斜和时域连续性被调整以维持原始信号的音质和音色。这样的BWE方法使得音频编解码器即使在大约24kbps/声道的低比特率下仍能够保持良好的品质。音频编码系统有效地以宽范围的比特率对任意音频信号进行编码。然而,对于高比特率,本专利技术的系统会聚于透明度,对于低比特率,使感知烦恼最小化。因此,可用比特率的主要份额用于在编码器中对信号的仅感知上最相关的结构进行波形编码,并且结果的频谱间隙在解码器中以大致近似原始频谱的信号内容来填充。非常有限的比特预算被消耗以通过从编码器发送至解码器的专用边信息来控制参数驱动的所谓的频谱智能间隙填充(IGF)。音频信号的存储或传输经常受到严格的比特率约束。在过去,仅当有很低的比特率可用时编码器才被迫大幅度地减小传输音频带宽。现代音频编解码器如今能够通过使用带宽扩展(BWE)方法[1]对宽带信号进行编码。这些算法依赖于高频内容(HF)的参数化表示以及参数驱动的后处理的应用,高频内容(HF)的参数化表示借助于将解码信号的波形编码的低频部分(LF)转移至HF频谱区域中(“修补(patching)”)来生成。按照BWE方案,高于给定的所谓的交叉频率的HF频谱区域的重构通常基于频谱修补。通常,HF区域包括多个相邻补片,并且这些补片中的每一者源自低于给定的交叉频率的LF频谱的带通(BP)区域。现有技术系统通过将一组相邻子带系数从源区域拷贝至目标区域来有效地执行滤波器组表示例如正交镜像滤波器组(QMF)内的修补。在如今的音频编解码器中发现的提高压缩效率从而使得能够在低比特率下扩展音频带宽的另一种技术是音频频谱的适当部分的参数驱动合成替换。例如,原始音频信号的类噪声信号部分可以用在解码器中生成并且由边信息参数缩放的人造噪声来替换,而基本上不损失主观品质。一个示例是包括在MPEG-4高级音频编码(AAC)中的感知噪声替代(PNS)工具[5]。还提供了也使得能够在低比特率下扩展带宽的另一种技术,其是包括在MPEG-D统一语音与音频编码(USAC)[7]中的噪声填充技术。通过由于太粗糙的量化而由量化器的死区得出的频谱间隙(零)随后以解码器中的人工噪声来填充并且通过参数驱动后处理来缩放。另一种现有技术系统被称为精确频谱替换(ASR)[2-4]。除了波形编解码器以外,ASR还采用专用信号合成段,其在解码器处恢复信号的感知上重要的正弦部分。此外,[5]中描述的系统依赖于波形编码器的HF区域中的正弦建模以使得扩展的音频带宽在低比特率下仍具有还不错的感知品质。所有这些方法涉及将数据变换至除了改进的离散余弦变换(MDCT)以外的第二域的变换并且还涉及用于保留HF正弦分量的相当复杂的分析/合成段。图13A示出了用于如在例如高效高级音频编码(HE-ACC)中使用的带宽扩展技术的音频编码器的示意图。线1300处的音频信号被输入至包括低通1302和高通1304的滤波器系统。通过高通滤波器1304输出的信号被输入至参数提取器/编码器1306。例如,参数提取器/编码器1306被配置成用于对参数例如频谱包络参数、噪声添加参数、丢失的谐波参数或逆滤波参数进行计算和编码。所提取的这些参数被输入至比特流复用器1308。低通输出信号被输入至通常包括下采样器1310和核心编码器1312的功能的处理器。低通1302将要被编码的带宽限于与出现在线1300上的原始输入音频信号中出现的带宽相比明显较小的带宽。这由于以下事实而提供了明显的编码增益:核心编码器中出现的全部功能仅必须对具有减小了的带宽的信号进行操作。当例如线1300上的音频信号的带宽为20kHz时并且当低通滤波器1302具有例如4kHz的带宽时,为了满足采样定理,理论上充分的是,下采样器之后的信号的采样频率为8kHz,其基本上降低至必须至少是40kHz的音频信号1300所需的采样速率。图13B示出了相应的带宽扩展解码器的示意图。解码器包括比特流复用器1320。比特流解复用器1320提取核心解码器1322的输入信号和参数解码器1324的输入信号。在上面的示例中,核心解码器输出信号的采样速率为8kHz并且因此带宽为4kHz,然而,为了完成带宽重构,高频重构器1330的输出信号必须处于20kHz,其要求至少40kHz的采样速率。为了使这可能,需要具有上采样器1325和滤波器组1326的功能的解码器处理器。然后,高频重构器1330接收由滤波器组1326输出的经频率分析的低频信号,并且使用高频带的参数化表示对由图13A的高通滤波器1304限定的频率范围进行重构。高频重构器1330具有几个功能如使用低频范围中的源范围来再生上频率范围、频谱包络调整、噪声添加功能以及在上频率范围内引入丢失的谐波的功能,并且为了解释较高频率范围通常与较低频率范围具有不同的音调的事实,如果在图13A的编码器中施加以及计算,则还包括逆滤波操作。在HE-ACC中,丢失的谐波在解码器侧上被重新合成,并且被精确地置于重构频带的中间。因此,在某个重构频带中确定了的所有丢失的谐波线未被放置在其位于原始信号中的频率值处。替代地,那些丢失的谐波线被置于某个频带的中心处的频率处。从而,当原始信号中的丢失的谐波线被放置得很靠近原始信号中的重构频带边界时,通过将重构信号中的该丢失的谐波线置于频带的中心处而引入的频率的误差接近生成并且发送了参数的个别重构频带的50%。此外,尽管典型的音频核心编码器操作在频谱域中,然而核心解码器生成时域信号,然后该时域信号通过滤波器组1326功能再次被转换至频谱域。这引入了额外的处理延迟,由于首先从频谱域变换成频域以及再次变换成通常不同的频域的串联处理而可能引入伪声,并且当然这还要求大量的计算复杂度以及因此电力,当带宽扩展技术被应用于移动装置如移动电话、平板或手提计算机等时,电力尤其是问题。当前音频编解码器使用BWE作为编码方案的主要部分来执行低比特率音频编码。然而,BWE技术限于仅替换高频(HF)内容。此外,它们不能使得高于给定的交叉频率的感知上重要的内容能够被波形编码。因此,由于在大多数系统中不考虑信号的音调谐波的精确对准,所以当实现BWE时,当代音频编解码器丢失HF细节或音品。目前现有技术的BWE系统的另一缺点是需要将音频信号变换至新的域中以实现BWE(例如,从MDCT域变换至QMF域)。这导致同步复杂、额外的计算复杂度以及增加了的存储需求。音频信号的存储或传输通常受到严格的比特率约束。在过去,仅当很低的比特率可用时,编码器才被迫大幅度地减小传输音频带宽。现代音频编解码器如今能够通过使用带宽扩展(BWE)方法[1-2]对宽带信号进行编码。这些算法依赖于高频内容(H本文档来自技高网...

【技术保护点】
一种用于对包括编码核心信号(1)的编码音频信号进行解码的设备,包括:核心解码器(1400),用于对所述编码核心信号(1401)进行解码以获得解码核心信号;铺片生成器(1404),用于使用所述解码核心信号的频谱部分来生成一个或更多个频谱铺片,所述一个或更多个频谱铺片具有未包括在所述解码核心信号中的频率;以及交叉滤波器(1406),用于对所述解码核心信号和具有从间隙填充频率(309)延伸至上边界频率的频率的第一频率铺片进行频谱交叉滤波,或者用于对第一频率铺片和第二频率铺片进行频谱交叉滤波。

【技术特征摘要】
【国外来华专利技术】2013.07.22 EP 13177346.7;2013.07.22 EP 13177350.9;1.一种用于对包括编码核心信号(1)的编码音频信号进行解码的设备,包括:核心解码器(1400),用于对所述编码核心信号(1401)进行解码以获得解码核心信号;铺片生成器(1404),用于使用所述解码核心信号的频谱部分来生成一个或更多个频谱铺片,所述一个或更多个频谱铺片具有未包括在所述解码核心信号中的频率;以及交叉滤波器(1406),用于对所述解码核心信号和具有从间隙填充频率(309)延伸至上边界频率的频率的第一频率铺片进行频谱交叉滤波,或者用于对所述第一频率铺片和第二频率铺片进行频谱交叉滤波,其中,所述交叉滤波器(1406)被配置成:在延伸在至少三个频率值上的交叉范围内对由淡出子滤波器(1420)滤波的所述解码核心信号与由淡入子滤波器(1422)滤波的所述第一频率铺片的至少一部分执行关于频率的加权相加(1424),或者在延伸在至少三个频率值上的所述交叉范围内对由淡出子滤波器(1420)滤波的所述第一频率铺片的至少一部分与由淡入子滤波器(1422)滤波的所述第二频率铺片的至少一部分执行关于频率的加权相加(1424)。2.根据权利要求1所述的设备,其中,由所述交叉滤波器(1406)影响的所述解码核心信号的频谱部分、所述第一频率铺片的频谱部分或所述第二频率铺片的频谱部分小于由所述解码核心信号的总频谱频带覆盖的或者由所述第一频率铺片或所述第二频率铺片的总频谱频带覆盖的频谱部分的30%并且大于或等于由至少5个相邻频率值所限定的频带。3.根据权利要求1所述的设备,其中,所述交叉滤波器(1406)被配置成用于应用淡入和淡出的类余弦滤波器特性。4.根据权利要求1所述的设备,包括包络调整器(1408),所述包络调整器(1408)用于使用所述编码音频信号中包括的参数化频谱包络信息(1407)对在由所述一个或更多个频谱铺片的频谱范围限定的频谱范围中的经交叉滤波的频谱信号进行包络调整。5.根据权利要求1所述的设备,还包括频率时间转换器(828),所述频率时间转换器(828)用于将经包络调整的信号连同所述解码核心信号转换成时间表示。6.根据权利要求5所述的设备,其中,所述频率时间转换器被配置成用于应用改进型离散余弦逆变换(512,514,516),所述改进型离散余弦逆变换包括对当前帧与先前时间帧的交叠/相加处理(516)。7.根据权利要求1所述的设备,其中,所述交叉滤波器是可控滤波器,其中,所述设备还包括信号特性检测器(1405),并且其中,所述信号特性检测器(1405)被配置成用于根据从所述解码核心信号得出的检测结果来控制所述交叉滤波器(1406)的滤波器特性。8.根据权利要求7所述的设备,其中,所述信号特性检测器(1405)是瞬变检测器,并且其中,所述瞬变检测器(1405)被配置成以以下方式来控制所述交叉滤波器:对于较多瞬变的信号部分,所述交叉滤波器对交叉滤波器输入信号具有第一影响,而对于较少瞬变的...

【专利技术属性】
技术研发人员:萨沙·迪施拉尔夫·盖格尔克里斯蒂安·黑尔姆里希弗雷德里克·纳格尔克里斯蒂安·诺伊坎康斯坦丁·施密特米夏埃尔·菲舍尔
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1