智能间隙填充框架内使用双声道处理的音频编码器、音频解码器及相关方法技术

技术编号:13087347 阅读:88 留言:0更新日期:2016-03-30 17:32
一种用于生成解码的双声道信号的设备,包括:音频处理器(802),用于对编码的双声道信号进行解码以获得第一组第一频谱部分;参数化解码器(804),用于提供第二组第二频谱部分的参数化数据以及提供用于标识第二频谱部分的第一双声道表示或不同的第二双声道表示的双声道标识;以及频率再生器(806),用于取决于第一组第一频谱部分中的第一频谱部分、第二部分的参数化数据以及第二部分的双声道标识来再生第二频谱部分。

【技术实现步骤摘要】
【国外来华专利技术】智能间隙填充框架内使用双声道处理的音频编码器、音频解码器及相关方法本专利技术涉及音频编码/解码,并且具体地涉及使用智能间隙填充(IGF)的音频编码。音频编码为使用心理声学知识处理音频信号中的冗余及无关部分的信号压缩领域。如今音频编解码器通常需要大约60kbps/声道以对几乎任何类型的音频信号进行感知透明编码。较新的编解码器旨在使用如带宽扩展(BWE)的技术通过利用信号中的频谱相似度来降低编码比特率。BWE方案使用低比特率参数集来表示音频信号的高频(HF)分量。HF频谱填充有来自低频(LF)区域的频谱内容,并且频谱形状、倾斜和时域连续性被调整以维持原始信号的音质和音色。这样的BWE方法使得音频编解码器即使在大约24kbps/声道的低比特率下仍能够保持良好的品质。音频信号的存储或传输经常受到严格的比特率约束。在过去,当仅有很低的比特率可用时编码器才被迫大幅度地减小传输音频带宽。现代音频编解码器如今能够通过使用带宽扩展(BWE)方法[1]对宽带信号进行编码。这些算法依赖于高频内容(HF)的参数化表示以及参数驱动的后处理的应用,高频内容(HF)的参数化表示借助至HF频谱区域的转移(“修补(patching)”)来从解码信号的波形编码的低频部分(LF)生成。按照BWE方案,高于给定的所谓的交叉频率的HF频谱区域的重构通常基于频谱修补。通常,HF区域包括多个相邻补片,并且这些补片中的每一个源自低于给定的交叉频率的LF频谱的带通(BP)区域。现有技术系统通过将一组相邻子带系数从源区域拷贝至目标区域来有效地执行滤波器组表示例如正交镜像滤波器组(QMF)内的修补。在如今的音频编解码器中发现的提高压缩效率从而使得能够在低比特率下扩展音频带宽的另一种技术是音频频谱的适当部分的参数驱动合成替换。例如,原始音频信号的类噪声信号部分可以用在解码器中生成并且由边信息参数缩放的人造噪声来替换,而基本上不损失主观品质。一个示例是包括在MPEG-4高级音频编码(AAC)中的感知噪声替代(PNS)工具[5]。还提供了也使得能够在低比特率下扩展音频带宽的另一种技术,其是包括在MPEG-D统一语音与音频编码(USAC)中的噪声填充技术[7]。通过由于太粗糙的量化导致的量化器的死区而推断出的频谱间隙(零)随后以解码器中的人工噪声来填充并且通过参数驱动后处理来缩放。另一种现有技术系统被称为精确频谱替换(ASR)[2-4]。除了波形编解码器以外,ASR还采用专用信号合成段,其在解码器处恢复信号的在感知上重要的正弦部分。此外,[5]中描述的系统依赖于波形编码器的HF区域中的正弦建模以使得扩展的音频带宽在低比特率下仍具有还不错的感知品质。所有这些方法涉及将数据变换至除了改进型离散余弦变换(MDCT)以外的第二域的变换并且还涉及用于保留HF正弦分量的相当复杂的分析/合成段。图13A示出了用于如在例如高效高级音频编码(HE-AAC)中使用的带宽扩展技术的音频编码器的示意图。线1300处的音频信号被输入至包括低通1302和高通1304的滤波器系统。由高通滤波器1304输出的信号被输入至参数提取器/编码器1306。参数提取器/编码器1306被配置成用于计算并且编码参数如例如频谱包络参数、噪声添加参数、丢失的谐波参数或逆滤波参数。所提取的这些参数被输入至比特流复用器1308。低通输出信号被输入至通常包括下采样器1310和核心编码器1312的功能的处理器。低通1302将要被编码的带宽限于与出现在线1300上的原始输入音频信号中出现的带宽相比明显较小的带宽。这由于以下事实而提供了明显的编码增益:核心编码器中出现的全部功能仅必须对具有减小了的带宽的信号进行操作。当例如线1300上的音频信号的带宽为20kHz时并且当低通滤波器1302具有例如4kHz的带宽时,为了满足采样定理,理论上充分的是,下采样器之后的信号的采样频率为8kHz,其基本上降低至必须至少是40kHz的音频信号1300所需的采样速率。图13B示出了相应的带宽扩展解码器的示意图。解码器包括比特流解复用器1320。比特流解复用器1320提取核心解码器1322的输入信号和参数解码器1324的输入信号。在上面的示例中,核心解码器输出信号的采样速率为8kHz并且因此带宽为4kHz,然而,对于完整的带宽重构,高频重构器1330的输出信号必须处于20kHz,其要求至少40kHz的采样速率。为了使这可能,需要具有上采样器1325和滤波器组1326的功能的解码器处理器。然后,高频重构器1330接收由滤波器组1326输出的经频率分析的低频信号,并且使用高频带的参数化表示对由图13A的高通滤波器1304限定的频率范围进行重构。高频重构器1330具有几个功能如使用低频范围中的源范围来再生上频率范围、频谱包络调整、噪声添加功能以及在上频率范围内引入丢失的谐波的功能,并且为了解释较高频率范围通常与较低频率范围具有不同的音调的事实,如果在图13A的编码器中施加以及计算,则还包括逆滤波操作。在HE-AAC中,丢失的谐波在解码器侧上被重新合成,并且被精确地置于重构频带的中间。因此,在某个重构频带中确定了的所有丢失的谐波线未被放置在位于原始信号中的频率值处。替代地,那些丢失的谐波线被置于某个频带的中心内的频率处。从而,当原始信号中的丢失的谐波线被放置得很靠近原始信号中的重构频带边界时,通过将重构信号中的该丢失的谐波线置于频带的中心处而引入的频率的误差接近生成并且发送了参数的个别重构频带的50%。此外,尽管典型的音频核心编码器操作在频谱域中,然而核心解码器生成时域信号,然后该时域信号通过滤波器组1326功能再次被转换至频谱域。这引入了额外的处理延迟,由于首先从频谱域变换成频域以及再次变换成通常不同的频域的串联处理而可能引入伪声,并且当然这还要求大量的计算复杂度以及因此电力,当带宽扩展技术被应用于移动装置如移动电话、平板或手提计算机等时,电力尤其是问题。当前音频编解码器使用BWE作为编码方案的主要部分来执行低比特率音频编码。然而,BWE技术限于仅替换高频(HF)内容。此外,它们不能使得高于给定的交叉频率的感知上重要的内容能够被波形编码。因此,由于在大多数系统中不考虑信号的音调谐波的精确对准,所以当实现BWE时,当代音频编解码器丢失HF细节或音品。目前现有技术的BWE系统的另一缺点是需要将音频信号变换至新的域中以实现BWE(例如,从MDCT域变换至QMF域)。这导致同步复杂、额外的计算复杂度以及增加了的存储需求。在双声道对的场景下,基本上存在几种声道表示如联合声道表示或分离声道表示。公知的联合表示是中间/侧表示,其中,中间声道是左声道和右声道之和,并且其中,侧声道是左声道与右声道之间的差。另一表示是下混合声道和残差声道以及使得能够从下混合和残差重建左声道和右声道的预测系数。在该情况下,分离表示会是分离的左声道和右声道或者通常的第一声道和第二声道。此外,存在以下情况,其中,用于间隙填充操作的源范围可以显示强相关性,而目标范围不显示该强相关性。在该实施方式中,当源范围使用如中间/侧表示的第一立体声表示来编码以降低核心频率部分的比特率,则对于重构部分或目标范围而言会生成错误的双声道图像。另一方面,当源范围没有显示任何相关性或者仅具有较小相关本文档来自技高网...

【技术保护点】
一种用于生成解码的双声道信号的设备,包括:音频处理器(802),用于对编码的双声道信号进行解码以获得第一组第一频谱部分;参数化解码器(804),用于提供:第二组第二频谱部分的参数化数据以及用于标识所述第二频谱部分的第一双声道表示或不同的第二双声道表示的双声道标识;以及频率再生器(806),用于取决于所述第一组第一频谱部分中的第一频谱部分、所述第二部分的参数化数据以及所述第二部分的双声道标识来再生第二频谱部分。

【技术特征摘要】
【国外来华专利技术】2013.07.22 EP 13177353;2013.07.22 EP 13177350;20131.一种用于生成解码的双声道信号的设备,包括:音频处理器(802),用于对编码的双声道信号进行解码以获得第一组第一频谱部分;参数化解码器(804),用于提供:第二组第二频谱部分的参数化数据以及用于标识第二频谱部分的第一双声道表示或不同的第二双声道表示的双声道标识;以及频率再生器(806),用于取决于第一组第一频谱部分中的第一频谱部分、第二频谱部分的参数化数据以及第二频谱部分的双声道标识来再生第二频谱部分,其中,所述音频处理器被配置成:根据第一组第一频谱部分的另外的双声道标识对第一组第一频谱部分进行解码,以及变换(832)第一组第一频谱部分以获得第一组第一频谱部分的第一双声道表示和第一组第一频谱部分的第二双声道表示,并且其中,所述频率再生器(806)被配置成:按照第二频谱部分的双声道标识所指示的,使用第一组第一频谱部分的第一双声道表示或第一组第一频谱部分的第二双声道表示。2.根据权利要求1所述的设备,其中,所述双声道标识对所述编码的双声道信号的两个声道的分离处理或者所述编码的双声道信号的两个声道的联合处理进行标识,并且其中,所述频率再生器(806)被配置成用于:使用第一声道的第一频谱部分和第二声道的第一频谱部分来再生所述两个声道中的第一声道的第二频谱部分以及所述两个声道中的第二声道的第二频谱部分,其中,第一声道的第一频谱部分和第二声道的第一频谱部分在由第二频谱部分的双声道标识所标识的双声道表示中。3.根据权利要求1所述的设备,其中,所述双声道标识对所述编码的双声道信号的两个声道的分离处理或者所述编码的双声道信号的两个声道的联合处理进行标识,并且其中,所述频率再生器(806)被配置成用于:按照所述双声道标识所标识的,再生第二频谱部分中的所述两个声道的联合表示,并且其中,所述频率再生器(806)还包括表示变换器(842),所述表示变换器(842)将第二频谱部分的所述联合表示变换成第二频谱部分的分离表示。4.根据权利要求3所述的设备,其中,所述表示变换器将另外的联合表示参数用于所述表示变换。5.根据权利要求3所述的设备,其中,所述联合表示是中间/侧表示,并且其中,所述表示变换器被配置成基于以下等式来操作:leftTile=0.5*(midTile+sideTile)rightTile=0.5*(midTile-sideTile)其中,leftTile和rightTile是第二频谱部分的分离表示,并且其中,midTile和sideTile是第二频谱部分的联合表示。6.根据权利要求3所述的设备,其中,所述联合表示是包括另外的预测系数的表示,并且其中,所述表示变换器被配置成基于以下等式来操作:当预测方向为从侧至中间时:sideTile[k]=sideTile[k]-predictionCoeff·midTile[k]leftTile[k]=midTile[k]+sideTile[k]rightTile[k]=midTile[k]-sideTile[k]或者,当预测方向被指示为从侧至中间时:midTile1[k]=midTile[k]-predictionCoeff·sideTile[k]leftTile[k]=midTile1[k]-sideTile[k]rightTile[k]=midTile1[k]+sideTile[k]其中,leftTile和rightTile是第二频谱部分的分离表示,并且其中,midTile和sideTile是第二频谱部分的联合表示,并且其中,predictionCoeffcient是所述另外的预测系数。7.根据权利要求1所述的设备,其中,针对所述双声道表示的每个声道,分别给出第二组第二频谱部分的参数化数据,并且其中,所述频率再生器(806)被配置成用于:当所述双声道标识对第二频谱部分的联合表示进行标识时,将第二频谱部分的参数化数据变换(840)成第二频谱部分的联合表示,以及将所述参数化数据应用至第一频谱部分的联合表示。8.根据权利要求1所述的设备,其中,第二频谱部分对应于频带,并且其中,所述双声道标识是标签数组——每个频带对应一个标签,并且其中,所述参数化解码器(804)被配置成:检查是否设置所述标签,以及根据所述标签来控制所述频率再生以使用所述编码的双声道信号的第一频谱部分的第一双声道表示或第二双声道表示。9.根据权利要求1所述的设备,其中,所述参数化解码器(804)被配置成:提供指示第一频谱部分的第一双声道表示或不同的第二双声道表示的、第一组第一频谱部分的另外的双声道标识,并且其中,所述设备被配置成用于:按照第一频谱部分的双声道标识所指示的,对第二双声道表示进行解码,并且其中,所述频率再生器(806)被配置成用于:在所述核心解码(830)之后将第二双声道表示变换成(832)第一双声道表示。10.根据权利要求1所述的设备,还包括组合器(846),所述组合器(846)将由所述音频处理器(802)生成的第一组第一频谱部分与由所述频率再生器(806)生成的所重构的第二频谱部分进行组合以获得所述解码的双声道信号。11.根据权利要求1所述的设备,其中,所述参数化解码器被配置成用于:针对第二频谱部分另外地提供源频带标识(1121),所述源频带标识(1121)指示要被用于再生第二频谱部分的特定的第一频谱部分,并且其中,所述频率再生器(806)被配置成:使用由所述源频带标识(833)所标识的第一频谱部分来再生第二频谱部分。12.根据权利要求1所述的设备,其中,所述频率再生器(806)包括表示变换器(832),所述表示变换器(832)用于提供由所述音频处理器(830)生成的第一组第一频谱部分的第一双声道表示和第二双声道表示,其中,所述频率再生器(806)还包括频率铺片生成器(836),所述频率铺片生成器(836)用于生成由所述双声道标识所标识的所述声道表示的每个声道的原始数据,并且使用指示要用于生成所述原始数据的第一频谱部分的源范围标识(833),其中,所述频率再生器(806)还包括参数变换器(840),所述参数变换器(840)用于:当每个声道的所述原始数据由所述频率铺片生成器(836)以第二双声道表示来提供时,将以第一双声道表示提供的参数变换成所述参数的第二双声道表示,其中,所述频率再生器(806)还包括包络调整器(838),所述包络调整器(838)用于调整所述双声道表示的每个声道的包络,所述双声道表示是第二双声道表示,其中,所述频率再生器(806)还包括表示变换器(842),所述表示变换器(842)用于将第二频谱部分中的频谱值的所述双声道表示变换成第一双声道表示,并且其中,所述设备还包括频率时间转换器(846),所述频率时间转换器(846)用于将由所述表示变换器(842)生成的表示从频谱域转换至时间域。13.根据权利要...

【专利技术属性】
技术研发人员:萨沙·迪施弗雷德里克·纳格尔拉尔夫·盖格尔巴拉吉·纳根德兰·托斯卡纳康斯坦丁·施密特斯特凡·拜尔克里斯蒂安·诺伊坎贝恩德·埃德勒克里斯蒂安·黑尔姆里希
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1