用于高频音频内容的有效恢复的方法及系统技术方案

技术编号:11324906 阅读:81 留言:0更新日期:2015-04-22 13:34
本文档涉及音频编码、解码和处理的技术领域。其具体涉及用于以有效方式从音频信号的低频分量恢复同一音频信号的高频分量的方法。描述了一种用于确定音频信号的第一频率子带(205)的第一分频带音调值(311,312)的方法。第一分频带音调值(311,312)用于基于音频信号的低频分量来近似音频信号的高频分量。该方法包括:基于音频信号的样本块来确定一组频率窗口的相应的一组变换系数;分别使用该组变换系数确定该组频率窗口的一组窗口音调值(341);以及组成位于第一频率子带内的一组频率窗口中的两个或更多个邻近频率窗口的一组窗口音调值(341)中的相应的两个或更多个窗口音调值的第一子集,从而产生第一频率子带的第一分频带音调值(311,312)。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】 相关申请的交叉引用 本申请要求2012年2月23日提交的欧洲专利申请No. 12156631.9 W及2012年8 月8日提交的美国临时专利申请No. 61/680, 805的优先权,在此通过引用W其全部内容合 并在本文中。
本文档设及音频编码、解码和处理的
具体地,其设及W有效方式从音频 信号的低频分量恢复同一音频信号的高频分量的方法。
技术介绍
音频信号的有效编码和解码通常包括基于屯、理声学原理减小要编码、传输和/或 解码的与音频有关的数据的量。例如,该包括丢弃存在于音频信号中但听者感知不到的所 谓的掩蔽的音频内容。可替代地或另外,当仅保持分别计算关于其较高频率内容的某些信 息而不实际直接对该样的较高频率内容进行编码时,要编码的音频信号的带宽可能是有限 的。然后,带限信号与所述较高频率信息一起被编码和传输(或被存储),后者所要求的资 源少于也对较高频率内容直接编码。 肥-AAC(高频-高级音频编码)中的谱带复制(SBR)和杜比数字+中的谱扩展 (SPX)是关于基于音频信号的低频分量W及基于附加的边带信息(也称为较高频率信息) 来近似或重建音频信号的高频分量的音频编码系统的两个示例。在下文中,参照杜比数字 +的SPX方案。然而,应当注意的是,本文档中所描述的方法和系统通常可应用于高频重建 技术,包括肥-AAC中的SBR。 基于SPX的音频编码器中的边带信息的确定通常受制于显著的计算复杂度。例 如,边带信息的确定可能需要音频编码器的总计算资源的大约50%。本文档描述了使得能 够降低基于SPX的音频编码器的计算复杂度的方法和系统。具体地,本文档描述了使得能 够在基于SPX的音频编码器的背景下降低用于执行音调计算的计算复杂度的方法和系统 (其中,音调计算会占用于确定边带信息的计算复杂度的大约80% )。
技术实现思路
根据一方面,描述了一种用于确定音频信号的第一频率子带的第一分频带音调值 的方法。音频信号可W是多通道音频信号(例如,立体声、5. 1或7. 1多通道信号)的通道 的音频信号。音频信号可W具有从低信号频率到高信号频率范围的带宽。带宽可W包括低 频带和高频带。第一频率子带可W位于低频带内或高频带内。第一分频带音调值可W指示 位于第一频率带内的音频信号的音调。如果频率子带包括相对高程度的稳定正弦内容,贝U 可W认为音频信号在频率子带内具有相对高音调。另一方面,如果频率子带包括相对高程 度的噪声,则可W认为音频信号在该频率子带内具有低音调。第一分频带音调值可W取决 于第一频率子带内的音频信号的相位变化。[000引用于确定第一分频带音调值的方法可w用在音频信号的编码器的背景下。编码器 可W利用高频重建技术如谱带复制(SBR)(例如在高效-高级音频编码器肥-AAC的背景下 所使用的)或谱扩展(SP幻(例如在杜比数字+编码器的背景下所使用的)。第一分频带音 调值可W用于基于音频信号的低频分量(在低频带中)来近似音频信号的高频分量(在高 频带中)。具体地,第一分频带音调值可W用于确定边带信息,该边带信息可W由相应的音 频解码器用于基于所接收的(解码的)音频信号的低频分量来重建音频信号的高频分量。 边带信息例如可W指定为了近似高频分量的频率子带而要添加至低频分量的转换的频率 子带的噪声量。 该方法可W包括基于音频信号的样本块来确定相应的频率区间(化equency bin) 集合的变换系数集合。音频信号的样本序列可W被分组成帖序列,每个帖包括预定数量的 样本。帖序列中的一个帖可W被细分成一个或更多个样本块。帖的邻近块可W重叠(例如, 高至50% )。可W使用时域到频域变换如修正离散余弦变换(MDCT)和/或修正离散正弦 变换(MDST)将样本块从时域变换到频域,从而产生变换系数集合。通过对样本块应用MDST 和MDCT,可W提供复变换系数集合。通常,变换系数的数量N(化及频率区间的数量脚对应 于块内的样本的数量N(例如,N = 128或N = 256)。第一频率子带可W包括多个N频率区 间。换句话说,N个频率区间(具有相对高的频率分辨率)可W被分组成一个或更多个频 率子带(具有相对较低的频率分辨率),因此,可W提供减小的数量的频率子带(通常,该相 对于编码音频信号的减小的数据速率是有利的),其中,频率子带彼此之间具有相对高频率 选择性(由于如下事实;通过对多个高分辨率频率区间进行分组获得频率子带)。 该方法还可W包括使用变换系数集合分别确定频率区间集合的区间音调值集合。 通常对于各个频率区间确定(使用各个频率区间的变换系数)区间音调值。因此,区间音 调值指示各个频率区间内的音频信号的音调。例如,区间音调值取决于相应各个频率区间 内的变换系数的相位变化。 该方法还可W包括对位于第一频率子带内的频率区间集合中的两个或更多个相 应的邻近频率区间的区间音调值集合中的两个或更多个音调值的第一子集进行组合,从而 产生第一频率子带的第一分频带音调值。换句话说,可W通过对位于第一频率子带内的两 个或更多个频率区间的两个或更多个频率音调值进行组合来确定第一分频带音调值。区间 音调值集合中的两个或更多个区间音调值的第一子集的组合可W包括对两个或更多个区 间音调值进行平均和/或对两个或更多个区间音调值进行求和。例如,可W基于位于第一 频率子带内的频率区间的区间音调值的和来确定第一分频带音调值。 因此,用于确定第一分频带音调值的方法指定:基于位于第一频率子带内的频率 区间的区间音调值来确定位于第一频率子带(包括多个频率区间)的第一分频带音调值。 换句话说,提出了 W两步确定第一分频带音调值,其中第一步骤提供区间音调值集合,并且 其中第二步骤对区间音调值集合(中的至少一些)进行组合W得到第一分频带音调值。由 于该样的两步法,可W基于同一区间音调值集合来确定(针对不同子带结构的)不同的分 频带音调值,从而降低利用不同的分频带音调值的音频编码器的计算复杂度。 在一种实施方式中,该方法还包括通过对位于第二频率子带内的频率区间集合中 的两个或更多个相应的邻近频率区间的区间音调值集合中的两个或更多个区间音调值的 第二子集进行组合来确定第二频率子带中的第二分频带音调值。第一频率子带和第二频 率子带可w包括至少一个共同的频率区间,并且第一子集和第二子集可w包括相应的至少 一个共同的区间音调值。换句话说,可W基于至少一个共同的区间音调值来确定第一分频 带音调值和第二分频带音调值,从而使得能够降低与分频带音调值的确定有关的计算复杂 度。例如,第一频率子带和第二频率子带可W位于音频信号的高频带内。第一频率子带可W 比第二频率子带窄,并且可W位于第二频率子带内。第一音调值可W用在基于SPX的编码 器的大方差衰减的背景下,第二音调值可W用在基于SPX的编码器的噪声混合的背景下。 如上面所指出的,在利用高频重建化FR)技术的音频编码器的背景下,通常使用 本文所描述的方法。该种HFR技术通常将音频信号的低频带中的一个或更多个频率区间转 换成高频带中的一个或更多个频率区间,W近似音频信号的高频分量。因此,基于音频信号 的低频分量近似音频信号的高频分量可W包括;将与低频分量对应的低频带中的一个或更 多个频率区间的一个或更多本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/CN104541327.html" title="用于高频音频内容的有效恢复的方法及系统原文来自X技术">用于高频音频内容的有效恢复的方法及系统</a>

【技术保护点】
一种用于针对音频信号的第一频率子带(205)确定第一分频带音调值(311,312)的方法;其中所述第一分频带音调值(311,312)用于基于所述音频信号的低频分量来近似所述音频信号的高频分量;所述方法包括:基于所述音频信号的样本块来确定相应一组频率区间中的一组变换系数;使用所述一组变换系数分别针对所述一组频率区间来确定一组区间音调值(341);以及组合针对位于所述第一频率子带内的所述一组频率区间的两个或更多个邻近频率区间的所述一组区间音调值(341)中的两个或更多个相应的区间音调值的第一子集,从而产生所述第一频率子带的所述第一分频带音调值(311,312)。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:罗宾·特辛米夏埃尔·舒格
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利