用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法技术

技术编号:11703170 阅读:87 留言:0更新日期:2015-07-09 02:18
一种用于对编码音频信号进行解码的设备,包括:频谱域音频解码器(602),其用于生成第一组第一频谱部分的第一解码表示,第一解码表示是频谱预测残差值;频率再生器(604),其用于使用第一组第一频谱部分中的第一频谱部分来生成重构的第二频谱部分,其中,重构的第二频谱部分另外地包括频谱预测残差值;以及逆预测滤波器(606),其用于使用包括在编码音频信号中的预测滤波器信息(607)使用第一组第一频谱部分和重构的第二频谱部分的频谱残差值来执行关于频率的逆预测。

【技术实现步骤摘要】
【国外来华专利技术】用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法本专利技术涉及音频编码/解码,并且更具体地涉及使用智能间隙填充(IGF)的音频编码。音频编码为使用心理声学知识处理音频信号中的冗余及无关部分的信号压缩领域。如今音频编解码器通常需要大约60kbps/声道以对几乎任何类型的音频信号进行感知透明编码。较新的编解码器旨在使用如带宽扩展(BWE)的技术通过利用信号中的频谱相似度来降低编码比特率。BWE方案使用低比特率参数集来表示音频信号的高频(HF)分量。HF频谱填充有来自低频(LF)区域的频谱内容,并且频谱形状、倾斜和时域连续性被调整以维持原始信号的音质和音色。这样的BWE方法使得音频编解码器即使在大约24kbps/声道的低比特率下仍能够保持良好的品质。音频信号的存储或传输经常受到严格的比特率约束。在过去,仅当有很低的比特率可用时编码器才被迫大幅度地减小传输音频带宽。现代音频编解码器如今能够通过使用带宽扩展(BWE)方法[1]对宽带信号进行编码。这些算法依赖于高频内容(HF)的参数化表示以及参数驱动的后处理的应用,高频内容(HF)的参数化表示借助于将解码信号的波形编码的低频部分(LF)转移至HF频谱区域中(“修补(patching)”)来生成。按照BWE方案,高于给定的所谓的交叉频率的HF频谱区域的重构通常基于频谱修补。通常,HF区域包括多个相邻修补,并且这些修补中的每一个源自低于给定的交叉频率的LF频谱的带通(BP)区域。现有技术系统通过将一组相邻子带系数从源区域拷贝至目标区域来有效地执行滤波器组表示例如正交镜像滤波器组(QMF)内的修补。在如今的音频编解码器中发现的提高压缩效率从而使得能够在低比特率下扩展音频带宽的另一种技术是音频频谱的适当部分的参数驱动合成替换。例如,原始音频信号的类噪声信号部分可以用在解码器中生成并且由边信息参数缩放的人造噪声来替换,而基本上不损失主观品质。一个示例是包括在MPEG-4高级音频编码(AAC)中的感知噪声替代(PNS)工具[5]。还提供了也使得能够在低比特率下扩展带宽的另一种技术,其是包括在MPEG-D统一语音与音频编码(USAC)[7]中的噪声填充技术。通过由于太粗糙的量化导致的量化器的死区而推断出的频谱间隙(零)随后以解码器中的人工噪声来填充并且通过参数驱动后处理来缩放。另一种现有技术系统被称为精确频谱替换(ASR)[2-4]。除了波形编解码器以外,ASR还采用专用信号合成段,其在解码器处恢复信号的感知上重要的正弦部分。此外,[5]中描述的系统依赖于波形编码器的HF区域中的正弦建模以使得扩展的音频带宽在低比特率下仍具有还不错的感知品质。所有这些方法涉及将数据变换至除了改进的离散余弦变换(MDCT)以外的第二域的变换并且还涉及用于保留HF正弦分量的相当复杂的分析/合成段。图13A示出了用于如在例如高效高级音频编码(HE-ACC)中使用的带宽扩展技术的音频编码器的示意图。线1300处的音频信号被输入至包括低通1302和高通1304的滤波器系统。通过高通滤波器1304输出的信号被输入至参数提取器/编码器1306。参数提取器/编码器1306被配置成用于计算和编码参数如例如频谱包络参数、噪声添加参数、丢失的谐波参数或逆滤波参数。所提取的这些参数被输入至比特流复用器1308。低通输出信号被输入至通常包括下采样器1310和核心编码器1312的功能的处理器。低通1302将要被编码的带宽限于与出现在线1300上的原始输入音频信号中出现的带宽相比明显较小的带宽。这由于以下事实而提供了明显的编码增益:核心编码器中出现的全部功能仅必须对具有减小了的带宽的信号进行操作。当例如线1300上的音频信号的带宽为20kHz时并且当低通滤波器1302具有例如4kHz的带宽时,为了满足采样定理,理论上充分的是,下采样器之后的信号的采样频率为8kHz,其基本上降低至必须至少是40kHz的音频信号1300所需的采样速率。图13B示出了相应的带宽扩展解码器的示意图。解码器包括比特流复用器1320。比特流解复用器1320提取核心解码器1322的输入信号和参数解码器1324的输入信号。在上面的示例中,核心解码器输出信号的采样速率为8kHz并且因此带宽为4kHz,然而,为了完成带宽重构,高频重构器1330的输出信号必须处于20kHz,其要求至少40kHz的采样速率。为了使这可能,需要具有上采样器1325和滤波器组1326的解码器处理器。然后,高频重构器1330接收由滤波器组1326输出的经频率分析的低频信号,并且使用高频带的参数化表示对由图13A的高通滤波器1304限定的频率范围进行重构。高频重构器1330具有几个功能如使用低频范围中的源范围来再生上频率范围、频谱包络调整、噪声添加功能以及在上频率范围内引入丢失的谐波的功能,并且为了解释较高频率范围通常与较低频率范围具有不同的音调的事实,如果在图13A的编码器中施加以及计算,则还包括逆滤波操作。在HE-ACC中,丢失的谐波在解码器侧上被重新合成,并且被精确地置于重构频带的中间。因此,在某个重构频带中确定了的所有丢失的谐波线未被放置在位于原始信号中的频率值处。替代地,那些丢失的谐波线被置于某个频带的中心内的频率处。从而,当原始信号中的丢失的谐波线被放置得很靠近原始信号中的重构频带边界时,通过将重构信号中的该丢失的谐波线置于频带的中心处而引入的频率中的误差接近生成并且发送了参数的个别重构频带的50%。此外,尽管典型的音频核心编码器操作在频谱域中,然而核心解码器生成时域信号,然后该时域信号通过滤波器组1326功能再次被转换至频谱域。这引入了额外的处理延迟,由于首先从频谱域变换成频域以及再次变换成通常不同的频域的串联处理而可能引入伪声,并且当然这还要求大量的计算复杂度以及因此电力,当带宽扩展技术被应用于移动装置如移动电话、平板或手提计算机等时,电力尤其是问题。当前音频编解码器使用BWE作为编码方案的主要部分来执行低比特率音频编码。然而,BWE技术限于仅替换高频(HF)内容。此外,它们不能使得高于给定的交叉频率的感知上重要的内容能够被波形编码。因此,由于在大多数系统中不考虑信号的音调谐波的精确对准,所以当实现BWE时,当代音频编解码器丢失HF细节或音品。目前现有技术的BWE系统的另一缺点是需要将音频信号变换至新的域中以实现BWE(例如,从MDCT域变换至QMF域)。这导致同步复杂、额外的计算复杂度以及增加了的存储需求。特别地,如果在滤波器组或时间频率变换域中实现带宽扩展系统,则仅存在有限的可能性来控制带宽扩展信号的时域形状。通常,时域粒度受在相邻变换窗之间使用的跳距(hop-size)的限制。这可以导致带宽扩展频谱范围内的不想要的预回声和后回声。为了增大时域粒度,可以使用较短的跳距或较短的带宽扩展帧,但这由于以下事实而导致比特率开销:对于某个时间段,较大数量的参数通常是每个时间帧的某组参数必须要被发送。否则,如果使得各个时间帧太大,则尤其对于音频信号的瞬变部分的会有预回声和后回声生成。本专利技术的目的是提供一种改进的编码/解码概念。该目的通过权利要求1的用于对编码音频信号进行解码的设备、权利要求10的用于对音频信号进行编码的设备、权利要求16的解码方法、本文档来自技高网...
用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法

【技术保护点】
一种用于对编码音频信号进行解码的设备,包括:频谱域音频解码器(602),用于生成第一组第一频谱部分的第一解码表示,所述第一解码表示是频谱预测残差值;频率再生器(604),用于使用所述第一组第一频谱部分中的第一频谱部分来生成重构的第二频谱部分,其中,所述重构的第二频谱部分和所述第一组第一频谱部分包括频谱预测残差值;以及逆预测滤波器(606,616,626),用于使用包括在所述编码音频信号中的预测滤波器信息(607)使用所述第一组第一频谱部分和所述重构的第二频谱部分的所述频谱预测残差值来执行关于频率的逆预测。

【技术特征摘要】
【国外来华专利技术】2013.07.22 EP 13177350.9;2013.07.22 EP 13177346.7;1.一种用于对编码音频信号进行解码的设备,包括:频谱域音频解码器(602),用于生成第一组第一频谱部分的第一解码表示,所述第一解码表示是频谱预测残差值;频率再生器(604),用于使用所述第一组第一频谱部分中的第一频谱部分来生成重构的第二频谱部分,其中,所述重构的第二频谱部分和所述第一组第一频谱部分包括频谱预测残差值;以及逆预测滤波器(210,606,616,626,728),用于使用包括在所述编码音频信号中的预测滤波器信息(607)使用所述第一组第一频谱部分和所述重构的第二频谱部分的所述频谱预测残差值来执行关于频率的逆预测。2.根据权利要求1所述的设备,还包括频谱包络整形器(614,624),所述频谱包络整形器(614)用于对所述逆预测滤波器(606)的输入信号或输出信号的频谱包络进行整形。3.根据权利要求2所述的设备,其中,所述编码音频信号包括所述第二频谱部分的频谱包络信息,所述频谱包络信息具有第二频谱分辨率,所述第二频谱分辨率低于与所述第一解码表示相关联的第一频谱分辨率,其中,所述频谱包络整形器(624)被配置成对所述逆预测滤波器(626)的输出应用频谱包络整形操作,其中,所述预测滤波器信息(607)已经通过使用预测滤波之前的音频信号被确定,或者其中,所述频谱包络整形器(614)被配置成:当所述预测滤波器信息(607)已经通过使用编码器中的预测滤波之后的音频信号被确定时,对所述逆预测滤波器(616)的输入应用频谱包络整形操作。4.根据权利要求1所述的设备,还包括频率时间转换器(212),所述频率时间转换器(212)用于将所述逆预测滤波器(210)的输出或者所述逆预测滤波器(210)的包络整形的输出转换为时间表示。5.根据权利要求1所述的设备,其中,所述逆预测滤波器(606)是由所述预测滤波器信息(607)限定的复数滤波器。6.根据权利要求1所述的设备,其中,所述频谱域音频解码器(602)被配置成生成所述第一解码表示以使得所述第一解码表示具有奈奎斯特频率,所述奈奎斯特频率等于通过所述逆预测滤波器(606)的输出的时间频率转换而生成的时域信号的采样速率。7.根据权利要求1所述的设备,其中,所述频谱域音频解码器(602)被配置成使得由所述第一解码表示中的最大频率的频谱值表示的所述最大频率等于包括在通过对所述逆预测滤波器(606)的输出进行频率时间转换而生成的时间表示中的最大频率,其中,所述第一解码表示中的最大频率的频谱值是零或不是零。8.根据权利要求1所述的设备,其中,第一组第一频谱部分的所述第一解码表示包括实数频谱值,其中,所述设备还包括估计器(724),所述估计器(724)用于根据实数值第一组第一频谱部分来估计所述第一组第一频谱部分的虚数值,并且其中,所述逆预测滤波器(728)是由复数值预测滤波器信息(714)限定的复数逆预测滤波器,并且其中,所述设备还包括频率时间转换器(730),所述频率时间转换器(730)被配置成用于执行将复数值频谱转换成时域音频信号。9.根据权利要求1所述的设备,其中,所述逆预测滤波器(606,728)被配置成应用多个子滤波器,其中,每个子滤波器的频率边界与重构频带的频率边界一致,所述重构频带与频率片一致。10.一种用于对音频信号进行编码的设备,包括:时间频谱转换器(100,702),用于将音频信号(99)转换成频谱表示;预测滤波器(704),用于对所述频谱表示执行关于频率的预测以生成频谱残差值,所述预测滤波器(704)由从所述音频信号得到的滤波器信息(714)来限定;音频编码器(708),用于对所述频谱残差值的第一组第一频谱部分进行编码以获得具...

【专利技术属性】
技术研发人员:萨沙·迪施弗雷德里克·纳格尔拉尔夫·热日尔巴拉吉·纳根德兰·托斯卡纳康斯坦丁·施密特斯特凡·拜尔克里斯蒂安·诺伊坎贝恩德·埃德勒克里斯蒂安·黑尔姆里希
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1