用于降低时域解码器中的量化噪声的装置和方法制造方法及图纸

技术编号:12246528 阅读:88 留言:0更新日期:2015-10-28 12:34
本公开涉及一种用于降低在由时域解码器解码的时域激励中包含的信号中的量化噪声的装置和方法。解码后的时域激励被转换为频域激励。产生加权掩模用于取回在量化噪声中丢失的频谱信息。通过应用加权掩模修改频域激励以增大频谱动态。修改的频域激励被转换为修改的时域激励。所述方法和装置可以用于改进基于线性预测的编解码器的音乐内容呈现。优选地,解码后的时域激励的合体可以被分类为第一组激励类别和第二组激励类别之一,所述第二组包括非活动或非嗓音类别,所述第一组包括其他类别。

【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及声音处理领域,更具体地,本公开涉及降低声音信号中的量化噪声。
技术介绍
现有技术的传统编解码器在大约8kbps的比特速率处表现出质量非常良好的干 净语音信号,并且在16kbps的比特速率处接近透明。为了在低比特速率处维持该高语音质 量,通常使用多模编码方案。通常输入信号被分为反映其特性的不同类别。不同类别包括例 如嗓音语音(voiced speech)、非嗓音语音(unvoiced speech)、嗓音进攻(voiced onset) 等。编解码器随后使用针对这些类别优化的不同编码模式。 基于语音模式的编解码器通常不能很好地呈现(render)例如音乐的通常音频信 号。因此,一些部署的语音编解码器不能高质量地表示音乐,尤其在低比特速率处。当部署 编解码器时,由于比特流被标准化并且对比特流的任何修改将打破编解码器的互操作性的 事实,难以修改编码器。 因此,存在改进基于语音模式的编解码器(例如基于线性预测(LP)编解码器)的 音乐内容呈现的需要。
技术实现思路
根据本公开,提供一种用于降低在由时域解码器解码的时域激励中包含的信号中 的量化噪声的装置。所述装置包括将解码后的时域激励转换为频域激励的转换器。还包括 产生用于取回在量化噪声中丢失的频谱信息的加权掩模的掩模构造器。所述装置还包括频 域激励的修改器,通过应用加权掩模增大频谱动态。所述装置还包括将修改的频域激励转 换为修改的时域激励的转换器。 本公开还涉及一种用于降低在由时域解码器解码的时域激励中包含的信号中的 量化噪声方法。解码后的时域激励被时域解码器转换为频域激励。产生加权掩模用于取回 在量化噪声中丢失的频谱信息。通过应用加权掩模修改频域激励以增大频谱动态。修改的 频域激励被转换为修改的时域激励。 上述和其他特征在阅读下列参考附图仅通过示例给出的其示意性实施例的非限 制性描述时变得更加清楚。【附图说明】 将参考附图仅通过示例描述本公开的实施例,其中: 图1是示出根据实施例的用于降低在由时域解码器解码的时域激励中包含的信 号中的量化噪声的方法的操作的流程图; 图2a和2b (统称为图2)是具有用于降低音乐信号和其他声音信号中的量化噪声 的频域后处理能力的解码器的简化示意图;以及 图3是形成图2的解码器的硬件组件的示例配置的简化框图。【具体实施方式】 本公开的各种方面一般通过降低音乐信号中的量化噪声来解决改进基于语音模 式的编解码器(例如基于线性预测(LP)的编解码器)的音乐内容呈现的问题中的一个或 多个。应记住的是本公开的教导也可以应用于其他声音信号,例如除了音乐之外的通用音 频信号。 对解码器的修改可以改进接收器侧的感知质量。本公开公开一种在解码器侧实现 用于音乐信号和其他声音信号的频域后处理,其降低解码后的合体(synthesis)的频谱中 的量化噪声的。后处理可以在没有任何额外的编码延迟的情况下实现。 这里使用的频谱谐波之间的量化噪声的频域移除和频域后处理的原理基于 Vaillancourt等的、2009年09月11日的PCT专利公布W02009/109050A1 (在下文中为 "Vaillancourt' 050"),其公开通过引用合并于此。一般地,对解码后的合体应用这种频域 后处理,并且这种频域后处理需要增加处理延迟以便包括重叠并且增加处理以得到显著的 质量增益。此外,使用传统频域后处理能力,由于有限的频率分辨率,增加的延迟越短(即 变换窗口越短),后处理效果越差。根据本公开,频域后处理实现更高的频率分辨率(使用 更长的频率变换),而不对合体增加延迟。此外,利用过去帧频率能量中存在的信息来创建 应用于当前帧频谱的加权掩模,以取回,即增强,在编码噪声中丢失的频谱信息。为了在不 对合体增加延迟的情况下实现该后处理,在该示例中,使用对称的梯形窗口。其中心在窗口 是平的(flat)的当前帧(其具有值为1的固定值),并且外推被用于创建未来信号。虽然 后处理一般可能被直接应用于任何编解码器的合成信号,但是本公开引入示意性实施例, 其中后处理被应用于在编码激励线性预测(CELP)编解码器的架构中的激励信号,其被描 述在标题为"Adaptive Multi-Rate - Wideband(AMR-WB) "的、第三代合作伙伴项目(3GPP) 的技术规范(TS) 26. 190中,3GPP网站上可获取该技术规范,且通过引用将其全部内容合并 于此。对激励信号而非合成信号进行工作的优点在于由后处理引入的任何潜在不连续性被 随后应用CELP合成滤波器而平滑掉。 在本公开中,具有12. 8kHz的内采样频率的AMR-WB用于示例目的。然而,本公开 可以应用于其中由通过合成滤波器(例如LP合成(synthesis)滤波器)滤波的激励信号 获得合体的其他低比特速率语音解码器。其也可以应用于其中使用时域和频域激励的组合 对音乐进行编码的多模式编解码器上。下面总结后滤波器的操作。然后是使用AMR-WB的 示意性实施例的详细描述。 首先,与在其公开通过引用合并于此的Jelinek等的、2003年12月11日的 PCT专利公开W02003/102921、Vaillancourt等的、2007年07月05日的PCT专利公开 W02007/073604A1、以及Vaillancourt等名下的、2012年11月01日提交的PCT国际申请 PCT/CA2012/001011 (在下文中为" Vai 1 lancourt ' 011")中公开的类似,对完整比特流进行 解码并且通过第一级分类器处理当前帧合体。出于本公开的目的,该第一级分类器分析帧 并且将非活动(INACTIVE)帧和例如对应于活动非嗓音语音的帧的非嗓音(UNVOICED)帧分 开。使用第二级分类器分析在第一级中没有被分类为非活动帧或非嗓音帧的全部帧。第二 级分类器决定是否应用后处理以及应用到何种程度。当不应用后处理时,仅更新与后处理 有关的存储器。 对于没有被第一级分类器分类为非活动帧或活动非嗓音语音帧的全部帧,使用过 去的解码后的激励、当前帧解码的激励和未来激励的外推形成向量。过去的解码后的激励 和外推的激励的长度相同并且取决于频率变换的期望分辨率。在该示例中,使用的频率变 换的长度是640个样本。使用过去和外推的激励创建向量允许增大频率分辨率。在本示例 中,过去的和外推的激励的长度相同,但是后滤波器不一定需要窗口对称来高效地工作。 然后,使用第二级分类器分析连结的激励(包括过去的解码后的激励、当前帧解 码后的激励和未来激励的外推)的频率表示的能量稳定性,以确定存在音乐的可能性。在 该示例中,在两级处理中进行存在音乐的确定。然而,音乐检测可以以不同方式进行,例如 可能在频率变换之前的单个操作中进行,或甚至在编码器中确定并且在比特流中传送。 与在Vaillancourt'050中类似,通过估计每个频率点(bin)的信噪比(SNR)以及 通过根据其SNR对每一个频率点(bin)应用增益来降低谐波间量化噪声。然而,在本公开 中,与在Vaillancourt' 050中教导的不同地完成噪声能量估计。 然后,使用取回在编码噪声中丢失的信息并且进一步增大频谱的动态的额外处 理。该处理以能量频本文档来自技高网...

【技术保护点】
一种用于降低在由时域解码器解码的时域激励中包含的信号中的量化噪声的装置,包括:转换器,将解码后的时域激励转换为频域激励;掩模构造器,产生用于取回在量化噪声中丢失的频谱信息的加权掩模;修改器,通过应用加权掩模修改频域激励而增大频谱动态;以及转换器,将修改的频域激励转换为修改的时域激励。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:T韦兰考特M杰利内克
申请(专利权)人:沃伊斯亚吉公司
类型:发明
国别省市:加拿大;CA

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利