用于降低时域解码器中的量化噪声的装置和方法制造方法及图纸

技术编号:24211711 阅读:59 留言:0更新日期:2020-05-20 17:10
本公开涉及一种用于降低在由时域解码器解码的时域激励中包含的声音信号中的量化噪声的装置和方法。基于解码后的时域激励,评估未来的帧的时域激励。连结解码后的时域激励和未来的帧的外推的时域激励,以形成连结的时域激励。连结的时域激励被转换为频域激励。产生加权掩模用于取回在量化噪声中丢失的频谱信息。通过应用加权掩模修改频域激励以增大频谱动态。修改的频域激励被转换为修改的时域激励。其中修改的频域激励到修改的时域激励的转换是无延迟的。所述方法和装置可以用于改进基于线性预测的编解码器的音乐内容呈现。

Device and method for reducing quantization noise in time domain decoder

【技术实现步骤摘要】
用于降低时域解码器中的量化噪声的装置和方法本申请是2014年1月9日提交的申请号为201480010636.2的专利技术专利申请“用于降低时域解码器中的量化噪声的装置和方法”的分案申请。
本公开涉及声音处理领域,更具体地,本公开涉及降低声音信号中的量化噪声。
技术介绍
现有技术的传统编解码器在大约8kbps的比特速率处表现出质量非常良好的干净语音信号,并且在16kbps的比特速率处接近透明。为了在低比特速率处维持该高语音质量,通常使用多模编码方案。通常输入信号被分为反映其特性的不同类别。不同类别包括例如嗓音语音(voicedspeech)、非嗓音语音(unvoicedspeech)、嗓音进攻(voicedonset)等。编解码器随后使用针对这些类别优化的不同编码模式。基于语音模式的编解码器通常不能很好地呈现(render)例如音乐的通常音频信号。因此,一些部署的语音编解码器不能高质量地表示音乐,尤其在低比特速率处。当部署编解码器时,由于比特流被标准化并且对比特流的任何修改将打破编解码器的互操作性的事实,难以修改编码器。因此,存在改进基于语音模式的编解码器(例如基于线性预测(LP)编解码器)的音乐内容呈现的需要。
技术实现思路
根据本公开,提供一种用于降低在由时域解码器解码的时域激励中包含的声音信号中的量化噪声的装置。所述装置包括激励外推器,基于解码后的时域激励,评估未来的帧的时域激励。所述装置还包括激励连结器,连结解码后的时域激励和未来的帧的外推的时域激励,以形成连结的时域激励。所述装置还包括将连结的时域激励转换为频域激励的转换器。还包括产生用于取回在量化噪声中丢失的频谱信息的加权掩模的掩模构造器。所述装置还包括频域激励的修改器,通过应用加权掩模增大频谱动态。所述装置还包括将修改的频域激励转换为修改的时域激励的转换器。其中,修改的频域激励到修改的时域激励的转换是无延迟的。本公开还涉及一种用于降低在由时域解码器解码的时域激励中包含的声音信号中的量化噪声方法。基于解码后的时域激励,评估未来的帧的时域激励。连结解码后的时域激励和未来的帧的时域激励,以形成连结的时域激励。连结的时域激励被时域解码器转换为频域激励。产生加权掩模用于取回在量化噪声中丢失的频谱信息。通过应用加权掩模修改频域激励以增大频谱动态。修改的频域激励被转换为修改的时域激励。其中,修改的频域激励到修改的时域激励的转换是无延迟的。上述和其他特征在阅读下列参考附图仅通过示例给出的其示意性实施例的非限制性描述时变得更加清楚。附图说明将参考附图仅通过示例描述本公开的实施例,其中:图1是示出根据实施例的用于降低在由时域解码器解码的时域激励中包含的信号中的量化噪声的方法的操作的流程图;图2A和2B(统称为图2)是具有用于降低音乐信号和其他声音信号中的量化噪声的频域后处理能力的解码器的简化示意图;以及图3是形成图2的解码器的硬件组件的示例配置的简化框图。具体实施方式本公开的各种方面一般通过降低音乐信号中的量化噪声来解决改进基于语音模式的编解码器(例如基于线性预测(LP)的编解码器)的音乐内容呈现的问题中的一个或多个。应记住的是本公开的教导也可以应用于其他声音信号,例如除了音乐之外的通用音频信号。对解码器的修改可以改进接收器侧的感知质量。本公开公开一种在解码器侧实现用于音乐信号和其他声音信号的频域后处理,其降低解码后的合体(synthesis)的频谱中的量化噪声的。后处理可以在没有任何额外的编码延迟的情况下实现。这里使用的频谱谐波之间的量化噪声的频域移除和频域后处理的原理基于Vaillancourt等的、2009年09月11日的PCT专利公布WO2009/109050A1(在下文中为“Vaillancourt’050”),其公开通过引用合并于此。一般地,对解码后的合体应用这种频域后处理,并且这种频域后处理需要增加处理延迟以便包括重叠并且增加处理以得到显著的质量增益。此外,使用传统频域后处理能力,由于有限的频率分辨率,增加的延迟越短(即变换窗口越短),后处理效果越差。根据本公开,频域后处理实现更高的频率分辨率(使用更长的频率变换),而不对合体增加延迟。此外,利用过去帧频率能量中存在的信息来创建应用于当前帧频谱的加权掩模,以取回,即增强,在编码噪声中丢失的频谱信息。为了在不对合体增加延迟的情况下实现该后处理,在该示例中,使用对称的梯形窗口。其中心在窗口是平的(flat)的当前帧(其具有值为1的固定值),并且外推被用于创建未来信号。虽然后处理一般可能被直接应用于任何编解码器的合成信号,但是本公开引入示意性实施例,其中后处理被应用于在编码激励线性预测(CELP)编解码器的架构中的激励信号,其被描述在标题为“AdaptiveMulti-Rate–Wideband(AMR-WB)”的、第三代合作伙伴项目(3GPP)的技术规范(TS)26.190中,3GPP网站上可获取该技术规范,且通过引用将其全部内容合并于此。对激励信号而非合成信号进行工作的优点在于由后处理引入的任何潜在不连续性被随后应用CELP合成滤波器而平滑掉。在本公开中,具有12.8kHz的内采样频率的AMR-WB用于示例目的。然而,本公开可以应用于其中由通过合成滤波器(例如LP合成(synthesis)滤波器)滤波的激励信号获得合体的其他低比特速率语音解码器。其也可以应用于其中使用时域和频域激励的组合对音乐进行编码的多模式编解码器上。下面总结后滤波器的操作。然后是使用AMR-WB的示意性实施例的详细描述。首先,与在其公开通过引用合并于此的Jelinek等的、2003年12月11日的PCT专利公开WO2003/102921、Vaillancourt等的、2007年07月05日的PCT专利公开WO2007/073604A1、以及Vaillancourt等名下的、2012年11月01日提交的PCT国际申请PCT/CA2012/001011(在下文中为“Vaillancourt’011”)中公开的类似,对完整比特流进行解码并且通过第一级分类器处理当前帧合体。出于本公开的目的,该第一级分类器分析帧并且将非活动(INACTIVE)帧和例如对应于活动非嗓音语音的帧的非嗓音(UNVOICED)帧分开。使用第二级分类器分析在第一级中没有被分类为非活动帧或非嗓音帧的全部帧。第二级分类器决定是否应用后处理以及应用到何种程度。当不应用后处理时,仅更新与后处理有关的存储器。对于没有被第一级分类器分类为非活动帧或活动非嗓音语音帧的全部帧,使用过去的解码后的激励、当前帧解码的激励和未来激励的外推形成向量。过去的解码后的激励和外推的激励的长度相同并且取决于频率变换的期望分辨率。在该示例中,使用的频率变换的长度是640个样本。使用过去和外推的激励创建向量允许增大频率分辨率。在本示例中,过去的和外推的激励的长度相同,但是后滤波器不一定需要窗口对称来高效地工作。然后,使用第二级分类器分析连结的激励(包括过去的解码后的本文档来自技高网...

【技术保护点】
1.一种用于降低在由时域解码器解码的时域激励中包含的声音信号中的量化噪声的装置,包括:/n激励外推器,基于解码后的时域激励,评估未来的帧的时域激励;/n激励连结器,连结解码后的时域激励和未来的帧的外推的时域激励,以形成连结的时域激励;/n转换器,将连结的时域激励转换为频域激励;/n掩模构造器,产生用于取回在量化噪声中丢失的频谱信息的加权掩模;/n修改器,通过应用加权掩模修改频域激励而增大频谱动态;以及/n转换器,将修改的频域激励转换为修改的时域激励;/n其中修改的频域激励到修改的时域激励的转换是无延迟的。/n

【技术特征摘要】
20130304 US 61/772,0371.一种用于降低在由时域解码器解码的时域激励中包含的声音信号中的量化噪声的装置,包括:
激励外推器,基于解码后的时域激励,评估未来的帧的时域激励;
激励连结器,连结解码后的时域激励和未来的帧的外推的时域激励,以形成连结的时域激励;
转换器,将连结的时域激励转换为频域激励;
掩模构造器,产生用于取回在量化噪声中丢失的频谱信息的加权掩模;
修改器,通过应用加权掩模修改频域激励而增大频谱动态;以及
转换器,将修改的频域激励转换为修改的时域激励;
其中修改的频域激励到修改的时域激励的转换是无延迟的。


2.如权利要求1所述的装置,包括:
分类器,将解码后的时域激励的合体分类为第一组激励类别和第二组激励类别之一;
其中,第二组激励类别包括非活动或非嗓音类别,并且第一组激励类别包括非活动或非嗓音类别以外的其他类别。


3.如权利要求2所述的装置,其中当解码后的时域激励的合体被分类为第一组激励类别时,应用将连结的时域激励转换为频域激励的转换器。


4.如权利要求2所述的装置,其中将解码后的时域激励的合体分类为第一组激励类别和第二组激励类别之一的分类器使用从编码器向时域解码器发送且在时域解码器处从解码后的比特流取回的分类信息。


5.如权利要求2所述的装置,包括第一合成滤波器,产生修改后的时域激励的合体。


6.如权利要求5所述的装置,包括第二合成滤波器,产生解码后的时域激励的合体。


7.如权利要求5或6所述的装置,包括去加重滤波器和重新采样器,从解码后的时域激励的合体和修改的时域激励的合体中的一个生成声音信号。


8.如权利要求5或6所述的装置,包括两级分类器,用于将输出合体选择为:
当解码后的时域激励的合体被分类为第二组激励类别时,解码后的时域激励的合体;以及
当解码后的时域激励的合体被分类为第一组激励类别时,修改的时域激励的合体。


9.如权利要求1所述的装置,包括频域激励的分析器,确定频域激励是否包含音乐。


10.如权利要求9所述的装置,其中频域激励的分析器通过比较频域激励...

【专利技术属性】
技术研发人员:T韦兰考特M杰利内克
申请(专利权)人:沃伊斯亚吉公司
类型:发明
国别省市:加拿大;CA

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1