自适应编码浊音语音的基音周期制造技术

技术编号:10857588 阅读:116 留言:0更新日期:2015-01-01 08:58
本发明专利技术提供了用于双重模式基音周期编码的系统和方法实施例。所述系统和方法实施例用于根据基音周期长度、稳定性或两者使用一个或两个基音周期编码模式对浊音语音信号的基音周期进行自适应编码。所述两种基音周期编码模式包括具有相对较高的精确度和较小的动态范围的第一基音周期编码模式以及具有相对较大的基音周期动态范围和较低的精确度的第二基音周期编码模式。在确定所述浊音语音信号具有相对较短或相当稳定的基音周期之后,使用所述第一基音周期编码模式。在确定所述浊音语音信号具有相对较长或稳定性较差的基音周期或是相当嘈杂的信号之后,使用所述第二基音周期编码模式。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本专利技术提供了用于双重模式基音周期编码的系统和方法实施例。所述系统和方法实施例用于根据基音周期长度、稳定性或两者使用一个或两个基音周期编码模式对浊音语音信号的基音周期进行自适应编码。所述两种基音周期编码模式包括具有相对较高的精确度和较小的动态范围的第一基音周期编码模式以及具有相对较大的基音周期动态范围和较低的精确度的第二基音周期编码模式。在确定所述浊音语音信号具有相对较短或相当稳定的基音周期之后,使用所述第一基音周期编码模式。在确定所述浊音语音信号具有相对较长或稳定性较差的基音周期或是相当嘈杂的信号之后,使用所述第二基音周期编码模式。【专利说明】自适应编码浊音语音的基音周期 本专利技术要求2012年12月21日递交的专利技术名称为"自适应编码浊音语音的基音 周期(Adaptively Encoding Pitch Lag For Voiced Speech)" 的第 13/724700 号美国 非临时专利申请案的在先申请优先权,该在先申请案要求2011年12月21日递交的专利技术 名称为"自适应编码池音语音的基音周期(Adaptively Encoding Pitch Lag For Voiced Speech) "的第61/578391号美国临时专利申请案的在先申请优先权,以上在先申请的内容 以引入的方式并入本文本中
本专利技术大体涉及信号编码领域,且在特定实施例中,涉及一种用于对浊音语音的 基音周期进行编码的系统和方法。
技术介绍
传统来讲,参数化语音编码方法都是利用语音信号本身的冗余,来减少待发送的 信息量,并估算一个信号的语音样本在短时段内的参数。这种冗余起因于语音波形周期性 的重复和语音信号的频谱包络慢变过程。不同形式的语音波形的冗余对应于不同类型的语 音信号,例如浊音和清音。就浊音语音而言,语音信号基本上是周期性的。然而,这种周期 性在语音段中是变化的,而且周期波形在语音段之间缓慢变化。低比特率的语音编码可以 很大地受益于这种周期性。浊音语音周期还称为基音周期,这种基音周期预测通常被命名 为长期预测(LTP)。至于清音,其信号更像是一个随机噪声,可预测性也较小。
技术实现思路
根据实施例,一种由语音/音频编码装置实施的双重模式基音周期编码方法包 括,根据基音周期长度、稳定性或两者,使用两种基音周期编码模式中的一种对一个浊音语 音信号中一帧的多个子帧的基音周期进行编码。所述两种基音周期编码模式包括第一种基 音周期编码模式和第二种基音周期编码模式,其中第一种基音周期编码模式具有相对较高 的基音周期编码精确度和较小的动态范围,而第二种基音周期编码模式具有相对较大的基 音周期动态范围和较低的编码精确度。 根据另一实施例,一种由语音/音频编码装置实施的双重模式基音周期编码的方 法包括,确定一个浊音语音信号是否具有相对较短的基音周期和相当稳定的基音周期中的 一个或者具有相对较长的基音周期和相对稳定性较差的基音周期中的一个或者是一个相 当嘈杂的信号。所述方法进一步包括,在确定所述浊音语音信号具有相对较短的或相当稳 定的基音周期之后,对所述具有相对较高的基音周期精确度和较小的动态范围的浊音语音 信号的基音周期进行编码,或者在确定所述浊音语音信号具有相对较长的或稳定性较差的 基音周期或者是一个相当嘈杂的信号之后,对所述具有相对较大的基音周期动态范围和较 低的精确度的浊音语音信号的基音周期进行编码。 在又一实施例中,一种支持双重模式基音周期编码的装置,包括一个处理器和一 个存储由所述处理器执行的程序的计算机可读存储介质。所述程序包括多个指令,以确定 浊音语音信号是否具有相对较短的基音周期和相当稳定的基音周期中的一个或者具有相 对较长的基音周期和相对稳定性较差的基音周期中的一个或者是否是一个相对嘈杂的信 号;以及在确定所述浊音语音信号具有相对较短的或相当稳定的基音周期之后,对具有相 对较高的精确度和较小的动态范围的浊音语音信号的基音周期进行编码;或在确定所述浊 音语音信号具有相对较长的或稳定性较差的基音周期或者是相对嘈杂的信号之后,对具有 相对较大的动态范围和较低的精确度的浊音语音信号的基音周期进行编码。 【专利附图】【附图说明】 为了更完整地理解本专利技术及其优点,现在参考以下结合附图进行的描述,其中: 图1是码激励线性预测技术(CELP)编码器的方框图。 图2是对应于图1中的CELP编码器的解码器的方框图。 图3是另一具有自适应分量的CELP编码器的方框图。 图4是另一对应于图3中的CELP编码器的解码器的方框图。 图5是基音周期小于子帧大小和半帧大小的浊音语音信号的示例。 图6是基音周期大于子帧大小而小于半帧大小的浊音语音信号的示例。 图7示出了浊音语音信号的频谱的示例。 图8示出了图7中的经过双倍基音周期编码的相同信号的频谱的示例。 图9示出了用于对浊音语音的基音周期进行双重模式的自适应编码的实施例方 法。 图10是可用于实施各种实施例的处理系统的方框图。 【具体实施方式】 下文将详细论述当前优选实施例的制作和使用。然而,应了解,本专利技术提供可在各 种具体上下文中体现的许多适用的专利技术性概念。所论述的具体实施例仅仅说明用以实施和 使用本专利技术的具体方式,而不限制本专利技术的范围。 针对浊音或清音,参数编码通过分割频谱包络分量和语音信号的激励分量来减 少语音段的冗余。频谱包络慢变过程可以被描述成线性预测编码(LPC),也称为短期预测 (STP)。低比特率的语音编码也同样受益于短期预测。这种编码的优点就来自于参数的慢 速变化。进一步地,语音信号参数值可能不会在几毫秒内有很大不同。在8千赫兹(kHz)、 12. 8kHz或16kHz采样率时,语音编码算法将10毫秒至30毫秒范围内的语音段作为常用 的帧长。而20毫秒是最常用的帧长。在G. 723. 1、G. 729、G. 718、EFR、SMV、AMR、VMR-WB或 AMR-WB等较近期的知名国际标准中已经采用了码激励线性预测技术(CELP)。CELP是一种 编码激励、长期预测和短期预测技术的结合。尽管不同编解码器的CELP细节可能显著不 同,但利用CELP的语音编码算法在语音压缩领域已经相当流行。 图1示出了 CELP编码器100的示例,其中利用综合分析方法可以最小化合成语音 信号102和原始语音信号101之间的加权误差109。CELP编码器100执行不同的操作或功 能。对应的函数W(z)通过误差加权滤波器110实现。函数1/B(z)通过长期线性预测滤波 器105实现。函数1/A(z)通过短期线性预测滤波器103实现。来自编码激励块108的编 码激励107,也称为固化码本激励,在通过随后滤波器之前乘以增益GJ06调节。短期线性 预测滤波器103通过分析原始信号101实施并由一组系数表示: 【权利要求】1. 一种由语音或音频编码装置实施的双重模式基音周期编码的方法,其特征在于,所 述方法包括: 根据基音周期长度、稳定性或两者,使用两种基音周期编码模式中的一种对一个浊音 语音信号中一帧的多个子帧的基音周期进行编码,其中所述两种基音周期编码模式包括第 一种本文档来自技高网
...

【技术保护点】
一种由语音或音频编码装置实施的双重模式基音周期编码的方法,其特征在于,所述方法包括:根据基音周期长度、稳定性或两者,使用两种基音周期编码模式中的一种对一个浊音语音信号中一帧的多个子帧的基音周期进行编码,其中所述两种基音周期编码模式包括第一种基音周期编码模式和第二种基音周期编码模式,所述第一种基音周期编码模式具有相对较高的基音周期编码精确度和较小的动态范围,所述第二种基音周期编码模式具有相对较大的基音周期动态范围和较低的精确度。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:高阳
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1