语音编解码器中用于线频谱频率矢量量化的方法和系统技术方案

技术编号:3046732 阅读:202 留言:0更新日期:2012-04-11 18:40
一种在语音编码器中用于量化LSF矢量的方法,其中将基于先前解码输出值的预测LSF值连同剩余编码本矢量和LSF系数用于估算频谱失真。此方法包括如下步骤:从相应预测LSF值和剩余编码本矢量中得到多个量化LSF系数;以有序的方式对频域中的量化LSF系数重新排列;根据重新排列的量化LSF系数和相应的LSF系数得到频谱失真;并基于频谱失真选择最优码矢量。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术主要涉及语音音频信号的编码,尤其涉及线频谱频域中线性预测系数的量化。
技术介绍
语音音频编码算法在通信、多媒体和存储器系统中具有广泛地应用。在节省传输和存储容量的同时又能维持合成信号的高质量,正是这种需求推动了编码算法的发展。编码器的复杂程度受应用平台的处理能力的限制。在一些应用如语音存储应用中,解码器可以非常复杂而解码器则应尽可能地简单。在典型的语音编码器中,按段对输入语音信号进行处理,这些段称为帧。通常帧的长度为10-30毫秒,后续帧中5-15毫秒的导前段也是可用的。帧还可进一步分为许多子帧。对于每一帧,解码器确定输入信号的参数表示。可将参数量化并通过通信信道传输或以数字形式存储在存储媒体中。在接收端,解码器基于所接收的参数来解释合成信号。目前多个的语音编码器包括线性预测(LP)滤波器用于产生激励信号。L滤波器一般具有如下式给出的全极点结构1A(z)=11+a1z-1+a2z-2+...+apz-p,---(1)]]>其中A(z)为具有非量化LP系数a1、a2、...、ap的逆滤波器,且p是的预测器的阶,通常为8-12。输入语音信号按帧进行处理。对于每个语音帧,编码器利用例如Levinson-Durbin算法(参见“AMR语音编解码器;代码转换功能”3G TS 26.090 v3.1.0(1999-12))确定LP系数。由于线频谱频率(LSF)表示或其它类似的的表示如线频谱对(LSP)、导抗频谱频率(ISF)和导抗频谱对(ISP)等(其中所得的稳定滤波器用阶矢量表示(ordervector)表示)具备良好的量化性能,因此被用于对系数进行量化。对于中间的子帧,可采用LSF表示对系数作线性内插。为定义LSF,用逆LP滤波器A(z)多项式来构造如下两个多项式P(z)=A(z)+z-(p+1)A(z-1),=(1-z-1)κ(1-2z-1cosωi+z-2),·i=2,4,...,p (2)和Q(z)=A(z)-z-(p+1)A(z-1)=(1-z-1)κ(1-2z-1cosωi+z-2),i=1,3,...,p-1. (3)多项式P(z)和Q(z)的根称为LSF系数。这些多项式的所有根均在单位园ejωi上(其中i=1,2,...p)。多项式P(z)和Q(z)有以下特性1)多项式的所有零点(根)均在单位园上;2)多项式P(z)和Q(z)的零点彼此交织。更具体地说,总满足以下关系0=ω0<ω1<ω2<...<ωp-1<ωp<ωp+1=π (4)升序排列确保了语音编码应用中通常要求的滤波稳定性。应当注意,第一个和最后一个参数总是分别为0和π,并且只需传输p的值。当语言编码器中需要高效的表示法用于存储LSF信息,采用矢量量化(VQ)通常再加上预测(参见附图说明图1)来将LSF量化。通常,基于先前解码输出值(AR(自回归)-预测器)或先前的量化值(MA(移动平均)-预测器)来估计预测值。pLSFk=mLSF+Σj=1mAj(qLSFk-j-mLSF)+Σi=1nBiCBk-i---(5)]]>其中,Aj和Bi为预测矩阵,m和n为预测器的阶。pLSFk、qLSFk和CBk分别为预测LSF、量化LSF和第k帧的码本矢量。mLSK为LSF矢量的均值。在计算预测值之后,可以得到量化的LSF值qLSFk=pLSFk+CBk, (6)其中,CBk为第k帧的最优码本项。实际上,当使用预测量化或约束VQ时,所得的qLSFk在转化为LP系数前必须检查其稳定性。只有在直接VQ(非预测、单级、未分裂)的情况下,才可以设计码本以使所得的量化矢量总是顺序的。在现有技术的解决方案中,滤波器的稳定性是在经量化和码本选择后通过对LSF矢量排序而得以保证的。当搜索最优码本矢量时,通常要尝试所有矢量(全搜索)并对每种情况计算一些感觉上重要的质量度量。通常使用的搜索过程的方框图示于图1a。选择最好基于如下的频谱失真SDiSD=1π∫0π[logS(ω)-logS^(ω)]2dω,---(7)]]>其中, 和S(ω)分别是经量化和未经量化的语音帧频谱。因为计算量非常大,所以可使用更简单的方法来替代。通常使用的方法是用(Wk)对LSF误差(rLSFik)加权。例如,使用如下的加权方法(参见“AMR语音编解码器;代码转换功能”3G TS26.090 v3.1.0(1999-12))对于dk<450Hz,Wk=3.347-1.547450dk]]>否则,=1.8-0.81050(450-dk)---(8)]]>其中,dk=LSFk+1-LSFk-1,其中LSF0=0Hz和LSF11=4000Hz。这种失真测量基本上取决于LSF频率间的距离。LSF彼此间越接近,它们所得的权重就越大。感觉上,这意味着对共振峰区域的量化更为精确。根据失真值,将对应最小失真值的码本矢量选作最佳码本索引。通常,判据为mini{SDi}=Σk=1p(LSFk-pLSFk-CBki)2Wk2,---(9)]]>正如从图1a中可看到,首先在求和部件12中确定目标LSF的系数LSFk和相应的预测LSF系数pLSFk之差,进而在另一个求和部件14中用第j个码本项的相应的剩余码本矢量CBj1k来调整该差值。式9可简化为min{SDi}=Σk=1p(LSFk-qLSFki)2Wk2,---(10)]]>进而可简化为mini{SDi}=Σk=1p(rLSFki)2Wk2---(11)]]>在如图1b所示的解码器中可较容易地看出式10和11所示的简化步骤。如图1b所示,求和部件16用于计算量化的LSF系数。随后,由求和部件18根据量化的LSF系数和目标LSF系数来计算LSF误差。如果量化的LSF系数qLSFik没有关于k按升序排列,那么现有技术的解决方案不一定能找到最佳码本索引。图2a-2e说明这种问题。为简单起见,仅显示了前3个LSF系数(k=1,2,3)。但是,简化的示范足以表示分裂矢量量化(split VQ)情况下相当常见的第一分裂(split)。目标LSF矢量用LSF1...LSF3来标记,并且还显示了基于先前帧的LSF的预测值(pLSF1...pLSF3)。如图2a所示,一些预测值大于相应的目标矢量,而一些则较小。在矢量量化器剩余码本中的第一个码本项看起来像码本矢量,如图2b所示。利用qLSF11-3=pLSF1-3+CB11-3,计算量化LSF系数并将其示于图2c中。为简单起见,未使用加权,即Wk=1,这样,频谱失真直接与目标值和量化值(量化的LSF系数)之间距离的平方或绝对值成比例。目标值和量化值之间的距离为qLSFik,因此第一分裂的总失真为SD1=Σk=13SDk1.---(12)]]>第二码本项(未示出)可以生成如图2d所示的量化LSF矢量(qLSF21-3)和频谱失真(SD21-3)。当将图2d与图2c相比时,所得的qLSF矢量大不相同,但是总的失真几乎相同,即(S本文档来自技高网...

【技术保护点】
一种在语音编码器中用于量化频谱参数矢量的方法,其中,线性预测滤波器用于计算频域中的多个频谱参数系数,其中,将多个基于先前解码输出值的预测频谱参数值和多个剩余码本矢量以及所述多个频谱参数系数用于估算频谱失真,以便基于所述频谱失真选择最优码矢量,所述方法包括以下步骤:     从所述相应预测频谱参数值和所述剩余码本矢量中得到多个量化频谱参数系数;    对所述频域中的量化频谱参数系数按有序方式重新排列;和    从所述重新排列的量化频谱参数系数和相应的频谱参数系数中得到频谱失真。

【技术特征摘要】
【国外来华专利技术】US 2001-5-16 09/859,2251.一种在语音编码器中用于量化频谱参数矢量的方法,其中,线性预测滤波器用于计算频域中的多个频谱参数系数,其中,将多个基于先前解码输出值的预测频谱参数值和多个剩余码本矢量以及所述多个频谱参数系数用于估算频谱失真,以便基于所述频谱失真选择最优码矢量,所述方法包括以下步骤从所述相应预测频谱参数值和所述剩余码本矢量中得到多个量化频谱参数系数;对所述频域中的量化频谱参数系数按有序方式重新排列;和从所述重新排列的量化频谱参数系数和相应的频谱参数系数中得到频谱失真。2.如权利要求1所述的方法,其特征在于,根据表示每个所述重新排列的量化频谱参数系数和所述相应的频谱参数系数之差的误差来计算所述频谱失真。3.如权利要求2所述的方法,其特征还在于,在根据所述频谱参数系数得到所述频谱失真之前对所述误差加权。4.如权利要求1所述的方法,其特征在于,对所述量化频谱参数系数的重新排列是在单分裂中进行的。5.如权利要求1所述的方法,其特征在于,对所述量化频谱参数系数的重新排列是在多分裂中进行的,并且根据每一分裂中的所述频谱失真选择最优码矢量。6.如权利要求1所述的方法,其特征在于,所述频谱参数包括线频谱参数。7.如权利要求1所述的方法,其特征在于,所述频谱参数包括线频谱对。8.如权利要求1所述的方法,其特征在于,所述频谱参数包括导抗频谱频率。9.如权利要求1所述的方法,其特征在于,所述频谱参数包括导抗频谱对。10.如权利要求1所述的方法,其特征在于,所述重新排列的步骤是在单级中进行的。11.如权利要求1所述的方法,其特征在于,对所述量化频谱参数系数的重新排列是在最优码矢量选择的多级之一中完成的,所述一些级是预先确定的并且所述最优码矢量选择基于所述一些级中的所述频谱失真。12.如权利要求1所述的方法,其特征在于,所述量化频谱参数系数的重新排列是在最优码矢量选择的多级中的某些级中进行的,其中,所述某些级是预先确定的并且所述最优码矢量选择基于所述某些级中的所述频谱失真。13.如权利要求1所述的方法,其特征在于,所述量化频谱参数系数的重新排列是在最优码矢量选择的多级中进行的,所述多级是预先确定的并且所述最优码矢量选择基于所述多级中的所述频谱失真。14.如权利要求1所述的方法,其特征在于,所述量化频谱参数系数的重新排列是作为针对最优矢量选择所用的一定数量的预选矢量的优化级来进行的,所述最优矢量选择基于所述预选矢量。15.一种在语音编码器中用于量化频谱参数矢量的装置,其中,将线性预测滤波器用于计算频域中的多个频谱参数系数,并且将基于先前解码输出值的多个预测频谱参数值、多个剩余码本矢量和所述多个频谱参数系数用于估算频谱失真并根据所述频谱失真选择最优码矢量,所述装置包括用于从所述相应的预测频谱参数值和所述剩余码本矢量得到多个量化频谱参数系数以便提供表示所述量...

【专利技术属性】
技术研发人员:A雷莫
申请(专利权)人:诺基亚有限公司
类型:发明
国别省市:FI[芬兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1