AMR语音编码中LSP系数量化的快速码本搜索的方法技术

技术编号:4179923 阅读:406 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种AMR语音编码中LSP系数量化的快速码本搜索的方法,包括在以加权欧氏距离作为失真测度的计算过程中,其中间结果不断的与已有最小距离做比较,如果这个结果已经大于该最小距离,则可终止对该码字距离的继续计算,从而可以尽快地筛选掉那些已经不符合要求的码字。采用该种AMR语音编码中LSP系数量化的快速码本搜索的方法,在计算加权欧氏距离时每次计算加权和后均进行判断,从而避免了大量的不必要的冗余计算,在没有任何性能损失的前提下,降低了计算复杂度,提高了系统的执行效率,较好地满足了实时语音处理的性能和效率需要,同时工作性能稳定可靠,适用范围较为广泛,为AMR技术应用于第三代移动通信中奠定了坚实的基础。

【技术实现步骤摘要】

本专利技术涉及移动通信
,特别涉及语音编码
,具体是指自适应多速率 (AMR)语音编码中LSP系数量化的快速码本搜索的方法。
技术介绍
自适应多速率(AMR)语音编码是由3GPP制定的应用于第三代移动通信WCDMA系统 中的语音压缩编码。它以更加智能的方式解决信源和信道编码的速率分配问题。使得无线资 源的配备和利用更加和高效。它支持八种速率12.2kb/s, 10.2kb/s, 7.95 kb/s, 7.40 kb/s, 6.70 kb/s, 5.90kb/s, 5.15 kb/s和4.75 kb/s,此外,它还包括低速率(1.80 kb/s )的背景噪声编码 模式。AMR语音编码采用的方案是代数码本激励线性预测(ACELP)技术,它是基于码本激 励线性预测(CELP)的技术。编码器输入为8kHz采样,16比特量化的线性PCM编码,编 码操作以20ms语音为一帧,即160个样点。发送端编码器提取ACELP模型参数进行传输, 接收端译码器再根据这些参数构成的激励信号合成出重建的语音信号。AMR语音编码根据其实现功能大致可分为LPC分析、基音搜索、代数码本搜索三大部 分。其中LPC分析完成的主要功能是获得10阶LPC滤波器的10个系数,并将它们转化为 线谱对参数LSF,以及对LSF进行量化;基音搜索包括了开环基音分析和闭环基音分析两部 分,以获得基音延迟和基音增益这两个参数;代数码本搜索则是为了获得代数码本索引和代 数码本增益,还包括了对码本增益的量化。这里我们所讨论的是编码器中LSP系数的量化, 因此,对于编码器和译码器的其他部分不做过多的介绍。线性预测分析在12.2 kb/s模式下每帧分析两次,得到了两组线性预测参数,在其他七种 模式下每帧分析一次,得到了 一组线性预测参数。线性预测参数在编码前都要转化为线谱对 参数,在12.2 kb/s模式下采用分裂矩阵量化法(SMQ, Split Matatrix Quantization)进行量化; 在其他七种模式下采用分裂矢量法(SVQ, Split Vector Quantization )进行量化。下面以12.2 kb/s 模式所采用的分裂矩阵量化法(SMQ)进行详细的介绍分裂矩阵量化法(SMQ)的基本依据是每一个频率分量对幅度i普的影响仅限于各自的频率区域内。其基本思路是将特征矢量这个io维的矢量分成几个小矢量,然后分别对每一个小矢量再进行矢量量化。具体量化过程介绍如下首先,将每一帧得到的两组线谙对(LSP)参数用频率域(LSF)表示为/ = larccos《,, / = 1,2,',、10 2;r(1)其中,/ e Hz是线谱对频率,/、 = 8000Hz是采样频率,则LSF系数的矢量可表示为fd^b;(')/2(')…y;(。')j, f(2) = b;(2)/2(2)'..y;(02)j。其次,求出当前帧去掉均值后的LSF矢量和z(2)("):1 10(i),(2)f(2)(")_,2)1,2,…,10(2)其中,f,")和f,")是当前帧LSF矢量,/(1)和,(2)是当前帧LSF矢量的第/(/ = 1,2,...,10) 个值,这里矢量与均值的差是指矢量中的每一个值分别与均值相减后的值构成的一个新矢量。 然后,用一阶滑动平均(MA)预测法求出当前帧的LSF预测残差矢量rW(")和r^("):! (')(")= Z(')(")-p(")"2)(") = z(2)(")-p(")(3)其中,rW( ) = k(、(". .{J , r(2)( ) = k(2V2(".. .r/。2)j; —阶滑动平均(MA )预测式"2) A(2)p(") = 0.65r (n-l)是当前帧LSF矢量的预测值,这里的r ("-l)是前一帧量化后的第二个 LSF残差矢量。接着,将上述计算所得的LSF残差矢量一(")和r^(w)组成的矩阵进行分裂,并进行矢量 量化。也就是将矩阵",用8 +1比特(1比特是附加符号位)进行量化;第四个子阵为 wV^^W2)^)]7,用8比特进行量化;第五个子阵为s—r^^V^9(2、(。2)]1,用6比特进行量化。这5个子阵的量化矢量^^,r称为重构矢量或量化码本。最后,分别将5个子阵(子矢量)与其量化矢量(重构矢量)r以欧氏距离作 为失真测度(使下式的加权误差最小),即、W、,("')2广1(4)、("其中,^V,是指第X/ = 1,2,3,4,5)个子阵(子矢量)的第= 1,2,3,4)个元素,w~ 。是指第X/ = 1,2,3,4,5)个量化矢量表的第&(^ = 0,1,…,W) (N的取值对应于5个量化矢量,分别为127, 255, 255, 255, 63 )个索引号的第/(z'= 1,2,3,4)个元素,w,("')(/= 1,2,…,10,w = 1或2(子矢量的前两个元素对应于附=1,后两个元素对应于附=2 ))是加权LSP失真检测因子, 其表达式为<formula>formula see original document page 6</formula>其中,《W = yJ;') —yj) ( /)— = 0, = 4000 )。根据欧氏失真测度,通常采用全搜索 方法就可以找到失真最小的重构矢量,将其索引号A作为输出,完成LSF矢量的量化。这里,以第一个子阵为例来说明量化过程将第一个子阵(子矢量)= [^Vj'V,Vff与《^ r (码 本中所有索引号的量化矢量的值)以式(4)作为失真测度进行计算(全搜索),求出失真最 小的量化矢量(重构矢量),将其索引号A用7比特编码作为量化输出。从上面的分析可以看出,全搜索方法是性能最优的一种方法,当然也是复杂度最高的一 种方法。这里我们仍以第一个子阵的量化为例,来分析其计算复杂度。由(4)式可得,每计 算出一个五,需要4次加法和8次乘法。对于第一个子阵,其码本空间大小为127,即要计 算出127个五,也就是127x4- 508次加法和127x8二1016次乘法。虽然,目前数字信号处理 器(DSP)技术已经有了突飞猛进的发展,但在实时语音处理过程中,过多的使用全搜索的 方法仍然不是一个明智的选择。因此需要寻找在性能没有任何损失的情况下能降低计算复杂 度的方法。
技术实现思路
本专利技术的目的是克服了上述现有技术中的缺点,提供一种能够有效降低计算复杂度、提 高运算效率、算法筒单快捷、工作性能稳定可靠、适用范围较为广泛的AMR语音编码中LSP系数量化的快速码本:l叟索的方法。为了实现上述的目的,本专利技术的AMR语音编码中LSP系数量化的快速码本搜索的方法 如下为了便于描述,这里定义加权欧氏子距离为<formula>formula see original document page 7</formula>实际计算时,加权欧氏子距离采用下面的迭代公式:<formula>formula see original document page 7</formula>显然,£4=£,即当"=4日于,加权欧氏子距离即为最终的加权欧氏距离。 该AMR语音编码中LSP系数量化的快速码本搜索的方本文档来自技高网
...

【技术保护点】
一种AMR语音编码中LSP系数量化的快速码本搜索的方法,其特征在于,所述的方法包括以下步骤: (1)初始化设置系统输出的量化码字索引号、当前最小欧氏距离及系统码本中的当前量化码字索引号; (2)将系统累加计数设置为1; ( 3)系统在当前量化码字索引号下,根据语音信号中频率分量的特征矢量所分裂的子矢量与当前量化码字索引号所对应的重构矢量进行加权欧氏子距离计算处理,并将计算结果作为失真测度,与当前最小欧氏距离进行比较处理操作; (4)如果所述的加权欧氏子距 离小于当前最小欧氏距离,则将系统累加计数增加1,并重复上述步骤(3),即根据语音信号中频率分量的特征矢量所分裂的子矢量与当前量化码字索引号所对应的重构矢量进行加权欧氏子距离计算处理,并将计算结果作为失真测度,与当前最小欧氏距离进行比较处理操作; (5)反之,则将当前量化码字索引号增加1,并重复上述步骤(2); (6)如果当系统累加计数为4时,加权欧氏子距离仍然小于当前最小欧氏距离,则将系统中的当前最小欧氏距离设置为该加权欧氏距离,并将系统输出的量化码字索引号设置为 当前量化码字索引号; (7)将当前量化码字索引号增加1,重复上述步骤(2),直到遍历完系统码本中全部量化码字。...

【技术特征摘要】

【专利技术属性】
技术研发人员:薛奕冰许大山
申请(专利权)人:上海摩波彼克半导体有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1