语音编码制造技术

技术编号:3047431 阅读:187 留言:0更新日期:2012-04-11 18:40
可变比特率语音编码方法为每个子帧确定一个量化矢量d(i),该矢量包括数量可变的脉冲。用于激励LTP和LPC合成滤波器的激励矢量c(i)是通过对量化矢量d(i)进行滤波得到的,增益值g↓[c]被确定以用于缩放脉冲幅度激励矢量c(i),使得缩放后的激励矢量表示加权后的残留信号*,该信号在通过LPC和LTP分析除去子帧语音信号中的冗余信息之后仍然保留在该子帧语音信号中。预测的增益值*是根据以前处理的子帧确定的,并且当依据量化矢量d(i)中的脉冲数m对矢量残留信号c(i)的幅度进行缩放时,*为包含于激励矢量c(i)中的能量E↓[c]的函数。量化后的增益校正因子γg↓[c]可以利用增益值g↓[c]和预测增益值*确定。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及语音编码,更具体地,涉及在包含数字化语音样本的离散时间帧中对语音信号编码,但是本专利技术特别适用于,尽管是不必要的,变长比特语音编码。在欧洲,被接受的数字蜂窝电话的标准以字首GSM而闻名(用于移动通讯的全球系统),最近版本的GSM标准(GSM2;06.60)导致已知为增强全速率(EFR)的新语音编码算法(或编解码器)的细则。如传统的语音编解码器那样,EFR被设计为降低个体声音或数据通讯所需的比特率。通过最小化该比特率,可以复用到给定信号带宽的独立呼叫数可以增加。类似于EFR中使用的语音编码器结构的通常的图解说明在图l中给出。采样后的语音信号被分成20毫秒的帧x,每个包含160个样本。每个样本由16个比特表示。通过首先将样本帧应用于线性预测编码器(LPC1),这些样本帧被编码,其中的线性预测编码器为每个帧产生一组LPC系数a.这些系数代表帧中的短时冗余。来自LPC1的输出包括LPC系数a和残余信号γ1,该信号是通过LPC分析滤波器从输入语音帧中除去短时冗余而产生的。然后,残留信号被提供给长时预测器(LPT)2,它产生一组表示残留信号γ1中长时冗余的LTP参数b,并且还产生长时冗余被除去的残留信号s。实际上,长时预测分两个阶段,(1)首先为整个帧进行开环估计得到一组LTP参数;(2)其次对估计所得的参数进行闭环精确化以便为该帧的每个40样本子帧产生一组LTP参数。LTP2提供的残留信号s依次通过滤波器1/A(z)和W(z)而被滤波(以图l中的方框2a给出)以给出加权后的残留信号s~]]>。这些滤波器中的第一个是LPC合成滤波器,而第二个是强调谱中的共振峰结构的感知加权滤波器.所有滤波器的参数是由LPC分析阶段给出的(块1)。代数激励码书3被用于产生激励矢量c。对于每个40样本子帧(每帧有4个子帧),通过缩放单元4,一些不同的“候选”激励矢量依次被施加给LTP合成滤波器5。滤波器5接受当前子帧的LTP参数,并且在激励矢量中引入LTP参数预测的长时冗余。所产生的信号然后被提供给LPC合成滤波器6,该滤波器接收连续帧的LPC系数。对于给定的子帧,利用帧到帧的内插会产生一组LPC系数,所产生的系数依次应用于产生合成信号ss。附图说明图1的编码器不同于以前的码激励线性预测(CELP)编码器,后者用到了包含预定的激励矢量组的码书。前者类型的编码器却依赖于激励矢量的代数产生和确定(例如,见WO 9624925),并且常常被称为代数CELP或ACELP。更具体的,量化矢量d(i)被定义为包含10个非零脉冲。所有的脉冲幅度可以为+1或-1。子帧中40个样本位置(I=0到39)被划分成5个“轨道”,每个轨道包括两个脉冲(即8个可能位置中的2个)。如在下面表中给出的。表1代数码书中各个脉冲的可能位置 给定轨道中每对脉冲的位置以6比特编码(即,总共30比特,每个脉冲3比特),而轨道中第一脉冲的符号以1比特编码(总共5比特)。第二脉冲的符号并不会被特别编码,而是根据其相对于第一脉冲的位置来获得,如果第二脉冲的采样位置先于第一脉冲,那麽第二脉冲被定义为与第一脉冲符号相反,否则,两个脉冲被定义具有相同的符号。所有的3比特脉冲位置被进行格雷编码,以便提高针对信道误差的强度,使得量化矢量可以用35比特代数码u来编码。为了产生激励矢量c(i),由代数码u定义的量化矢量d(i)被预滤波器FE(z)滤波,其中的预滤波器增强了特殊的谱分量以便提高合成语音的质量。预滤波器(常常称为色彩滤波器)用为该子帧产生的某些LTP参数来定义。如传统的CELP编码器那样,差值单元7在逐个样本(逐个子帧)的基础上确定合成信号和输入信号之间的差值。加权滤波器8被用于对误差信号加权以考虑人类音频感知。对于给定的子帧,搜索单元9从代数码书3产生的候选矢量中选出适当的激励矢量{c(i),其中I=0到39},其方式是识别出最小化加权均方误差的矢量。该过程通常称为“矢量量化”。如已经注意到的,在缩放单元4激励矢量被乘以增益gc。导致缩放后的激励矢量的能量等于加权残留信号s~]]>能量的增益值被选出,其中的残留信号由LTP2给出。该增益由下式给出gc=s~THc(i)c(i)THTHc(i)]]>其中H是线性预测模型(LTP和LPC)脉冲响应矩阵。有必要将增益信息连同定义激励矢量的代数码一起引入编码后的语音子帧,以使得子帧能够被正确重构。然而,与其直接引入增益gc,不如在处理单元10中根据以前的语音子帧产生预测增益 并且在单元11中确定校正因子,即 然后,在包括5比特码矢量的校正因子码书情况下,相关因子被进行矢量量化。索引矢量νγ表明量化后的增益相关因子 该因子被引入编码后的帧。假定增益gc在帧与帧之间略有不同,那麽γgc≌1,并可以用相对较短的码书来正确量化。实际上,预测增益 是利用具有固定系数的移动平均(MA)预测得到的,如下所示,对激励能量进行了4阶MA预测。使得子帧n中除去平均激励能量(以dB)后得到E(n),由下式给出E(n)=10log(1Ngc2Σi=0N-1c2(i))-E_......(3)]]>其中N=40是子帧的大小,c(i)是激励矢量(包括预滤波)。E=36dB是典型激励能量的预定均值。子帧n的能量可以由下式预测 其中[b1b2b3b4]=是MA预测系数, 是子帧j的预测能量 中的误差。根据下面等式,当前子帧的误差被计算出来,用在处理后续子帧中 通过以 代替等式(3)中的E(n),预测能量可以用于计算预测增益 如下式 其中Ec=10log(1NΣi=0N-1c2(i))......(7)]]>是激励矢量c(i)的能量。增益校正因子码书搜索被执行以识别量化后的增益校正因子 它使得误差最小化 编码帧包括LPC系数,LTP参数,定义激励矢量的代数码,以及量化后的增益校正因子码书索引。在发送之前,在编码和复用单元12中会对某些编码参数进行进一步编码。实际上,LPC系数被转换成相应数量的线性谱对(LSP)系数,如在“Efficient Vector Quantisation ofLPC Parameters at 24Bits/Frame”Kuldip K.P和Bishnu S.A,IEEETrans Speech and Audio Processing,卷1,第1期,January 1993中描述的那样,整个的编码帧也被编码以用于误差检测和校正。为GSM2制定的编解码器以完全相同的比特数,即244对每个语音帧进行编码。在引入卷积编码和附加了循环冗余检验比特后增加到456比特。图2给出ACELP解码器的通常结构,适于对被图1的编码器编码的信号解码。解复用器13将所接收的编码信号分离为各个分量。相同于解码器处的码书3的代数码书14确定编码矢量并对该矢量进行预滤波(利用LTP参数)以产生激励矢量,其中的编码矢量由所接收的编码信号中的35比特代数码确定。增益校正因子是利用所接收的量化增益校正因子并根据增益校正因子码书确定的,并且该因子在块15中用于校正在块16确定的、根据以前解码的子帧得到的预测增益。在块17中,激励矢量被乘以校正后的增益,然后该乘积被传送给LTP合成滤本文档来自技高网...

【技术保护点】
一种编码语音信号的方法,其中的信号包括含有数字化语音样本的子帧序列,对于每个子帧,该方法包括: (a)选出一个包括至少一个脉冲的量化矢量d(i),其中矢量d(i)中的脉冲数m和脉冲位置可能在子帧之间变化; (b)确定增益值g↓[c]用于缩放量化矢量d(i)的幅度或用于缩放从量化矢量d(i)得到的另一个矢量c(i)的幅度,其中缩放后的矢量与加权后的残留信号*同步; (c)确定缩放因子k,该因子为预定能量值与量化矢量d(i)中能量之比的函数; (d)在一个或多个以前处理过的子帧基础上确定预测的增益值*,该增益值为量化矢量d(i)的能量E↓[c]的函数或当另一个矢量c(i)的幅度由所述的缩放因子k缩放时该矢量c(i)的能量E↓[c]的函数; (e)利用所述的增益值g↓[c]和所述的预测增益值*确定量化的增益校正因子*。

【技术特征摘要】
FI 1998-3-9 9805321.一种编码语音信号的方法,其中的信号包括含有数字化语音样本的子帧序列,对于每个子帧,该方法包括(a)选出一个包括至少一个脉冲的量化矢量d(i),其中矢量d(i)中的脉冲数m和脉冲位置可能在子帧之间变化;(b)确定增益值gc用于缩放量化矢量d(i)的幅度或用于缩放从量化矢量d(i)得到的另一个矢量c(i)的幅度,其中缩放后的矢量与加权后的残留信号s~]]>同步;(c)确定缩放因子k,该因子为预定能量值与量化矢量d(i)中能量之比的函数;(d)在一个或多个以前处理过的子帧基础上确定预测的增益值 该增益值为量化矢量d(i)的能量Ec的函数或当另一个矢量c(i)的幅度由所述的缩放因子k缩放时该矢量c(i)的能量Ec的函数;(e)利用所述的增益值gc和所述的预测增益值 确定量化的增益校正因子2.根据权利要求1的方法,该方法是变比特率编码方法,该方法包括通过从语音信号子帧中基本上除去长时和短时冗余而产生所述的加权残留信号s;~]]>根据包含于加权残留信号s~]]>中的能量将语音信号子帧分类,并利用该分类确定量化矢量d(i)中的脉冲数m。3.根据权利要求1或2的方法,包括为每个子帧产生一组线性预测编码(LPC)系数a和为每个数据帧产生一组长时预测(LTP)参数b,其中的数据帧包括多个语音子帧;在LPC系数,LTP参数,量化矢量d(i)以及量化增益校正因子 的基础上产生编码语音信号。4.根据前面任何一个权利要求的方法,包括通过代数码u在编码信号中定义量化矢量d(i)。5.根据前面任何一个权利要求的方法,其中预测增益值是根据下面等式确定的 其中E是常数, 是在所述以前处理过的子帧基础上确定的当前子帧中能量的预测值。6.根据前面任何一个权利要求的方法,其中所述预测增益值量化矢量d(i)的除去均值后的能量E(n)的函数,或者当每个以前处理的子帧的所述另一个矢量c(i)的幅度被所述缩放因子k缩放时,为该矢量c(i)的能量Ec的函数。7.根据前面任何一个权利要求的方法,其中增益值gc被用于对所述另一个矢量c(i)进行缩放,该另一个矢量是通过对量化矢量d(i)滤波得到的。8.根据权利要求5的方法,其中所述预测增益值 是量化矢量d(i)的除去均值后的激励能量E(n)的函数,或者当每个以前处理过的子帧的所述另一个矢量c(i)的幅度被所述缩放因子k缩放时,为该矢量c(i)的能量Ec的函数;增益值gc被用于对所述另一个矢量c(i)进行缩放,该另一个矢量是通过对量化矢量d(i)滤波得到的;预测能量是利用下面等式得到的 其中bi是移动平均预测系数,P是预测阶数, 是以前子帧j中预测能量 中的误差,由下式给出 其中9.根据权利要求5的方法,其中项Ec由下面等式确定Ec=10log(1NΣi=0N-1(kc(i))2)]]>其中N是子帧中的样本数。10.根据前面任何一个权利要求的方法,其中,如果量化矢量d(i)包括两个或多个脉冲,则所有脉冲具有相同的幅度。11.根据前面任何一个权利要求的方法,其中缩放因子由下式给出k=Mm]]>其中M是量化矢量d(i)中最大允许的脉冲数。12.根据前面任何一个权利要求的方法,该方法包...

【专利技术属性】
技术研发人员:P奥亚拉
申请(专利权)人:诺基亚移动电话有限公司
类型:发明
国别省市:FI[芬兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1