一种编码一个激励脉冲参数序列的方法技术

技术编号:3047672 阅读:223 留言:0更新日期:2012-04-11 18:40
一种编码第一和第二种类型的激励脉冲参数(分别为f↓[p]和n↓[fp])的方法,这两种类型的参数共同给出通过下面计算所得的激励脉冲的位置(m↓[p]): a)按照第一种方法,在一些计算阶段(j)中计算激励脉冲的位置,其中对被划分为语音帧的一个语音信号进行分析,分析后的语音信号被合成(110)以形成一个预测残差(d↓[k])和多个预测参数(a↓[k]),它们被用于一个激励处理器(120)中,该激励处理器根据所述预测参数(a↓[k]),为每个所需激励脉冲滤波预测残差(d↓[k])和从激励处理器得到的参数(A↓[i],M↓[i]); b)按照第二种方法,执行一些计算阶段(N1,N2,…,NL),以确定激励脉冲的位置,每个计算阶段都有一开始点,该开始点来自按照第一种方法计算所得的多个位置(m↓[i],m↓[k],m↓[r])中的一个,在第二种方法中,一个语音帧也被分为多个相位位置(n↓[f]),每个相位位置被分为多个相位(n),其中加入了限制,对于每个随后激励脉冲和语音帧中每个相位位置(n↓[f])来说在放置一个激励脉冲时,已被占用的相位是被禁止使用的,以此获得多个脉冲布置(L)中的一个;以及 c)在分别按第一和第二种方法进行的计算阶段(j和max[N1,N2])的数目间选择比例,以此,在给定语音质量的前提下,获得最小的计算复杂度。 其特点在于: 将第一种类型的参数(f↓[p])组合在一个或多个消息字中,所述消息字与包含第二种类型的参数(n↓[fp])的消息字是分离的,且后一种的这些消息字每一个都被分别编码。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术有关一种在一个线性预测语音编码器中,编码一个语音帧中的一个激励脉冲参数序列的方法,该编码器按照多脉冲规则操作。这样一个语音编码器可以用于一个移动电话系统中,例如,用来在从移动台发送之前,对语音信号进行压缩。
技术介绍
概述对本技术来说,按照上述多脉冲规则操作的线性预测语音编码器是已知的;见于,例如,美国专利说明书3624302,它描述了语音信号的线性预测编码,及美3740476,它描述了在这样一个语音编码器中,怎样形成预测参数及预测残差信号。在通过线性预测编码,形成一个仿真语音信号时,从原始信号中,产生多个表征该仿真语音信号的预测参数(ak)。这样,可从这些参数中形成一个语音信号,它不包含自然语音中通常含有的因而不需要在诸如一个移动无线电系统的一个移动站和基站之间的语音发送中加以转换的冗余。从带宽角度来看,更合适的是仅传送预测参数,而不是原始语音信号,因为原始语音信号需要一个更大的带宽。不过,这样在接收器中重新生成语音信号时所构成的合成语音信号,可能会难以理解,这是在原始信号和由预测参数重新生成的合成信号的语音波形间不一致造成的。这些不足之处在美专利说明书4472832(SE-B-456618)中已详细介绍,并且可通过在构成合成语音拷贝时引入所谓的激励脉冲(多脉冲)来得到某种程度的缓解。这可以通过将原始语音输入波形划分为一系列帧来实现。在每个帧内,形成一些确定数目的脉冲,这些脉冲具有与预测参数ak,及语音输入波形和语音拷贝间的预测残差dk相应的不同的幅值和相位位置(时间位置)。每个脉冲都能影响语音波形拷贝,以至于能得到最小的可能预测残差。生成的激励脉冲有一个相对低的比特率,因此,类似于预测参数,能在一个窄带内被编码和传送。这提高了重新生成的语音信号的质量。在上述已知方法中,激励脉冲是在语音输入波形的每个帧中,通过在一个预测滤波器中对残差信号dk进行加权而在另一个预测滤波器中将各激励信号的生成值反馈回来进行加权来生成的。然后,在两个滤波器的输出信号间进行相关,使相关对于相关信号中的一些信号元达到最大值,这样,就形成了激励脉冲的参数(幅值和相位位置)。通过这种多脉冲算法生成激励脉冲所提供的优势在于,不同类型的声音能用少量脉冲生成(例如八脉冲/帧)。这种脉冲_搜索算法通常是关于帧中脉冲的位置。有可能重新生成不发声音(辅音),它通常需要随机放置的脉冲,及发声音(元音),它要求脉冲位置是更集中的。这些已知方法计算在语音信号的一个帧和其后的帧中,激励脉冲的正确相位位置,而对脉冲的定位,所谓的脉冲布置,仅是依靠对语音信号参数(预测残差,残差信号及前面帧中的激励脉冲参数)的复杂处理来实现的。如前面所述美专利中介绍的原始脉冲布置方法的一个缺点是,在计算脉冲位置之后实施的编码,在计算和存储方面是复杂的。编码还要求帧周期中每个脉冲位置用大量的位。此外,从最优组合脉冲编码算法得到的代码字中的位对位错误敏感。从传送器到接收器的传送过程中出现的代码字中的位错误,在接收器中解码时,在脉冲定位方面会造成灾难性的后果。这可通过限制在每个语音帧中需被发出的激励脉冲的数目来得到缓解。这种可能性是基于这样一个事实,一个帧中的激励脉冲的脉冲位置数目很大,使得能省略帧中一个或多个激励脉冲的精确定位,而在编码和传送后仍能得到质量可接受的重新生成的语音信号。相应地,还提出了一种方法(见美专利说明5193140),其中,在布置脉冲时,引入了一些相位位置限制,这是通过禁止一些数目的相位位置来实现的,这些相位位置对于继已计算的激励脉冲的相位位置之后的那些脉冲来说,是已经确定了的。当帧中第一个脉冲的位置已被计算并被置于其计算所得相位位置时,则帧中随后的脉冲不能再占用该相位位置。该规则对帧中所有的脉冲位置适用。当开始新的下一个帧中的脉冲定位时,帧中所有的位置就都是自由可占的。近来,在生成合成语音信号时,已提出使用语音编码器中的所谓的代码本(code book)。例如,见美专利说明书4701954。这种代码本存有一些语音信号代码字,它们在生成合成语音拷贝时用到。代码本可以是固定的,即包含永久代码字,或是自适应的,即当语音拷贝形成时能被更新。也可以用固定和自适应代码本的组合。专利技术概述上述这种禁止其中一个位置已配置了一个激励脉冲的一个语音帧中的各相位位置的方法,使得比只用一个限制时,被传送激励脉冲的数目更有限。另外,在提高接收方解码时的相位位置分离性的同时,在传送器一方,更容易编码激励脉冲的相位位置。按照本专利技术,最敏感的相位位置被逐个地编码,而不大敏感的相位被共同编码。由此,本专利技术方法的特点在于由权利要求1中的特性条款中列出的步骤。根据权利要求1的编码方法的最佳实施例的特点,如权利要求2和3的特点部分所示。所提出的方法能用于语音编码器,这种编码器根据具有使原始语音信号和LPC合成信号脉冲响应进行相关的多脉冲规则操作,利用或不利用前面所述的代码本。不过,这种方法可由一个所谓的RPE语音编码器应用,其中,几个激励脉冲在帧周期中被同时放置。图形概述借助于附图,将对所提方法作详细介绍,附图包括附图说明图1是一个简化方框图,说明一个已知的LPC语音编码器;图2是一个时序图,示出了图1的语音编码器中出现的一些信号;图3用图解法说明一个语音帧,其意图是解释前面已知方法的原理,该方法包含确定激励脉冲时的限制。图4是一个方框图,说明按本专利技术规则操作的语音编码器的一部分;图5是一个方框图,说明了有一个自适应代码本的已知语音编码器的一部分,其中,本专利技术所述方法可以得到应用;图6是用来解释本专利技术方法的一个流程图;图7是一个用来说明按照本专利技术,布置脉冲的示意图;图8是一个说明借助于本专利技术相位校正所做的脉冲布置的示意图;图9是一个方框图,说明按本专利技术方法操作的语音编码器的一部分;以及图10是一个方框图,说明按另一个本专利技术方法操作的语音编码器的部分。实施例具体说明图1是一个简化方框图,说明按照采用相关的多脉冲规则的一个已知LPC语音编码器,这样一个编码器在美专利说明书4472832(SE-B-456618)中作了详细说明。一个从话筒来的模拟语音信号,例如,出现在预测分析器110的输入端。除了一个模一数转换器外,预测分析器110还包括一个LPC计算器和一个残差信号生成器,生成预测参数ak和一个残差信号dk。这些预测参数表征了合成信号和跨接在分析器输入端的原始语音信号。一个激励处理器120接收两个信号ak和dk,并在由帧信号FC确定的相继各帧内操作,以在每个帧内产生一定数量的激励脉冲。每个脉冲由其幅值Amp和其在帧中的时间位置mp确定。激励脉冲参数Amp,mp被送到编码器131,以后例如,在从无线发送器发送之前,与预测参数ak多路调制。激励处理器120有两个预测滤波器,它们有相同的脉冲响应,在一个给定的计算或运算阶段P,根据预测参数ak,分别对信号dk和(Ai,Mi)进行加权。还包括一个相关信号生成器,它在每次生成一个激励脉冲时,实现已加权原始信号(Y)和已加权仿真信号( )间的相关。每次相关都得到一些候选脉冲元Ai,Mi(0≤i<I),其中,一个候选脉冲(1)给出了最小平方误差或最小绝对值。选定的候选脉冲的幅值Amp和时间位置mp在激励信号生成器中计算。在本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种编码第一和第二种类型的激励脉冲参数(分别为fp和nfp)的方法,这两种类型的参数共同给出通过下面计算所得的激励脉冲的位置(mp)a)按照第一种方法,在一些计算阶段(j)中计算激励脉冲的位置,其中对被划分为语音帧的一个语音信号进行分析,分析后的语音信号被合成(110)以形成一个预测残差(dk)和多个预测参数(ak),它们被用于一个激励处理器(120)中,该激励处理器根据所述预测参数(ak),为每个所需激励脉冲滤波预测残差(dk)和从激励处理器得到的参数(Ai,Mi);b)按照第二种方法,执行一些计算阶段(N1,N2,…,NL)。以确定激励脉冲的位置,每个计算阶段都有一开始点,该开始点来自按照第一种方法计算所得的多个位置(mi,mk,mr)中的一个,在第二种方法中,一个语音帧也被分为多个相位位置(nf),每个相位位置被分为多个相位(n),其中加入了限制,对于每个随后激励脉冲和语...

【专利技术属性】
技术研发人员:T·B·明德
申请(专利权)人:艾利森电话股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1