在语音编码系统中对增益信息进行编码的方法和装置制造方法及图纸

技术编号:3046093 阅读:131 留言:0更新日期:2012-04-11 18:40
一种用于对信号进行综合分析编码的方法,包括步骤:    基于输入信号,生成目标矢量;    生成与合成激励信号相关的多个构成成分,其中多个构成成分中的第一构成成分基于偏移后的多个构成成分中的第二构成成分;和    基于目标矢量和多个构成成分来评估差标准,以确定与多个构成成分中每个构成成分相关联的增益。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般涉及信号压缩系统,更具体涉及码本激励线性预测(CELP)型的语音编码系统。
技术介绍
低速率编码应用,诸如数字语音,通常使用诸如线性预测编码(LPC)的技术来对短时语音信号进行建模。采用LPC技术的编码系统提供预测残差信号,用于校正短时模型的特性。一种这样的编码系统是称为码本激励线性预测(CELP)的语音编码系统,其以低比特率、即4.8到9.6千比特每秒(kbps)的比特率,产生高质量合成语音。这类语音编码,也称为矢量激励线性预测或随机编码,用于各种语音通信和语音合成应用中。CELP还特别适用于数字语音加密和数字无线电话通信系统,在这样的系统中,特别关注语音质量、数据速率、大小和成本。实现LPC编码技术的CELP语音编码器通常采用长时(“基音”)和短时(“共振峰”)预测器,它们对输入语音信号的特性进行建模并且合并到一组时变线性滤波器中。用于滤波器的激励信号,或者说码矢量,选自储存的码矢量的码本。对于每个语音帧,语音编码器将码矢量用于滤波器以生成重建的语音信号,并且将原始输入语音信号与重建信号进行比较以产生差信号。然后通过让差信号通过具有基于人类听觉的响应的加权滤波器而对差信号进行加权。然后通过选择一个或多个产生具有当前帧的最小能量的加权差信号的码矢量来确定最优化的激励信号。例如,图1是现有技术的CELP编码器100的框图。在CELP编码器100中,将输入信号s(n)施加到线性预测(LP)分析器101,其中使用线性预测编码来估计短时频谱包络。得到的频谱系数(或线性预测(LP)系数)是由传输函数A(z)表示的。将频谱系数施加到LP量化器102,LP量化器102对频谱系数进行量化以产生适合用于多路复用器109的量化后的频谱系数Aq。量化后的频谱系数Aq随后被传送到多路复用器109,多路复用器基于量化后的频谱系数以及由平方差最小化/参数量化模块108确定的一组与激励矢量相关的参数L,β,I和γ来产生编码比特流。结果,对于每个语音块,产生的对应的一组与激励矢量相关的参数包括长时预测器(LTP)参数L和β,以及固定码本索引I和缩放因子γ。量化后的频谱参数还被本地传送到LP合成滤波器105,LP合成滤波器105具有对应的传输函数1/Aq(z)。LP合成滤波器105还接收组合的激励信号ex(n)并基于量化频谱系数Aq和组合的激励信号ex(n)来产生对输入信号的估计(n)。如下产生组合的激励信号ex(n)。固定码本(FCB)码矢量,或激励矢量, 选自固定码本(FCB)103,其基于固定码本索引参数I。FCB码矢量 随后基于增益参数γ进行加权,加权后的固定码本码矢量被传送到长时预测器(LTP)滤波器104。LTP滤波器104具有对应的传输函数“1/(1-βz-L)”,其中β和L是由平方差最小化/参数量化模块108传送到滤波器的与激励矢量相关的参数。LTP滤波器104对从FCB 103接收的加权固定码本码矢量进行滤波,以产生组合激励信号ex(n)并将激励信号传送到LP合成滤波器105。LP合成滤波器105将输入信号估计(n)传送到组合器106。组合器106还接收输入信号s(n)并且用输入信号s(n)减去输入信号的估计(n)。输入信号s(n)和输入信号估计(n)之差施加到感觉差加权滤波器107,该滤波器基于(n)和s(n)之差和加权函数W(z)产生感觉加权差信号e(n)。感觉加权差信号e(n)然后被传送到平方差最小化/参数量化块108。平方差最小化/参数量化108使用差信号e(n)来确定一组与激励矢量相关的最优化参数L,β,I和γ,这些参数产生了输入信号s(n)的最佳估计(n)。量化的LP系数和最优化的一组参数L,β,I和γ随后通过通信信道被传送到接收通信设备,在接收通信设备,语音合成器使用LP系数和与激励矢量相关的参数来重构输入语音信号s(n)。在CELP编码器中,诸如编码器100中,用于生成CELP编码器组合激励信号的合成函数是由下面的广义差分方程给出的ex(n)=γc~I(n)+βex(n-L),n=0,N-1---(1)]]>其中,ex(n)是一子帧的合成组合激励信号, 是码矢量或激励矢量,选择诸如FCB 103的码本,I是索引参数或码字,指定选择的码矢量,γ是用于缩放码矢量的增益,ex(n-L)是相对当前子帧的第n个采样延迟L个采样的合成组合激励信号(对于浊语音来说,L通常与基音周期相关),β是长时预测器(LTP)增益因子,N是子帧中的采样数。当n-L<0时,ex(n-L)包含过去合成激励的历史,如公式(1)所示构建。也即,对于n-L<0,表达式“ex(n-L)”对应于在当前子帧之前构建的激励采样,该激励采样已经依照LTP滤波器传输函数“1/(1-βz-L)”延迟且缩放。典型CELP语音编码器(诸如编码器100)的目标是选择规定合成激励的参数,即,编码器100中的参数L,β,I,γ,n<0的给定ex(n)以及短时线性预测器(LP)滤波器105的确定系数,由此,当n=0,N-1的合成激励序列ex(n)通过LP滤波器105进行滤波以生成合成语音信号(n)时,根据所采用的失真标准,合成语音信号最接近地近似于在子帧被编码的输入语音信号s(n)。对于大于或等于N的L值,即LN,公式(1)准确实现。在这样的情况下,对于该子帧的合成激励,可等价地定义为ex(n)=βc0(n)+γc1(n),n=0,N-1,(2)其中c0(n)=ex(n-L),n=0,N-1,(3)c1(n)=c~I(n),n=0,N-1,---(4)]]>而且,其中,c0(n)是为该子帧所选择的LTP矢量,c1(n)是为该子帧选择的码矢量。由于L≥N,c0(n)和c1(n)一旦选定,在公式(2)的方程里显然独立于β和γ。而且,c0(n)仅仅是n<0的ex(n)的函数,其保持β的解为线性问题。类似地,因为L≥N,在当前子帧,c1(n)不受长时预测器(LTP)滤波器104的影响。这些因子通过语音编码器100的平方差最小化/参数量化模块108简化了参数(L,β,I,γ)的选择。选择L的范围,使其覆盖较广大的讲话者的基音的期望范围,在8kHz采样频率,该范围的低限通常设置为20个采样左右,对应于400Hz的基音频率。为了获得好的编码效率,最好使用N>Lmin,其中是Lmin是延迟范围上的低限。典型地,编码器的激励参数以子帧速率传输,该子帧速率与子帧长度N成反比。也就是说,子帧长度N越长,就越不需要频繁地量化和传输编码器的子帧参数。对于小于N的L值,即L<N,公式(2)不再等价于公式(1)。为了在L<N时保留使用公式(2)的形式的优点,题为“Code ExcitedLinear Predictive Vocoder Using Virtual Searching”的美国专利4,910,781中提出了一种想法,即如下修改c0(n)的定义ex(n)=βc0(n)+γc1(n),n=0,N-1,(5)其中c0(n)=ex(n-L),n=0,Min(L,N)-1,c0(n-L),n=L,N-1---(6)]]>c1(n)=c~I(n),n=0,N-1---(7)]]>在公本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于对信号进行综合分析编码的方法,包括步骤基于输入信号,生成目标矢量;生成与合成激励信号相关的多个构成成分,其中多个构成成分中的第一构成成分基于偏移后的多个构成成分中的第二构成成分;和基于目标矢量和多个构成成分来评估差标准,以确定与多个构成成分中每个构成成分相关联的增益。2.如权利要求1所述的方法,其中,评估差标准的步骤包括步骤基于目标矢量和多个构成成分来评估差标准,以确定增益,其中使用所述增益来产生多个增益,并且多个增益中的每个增益与多个构成成分中的每个构成成分相关联。3.如权利要求1所述的方法,其中,评估差标准的步骤包括步骤基于多个构成成分生成非线性方程的系统;和解所述非线性方程的系统,从而确定与多个构成成分中每个构成成分相关联的增益。4.如权利要求1所述的方法,其中,评估差标准的步骤包括步骤基于多个构成成分生成线性方程的系统;和解所述线性方程的系统,从而确定与多个构成成分中每个构成成分相关联的增益。5.如权利要求1所述的方法,其中,评估差标准的步骤包括步骤基于目标矢量和多个构成成分,评估差标准;和基于对差标准的评估,生成多个增益参数。6.如权利要求5所述的方法,其中,生成多个增益参数的步骤包括步骤预先计算第一多个增益参数,以产生多个预先计算的增益参数;和基于预先计算的多个增益参数,选择第二多个增益参数。7.一种用于对信号进行综合分析编码的装置,包括目标矢量生成器装置,用于基于输入信号,生成目标矢量;成分生成器,用于...

【专利技术属性】
技术研发人员:马克·A·亚修克詹姆士·P·阿什利乌达尔·米塔尔
申请(专利权)人:摩托罗拉公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利