语音编码转换方法和装置制造方法及图纸

技术编号:3046995 阅读:233 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种语音编码转换方法和装置,能够在子帧长度不同的语音编码方案之间转换语音编码。语音编码转换装置从第一语音编码方案的语音编码中分离出多个为重构语音信号所必需的多个编码分量(Lsp1、Lag1、Gain1、Cb1),逆量化每个分量的编码,把除代数编码分量之外的编码分量的逆量化值转换为第二语音编码方案的语音编码的编码分量(Lsp2,Lag2,Gp2)。此外,语音编码转换装置根据逆量化值再现语音,对被转换为第二语音编码方案编码的编码进行逆量化,使用逆量化值和再现的语音生成目标信号,把该目标信号输入到代数编码转换器,获得第二语音编码方案的代数编码(Cb2)。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种语音编码转换方法和装置,用于把依据第一语音编码方案进行编码而获得的语音编码转换为第二语音编码方案地语音编码。尤其涉及这样一种语音编码转换方法和装置把根据由因特网或者移动电话系统等使用的第一语音编码方案对语音进行编码而获得的语音编码转换为不同于第一语音编码方案的第二编码方案的语音编码。
技术介绍
近年来移动电话的用户迅速增长,而且预计用户的数量还将会继续增加。使用因特网的语音通信(VoIP)在公司内部IP网络(Intranet)中得到越来越多的应用,而且还用于提供长途电话服务。在诸如移动电话系统和VoIP之类的语音通信系统中,为了有效地利用通信信道,使用了压缩语音的语音编码技术。在移动电话的情况下,不同的国家或者系统使用的语音编码技术有所不同。在被认为是下一代移动电话系统的cdma 2000中,采用EVRC(Enhanced Variable-Rate Codec,增强的可变速率编码译码器)作为语音编码方案。另一方面,就VoIP来说,遵循ITU-T建议G.729A的方案正被广泛地用作语音编码方法。下面首先说明G.729A和EVRC的概况。(1)G.729A的说明编码器的结构与操作图15示出了遵循ITU-T建议G.729A的编码器的结构。如图15所示,每帧具有规定采样数(=N)的输入信号(语音信号)X被逐帧地输入到LPC(Linear Prediction Coefficient,线性预测系数)分析器1中。如果采样速度是8kHz且单帧的长度是10ms,则一帧由80个采样组成。LPC分析器1(是由下列等式表示的全极滤波器)获得滤波器系数αi(i=1,……,P),其中P表示滤波器的级数 H(z)=1/[1+∑αi z-i](i=1到P)(1)通常,在电话频带语音的情况下,P采用10到12的值。LPC分析器1使用输入信号的80个采样、40个预读采样和120个过去信号采样总共240个采样来进行LPC分析,获得LPC系数。参数转换器2把LPC系数转换为LSP(Line Spectrum Pair,线谱对)参数。LSP参数是能与LPC系数相互转换的频率区域的参数。由于其量化特性优于LPC系数,所以在LSP域中进行量化。LSP量化器3对通过转换获得的LSP参数进行量化,并且获得LSP编码和LSP逆量化值。LSP插值器4根据在当前帧中求出的LSP逆量化值和在前一帧中求出的LSP逆量化值,获得LSP内插值。更具体地说,一帧被分成两个5ms的子帧、即第一和第二子帧,LPC分析器1确定第二子帧的LPC系数,不决定第一子帧的LPC系数。使用在当前帧中求出的LSP逆量化值和在前一帧中求出的LSP逆量化值,LSP插值器4通过插值法预测第一子帧的LSP逆量化值。参数逆转换器5把LSP逆量化值和LSP内插值转换为LPC系数,并且在LPC合成滤波器6中设置这些系数。在这种情况下,把从该帧的第一子帧的LSP内插值转换的LPC系数以及从第二子帧的LSP逆量化值转换的LPC系数用作LPC合成滤波器6的滤波器系数。在以下的说明中,在以“l”开头的索引项(例如lspi、li(n))中,“l”是字母表中的字母“l”。在LSP量化器3中,LSP参数lspi(i=1,……,P)通过标量量化或者矢量量化被量化之后,量化索引(LSP编码)被发送到解码器。图16是用于说明量化方法的图。在此,与索引号1到n对应,大量的量化LSP参数组被保存在量化表3a中。距离计算单元3b依据下列等式计算距离 d=∑i{lspq(i)-lspi}2(i=i~P)当q在1到n变化时,最小距离索引检测器3c求出使距离d最小的q,并且把该索引q作为LSP编码发送到解码器。接下来,进行声源和增益搜索处理。以子帧为单位处理声源和增益。首先,声源信号被分成基音(pitch)周期分量和噪音分量,存储了过去的声源信号序列的自适应码本7被用来量化基音周期性分量,而代数码本或者噪音码本被用来量化噪音分量。下面对使用自适应码本7和代数码本8作为声源码本的语音编码进行说明。自适应码本7与索引1到L相对应,输出被依次延迟一个采样的N个采样的声源信号(称为“周期性信号”)。图17是在每一个子帧40个采样(N=40)情况下的自适应码本7的结构图。自适应码本是由用于存储最新的(L+39)个采样的基音周期性分量的缓冲器BF构成的。包含第1到40个采样的周期性信号用索引1表示,包含第2到41个采样的周期性信号用索引2表示,……,以及包含第L到L+39个采样的周期性信号用索引L表示。在初始状态中,自适应码本7中的内容为所有信号的振幅都是零。将最旧信号逐子帧地丢弃(每次一个子帧长度),以便使将当前帧中获得的声源信号保存在自适应码本7中。自适应码本搜索使用存储有过去声源信号的自适应码本7来标识声源信号中的周期性分量。也就是说,从自适应码本7中抽出的一个子帧长度(=40个采样)的过去声源信号,同时每次把从自适应码本7中开始读出的指针改变一个采样,把声源信号输入到LPC合成滤波器6中以创建基音合成信号βAPL,其中PL表示从自适应码本7中抽出的、对应于延迟L的过去周期性信号(适应编码矢量),A表示LPC合成滤波器6的脉冲响应,β表示自适应码本的增益。运算单元9依据下列等式求出输入语音X和βAPL之间的误差功率EL EL=|X-βAPL|2 (2)如果我们用APL表示来自自适应码本的加权的合成输出、Rpp表示APL的自相关、Rxp表示APL和输入信号X之间的互相关,则使等式(2)中的误差功率最小的基音延迟(pitch lag)Lopt处的适应编码矢量PL由下列等式表示 PL=argmax(Rxp2/Rpp) (3)也就是说,用于读该码本的最优起始点在用该基音合成信号的自相关Rpp标准化(normalize)基音合成信号APL和输入信号X之间的互相关Rxp而获得的值为最大的地方。因此,误差功率评价单元10求出满足等式(3)的基音延迟Lopt。最优基音增益βopt可以用下式表示 βopt=Rxp/Rpp (4)接下来,使用代数码本8量化包含在该声源信号中的噪声分量。该代数码本由多个振幅为1或者-1的脉冲构成。举例来说,图18示出了帧长度是40个采样情况下的脉冲位置。该代数码本8把构成一个帧的N(=40)个采样点划分为多个脉冲系统组1到4,而且对于通过从每个脉冲系统组中抽出一个采样点而获得的所有组合,顺序地输出每个采样点处的具有+1或者-1脉冲的脉冲性信号作为噪声分量。在本示例中,每一帧基本上配置了四个脉冲。图19是用于说明分配给每个脉冲系统组1到4的采样点的图。(1)0、5、10、15、20、25、30、35八个采样点被分配给脉冲系统组1;(2)1、6、11、16、21、26、31、36八个采样点被分配给脉冲系统组2;(3)2、7、12、17、22、27、32、37八个采样点被分配给脉冲系统组3;以及(4)3、4、8、9、13、14、18、19、23、24、28、29、33、34、38、39十六个采样点被分配给脉冲系统组4。需要三位来表示脉冲系统组1到3中的采样点,用一位来表示脉冲的正负号,总共四位。此外,需要四位来表示脉冲系统组4中的采样点,用一位来表示脉冲的正负号,总共五本文档来自技高网...

【技术保护点】
一种语音编码转换方法,用于把依据第一语音编码方案进行编码而获得的语音编码转换为第二语音编码方案的语音编码,包括以下步骤: 从基于第一语音编码方案的语音编码中,分离出重构语音信号所必需的多个编码分量; 输出通过逆量化每个分量的编码所获得的逆量化值; 量化除代数编码分量之外的编码分量的逆量化值,从而实现到第二语音编码方案的语音编码的编码分量的转换; 根据逆量化值再现语音; 通过逆量化第二语音编码方案的每个编码分量,获得第二语音编码方案的逆量化值; 使用再现的语音以及第二语音编码方案的每个逆量化值,生成目标信号; 使用该目标信号获得第二语音编码方案的代数编码;以及 输出第二语音编码方案的编码分量作为语音编码。

【技术特征摘要】
JP 2002-1-29 019454/20021.一种语音编码转换方法,用于把依据第一语音编码方案进行编码而获得的语音编码转换为第二语音编码方案的语音编码,包括以下步骤从基于第一语音编码方案的语音编码中,分离出重构语音信号所必需的多个编码分量;输出通过逆量化每个分量的编码所获得的逆量化值;量化除代数编码分量之外的编码分量的逆量化值,从而实现到第二语音编码方案的语音编码的编码分量的转换;根据逆量化值再现语音;通过逆量化第二语音编码方案的每个编码分量,获得第二语音编码方案的逆量化值;使用再现的语音以及第二语音编码方案的每个逆量化值,生成目标信号;使用该目标信号获得第二语音编码方案的代数编码;以及输出第二语音编码方案的编码分量作为语音编码。2.如权利要求1所述的方法,其特征在于进一步包括以下步骤检测是否出现传输路径错误;以及如果没有出现传输路径错误,则使用被分离出的编码分量来输出逆量化值,如果出现了传输路径错误,则使用过去的正常编码分量来输出逆量化值。3.一种语音编码转换方法,用于把第一语音编码转换为基于第二语音编码方案的第二语音编码,其中该第一语音编码是依据基于第一语音编码方案的LSP编码、基音延迟编码、代数编码和增益编码对语音信号进行编码而获得的,该语音编码转换方法包括以下步骤逆量化第一语音编码的LSP编码、基音延迟编码和增益编码以获得逆量化值,并且根据第二语音编码方案量化这些逆量化值以求出第二语音编码的LSP编码、基音延迟编码和增益编码;使用第二语音编码方案的LSP编码、基音延迟编码和增益编码的逆量化值生成基音周期性合成信号,根据第一语音编码再现语音信号,并且生成该再现语音信号和基音周期性合成信号之间的差信号作为目标信号;使用第二语音编码方案中的任何代数编码以及构成第二语音编码的LSP编码的逆量化值,生成代数合成信号;求出使该目标信号和代数合成信号之间的差最小的、第二语音编码方案中的代数编码;以及输出第二语音编码方案中的LSP编码、基音延迟编码、代数编码和增益编码。4.如权利要求3所述的方法,其特征在于生成基音周期性合成信号的步骤包括生成信号的步骤,其中该信号是通过把与第二语音编码方案的基音延迟编码的逆量化值对应的自适应码本输出信号和与第二语音编码方案的增益编码对应的增益相乘获得的;把所述信号输入到基于第二语音编码方案的LSP编码的逆量化值的LPC合成滤波器中;以及采用该LPC合成滤波器的输出信号作为基音周期性合成信号。5.如权利要求3所述的方法,其特征在于生成代数合成信号的步骤包括把与第二语音编码方案的所述任何代数编码对应的代数码本输出信号输入到基于第二语音编码方案的LSP编码的逆量化值的LPC合成滤波器中;以及采用该LPC合成滤波器的输出信号作为代数合成信号。6.如权利要求3所述的方法,其特征在于第一语音编码方案的增益编码是把基音增益和代数码本增益编码为一组的结果,所述方法进一步包括下列步骤通过根据第二语音编码方案对通过逆量化该增益编码所获得的逆量化值中的基音增益逆量化值进行量化,求出第二语音编码中的基音增益编码。7.如权利要求6所述的方法,其特征在于进一步包括步骤把与所求出的第二语音编码方案的代数编码对应的代数码本输出信号输入到基于第二语音编码方案的LSP编码的逆量化值的LPC合成滤波器中;根据该LPC合成滤波器的输出信号和目标信号,求出代数码本增益;以及量化该代数码本增益,以求出基于第二语音编码方案的代数码本增益。8.如权利要求3所述的方法,其特征在于第一语音编码方案的增益编码是把基音增益和代数码本增益编码为一组的结果,所述方法进一步包括下述步骤通过依据第二语音编码方案,对通过逆量化该增益编码分别获得的基音增益逆量化值和代数码本增益逆量化值进行量化,来求出第二语音编码的基音增益编码和代数码本增益编码。9.一种语音编码转换方法,用于把第一语音编码转换为基于第二语音编码方案的第二语音编码,其中第一语音编码是依据基于第一语音编码方案的LSP编码、基音延迟编码、代数编码、基音增益编码和代数码本增益编码对语音信号进行编码获得的,该语音编码转换方法包括下列步骤逆量化构成第一语音编码的每个编码以获得逆量化值,根据第二语音编码方案量化这些逆量化值中的LSP编码和基音延迟编码的逆量化值,求出第二语音编码的LSP编码和基音延迟编码;通过使用第一语音编码的基音增益编码的逆量化值进行插值处理,求出第二语音编码的基音增益编码的逆量化值;使用第二语音编码的LSP编码、基音延迟编码和基音增益的逆量化值,生成基音周期性合成信号,根据第一语音编码再现语音信号,并且生成该再现语音信号和基音周期性合成信号之间的差信号作为目标信号;使用第二语音编码方案的任何代数编码以及第二语音编码的LSP编码的逆量化值,生成代数合成信号;求出使该目标信号和代数合成信号之间的差最小的、第二语音编码方案的代数编码;通过使用第二语音编码的LSP编码和基音延迟编码的逆量化值、求出的代数编码以及目标信号,依据第二语音编码方案,求出作为基音增益和代数码本增益的组合的、第二语音编码的增益编码;以及输出所求出的第二语音编码方案的LSP编码、基音延迟编码、代数编码和增益编码。10.一种语音编码转换装置,用于把依据第一语音编码方案进行编码而获得的语音编码转换为第二语音编码方案的语音编码,包括编码分离装置,用于从基于第一语音编码方案的语音编码中,分离出重构语音信号所必需的多个编码分量;逆量化器,用于输出通过逆量化每个分量的编码所获得的逆量化值;量化器,用于量化从所述逆量化器输出的除代数编码分量之外的编码分量的逆量化值,以实现到第二语音编码方案的语音编码的编码分量的转换;语音再现单元,用于根据逆量化值再现语音;逆量化装置,用于通过逆量化第二语音编码方案的每个编码分量来获得第二语音编码方案的逆量化值;目标值生成装置,用于使用从所述语音再现单元输出的再现语音、以及从所述逆量化装置输出的第二语音编码方案的每个逆量化值,生成目标信号;代数编码获得单元,用于使用该目标信号来获得第二语音编码方案的代数编码;以及编码多路复用装置,用于输出第二语音编码方案的各编码分量作为一个语音编码。11.一...

【专利技术属性】
技术研发人员:铃木政直大田恭士土永义照田中正清
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1