一种G.729到AMR12.2速率的转码方法技术

技术编号:9465026 阅读:172 留言:0更新日期:2013-12-19 02:44
本发明专利技术公开了一种G.729到AMR12.2速率的转码方法,属于信号处理技术领域。本发明专利技术将输入比特流输入到G.729AB解码单元,利用G.729AB解码单元对输入比特流进行解码,然后将解码得到的帧类型、LSP系数、基音延时、固定码本矢量、码本增益以及合成语音输入G.729AB到AMR-12.2kbps转码单元,对每一部分进行相应的转码,最后将转码后的各个参数输入到AMR-12.2kbps编码单元,按照AMR-12.2kbps量化方法重新量化后,写入到输出比特流。

【技术实现步骤摘要】
一种G.729到AMR12.2速率的转码方法
本专利技术涉及一种G.729到AMR12.2速率的转码方法,属于信号处理

技术介绍
信息的传输与交换在当代人们生活中不可或缺,在诸多信息数据中,语音数据无疑占有举足轻重的地位。数字语音通信具有高可靠性、高抗干扰能力等优点,随着通信技术的不断发展,其所占的比重越来越大。为了提高通信效率,数字语音压缩编码技术得到了广泛应用,出现了多种语音压缩编码标准。为了保证网际间的互通性,语音编码器之间的无缝连接变得越来越重要。要实现不同网络间的语音码流顺利转换,就需要把一端编码器的码流转换成另一端所能识别的码流,这种码流转换技术就称为语音转码。G.729和AMR是两种使用广泛的语音压缩编码标准。G.729是国际电信联盟(ITU)于2006年制定的8kbps语音编码协议,G.729A是G.729标准的简化版本;G.729B是与G.729(A)配合的静音压缩标准;G.729AB是指将低复杂度的G.729A和具有静音压缩功能的G.729B联合使用的语音编码标准,它在实际中应用最多,已广泛用于IP电话、视频会议系统等领域。AMR是WCDMA移动通信系统的自适应多速率语音编码标准,它共有8个速率,其中12.2kbps是其最高速率,该标准在蜂窝移动通信系统中发挥着重要作用。为了实现IP电话和蜂窝移动通信系统之间的互通,需要进行G.729AB与AMR编码器之间的转码工作。传统的解决方法是采用先解后编(DecodethenEncode,DTE)方式进行转码,即用源解码器将传输的比特流进行解码,恢复出重建语音,然后再使用目标编码器对重建语音进行编码,生成目标解码器可以解码的码流。这种方法虽然能够完成不同编码器之间的转码操作,但存在转码后语音质量低、计算复杂度高和延时长等缺点。
技术实现思路
本专利技术针对以上问题的提出,而研制一种G.729到AMR12.2速率的转码方法。本专利技术采取的技术方案如下:将输入比特流输入到G.729AB解码单元,利用G.729AB解码单元对输入比特流进行解码,然后将解码得到的帧类型、LSP系数、基音延时、固定码本矢量、码本增益以及合成语音输入G.729AB到AMR-12.2kbps转码单元,对每一部分进行相应的转码:根据解码得到的帧类型信息来对目标帧的VAD信息做出判断;将解码端得到的LSP系数和整数基音延时分别作为编码端的LSP系数和开环基音延时;利用输入语音与重构语音之间的均方误差最小准则,同时采用G.729AB的快速搜索方法和AMR-12.2kbps1/6分辨率,搜索编码端的闭环基音延时;用加权输入语音和加权重构语音之间的均方误差最小准则来搜索固定码本中的码矢,在搜索过程中利用量化信号的最大绝对值来获得部分脉冲的位置,同时减少部分脉冲的搜索个数。最后对各个参数进行编码,得到输出比特流。本专利技术的有益效果:为了验证本专利技术方法的有效性,进行了若干实验测试。测试中,将经过转码后的输出比特流经过AMR-12.2kbps解码后,得到转码后的语音,然后对该语音进行测试。本专利技术使用PESQ、MOS-LQO作为转码后客观语音质量的衡量指标。测试序列选用ITU-T在G.729AB和AMR中提供的10组标准文件,测试结果如表3,表3在具体实施方式里面。从表3中可以看出,本专利技术的转码方法在计算量上比传统方式下降了44%左右,PESQ值和MOS-LQO都有所增加。附图说明图1G.729AB和AMR编解码算法原理框图。图2G.729AB与AMR帧结构对应图。图3G.729AB到AMR12.2kbps转码装置。图4G.729AB到AMR-12.2kbps的转码。图5LSP参数解码流程图。图6基音延时解码流程图。图7闭环基音搜索流程图。图8固定码本搜索流程图。具体实施方式下面结合附图对本技术最进一步说明:G.729AB和AMR是两种使用广泛的语音压缩编码标准。G.729是国际电信联盟(ITU)于2006年制定的8kbps语音编码协议,G.729A是G.729标准的简化版本;G.729B是与G.729(A)配合的静音压缩标准;G.729AB是指将低复杂度的G.729A和具有静音压缩功能的G.729B联合使用的语音编码标准,它在实际中应用最多,已广泛用于IP电话、视频会议系统等领域。AMR是WCDMA移动通信系统的自适应多速率语音编码标准,它共有8个速率,其中12.2kbps是其最高速率,该标准在蜂窝移动通信系统中发挥着重要作用。为了实现IP电话和蜂窝移动通信系统之间的互通,需要进行G.729AB与AMR编码器之间的转码工作。传统的解决方法是采用先解后编(DecodethenEncode,DTE)方式进行转码,即用源解码器将传输的比特流进行解码,恢复出重建语音,然后再使用目标编码器对重建语音进行编码,生成目标解码器可以解码的码流。这种方法虽然能够完成不同编码器之间的转码操作,但存在转码后语音质量低、计算复杂度高和延时长等缺点。为了解决上述DTE方式语音转码存在的问题,本专利技术给出了一种在G.729AB与AMR-12.2kbps间高效的转码方法。该方法在保证语音质量的前提下,使转码算法的计算复杂度降低40%以上。该专利技术具有转码后语音质量高、计算复杂度低、转码算法延时小等优点,从而可降低设备的成本,保证不同设备供应商间设备的兼容与互通。G.729AB与AMR均基于CELP语音生成模型,两个编码算法对于语音信号的处理过程基本相同。G.729AB和AMR编解码算法的原理框图如图1所示:在编码端,首先,都需要将输入语音经过预处理后,通过VAD判决进行分类,分为语音帧和非语音帧;然后,根据不同的帧类型选用不同的编码方法:对于语音帧,采用高速率的语音帧编码算法;对于非语音帧,采用DTX技术进行编码处理,将需要传送的噪声信息通过SID帧发送到解码端;最后,将编码后的比特流进行传输。在解码端,根据不同的帧类型,选择不同的解码算法来生成合成语音:对非语音帧,采用CNG算法生成合成语音;对语音帧,采用语音帧解码算法生成合成语音。最后对合成语音作一些后置处理以改善音质。现有技术介绍为了解决DTE方式转码存在的问题,国内外提出了一些转码方法。下面结合几篇外文文献和专利,对现有转码技术进行简要介绍。现有技术简介(1)2004年,M.Ghenania在文献“Low-costSmartTranscodingAlgorithmbetweenITU-TG.729(8kbit/s)and3GPPNB-AMR(12.2kbit/s)”中提出了一种G.729与AMR12.2kbit/s之间的转码方法。其基本思路是:将源解码器解码得到的LSP参数和基音延时参数直接赋值给目标编码器;对于代数码书,则利用源编码器搜索得到的代数码书脉冲位置附近的N个非零脉冲构成子代数码书;然后,目标编码器在子代数码书上,采用目标编码器的代数码书搜索算法来得到代数码书脉冲位置和符号。(2)在公开号为US20050075868A1的美国专利中,申请人公开了一种从EVRC到G.729AB转码的方法。其基本思路是:通过内插EVRC的LSP参数来得到G.729AB的LSP参数,将EVRC的闭环基音延时赋值给G.729AB的开环基音延时,利用EVRC固定码本文档来自技高网
...
一种G.729到AMR12.2速率的转码方法

【技术保护点】
一种G.729到AMR12.2速率的转码方法,其特征在于:将输入比特流输入到G.729AB解码单元,利用G.729AB解码单元对输入比特流进行解码,然后将解码得到的帧类型、LSP系数、基音延时、固定码本矢量、码本增益以及合成语音输入G.729AB到AMR?12.2kbps转码单元,对每一部分进行相应的转码,最后将转码后的各个参数输入到AMR?12.2kbps编码单元,按照AMR?12.2kbps量化方法重新量化后,写入到输出比特流。

【技术特征摘要】
1.一种G.729到AMR12.2速率的转码方法,其特征在于:将输入比特流输入到G.729AB解码单元,利用G.729AB解码单元对输入比特流进行解码,然后将解码得到的帧类型、LSP系数、基音延时、固定码本矢量、码本增益以及合成语音输入G.729AB到AMR-12.2kbps转码单元,对每一部分进行相应的转码,最后将转码后的各个参数输入到AMR-12.2kbps编码单元,按照AMR-12.2kbps量化方法重新量化后,写入到输出比特流;G.729AB到AMR-12.2kbps转码单元的工作过程为:(1)VAD部分屏蔽AMR编码时的VAD操作,利用G.729AB解码得到的帧类型信息判断AMR-12.2kbps编码时VAD的信息,具体作法如下:1)若G.729AB解码得到的帧类型ftype=1,则VAD_flagG.729AB=1;否则,VAD_flagG.729AB=0;2)根据连续两帧G.729AB的VAD_flag判断AMR编码端VAD_flag的值,VAD_flag的值为VAD_flagAMR=VAD_flagG.729AB_1||VAD_flagG.729AB_2;(11)这里,VAD_flagG.729AB_1表示第一帧G.729AB的VAD信息,VAD_flagG.729AB_2表示第二帧G.729AB的VAD信息;(2)LSP部分将G.729AB第2n-1帧和第2n帧的LSP参数,传递给AMR-12.2kbps第n帧的第二子帧和第四子帧,即其中,表示G.729AB第2n-1帧的LSP系数,表示G.729AB第2n帧的LSP系数,表示AMR-12.2kbps第n帧的第二子帧的LSP系数,表示AMR-12.2kbps第n帧的第四子帧的LSP系数;第一和第三子帧的LSP系数由下式得到:各子帧LSP系数的奇数项记为q2i-1,偶数项记为q2i,各子帧的LSP系数转换为对应的LP系数ai的过程均可由如下步骤实现:1)循环变量i取值范围从1到5,每次增加1;每次变量i循环时,执行f1(i)=-2q2i-1f1(i-1)+2f1(i-2)操作;2)循环变量j取值范围从i-1到1,每次减少1;每次循环变量j循环时,执行f1(j)=f1(j)-2q2i-1f1(j-1)+f1(j-2)操作;其中,f1(0)=1,f1(-1)=0;将q2i-1替换成q2i即可得到f2(i);3)由f1(i),f2(i)计算f1'(i),f2'(i):f1'(i)=f1(i)+f1(i-1),i=1,...,5;f2'(i)=f2(i)+f2(i-1),i=1,…,54)计算LP系数:(3)开环基音搜索部分将G.729AB第2n-1帧和第2n帧的第一子帧闭环基音参数作为AMR-12.2kbps第n帧的两个开环基音参数:(4)自适应码本搜索部分1)计算基音延时的搜索范围[t0_min,t0_max]在第一/第三子帧,t0_min=max{18,TOP-3},t0_max=min{143,TOP+3};在第二/第四子帧,t0_min=max{18,Tpmi-5},t0_max=min{143,Tpmi+4},其中Tpmi是前一子帧基音分数延时的最大整数部分;2)计算LP滤波器的残差信号resLP(n):其中,s(n)是G.729AB解码后得到的合成语音;是量化了的LP系数,其中i=1,2,…,10;3)将残差信号resLP(n)通过感知加权合成滤波器h(n),从而得到用于自适应码本搜索的目标信号x(n),即x(n)=resLP(n)*h(n);(19)4)计算x(n)与h(n)的相关:5)将LP残差信号赋值给激励信号u(n):u(n)=resLP(n),n=0,…,39;6)计算R(k):7)求出R(k)最大值对应的k,即为最佳整数基音延时;8)在最佳整数基音延时k附近以分数1/6为步长内插R(k):其中,b24是内插滤波器系数,t=0,…,5分别对应分数0、1/6、2/6、3/6、-2/6和-1/6;搜索R(k)t的最大值所对应的t,即为最佳分数基音延时;9)确定基音延时后,在给出的整数延时k和分数延时t处内插过去的激励u(n)来计算自适应码本矢量v(n):其中,b60是内插滤波器系数;10)计算自适应码本的增益:其中,y(n)=v(n)*h(n);(5)固定码本搜索部分1)计算固定码本搜索的目标信号x2(n):其中,y(n)=v(n)*h(n)是自适应码本矢量滤波,是量化了的自适应码本增益;2)计算x2(n)与h(n)的相关信号d(n):3)计算h(n)的自相关矩阵φ,其中φ的每个元素按下式计算:4)计算量化信号b(n):5)计算符号信号S(n)=sgn[b(n)];6)脉冲搜索位置预选;按量化信号|b(n)|从大到小的顺序重置每个轨道的脉冲位置;用前M区的脉冲位置作为搜索脉冲的候选,取M=5;7)记录|b(n)|最大值的位置及其所在轨道数;将i0固定在所有轨道中|b(n)|最大值的位置,i1固定在下一轨道中|b(n)|最大值的位置;8)在候选的脉冲搜索位置上,按照AMR编码标准里的深度优先树方法搜索出其它8个脉冲的位置,即脉冲{i2,i3}、{i4,i5}、{i6,i7}、{i8,i9}在依次轨道上成对地、顺序地在嵌套环中搜索出;搜索准则是使下式最大:其中,mi是第i个脉冲的位置,N是脉冲的个数,N=10;9)计算固定码本矢量c(n):其中,Si是第i个脉冲的符号,mi是第i个脉冲的位置,N是脉冲的个数;10)计算固定码本增益gc:2.根据权利要求1所述的一种G.729到AMR12.2速率的转...

【专利技术属性】
技术研发人员:陈喆殷福亮李腾
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1