当前位置: 首页 > 专利查询>清华大学专利>正文

带级间预测的超帧声道参数多级矢量量化方法技术

技术编号:3044357 阅读:229 留言:0更新日期:2012-04-11 18:40
带级间预测的超帧声道参数多级矢量量化方法涉及超帧声道参数矢量量化方法,属于低速率语音压缩编码技术领域,其特征在于,该方法对已有的基于模式的去直流去帧间预测的多级矢量量化方案进行改进,多级矢量量化过程中,利用上一级码本的选定码矢对残差矢量进行预测,得到预测值,下一级矢量量化的待量化值由上一级矢量量化的待量化值减去上一级的选定码矢及预测值后得到。测试结果表明,这种带有多级码本级间预测的算法与无级间预测的算法相比能够有效提高声道参数的量化精度,使合成语音具有更高的可懂性。该方法适合300b/s-2400b/s低速率参数语音编码。

【技术实现步骤摘要】

属于语音编码
,特别涉及多帧联合处理低码率参数语音编码技术。
技术介绍
语音编码在通信系统、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。近些年来国际电信联盟(ITU)、一些区域组织和一些国家相继制定了一系列语音压缩编码标准,在编码速率为1.2kb/s到16kb/s上得到了令人满意的语音质量。目前国内外的研究主要集中在1.2kb/s以下速率高质量语音压缩编码上,主要用于无线通信、保密通信、大容量语音存储回放等。由于编码速率太低,必须采用多帧联合(即超帧)处理的参数语音编码技术,其中最关键的是如何对声道参数进行量化,因为声道参数量化所需要的比特数最高,对它量化的质量将决定语音可懂度。 直接对声道A参数量化效果不好,因此需要将声道A参数转成线谱对参数,然后再进行量化。如图1所示,该方法包括以下步骤 步骤(1)对输入语音信号样点按时间顺序分帧,将连续的若干帧组成一个超帧; 步骤(2)对当前超帧中的每一帧提取声道A参数; 步骤(3)将当前超帧中的每一帧声道A参数转换成线谱对参数; 步骤(4)对当前超帧中的每一帧提取清浊音参数; 步骤(5)对当前超帧的清浊音参数进行矢量量化,得到当前超帧量化后的清浊音参数量化值; 步骤(6)根据当前超帧清浊音参数量化值确定当前超帧模式; 步骤(7)根据当前超帧的模式确定当前超帧中每一个线谱对参数的直流分量,并从每一个线谱对参数中减去相应的直流分量; 步骤(8)根据当前超帧模式和前一个超帧的模式确定一组线谱对参数预测系数; 步骤(9)利用这一组预测系数和前一超帧中最后一帧量化后的余量线谱对参数计算预测值;从当前超帧中每一个已去直流线谱对参数中减去相应的预测值,得到当前超帧的余量线谱对参数; 步骤(10)对当前超帧的余量线谱对参数进行多级矢量量化,得到当前超帧量化后的余量线谱对参数; 步骤(11)将上述步骤(7)得到的直流分量和上述步骤(9)得到的预测值加到量化后的余量线谱对参数中得到量化后的线谱对参数; 步骤(12)将当前超帧量化后的线谱对参数转换成声道A参数,得到量化后的声道A参数。 上述已有技术对超帧线谱对参数采用矢量量化,在矢量量化之前对线谱对参数去除直流分量,并利用已处理过的上一超帧线谱对参数对当前超帧的线谱对参数进行预测,然后去除预测分量,再进行多级矢量量化。但在多级矢量量化过程中,搜索上一级码本所选定的码矢和下一级待量化的残差矢量之间的相关性却没有得到充分利用,因而量化质量并不是最优的。 如图1所示,原有技术只去除了各帧之间的相关性,但在低速率参数语音编码技术中,对各参数尤其是LSF的量化精度要求很高,仅去除帧间冗余信息,不足以达到较高的量化质量。
技术实现思路
本专利技术的目的是克服已有技术的不足之处,提出一种超帧声道参数矢量量化的方法,能够充分利用超帧之间、多级矢量量化中上一级码本的选定码矢和残差矢量之间的相关性,预测效率及量化精度更高。 本专利技术提出的带级间预测的超帧声道参数量化方法,包括以下步骤 步骤(1)对输入语音信号样点按时间顺序分帧,将连续的若干帧组成一个超帧; 步骤(2)对当前超帧中的每一帧提取声道A参数; 步骤(3)将当前超帧中的每一帧声道A参数转换成线谱对参数; 步骤(4)对当前超帧中的每一帧提取清浊音参数; 步骤(5)对当前超帧的清浊音参数进行矢量量化,得到当前超帧量化后的清浊音参数量化值; 步骤(6)根据当前超帧清浊音参数量化值确定当前超帧模式; 步骤(7)根据当前超帧的模式确定当前超帧中每一个线谱对参数的直流分量,并从每一个线谱对参数中减去相应的直流分量; 步骤(8)根据当前超帧模式和前一个超帧的模式确定一组线谱对参数预测系数; 步骤(9)利用这一组预测系数和前一超帧中最后一帧量化后的余量线谱对参数计算预测值;从当前超帧中每一个已去直流线谱对参数中减去相应的预测值,得到当前超帧的余量线谱对参数R;同时,设定变量R1=R,设定变量i,令i=1; 步骤(10)对Ri进行矢量量化,在当前第i级码本中搜索与待量化矢量最近的码矢 若当前级为最后一级,跳至步骤(14); 步骤(11)根据多级矢量量化级数及当前级数确定一组级间预测系数αn(i,i+1),利用这一组预测系数和当前第i级已定码矢得到级间预测值Rip,其中, 步骤(12)从第i级待量化线谱对参数Ri中减去步骤(10)中搜索所得到的码矢 及步骤(11)得到的预测值Rip,得到第i+1级待量化的矢量参数Ri+1; 步骤(13)令i=i+1,重复(10),(11),(12)的步骤,直至完成多级矢量量化最后一级; 步骤(14)将多级矢量量化各级的选定码矢及级间预测值相加求和,得到量化后的余量线谱对参数; 步骤(15)将上述步骤(7)得到的直流分量和上述步骤(9)得到的预测值加到步骤(14)量化后的余量线谱对参数中得到量化后的线谱对参数; 步骤(16)将当前超帧量化后的线谱对参数转换成声道A参数,得到量化后的声道A参数。 本专利技术的特点是在对线谱对参数的多级矢量量化过程中,不仅采用了帧间预测,在多级矢量量化过程中也采用了级间预测。目前的语音参数编码模型中,只考虑了超帧帧间的相关性,并利用了此相关性得到余量线谱对参数,从而降低了量化的计算量和存储量,并达到了较高的量化精度。本专利技术经过对大量语音样本统计,发现多级矢量量化中上一级码本搜索过程中所选定的码矢和下一级待量化残差矢量之间也存在一定的相关性,利用这种相关性可以提高低码率语音编码的性能。本专利技术利用余量线谱对参数多级矢量量化中,各级之间的相关性,进一步去除冗余信息,得到新的待量化参数,可以更好地完成余量线谱对的多级矢量量化。这种方法利用多级矢量量化中上一级码本搜索过程中选定码矢和残差矢量之间的相关性,使得对声道参数量化的精度得到了提高,进而提高了低码率语音编码的质量。 本方法可以提高声道参数的量化精度,使合成语音具有更高的可懂性。该方法最适合300~2400b/s低速率参数语音编码。 附图说明 图1为已有技术的超帧声道参数量化方法流程框图。 图2为本专利技术提出的超帧声道参数量化方法流程框图。 具体实施例方式 本专利技术提出的超帧声道参数矢量量化方法结合附图及实施例进一步说明如下 本专利技术的方法流程如图2所示,包括以下步骤 步骤(1)对输入语音信号样点按时间顺序分帧,将连续的若干帧组成一个超帧; 步骤(2)对当前超帧中的每一帧提取声道A参数; 步骤(3)将当前超帧中的每一帧声道A参数转换成线谱对参数; 步骤(4)对当前超帧中的每一帧提取清浊音参数; 步骤(5)对当前超帧的清浊音参数进行矢量量化,得到当前超帧量化后的清浊音参数量化值; 步骤(6)根据当前超帧清浊音参数量化值确定当前超帧模式; 步骤(7)根据当前超帧的模式确定当前超帧中每一个线谱对参数的直流分量,并从每一个线谱对参数中减去相应的直流分量; 步骤(8)根据当前超帧模式和前一个超帧的模式确定一组线谱对参数预测系数; 步骤(9)利用这一组预测系数和前一超帧中最后一帧量化后的余量线谱对参数计算预本文档来自技高网
...

【技术保护点】
带级间预测的超帧声道参数多级矢量量化方法,其特征在于,该方法依次按以下步骤实现:    步骤(1)对输入语音信号样点按时间顺序分帧,将连续的若干帧组成一个超帧;    步骤(2)对当前超帧中的每一帧提取声道A参数;    步骤(3)将当前超帧中的每一帧声道A参数转换成线谱对参数;    步骤(4)对当前超帧中的每一帧提取清浊音参数;    步骤(5)对当前超帧的清浊音参数进行矢量量化,得到当前超帧量化后的清浊音参数量化值;    步骤(6)根据当前超帧清浊音参数量化值确定当前超帧模式;    步骤(7)根据当前超帧的模式确定当前超帧中每一个线谱对参数的直流分量,并从每一个线谱对参数中减去相应的直流分量;    步骤(8)根据当前超帧模式和前一个超帧的模式确定一组线谱对参数预测系数;    步骤(9)利用这一组预测系数和前一超帧中最后一帧量化后的余量线谱对参数计算预测值;从当前超帧中每一个已去直流线谱对参数中减去相应的预测值,得到当前超帧的余量线谱对参数R;同时,设定变量R↓[1]=R,设定变量i,令i=1;    步骤(10)对R↓[i]进行矢量量化,在当前第i级码本中搜索与待量化矢量最近的码矢*↓[i];若当前级为最后一级,跳至步骤(14);    步骤(11)根据多级矢量量化级数及当前级数确定一组级间预测系数α↑[n](i,i+1),利用这一组预测系数和当前第i级已定码矢得到级间预测值R↓[i]↑[p],其中,R↓[i]↑[p]=α(i,i+1)*↓[i];    步骤(12)从第i级待量化线谱对参数R↓[i]中减去步骤(10)中搜索所得到的码矢*↓[i]及步骤(11)得到的预测值R↓[i]↑[p],得到第i+1级待量化的矢量参数R↓[i+1];    步骤(13)令i=i+1,重复(10),(11),(12)的步骤,直至完成多级矢量量化最后一级;    步骤(14)将多级矢量量化各级的选定码矢及级间预测值相加求和,得到量化后的余量线谱对参数;    步骤(15)将上述步骤(7)得到的直流分量和上述步骤(9)得到的预测值加到步骤(14)量化后的余量线谱对参数中得到量化后的线谱对参数;    步骤(16)将当前超帧量化后的线谱对参数转换成声道A参数,得到量化后的声道A参数。...

【技术特征摘要】
1、带级间预测的超帧声道参数多级矢量量化方法,其特征在于,该方法依次按以下步骤实现步骤(1)对输入语音信号样点按时间顺序分帧,将连续的若干帧组成一个超帧;步骤(2)对当前超帧中的每一帧提取声道A参数;步骤(3)将当前超帧中的每一帧声道A参数转换成线谱对参数;步骤(4)对当前超帧中的每一帧提取清浊音参数;步骤(5)对当前超帧的清浊音参数进行矢量量化,得到当前超帧量化后的清浊音参数量化值;步骤(6)根据当前超帧清浊音参数量化值确定当前超帧模式;步骤(7)根据当前超帧的模式确定当前超帧中每一个线谱对参数的直流分量,并从每一个线谱对参数中减去相应的直流分量;步骤(8)根据当前超帧模式和前一个超帧的模式确定一组线谱对参数预测系数;步骤(9)利用这一组预测系数和前一超帧中最后一帧量化后的余量线谱对参数计算预测值;从当前超帧中每一个已去直流线谱对参数中减去相应的预测值,得到当前超帧的余量线谱对参数R;同时,设定变量R1=R,设定变量i,令i=1;步骤(10)对Ri进行矢量量化,在当前第i级码本中搜索与待量化矢量最近的码矢若当前级为最后一级,跳至步骤(14);步骤(11)根据多级矢量量化级数及当前...

【专利技术属性】
技术研发人员:崔慧娟唐昆李晔彭坦许明
申请(专利权)人:清华大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利