当前位置: 首页 > 专利查询>清华大学专利>正文

多模式多级码本联合优化方法技术

技术编号:11765999 阅读:136 留言:0更新日期:2015-07-23 17:37
本发明专利技术公开了一种多模式多级码本联合优化方法,属于低速率语音编码矢量量化技术领域,解决了现有的多模式多级码本训练中,误码对系统失真的影响较大的技术问题。该多模式多级码本联合优化方法包括:输出待量化矢量;对所述待量化矢量进行训练,获得各模式各级初始化码本;对所述各模式各级初始化码本进行码本索引的重排,获得新的码本;对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和量化索引;利用输入残差矢量和对应的量化索引,更新各级各模式最优码字,并迭代至预设次数;获取最后一次迭代得出的码本。

【技术实现步骤摘要】

本专利技术涉及低速率语音编码矢量量化
,具体地说,涉及一种多模式多级 码本联合优化方法。
技术介绍
随着音频技术的发展,低速率语音编码在无线通信、卫星通信等领域有着广泛的 应用。 在低速率语音编码中,由于受到存储量及运算量的限制,往往采用受约束的矢量 量化方式,其中包括树型矢量量化、分类矢量量化、多级矢量量化、变换域矢量量化等,以降 低码本的存储量和运算量。其中,以多级矢量量化最为常用。另一方面,分模式矢量量化 虽然会增加一定的存储量,但是它可以在不额外增加比特的情况下,有效的降低量化误差。 在低速率语音编码的众多应用领域中,往往时刻伴随着误码的存在。对于多模式多级矢量 量化,一旦发生误码,不仅各级码本索引会出错,而且模式的选择也会出错,这样在解码端 合成的参数往往与编码端的输入参数出现较大的偏差,严重影响合成语音的可懂度和舒适 度。 传统的分模式多级矢量量化,以信源最优为准则进行码本训练和码本的联合优 化,由于不考虑信道误码情况,信源最优的多模式多级矢量量化的系统失真即为量化失真。 这样训练出来的最优码字均匀分布在整个量化空间中,而一旦发生误码,整个系统失真也 会比较大。 基于上述情况,现有的多模式多级码本训练中,误码对系统失真的影响较大,影响 了对反量化码字以及合成语音的质量。
技术实现思路
本专利技术的目的在于提供一种,以解决现有的多模式 多级码本训练中,误码对系统失真的影响较大的技术问题。 本专利技术提供一种,包括: 步骤1,输出待量化矢量; 步骤2,对所述待量化矢量进行训练,获得各模式各级初始化码本,其中,级数为 M; 步骤3,对所述各模式各级初始化码本进行码本索引的重排,获得新的码本; 步骤4,对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和 量化索引; 步骤5,对于第m级码本,利用本级的输入残差矢量和对应的量化索引,更新本级 各模式最优码字,其中,m的初始值为1;步骤6,比较m与M的值; 如果m〈M,则将m的值加1,并返回步骤4; 如果m=M,则进行步骤7 ; 步骤7,判断迭代次数t是否达到预设值T,其中,t的初始值为1 ; 如果t〈T,则将t的值加1,将m的值重置为1,并返回步骤4 ; 如果t=T,则进行步骤8; 步骤8,获取最后一次迭代得出的码本。 优选的是,所述步骤1,具体为: 在低速率语音编码中,对语音库根据分模式依据参数的量化索引作为模式的编 号,输出待量化参数在各模式下待量化矢量。 所述语音库优选为具有设定采样频率的、具有一定时长的、包含多种音色的标准 中文语音库。所述设定采样频率优选为8kHz。 优选的是,所述步骤2,具体为: 将各模式待量化矢量作为码本训练和联合优化的输入矢量,分别采用基于模拟退 火的码本训练方法,按照各级分配的比特数进行多级码本训练,获得各模式各级初始化码 本。 优选的是,所述步骤3,具体为: 对所述各模式各级初始化码本,采用基于禁忌搜索的方法进行码本索引的重排, 获得新的码本。 优选的是,T的取值范围在20至40之间。 本专利技术带来了以下有益效果:本专利技术提供的中,通 过多次迭代获得信道最优的多模式多级矢量量化的最优码本,其中的码字并不是当前胞腔 的质心,而是各个胞腔质心通过误码转移概率加权平均得到的。相比于现有的信源最优的 多模式多级矢量量化方式,本专利技术中最优码字之间的距离比较小,一旦发生误码,整个系统 失真也会显著减小,从而减弱了误码对系统失真的影响,提高了系统的抗误码性能。因此, 在多模式多级矢量量化和传输过程中,能够有效降低信道误码情况下反量化码字与输入参 数的系统失真,并有效提高信道误码情况下合成语音的质量。 本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利 要求书以及附图中所特别指出的结构来实现和获得。【附图说明】 为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要的 附图做简单的介绍: 图1是本专利技术实施例提供的的流程图。【具体实施方式】 以下将结合附图及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用 技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明 的是,只要不构成冲突,本专利技术中的各个实施例以及各实施例中的各个特征可以相互结合, 所形成的技术方案均在本专利技术的保护范围之内。 本专利技术实施例提供一种,可应用于低速率语音编码 中。如图1所示,该方法包括: Sl:输出待量化矢量。 具体的,在低速率语音编码中,对语音库根据分模式依据参数的量化索引作为模 式的编号,输出待量化参数在各模式下待量化矢量。其中,语音库优选为具有设定采样频率 的、具有一定时长的、包含多种音色的标准中文语音库。 本实施例中采用的语音库的采样频率为8kHz,时长可以为数个小时,其中包含不 同性别、不同年龄的多种音色。对该语音库,线谱对参数每20ms提取10维系数,去预测、去 均值后作为待量化参数,并利用清浊音参数的量化索引作为模式编号。 S2 :对待量化矢量进行训练,获得各模式各级初始化码本。 具体的,将各模式待量化矢量作为码本训练和联合优化的输入矢量,分别采用基 于模拟退火的码本训练方法,按照各级分配的比特数进行多级码本训练,获得各模式各级 初始化码本。 对于典型的多模式多级矢量量化器,U种模式M级的语音编码器Q将K维(K= 10) 的输入矢量X= 映射到对应的模式U和索引/"=忙名,..4},得到对应的码【主权项】1. 一种,其特征在于,包括: 步骤1,输出待量化矢量; 步骤2,对所述待量化矢量进行训练,获得各模式各级初始化码本,其中,级数为M; 步骤3,对所述各模式各级初始化码本进行码本索引的重排,获得新的码本; 步骤4,对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和量化 索引; 步骤5,对于第m级码本,利用本级的输入残差矢量和对应的量化索引,更新本级各模 式最优码字,其中,m的初始值为1 ; 步骤6,比较m与M的值; 如果m〈M,则将m的值加1,并返回步骤4 ; 如果m=M,则进行步骤7; 步骤7,判断迭代次数t是否达到预设值T,其中,t的初始值为1 ; 如果t〈T,则将t的值加1,将m的值重置为1,并返回步骤4 ; 如果t=T,则进行步骤8 ; 步骤8,获取最后一次迭代得出的码本。2. 根据权利要求1所述的方法,其特征在于,所述步骤1,具体为: 在低速率语音编码中,对语音库根据分模式依据参数的量化索引作为模式的编号,输 出待量化参数在各模式下待量化矢量。3. 根据权利要求2所述的方法,其特征在于,所述语音库为具有设定采样频率的、具有 一定时长的、包含多种音色的标准中文语音库。4. 根据权利要求3所述的方法,其特征在于,所述设定采样频率为8kHz。5. 根据权利要求1所述的方法,其特征在于,所述步骤2,具体为: 将各模式待量化矢量作为码本训练和联合优化的输入矢量,分别采用基于模拟退火的 码本训练方法,按照各级分配的比特数进行多级码本训练,获得各模式各级初始化码本。6. 根据权利要求1所述的方法,其特征在于,所述步骤3,具体为: 对所述各模式本文档来自技高网...

【技术保护点】
一种多模式多级码本联合优化方法,其特征在于,包括:步骤1,输出待量化矢量;步骤2,对所述待量化矢量进行训练,获得各模式各级初始化码本,其中,级数为M;步骤3,对所述各模式各级初始化码本进行码本索引的重排,获得新的码本;步骤4,对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和量化索引;步骤5,对于第m级码本,利用本级的输入残差矢量和对应的量化索引,更新本级各模式最优码字,其中,m的初始值为1;步骤6,比较m与M的值;如果m<M,则将m的值加1,并返回步骤4;如果m=M,则进行步骤7;步骤7,判断迭代次数t是否达到预设值T,其中,t的初始值为1;如果t<T,则将t的值加1,将m的值重置为1,并返回步骤4;如果t=T,则进行步骤8;步骤8,获取最后一次迭代得出的码本。

【技术特征摘要】

【专利技术属性】
技术研发人员:徐敬德崔慧娟唐昆
申请(专利权)人:清华大学信瑞递北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1