语音编码系统技术方案

技术编号:3046930 阅读:224 留言:0更新日期:2012-04-11 18:40
提供了一种带有特别的固定码本结构和新的搜索例行程序的语音压缩系统,用于语音编码。该系统能够把语音信号编码为位流,在此之后对其进行解码以产生合成语音。码本结构使用多个子码本。每一子码本被设计为适配特定的语音信号组。对每一子码本计算基准值以便在作为编码系统一部分的最小环中使误差信号最小化。一外部信号设置最大位流速率,用于把编码的语音传送到通信系统中。该语音压缩系统包括全速率编解码器、半速率编解码器、四分之一速率编解码器和八分之一编解码器。每一编解码器有选择地被激活以便以不同的位速率对语音信号编码和解码,以便在有限的平均位速率下提高合成语音的整体质量。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
与相关申请的交叉参考本申请是在1998年9月18日提交的、申请号为No.09/156,814、标题为“用于语音编码器的完整的固定的码本”、并转让给本专利技术的受让人的申请的部分继续申请,该申请的公开被结合作为参考。以下的申请被整体结合以作为参考并构成本申请的一部分美国临时申请No.60/097,569(代理人文档号No.98RSS325),标题为“自适应性速率语音编/解码”,1998年8月24日提交;美国专利申请No.09/154,675(代理人文档号No.97RSS383),标题为“在长期预处理中使用连续扭曲的语音编码器”,1998年9月18日提交;美国专利申请No.09/156,649(代理人文档号No.95EO20),标题为“组合码本结构”,1998年9月18日提交;美国专利申请No.09/156,648(代理人文档号No.98RSS228),标题为“低复杂性的随机码本结构”,1998年9月18日提交;美国专利申请No.09/156,650(代理人文档号No.98RSS343),标题为“使用组合开环和闭环增益的增益规一化的语音编码器”,1998年9月18日提交;美国专利申请No.09/156,832(代理人文档号No.97RSS039),标题为“使用话音活动检测编码噪声的语音编码器”,1998年9月18日提交;美国专利申请No.09/154,654(代理人文档号No.98RSS344),标题为“使用语音分类和现有音调估计的音调确定”,1998年9月18日提交;美国专利申请No.09/154,657(代理人文档号No.98RSS328),标题为“使用平滑噪声编码的分类器的语音编码器”,1998年9月18日提交;美国专利申请No.09/156,826(代理人文档号No.98RSS382),标题为“用于合成语音残留的自适应性倾斜补偿”,1998年9月18日提交;美国专利申请No.09/154,662(代理人文档号No.98RSS383),标题为“码本搜索中使用的语音分类和参数加权”,1998年9月18日提交;美国专利申请No.09/154,653(代理人文档号No.98RSS406),标题为“使用语音参数的合成编码器-解码器帧隐蔽”,1998年9月18日提交;美国专利申请No.09/154,663(代理人文档号No.98RSS345),标题为“自适应性降低增益以产生固定的码本目标信号”,1998年9月18日提交;美国专利申请No.09/154,660(代理人文档号No.98RSS384),标题为“自适应性应用音调长期预测和带有连续扭曲的音调预处理的语音编码器”,1998年9月18日提交。以下共同未决的共同转让的美国专利申请已经在本申请同一天提交。所有这些申请与本申请中公开的实施例相关并进一步描述了其它方面,并一并结合以资参考。美国专利申请号____,“向用于低位速率CELP的脉冲激励注入高频噪声”,代理人参考号00CXT0065D(10508.5),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“CELP语音编码中的短期增强”,代理人参考号00CXT0666N(10508.6),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“用于语音编码中的脉冲样激励的动态脉冲位置跟踪系统”,代理人参考号00CXT0537N(10508.7),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“带有时域噪声衰减的语音编码系统”,代理人参考号00CXT0554N(10508.8),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“用于自适应性激励语音编码模式的系统”代理人参考号98RSS366(10508.9),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“使用带有不同分辩级别的自适应性码本编码语音信息的系统”,代理人参考号00CXT0670N(10508.13),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“用于编码和解码的码本表”,代理人参考号00CXT0669N(10508.14),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“用于传输编码的语音信号的比特流协议”,代理人参考号00CXT0668N(10508.15),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“用于过滤语音编码信号的内容的系统”,代理人参考号00CXT0667N(10508.16),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“对语音信号进行编码和解码的系统”,代理人参考号00CXT0665N(10508.17),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“具有自适应性帧结构的编码系统”,代理人参考号00CXT0384CIP(10508.18),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“改进使用带有子码本的音调增强的系统”代理人参考号00CXT0569N(10508.19),2000年9月15日提交,且现在是美国专利号____。人类通信的一种流行的方式涉及通信系统的使用。通信系统包括有线和无线电系统。无线通信系统与陆地线路系统电连接,并使用射频(RF)与移动通信装置通信。当前,例如在蜂窝式系统中通信可用的射频是大约以900MHz为中心的频率范围,并在个人通信服务(PCS)频率范围大约以1900MHz为中心。由于诸如蜂窝式电话等无线通信装置不断地普及引起的增加的通信量,于是希望能够降低无线系统内的传输带宽。无线电远程通信中的数字传输,由于其抗噪声性、可靠性、设备的小型化、以及能够使用数字技术实现复杂的信号处理功能的能力,而正在不断广泛地用于话音和数据两者。语音信号的数字传输涉及这样的步骤使用模拟-数字转换器对模拟语音波形采样、语音压缩(编码)、传输、语音解压缩(解码)、数字到模拟的转换、以及向耳机或扬声器重放。使用模拟到数字转换器的模拟语音波形的采样生成数字信号。然而,在数字信号中用来表示模拟语音波形的位数生成了相当大的带宽。例如,以8000Hz(每0.125ms一次)速率其中每一采样由16位表示的采样的语音信号,将有每秒128,000(16×8000)位或128 kbps(千位每秒)的位速率。语音压缩可降低表示语音信号的位数,这样就降低了传输所需的带宽。然而,语音压缩可能造成解压缩的语音质量的劣化。一般来说,较高的位速率会产生较高的质量,而较低的位速率会产生是较低的质量。然而语音压缩技术,诸如编码技术,能够以相对低的位速率产生相对高质量的解压缩语音。一般来说,在保留或不保留实际的语音波形下,低位速率编码技术试图表示语音信号感知上的重要特征。典型地,对适当感知表示比较困难或比较重要的语音信号部分(诸如浊音语音,爆破音或浊音启动)使用较高位数编码并传输。对适当感知表示不很困难或不很重要的语音信号部分(诸如非浊音,或词句之间的寂静)使用较低位数编码。由此产生的语音信号的平均位速率本文档来自技高网...

【技术保护点】
一种语音编码系统,包括: 语音处理电路,配置为接收语音波形, 其中语音处理电路包括具有多个子码本的码本,至少两个子码本不同,以及 其中每一子码本包括多个脉冲位置,用于响应语音波形产生至少一个码向量。

【技术特征摘要】
US 2000-9-15 09/663,2421.一种语音编码系统,包括语音处理电路,配置为接收语音波形,其中语音处理电路包括具有多个子码本的码本,至少两个子码本不同,以及其中每一子码本包括多个脉冲位置,用于响应语音波形产生至少一个码向量。2.根据权利要求1的语音编码系统,其中多个子码本包括至少一个脉冲状子码本和噪声状子码本。3.根据权利要求1的语音编码系统,其中至少一个码向量是脉冲状和噪声状之一。4.根据权利要求1的语音编码系统,其中多个脉冲位置包括至少一个轨迹,且其中至少一个码向量包括从至少一个轨迹中选择的至少一个脉冲。5.根据权利要求4的语音编码系统,其中至少一个脉冲包括第一脉冲和第二脉冲,其中至少一个轨迹包括第一轨迹和第二轨迹,且其中第一脉冲从第一轨迹中选择,且第二脉冲从第二轨迹中选择。6.根据权利要求5的语音编码系统,其中其中至少一个脉冲还包括第三脉冲,其中至少一个轨迹还包括第三轨迹,且其中第三脉冲是从第三轨迹中选择的。7.根据权利要求6的语音编码系统,其中第三轨迹的至少一个脉冲位置不同于第一轨迹和第二轨迹的至少之一的至少一个脉冲位置。8.根据权利要求1的语音编码系统,其中多个子码本包括第一子码本,提供包括第一脉冲和第二脉冲的第一码向量;第二子码本,提供包括第三脉冲、第四脉冲和第五脉冲的第二码向量;以及第三子码本,提供包括第六脉冲、第七脉冲、第八脉冲、第九脉冲和第十脉冲的第三码向量。9.根据权利要求8的语音编码系统,其中第一子码本包括第一轨迹和第二轨迹,其中第一脉冲从第一轨迹中选择,且第二脉冲从第二轨迹中选择;其中第二子码本包括第三轨迹,第四轨迹和第五轨迹,其中第三脉冲从第三轨迹中选择,第四脉冲从第四轨迹中选择,且第五脉冲从第五轨迹中选择;以及其中第三子码本包括第六轨迹、第七轨迹、第八轨迹、第九轨迹和第十轨迹,其中第六脉冲从第六轨迹中选择,第七脉冲从第七轨迹中选择,第八脉冲从第八轨迹中选择,第九脉冲从第九轨迹中选择,且第十脉冲从第十轨迹中选择。10.根据权利要求9的语音编码系统,其中第一轨迹包括脉冲位置0,1,2,3,4,5,6,7,8,9,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52;其中第二轨迹包括脉冲位置1,3,5,7,9,11,12,13,14,15,16,17,18,19,20,21,22,23 25,27,29,31,33,35,37,39,41,43,44,45,47,51;其中第三轨迹包括脉冲位置3,6,9,12,15,18,21,24,27,30,33,36,39,42,45,48;其中第四轨迹包括脉冲位置Pos1-2,Pos1,Pos1+2,Pos1+4;其中第五轨迹包括脉冲位置Pos1-3,Pos1-1,Pos1+1,Pos1+3;其中第六轨迹包括脉冲位置0,15,30,45;其中第七轨迹包括脉冲位置0,5;其中第八轨迹包括脉冲位置10,20;其中第九轨迹包括脉冲位置25,35;以及其中第十轨迹包括脉冲位置40,50,其中第四和第五轨迹相对于Pos1是动态的,Pos1是第三脉冲的确定的位置并限制在子帧内。11.根据权利要求9的语音编码系统,其中第四轨迹和第五轨迹的脉冲候选位置分别具有相对于第三脉冲确定的位置的相对位移。12.根据权利要求11的语音编码系统,其中相对位移包括2位以及对于第三脉冲的位置包括4位。13.根据权利要求12的语音编码系统,其中第三脉冲的位置包括3,6,9,12,15,18,21,24,27,30,33,36,39,42,45,48。14.根据权利要求1的语音编码系统,其中多个子码本包括第一子码本,提供包括第一脉冲、第二脉冲、第三脉冲、第四脉冲和第五脉冲的第一码向量;第二子码本,提供包括第六脉冲、第七脉冲、第八脉冲、第九脉冲和第十脉冲的第二码向量;以及第三子码本,提供包括第十一脉冲、第十二脉冲、第十三脉冲、第十四脉冲和第十五脉冲的第三码向量。15.根据权利要求14的语音编码系统,其中第一子码本包括第一轨迹、第二轨迹、第三轨迹、第四轨迹和第五轨迹,其中第一脉冲选自第一轨迹,第二脉冲选自第二轨迹,第三脉冲选自第三轨迹,第四脉冲选自第四轨迹,并且第五脉冲选自第五轨迹;其中第二子码本包括第六轨迹、第七轨迹、第八轨迹、第九轨迹和第十轨迹,其中第六脉冲选自第六轨迹,第七脉冲选自第七轨迹,第八脉冲选自第八轨迹,第九脉冲选自第九轨迹,第十脉冲选自第十轨迹;以及其中第三子码本包括第十一轨迹、第十二轨迹、第十三轨迹、第十四轨迹和第十五轨迹,其中第十一脉冲选自第十一轨迹,第十二脉冲选自第十二轨迹,第十三脉冲选自第十三轨迹,第十四脉冲选自第十四轨迹,并且第十五脉冲选自第十五轨迹。16.根据权利要求15的语音编码系统,其中第一轨迹包括脉冲位置1,3,6,8,11,13,16,18,21,23,26,28,31,33,36,38;其中第二轨迹包括脉冲位置4,9,14,19,24,29,34,39;其中第三轨迹包括脉冲位置1,3,6,8,11,13,16,18,21,23,26,28,31,33,36,38;其中第四轨迹包括脉冲位置4,9,14,19,24,29,34,39;其中第五轨迹包括脉冲位置0,2,5,7,10,12,15,17,20,22,25,27,30,32,35,37;其中第六轨迹包括脉冲位置0,1,2,3,4,6,8,10其中第七轨迹包括脉冲位置5,9,13,16,19,22,25,27其中第八轨迹包括脉冲位置7,11,15,18,21,24,28,32;其中第九轨迹包括脉冲位置12,14,17,20,23,26,30,34;其中第十轨迹包括脉冲位置29,31,33,35,36,37,38,39;其中第十一轨迹包括脉冲位置0,1,2,3,4,5,6,7;其中第十二轨迹包括脉冲位置8,9,10,11,12,13,14,15;其中第十三轨迹包括脉冲位置16,17,18,19,20,21,22,23;其中第十四轨迹包括脉冲位置24,25,26,27,28,29,30,31;以及其中第十五轨迹包括脉冲位置32,33,34,35,36,37,38,39。17.根据权利要求1的语音编码系统,其中多个子码本包括高斯子码本。18.根据权利要求17的语音编码系统,其中高斯子码本产生高斯码向量。19.根据权利要求17的语音编码系统,其中多个子码本还包括第一子码本,提供包括第一脉冲和第二脉冲的第一码向量;以及第二子码本,提供包括第三脉冲、第四脉冲和第五脉冲的第二码向量。20.根据权利要求19的语音编码系统,其中第一子码本包括第一轨迹和第二轨迹,其中第一脉冲选自第一轨迹且第二脉冲选自第二轨迹;以及其中第二子码本包括第三轨迹、第四轨迹和一第五轨迹,其中第三脉冲选自第三轨迹,第四脉冲选自第四轨迹,第五脉冲选自第五轨迹。21.根据权利要求20的语音编码系统,其中第一轨迹包括脉冲位置0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79;其中第二轨迹包括脉冲位置0,1,2,3,4,5,6,7,8,9,10,11,1...

【专利技术属性】
技术研发人员:Y高
申请(专利权)人:康奈克森特系统公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1