可变比特率宽带语音编码中增益量化的方法和装置制造方法及图纸

技术编号:3045748 阅读:178 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种增益量化方法和装置,用于实现对编码期间由L个采样连续帧处理的采样声音信号进行编码的技术,其中每个帧被分为若干子帧,并且每个子帧包括N个采样,这里N<L。在该增益量化方法和装置中,基于f个子帧计算初始基音增益,选择与该初始基音增益相关的一部分增益量化码本,并联合量化基音和固定码本增益。对于f个子帧,对基音和固定码本增益的这个联合量化包括搜索与搜索标准相关的增益量化码本。码本搜索限制在增益量化码本的所选部分,并找寻最符合该搜索标准的增益量化码本所选部分的索引。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于对声音信号进行数字编码的改进技术,具体地说,考虑到该声音信号的传输和合成,而不仅仅指语音信号。
技术介绍
在诸如电话会议、多媒体和无线通信等各种应用领域中,对在主观质量和比特率之间具有优良权衡的高效数字窄带和宽带语音编码技术的需求不断增加。直到最近,限定在200-3400Hz之间的电话带宽已被主要用在语音编码应用中。不过,与传统电话带宽相比,宽带语音应用在通信方面提供了增强的可理解性和自然性。已经发现50-7000Hz范围内的带宽足以传送如同面对面通信的优良音质。对于一般音频信号来说,虽然该带宽给出了可接受的主观质量,但是其质量还是低于分别在20-16000Hz和20-20000Hz范围内操作的FM无线电或CD的质量。语音编码器将语音信号转换为通过通信信道传输或存储在存储介质中的数字比特流。该语音信号被数字化,即,采用通常16比特每采样进行采样和量化。语音编码器所扮演的角色是,在保持优良主观语音质量的同时用更少的比特数表示这些数字采样。语音解码器或合成器作用在所传输或存储的比特流上,并将其转换回声音信号。码激励线性预测(CELP)编码是在主观质量和比特率之间实现优良折衷的最好的先有技术之一。该编码技术构成无线和有线应用中几个语音编码标准的基础。在CELP编码中,在L个采样的连续块(通常称其为帧)中处理采样语音信号,这里L是预先确定的通常对应于10-30ms的数字。对每个帧都要计算和传输线性预测(LP)滤波器。对LP滤波器的计算通常需要先行,即,后续帧中的5-15ms语音片段。L个采样的帧被分为更小的块,称其为子帧。通常,子帧的数量是3或4,产生4-10ms子帧。在每个子帧中,通常从2个分量—以往激励和更新的固定码本激励中获得激励信号。通常将以往激励构成的分量称作自适应码本或基音(pitch)激励。对表征激励信号的参数进行编码,并将其传输到解码器,在此重构的激励信号用作LP滤波器的输入。在使用码分多址(CDMA)技术的无线系统中,源受控可变比特率(VBR)语音编码的使用极大地改进了系统的能力。在源受控VBR编码中,编解码器工作在几个比特率上,并使用速率选择模块来根据语音帧的特性(例如,浊音、清音、瞬态、背景噪声等)判定使用哪个比特率对每个语音帧进行编码。其目的是,在给定的平均比特率,也称为平均数据率(ADR)上获取最佳语音质量。通过调整速率选择模块以获得不同工作模式的不同ADR,编解码器可以工作在不同模式下,在不同模式中编解码器的性能随着ADR的增加而提高了。系统根据信道条件利用工作模式。这就使得编解码器具有在语音质量和系统能力之间进行权衡的机制。在CDMA系统(例如CDMA 1和CDMA 2000)中,通常使用4个比特率,并将其称为全速率(FR)、半速率(HR)、四分之一速率(QR)和八分之一速率(ER)。在该系统中,所支持的2个速率集称为速率集I和速率集II。在速率集I中,具有速率选择机制的可变速率编解码器工作在13.3(FR)、6.2(HR)、2.7(QR)和1.0(ER)kbit/s的源编码比特率,对应于总比特率14.4、7.2、3.6和1.8kbit/s(增加的一些比特用于误差检测)。通常,在CDMA系统的VBR编码中,在没有语音活动(安静或仅有噪声帧)的情况下,使用八分之一速率对帧进行编码。当帧是稳定的浊音或稳定的清音时,根据工作模式使用半速率或四分之一速率。当对稳定的清音帧使用半速率时,使用没有基音码本的CELP模型。当对稳定浊音帧使用半速率时,使用信号修正以增强周期性并减少用于基音索引的比特数量。如果工作模式利用四分之一速率,则由于比特数不够并且一般应用某参数的编码,因此通常可能没有波形匹配。全速率用于开始、瞬态帧以及混合浊音帧(通常使用典型的CELP模型)。除了CDMA系统中的源受控编解码器操作外,该系统可以限定某些语音帧中的最大比特率,以便发送带内信令信息(称为模糊与突发信令),或在恶劣的信道条件(诸如接近小区边界)下以便改进编解码器的鲁棒性。这称为最大半速率。当速率选择模块将要编码的帧选作全速率帧而系统利用例如HR帧时,语音性能下降,这是因为专用HR模式不能够有效地对开始和瞬态信号进行编码。另一种通用HR编码模型设计用于处理这些特殊情况。ITU-T(国际电信联盟一电信标准部)将自适应多速率宽带(AMR-WB)语音编解码器用于几个宽带语音电话技术和服务,而3GPP(第三代移动通信合作计划)将其用于GSM和W-CDMA第三代无线系统。AMR-WB编解码器包括9个比特率,即,6.60、8.85、12.65、14.25、15.85、18.25、19.85、23.05和23.85kbit/s。为CDMA系统设计基于AMR-WB的源受控VBR编解码器具有的优点是,使能够利用AMR-WB编解码器在CDMA和其他系统之间相互操作。12.65kbit/s的AMR-WB比特率是能够适合速率集II的13.3kbit/s全速率的最接近速率。该速率可用作CDMA宽带VBR编解码器和AMR-WB之间的公共速率,以使能够在不需要代码转换(其降低了语音质量)的情况下进行相互操作。必须为CDMA VBR宽带解决方案特别设计较低速率编码类型,以使能够在速率集II构架中进行有效运作。然后编解码器可以利用所有速率工作在少数CDMA特定模式下,不过将具有使能够利用AMR-WB编解码器与系统进行相互操作的模式。在基于CELP的VBR编码中,除了清音和非活动语音类别外,通常所有类别都使用基音(或自适应)码本和更新(固定)码本来表示激励信号。因此编码的激励包括基音延迟(或基音码本索引)、基音增益、更新码本索引和更新码本增益。通常,对基音和更新增益进行联合量化或矢量量化,以产生比特率。如果进行单独量化,则基音增益需要4个比特,而更新码本增益需要5或6个比特。不过,当进行联合量化时,6或7个比特就足够了(节省3个比特每5ms子帧相当于节省0.6kbit/s)。一般来说,利用所有语音片段(例如浊音、清音、瞬态、开始、结束等)类型来训练量化表或码本。在VBR编码环境下,半速率编码模型通常是类别特定的。所以为不同的信号类别(浊音、清音或一般的)设计不同的半速率模型。由此需要为这些类别特定的编码模型设计新的量化表。
技术实现思路
本专利技术涉及一种增益量化方法,用于实现对编码期间由L个采样的连续帧处理的采样声音信号进行编码的技术,其中-每个帧被分为若干子帧;-每个子帧包括N个采样,这里N<L;以及-所述增益量化方法包括基于f个子帧计算初始基音增益;选择与该初始基音增益相关的部分增益量化码本;利用至少1比特每f个子帧连续组来标识增益量化码本的所选部分;以及联合量化基音和固定码本增益。对于f个子帧,对基音和固定码本增益的联合量化包括搜索与搜索标准相关的增益量化码本。搜索增益量化码本包括将码本搜索限制在增益量化码本的所选部分,并找寻最符合搜索标准的增益量化码本所选部分的索引。本专利技术还涉及一种增益量化装置,用于实现对编码期间由L个采样的连续帧处理的采样声音信号进行编码的系统,其中-每个帧被分为若干子帧;-每个子帧包括N个采样,这里N<L;以及-所述增益量化装置包括用于基于f个子帧计算初始基音增益的部件;用于选择与初始基音增益本文档来自技高网
...

【技术保护点】
一种增益量化方法,用于实现对编码期间由L个采样的连续帧处理的采样声音信号进行编码的技术,其中:-每个帧被分为若干子帧;-每个子帧包括N个采样,这里N<L;并且-所述增益量化方法包括:基于f个子帧计算初始基音增益;选择与所述初始基音增益相关的部分增益量化码本;利用至少1比特每f个子帧连续组来标识所述增益量化码本的所选部分;以及联合量化基音和固定码本增益,所述基音和固定码本增益的所述联合量化包括对f个子帧:-搜索与搜索标准相关的所述增益量化码本,所述增益量化码本的所述搜索包括将所述码本搜索限制在所述增益量化码本的所选部分,并找寻最符合所述搜索标准的所述增益量化码本所选部分的索引。

【技术特征摘要】
【国外来华专利技术】US 2003-5-1 60/466,7841.一种增益量化方法,用于实现对编码期间由L个采样的连续帧处理的采样声音信号进行编码的技术,其中-每个帧被分为若干子帧;-每个子帧包括N个采样,这里N<L;并且-所述增益量化方法包括基于f个子帧计算初始基音增益;选择与所述初始基音增益相关的部分增益量化码本;利用至少1比特每f个子帧连续组来标识所述增益量化码本的所选部分;以及联合量化基音和固定码本增益,所述基音和固定码本增益的所述联合量化包括对f个子帧-搜索与搜索标准相关的所述增益量化码本,所述增益量化码本的所述搜索包括将所述码本搜索限制在所述增益量化码本的所选部分,并找寻最符合所述搜索标准的所述增益量化码本所选部分的索引。2.如权利要求1所述的增益量化方法,其中计算初始基音增益包括用如下关系式基于f个子帧计算所述初始基音增益gigi=Σn=0fN-1x(n)y(n)Σn=0fN-1y(n)y(n)]]>其中fN表示f个子帧中的采样数,x(n)是处理所述采样声音信号期间在f个子帧周期上计算的目标信号,而y(n)是处理所述采样声音信号期间在f个子帧周期上计算的滤波自适应码本信号。3.如权利要求2所述的增益量化方法,其中f个是2个,并且其中计算所述初始基音增益包括用如下关系式基于2个子帧计算所述初始基音增益gigi=Σn=02N-1x(n)y(n)Σn=02N-1y(n)y(n)]]>4.如权利要求2所述的增益量化方法,包括在f个子帧周期上计算所述目标信号x(n),其中所述目标信号计算包括通过感知加权滤波器处理所述采样声音信号以计算加权声音信号;利用在所述f个子帧周期的初始子帧期间计算的线性预测滤波器,来扩展所述f个子帧周期上的所述加权声音信号的计算;计算加权合成滤波器的零输入响应;以及利用在所述f个子帧周期的所述初始子帧期间计算的所述线性预测滤波器,来扩展所述f个子帧周期上的所述零输入响应的计算。5.如权利要求2所述的增益量化方法,包括在所述f个子帧周期上计算所述滤波自适应码本信号,其中所述自适应码本信号的计算包括计算自适应码本矢量;扩展所述f个子帧周期上的所述自适应码本矢量的计算;计算加权合成滤波器的脉冲响应;扩展所述f个子帧周期上的所述加权合成滤波器的所述脉冲响应的计算;以及通过对在所述f个子帧周期上计算的所述自适应码本矢量与在所述f个子帧周期上计算的所述加权合成滤波器的所述脉冲响应进行卷积,来计算所述f个子帧周期上的所述滤波自适应码本信号。6.如权利要求1所述的增益量化方法,其中所述编码技术是半速率编码技术,并且其中选择部分增益量化码本包括选择用于所述采样声音信号的全速率编码的部分增益量化码本。7.如权利要求1所述的增益量化方法,还包括对固定码本能量应用预测方案以产生预测固定码本增益;以及计算所述固定码本增益的实际值和所述预测固定码本增益之间的校正因子。8.如权利要求7所述的增益量化方法,其中对所述基音和固定码本增益进行联合量化包括联合量化所述基音增益和所述校正因子。9.如权利要求1所述的增益量化方法,其中搜索所述增益量化码本的所选部分包括最小化所述采样声音信号和所述采样声音信号的合成版本之间的均方误差。10.如权利要求1所述的增益量化方法,其中基于f个子帧计算初始基音增益包括基于至少2个子帧计算初始基音增益。11.如权利要求1所述的增益量化方法,包括对每f个子帧连续组,重复初始基音增益的所述计算、部分所述增益量化码本的所述选择以及所述基音和固定码本增益的所述联合量化。12.如权利要求1所述的增益量化方法,其中选择部分所述增益量化码本包括在所述增益量化码本中找寻与最接近所述初始基音增益的基音增益相关联的初始索引;以及选择包含找到的初始索引的部分所述增益量化码本。13.如权利要求1所述的增益量化方法,包括选择帧中的子帧数,如f个。14.如权利要求1所述的增益量化方法,其中计算所述初始基音增益g′p包括利用如下关系式g′p=Σn=0K-1sw(n)sw(n-TOL)Σn=0K-1sw(n-TOL)sw(n-TOL)]]>其中TOL是开环基音延迟,而sw(n)是从所述采样声音信号的感知加权版本得到的信号。15.一种增益量化方法,用于实现对编码期间由L个采样的连续帧处理的采样声音信号进行编码的技术,其中-每个帧被分为若干子帧;-每个子帧包括N个采样,这里N<L;以及-所述增益量化方法包括基于大于所述子帧的周期K计算初始基音增益;选择与所述初始基音增益相关的部分增益量化码本;利用至少1比特每f个子帧连续组来标识所述增益量化码本的所选部分;以及联合量化基音和固定码本增益,所述基音和固定码本增益的所述联合量化包括-搜索与搜索标准相关的所述增益量化码本,所述增益量化码本的所述搜索包括将所述码本搜索限制在所述增益量化码本的所选部分,并找寻最符合所述搜索标准的所述增益量化码本所选部分的索引;并且基于大于所述子帧的周期K计算初始基音增益包括利用如下关系式g′p=Σn=0K-1sw(n)sw(n-TOL)Σn=0K-1sw(n-TOL)sw(n-TOL)]]>其中TOL是开环基音延迟,而sw(n)是从所述采样声音信号的感知加权版本得到的信号。16.如权利要求15所述的增益量化方法,包括设置所述时段K等于所述开环基音延迟TOL。17.如权利要求15所述的增益量化方法,包括设置所述时段K等于所述开环基音延迟TOL的倍数。18.如权利要求15所述的增益量化方法,包括设置所述时段K等于至少2个子帧。19.如权利要求15所述的增益量化方法,其中将所述码本搜索限制在所述增益量化码本的所选部分包括减少量化增益值的波动并改进整体声音信号质量,产生较平滑的波形演化。20.如权利要求15所述的增益量化方法,其中将所述码本搜索限制在所述增益量化码本的所选部分包括将所述搜索限定在Iinit-p到Iinit+p的范围,其中Iinit是对应于最接近所述初始基音增益的基音增益的所述增益量化码本的增益矢量的索引,并且其中p是整数。21.如权利要求20所述的增益量化方法,其中在Iinit-p≥0和Iinit+p<128的限制下,p等于15。22.一种增益量化装置,用于实现对编码期间由L个采样的连续帧处理的采样声音信号进行编码的系统,其中-每个帧被分为若干子帧;-每个子帧包括N个采样,这里N<L;以及-所述增益量化装置包括用于基于...

【专利技术属性】
技术研发人员:M耶林克R萨拉米
申请(专利权)人:诺基亚有限公司
类型:发明
国别省市:FI[芬兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1