选择导谱频率系数矢量量化的方法及装置制造方法及图纸

技术编号:3044697 阅读:228 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种选择导谱频率ISF系数矢量量化的方法及装置,包括:将ISF系数矢量分裂为至少两组子矢量;针对每一组子矢量分别进行帧间导谱强相关、弱相关矢量量化,计算强、弱相关矢量量化后的残差信号,并计算所述强、弱相关残差信号的量化误差;分别判断每一组子矢量的强相关残差信号的量化误差与弱相关残差信号的量化误差的大小,针对该组选择量化误差小的相关方式进行ISF系数矢量量化。本发明专利技术基于导谱频率系数的短时相关性和长时相关特性,对导谱频率系数的每一维分别使用不同的预测系数,提高了预测增益,减少了残差信号的动态变化范围,提高了ISF系数量化精度,获得了透明量化,从而提高了宽带语音编码质量。

【技术实现步骤摘要】

本专利技术涉及数字语音编码
,特别是选择导谱频率(ISF)系数矢量量化的方法及装置。
技术介绍
语音信号的线性预测系数(LPC)能够比较准确的表征语音信号短时幅度谱包络,在当前中、低速率语音编码中得到应用如码激励线性预测(CELP,Code Excitation Linear Prediction),多带激励编码(MBE,MultibandExcitation Coding),波形内插编码(WI,Waveform Interpolation)等,但LPC系数有较宽的动态范围以及在合成滤波器中的不稳定性,因而LPC系数不适合直接量化。针对上述问题,在语音谱包络量化研究中需要将LPC转换为其它的表示形式以保证线性预测系数量化后全极点滤波器的稳定,减少谱失真。在宽带语音编码中如AMR-WB、AMR-WB+等通常将LPC系数转换为导谱频率(ISF)量化,因为ISF系数变化范围小易于量化,并且一个导谱频率参数的误差仅仅影响全极点模型中邻近这个参数对应频率处的语音谱,而不影响其它地方,能够满足高质量的语音编码和语音合成系统中对LPC系数要求“透明量化”的要求。 为了说明方便,先简单介绍几个基本概念 线性预测系数(LPC,Linear Predictive Coefficient),一组简洁的语音信号模型参数,这一组参数较精确的表征了语音信号的频谱幅度。 导谱频率对(ISP,Immittance Spectral Pair),线性预测系数的一种表现形式。 导谱频率(ISF,Immittance Spectrum Frequency),线性预测系数的一种表现形式。 矢量量化(VQ,Vector Quantization),将若干个标量数据构成一个矢量,然后对矢量空间予以整体量化。 以下以AMR-WB+编码标准[3GPP TS 26.290,“Extended AdaptiveMulti-Rate-Wideband(AMR-WB+)codec”,Dec 2004]中ISF系数量化方案为例,具体说明现有的ISF系数矢量化方法。 1.编码端 对每一帧(256点)求取一组16阶的线性预测系数a1,a2,......,a16,即LPC系数,将上述LPC系数转换为16阶ISP系数,然后将ISP系数转换为频域的16阶ISF系数isf1,isf2,......,isf16作为当前量化输入,假定isf′1,isf′2,......,isf′16为上一帧16阶的ISF系数,mean[i],i=1,2,3,....,16为各维矢量的均值。 (1)计算一组残差信号ri (2)将上述16阶残差信号分裂为2个子矢量VQ1和VQ2,VQ1包括r1,r2,......,r9,VQ2,包括r10,r11,......,r16; (3)针对上述子矢量VQ1,本例中使用8比特进行量化,假设量化后的信号为 计算一组9维的残差信号ei (4)针对上述残差信号ei,将其分裂为VQ3,VQ4和VQ5这3个子矢量。其中VQ3包括e1,e2,e3;VQ4包括e4,e5,e6;VQ5包括e7,e8,e9。对VQ3,VQ4和VQ5分别进行矢量量化,本例中所用比特数为6,7和7。 (5)针对子矢量VQ2,使用8比特进行量化,计算一组7维的残差信号ei’ (6)针对上述残差信号ei’,将其分裂为VQ6和VQ7。其中VQ6包括e10,e11,e12;其中VQ6包括e13,e14,e15,e16。对VQ6和VQ7分别进行矢量量化,本例中所用比特数为5和5。 2.解码端 在解码端,根据编码索引值搜索码本,重建VQ1和VQ2量化后的ISF矢量,然后再执行编码端(2)和(1)的逆过程最终得到重建的ISF系数 众所周知,ISF系数自身具有一些独特的特点导谱频率(ISF)系数呈升序排列,对于强浊音语音段,由于该类语音段持续时间较长,在相邻语音帧的导谱频率系数之间存在着较强的相关冗余性,这段语音选用反应强相关的预测值集合是一种必然选择;对于清音和弱浊音语音段,相邻语音帧的导谱频率系数之间的相关性较弱,这时需要选择反映弱相关的预测值集合。 而现有技术没有考虑谱频率(ISF)系数自身特点,没有区分强、弱相关性的情况,量化方法比较简单,致使量化误差比较大,损害了宽带语音编码质量。
技术实现思路
为了提高ISF系数量化精度,进而提高宽带语音编码质量,本专利技术提供了一种选择ISF系数矢量量化的方法及装置。 一种选择导谱频率ISF系数矢量量化的方法,包括 将ISF系数矢量分裂为至少两组子矢量; 针对每一组子矢量分别进行帧间导谱强相关、弱相关矢量量化,计算强、弱相关矢量化后的残差信号,并计算所述强、弱相关残差信号的量化误差; 分别判断每一组子矢量的强相关残差信号的量化误差与弱相关残差信号的量化误差的大小,针对该组选择量化误差小的相关方式进行ISF系数矢量量化。 一种选择导谱频率ISF系数矢量量化的装置,包括ISF系数矢量分裂单元,残差信号的量化误差计算单元,判别选择单元以及ISF系数矢量量化索引输出单元,其中, ISF系数矢量分裂单元,用于将ISF系数矢量分裂为至少两组子矢量; 残差信号的量化误差计算单元,用于对每一组子矢量分别进行帧间导谱强相关、弱相关矢量量化,计算强、弱相关矢量化后的残差信号,之后计算所述强、弱相关残差信号的量化误差; 判别选择单元,用于判断出每一组子矢量的强相关残差信号的量化误差与弱相关残差信号的量化误差的大小后,针对该组选择量化误差小的相关方式进行ISF系数矢量量化; ISF系数矢量量化索引输出单元,用于分别输出每组ISF系数矢量量化索引。 上述选择ISF系数矢量量化的方法及装置,通过将ISF系数矢量分裂为至少两组子矢量,基于导谱频率系数的短时相关性和长时相关特性,训练分别对应的弱相关和强相关的两个预测系数集合,对导谱频率系数的每一维分别使用不同的预测系数,提高了预测增益,减少了残差信号的动态变化范围,从而减少了量化误差,提高了ISF系数量化精度,获得了透明量化,从而提高了宽带语音编码质量。 附图说明 图1是根据本专利技术一实施例的实现流程示意图; 图2是根据本专利技术一实施例的双预测分裂式多级矢量量化示意图; 图3是根据本专利技术一实施例的选择导谱频率ISF系数矢量量化的装置结构示意图。 具体实施例方式 编码端将ISF系数矢量分裂为至少两组子矢量;针对每一组子矢量分别进行帧间导谱强相关、弱相关矢量量化,计算强、弱相关矢量化后的残差信号,并计算所述强、弱相关残差信号的量化误差;分别判断每一组子矢量的强相关残差信号的量化误差是否小于等于弱相关残差信号的量化误差,若是,则针对该组选择强相关方式进行ISF系数矢量量化,否则,针对该组选择弱相关方式进行ISF系数矢量量化;每组分别输出ISF系数矢量量化索引。解码端根据ISF系数矢量量化索引搜索码本,重建编码端所分裂的两组子矢量,根据从编码端获取的强或弱相关方式,执行编码端的逆过程,重建ISF系数。 下面结合附图及具体实施例对本专利技术做进一步详细说明。 参见图1和图2,本实施例中,对每一帧(256点)求取一组16阶本文档来自技高网
...

【技术保护点】
一种选择导谱频率ISF系数矢量量化的方法,其特征在于,包括:    将ISF系数矢量分裂为至少两组子矢量;    针对每一组子矢量分别进行帧间导谱强相关、弱相关矢量量化,计算强、弱相关矢量化后的残差信号,并计算所述强、弱相关残差信号的量化误差;    分别判断每一组子矢量的强相关残差信号的量化误差与弱相关残差信号的量化误差的大小,针对该组选择量化误差小的相关方式进行ISF系数矢量量化。

【技术特征摘要】
1.一种选择导谱频率ISF系数矢量量化的方法,其特征在于,包括将ISF系数矢量分裂为至少两组子矢量;针对每一组子矢量分别进行帧间导谱强相关、弱相关矢量量化,计算强、弱相关矢量化后的残差信号,并计算所述强、弱相关残差信号的量化误差;分别判断每一组子矢量的强相关残差信号的量化误差与弱相关残差信号的量化误差的大小,针对该组选择量化误差小的相关方式进行ISF系数矢量量化。2.根据权利要求1所述的方法,其特征在于,所述选择量化误差小的相关方式进行ISF系数矢量量化的过程包括若强相关残差信号的量化误差小于等于弱相关残差信号的量化误差,则针对该组选择强相关方式进行ISF系数矢量量化;若强相关残差信号的量化误差大于弱相关残差信号的量化误差,则针对该组选择弱相关方式进行ISF系数矢量量化。3.根据权利要求1所述的方法,其特征在于,所述ISF系数矢量分裂、矢量量化并计算量化误差、以及判断选择操作由编码端执行;该方法进一步包括解码端根据ISF系数矢量量化索引搜索码本,重建编码端所分裂的两组子矢量,根据从编码端获取的强或弱相关方式,执行编码端的逆过程,重建ISF系数。4.根据权利要求1或3所述的方法,其特征在于,所述针对每一组子矢量分别进行帧间导谱强相关、弱相关矢量量化,计算强、弱相关矢量化后的残差信号的过程包括i)选择一组最佳预测系数P1、P2,......Pn,n为所述一组子矢量的维数;所述最佳预测系数是根据样本训练得到的,且强、弱相关时所述系数不同;计算该组n维的残差信号riri=isfi-mean[i]-pi×isfi′,mean[i]为各维矢量的均值,i=1,2......n;ii)对步骤i)所述残差信号进行量化,假设量化后的信号为则量化后的残差信号ei为i=1,2......n。5.根据权利要求4所述的方法,其特征在于,所述针对每一组子矢量计算矢量化后强、弱相关残差信号的量化误差的过程包括将所述残差信号ei再分裂为至少两组子矢量,每组子矢量至少包括两个以上...

【专利技术属性】
技术研发人员:胡瑞敏高戈张勇石雾岚吴云佳王庭红马付伟
申请(专利权)人:华为技术有限公司武汉大学
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1