一种多速率语音频编码的方法技术

技术编号:3048247 阅读:276 留言:0更新日期:2012-04-11 18:40
本发明专利技术的实施例中公开了一种多速率语音频编码的方法,该方法包括:对于每个相邻的格点,计算感觉加权滤波器的频谱以及根据输入信号编码再解码后的前两层的合成语音的频谱的第一比值;根据所述的第一比值从大到小的顺序,将所述第一比值相对应的格点的索引值编入码流。通过使用本实施例中的方法,可提高变换域编码中比特不足时输出语音或音频信号的质量。

【技术实现步骤摘要】

本专利技术涉及编码技术,尤其是指。
技术介绍
在目前的多速率语音频编码中,当输入信号较符合音乐特性或码率较高的情况下(例如,在AMR-WB+、 G.729.1和G.VBR中),多采用变换域编 码,即通过变换方法,例如,修正的离散余弦变换(MDCT)或快速傅立叶 (FFT)变换等,将时域信号变换到频域。而在对变换域编码的参数进行量 化时,则多采用格型矢量量化技术。图1为现有技术中格型矢量量化方法的 流程图。如图1所示, 一般来说,格型矢量量化包括如下所述的步骤步骤101,对频域信号根据就近原则找到相应的格点。即对输入频语矢量根据就近原则,具体来说,在8维的戈塞特(Gosset) 点阵(称为RE8格)或Z8格或Z16格等,中找到与其离得最近的格点Q;步骤102,根据每个格点所对应的频谱能量的大小和总比特数,求取相应 格点的索引值。其中,当G在基本码书中,索引值包括码书索引值^和相应码字索引值 A;当Ct不在基本码书中时,对Q要进行Voronoi扩展,此时索引值除了包括 码书索引值 和码字索引值A外,还包括扩展码书的索引^v。步骤103,当比特数不足时,能量较小的频镨对应的格点的元素将全部被 强行置0。步骤104,按照从低频到高频的顺序,将这些格点的索引值写进码流。 步骤105,在解码端,根据解码出的索引值从低频到高频顺序解码出量化 后的频谱序列。由信号的掩蔽效应可知,声强大的信号可以掩蔽掉其周围声强小的信号,使得人的听觉系统感觉不到被掩蔽信号的存在;同时,人的听觉系统本身也具有信号掩蔽的作用,即当信号声强小于一定的门限时,即使没有其它信号的掩 蔽,人的听觉系统也感觉不到该信号的存在,这种掩蔽称为绝对掩蔽。通过试验检测可知,在0~200Hz的范围内,绝对掩蔽域值随着频率的增加而减小, 而在200 2000Hz的范围内,绝对掩蔽域值几乎不变。在对输入信号的频谱进行格型矢量量化时,由于总比特数的限制,有些格 点的元素(例如,输入信号的频谱所对应的量化值)可能要被强制置0。此时, 如果把一些带有重要信息的频谱模块对应的格点强制置0,将会大大降低编码质量,因此需要根据一个决定将哪些格点置成o,而保留哪些格点的准则。在上述的编码方法中,由于在编码端将按照从低频到高频的顺序,即根据 频谱能量从大到小的顺序,将变换域编码的参数索引值写进码流。因此,当比特数不足时,频谱能量相对较小的频谱对应的格点的元素将全部被强行置0。因此,当比特数不足时,在解码端只能解码出部分码流,且因为编码端的变换 域编码的参数是按低频到高频顺序写在码流中的,所以此时只能恢复出少量的 低频信号,从而导致当码率升高时,输出的语音或音频信号质量也没有明显提 升。另外,当求取格点的索引值时,根据频谱能量的大小决定格点的重要性,当比特数不够时,将频谱能量较小的格点的元素置成0;但频谱能量大的部分 不一定是重要的成分,这样的判决准则可能将一些重要成分对应的格点的元素 置成0,影响输出信号的质量。此外,根据掩蔽效应的原理可知,信号是否被 掩蔽不完全取决于频谱能量的大小,在一定程度上,还取决于掩蔽信号和被掩 蔽信号之间的差别,而在上述的编码方法中也没有考虑这种差别。
技术实现思路
有鉴于此,本专利技术实施例的主要目的在于提供一种多速率语音频编码的方 法,从而提高变换域编码中比特不足时输出语音(音频)信号的质量。 为达到上述目的,本专利技术实施例中的技术方案是这样实现的,该方法包括对于每个相邻的格点,计算感觉加权滤波器的频谱以及根据输入信号编码再解码后的前两层的合成语音的频语的第一比值;根据所述的第一比值从大到 小的顺序,将所述第一比值相对应的格点的索引值编入码流。综上可知,本专利技术的实施例中提供了。通过 使用本实施例中的方法,可保证被掩蔽掉的可能性较小的信号所对应的引导项 不会被强制置为0,从而保证当比特数不足时,较重要的信息将被较精细地量 化并被优先编入码流,而不重要的信息将被粗略地量化。使得在解码端比特数 不够时,可以解码出较重要的信息,从而提高解码出的语音的质量。附图说明图1为现有技术中格型矢量量化方法的流程图。图2为本专利技术实施例中多速率语音频编码方法的流程图。图3为本专利技术另一实施例中多速率语音频编码方法的流程图。图4为本专利技术再一实施例中多速率语音频编码方法的流程图。具体实施例方式为使本专利技术的目的、技术方案和优点表达得更加清楚明白,下面结合附 图及具体实施例对本专利技术再作进一步详细的说明。图2为本专利技术实施例中多速率语音频编码方法的流程图。如图2所示, 本专利技术实施例中多速率语音频编码方法的流程包括如下所述的步骤 步骤201,编码端接收输入数据。在本步骤中,可对输入频谱矢量根据就近原则,在RE8格中找到与其 离的最近的格点C,;将格点C,所对应的频语能力的大小和总比特数作为输 入数据,编码端接收所述的输入数据,对其进行如下的处理。步骤202,对输入信号进行CELP编码。在CELP编码过程中,可将输入信号分两层(例如,L1层和L2层)分 别进4于编码。步骤203,对所述进行CELP编码的信号进行解码。步骤204,根据步骤203中的解码信号求解频谱。具体来说,即根据解 码信号求解出解码信号中的前两层的合成语音(音频)信号的频谱Fr叫一R2。步骤205,计算原输入信号与步骤203中的解码信号的前两层的合成语 音(音频)信号的差值信号,并计算出该差值信号的MDCT系数(即频谱 Freq—err )。步骤206,对步骤205中的MDCT系数进行操作(例如,取整操作)后, 可得到35个引导项。步骤207,计算步骤204中的频谱Freq—R2与步骤205中的Freq—err的 比值/ Go[A]。计算的公式如下所示脑,=f F呵一/ 2K,丫 ( i )S、 F, —7 2[/] J其中,/=8*壯/, /t=0,l,2,…,34, /=0,1,2, ,..,7。通过使用公式(2)进行计算,可得到一个由35个比值构成的数组 i ao[&],数组中的每一个比值都唯一对应一个步骤206中的引导项。步骤208,根据数组对引导项进行排序。具体来说,即将WW/o[A:]分成两个区域,前n个比值为第一个区域,后 (35-n)个比值为另一个区域。首先对第一个区域按照比值从小到大的顺序 进行排序,对第二个区域按照比值从大到小的顺序进行排序;建立一个包括 35个元素的数组R[A],然后将与排序后的第二个区域中的(35-n)比值相对 应的格点的引导项的序号按照第二个区域中比值的排列顺序,分别存放在数 组R[A:]中相对应的前(35-n)个元素中;将与排序后的第 一个区域中的n比 值相对应的格点的引导项的序号按照第 一个区域中比值的排列顺序,分别存 放在数组R[&]中相对应的前n个元素中。其中,n可根据实际应用情况而预 先设定。在本实施例中,可以设11=4。步骤209,求解感觉加权滤波器的频谱W—Freq 。所述的感觉加权滤波器//0)满足公式7/(z) = /lO//0-y^-')。其中,」 表示线性预测系数,z表示频域,-和K则表示加权因子, 一般情况下为常数。步骤210,计算步骤204中的频镨Freq一R2与步骤209中的W—Freq的 比值尺a^:],计算的公式如下所示<本文档来自技高网
...

【技术保护点】
一种多速率语音频编码的方法,其特征在于,该方法包括: 对于每个相邻的格点,计算感觉加权滤波器的频谱以及根据输入信号编码再解码后的前两层的合成语音的频谱的第一比值;根据所述的第一比值从大到小的顺序,将所述第一比值相对应的格点的索引值编入 码流。

【技术特征摘要】
1、一种多速率语音频编码的方法,其特征在于,该方法包括对于每个相邻的格点,计算感觉加权滤波器的频谱以及根据输入信号编码再解码后的前两层的合成语音的频谱的第一比值;根据所述的第一比值从大到小的顺序,将所述第一比值相对应的格点的索引值编入码流。2、 根据权利要求1所述的方法,其特征在于,当总比特数不足时,将所述 比值相对应的4各点的索引值编入码流包括计算输入信号与根据输入信号编码再解码后的前两层的合成信号的差值的 频谙,计算所述差值的频谱与根据输入信号编码再解码后的前两层的合成语音 的频镨的第二比值,将与所述第二比值相对应的格点的索引值,根据第二比值 从大到小的顺序编入码流。3、 根据权利要求1所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:刘泽新马付伟肖玮
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1