在速率可变的声码器中选择编码速率的方法和装置制造方法及图纸

技术编号:3045398 阅读:143 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种降低把低能量非嗓音话音作为背景噪声进行编码的概率的方法。用数字副带滤波器(4)和(6)把输入信号分成副带,在副带速率判定部件(12)和(14)中把这些副带中的能量与一组阈值比较,然后在编码速率选择器(16)内检查这些比较结果,通过这些步骤来确定编码速率。用这种方法,可以把非嗓音话音与背景噪声区别开。本发明专利技术还提供一种用输入信号的信噪比设置阈值电平的装置,本发明专利技术还提供一种用速率可变的声码器对音乐进行编码的方法,它通过检查输入信号的周期性以把音乐与背景噪声区别开来。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种声码器。本专利技术尤其涉及在速率可变的声码器中确定话音编码速率的新颖的和经改进的方法。
技术介绍
速率可变话音压缩系统一般在开始进行编码之前使用一些速率确定算法。这种速率确定算法把较高的比特率编码方法赋予了有话音出现的音频信号段,把较低的比特率编码方法赋予无声段。在这种方法中,可以实现较低的平均比特率,而重新构成的话音仍保持较高质量。因此,为了有效地进行工作,速率可变的话音声码器需要一种健全的速率确定算法,以能在各种背景噪声环境中区别话音和无声。在1991年6月11日申请的,名称为“速率可变的声码器”的待批美国专利申请No.07/713/661中揭示了这样一种速率可变的话音压缩系统或速率可变的声码器,该专利申请已转让给本专利技术的受让人,援引在此,以作参考。在这种速率可变的声码器的特定的实现方法中,用码激励线性预测编码技术(CELP)以根据话音活动性的程度确定的几种速率中的一种速率对输入话音进行编码。话音的活动性程度根据除了有声话音之外还可以包含背景噪声的输入音频样值内的能量来确定。为了使声码器在各种背景噪声下都提供高质量的声音编码,需要一种合适的调整阈值的技术来补偿背景噪声对速率判定算法的影响。声码器一般用在诸如蜂窝电话等通信设备或个人通信设备中,以对转换成数字形式进行传输的模拟音频信号进行数字信号压缩。在可以使用蜂窝电话或个人通信设备的移动的环境中,高的背景噪声能量使得用基于信号能量的速率确定算法难以把低能量的非嗓音声音从低背景噪声中区分开来。因此,经常对非嗓音声音以较低的比特率进行编码,声音质量下降,诸如“s”、“x”、“ch”、“sh”、“t”等辅音在重新构成的话音中被丢失。根据仅把背景噪声能量作为依据的速率判定的声码器在设定阈值时没有考虑信号相对于背景噪声的强度。当背景噪声提高时,根据仅把背景噪声作为依据的声码器必然会一起压缩阈值。如果信号电平仍然维持不变,但设置阈值电平的校正方法是把信号电平与背景噪声电平一起提升,那么,压缩阈值电平不是最佳的解决方法。在速率可变的声码器内需要另一种考虑了信号强度的设置阈值电平的方法。剩余的决定性的问题是在通过基于背景噪声能量的速率判定声码器来播放音乐时产生的。当人在说话时,他们必须暂停以便呼吸,这可以把阈值重新设置到适当的背景噪声电平上。然而,在通过声码器传输时,在音乐持续的情况下,没有暂停发生,并且阈值将持续提高,一直到开始对音乐以小于全速率的速率进行编码。在这种情况下,速率可变的编码器把音乐与背景噪声混为一谈。
技术实现思路
本专利技术是一种新颖的和经改进的在速率可变的声码器内确定编码速率的方法和装置。本专利技术的第一个目的是提供一种方法,用这种方法可降低把低能量的非嗓音话音作为背景噪声进行编码的概率。在本专利技术中,把输入信号滤波成高频分量和低频分量。然后单独地对输入信号的滤波信号进行分析,以检测是否有话音的存在。因为非嗓音话音有高频分量,所以相对于高频带来说其强度与背景噪声相比的区别比在整个频带上与背景噪声相比的区别来得更大。本专利技术的第二个目的是提供一种装置,这种装置在设置阈值时考虑了信号能量以及背景噪声能量。在本专利技术中,根据输入信号的信噪比(SNR)的估计值来设定声音检测阈值。在一个典型的实施例中,把在存在话音期间的信号能量估计为最大信号能量,把在无声期间的背景噪声能量估计为最小信号能量。本专利技术的第三个目的是提供一种通过速率可变的声码器对音乐进行编码的方法。在一个典型的实施例中,速率选择装置检测阈值电平上升的连续帧的数量,并检查帧数的周期。如果输入信号是有周期性的,这表示存在音乐。如果检测到有音乐存在,那么把阈值设置到以全速率对信号进行编码的电平上。本专利技术提供一种为输入信号选择编码速率的装置,包括声音信号检测部件,用于判断在所述输入信号的各频率副带中是否存在声音信号;以及编码速率选择部件,用于根据对所述输入信号的各频率副带中是否存在声音信号的判断来为所述输入信号选择编码速率。本专利技术还提供一种为输入信号选择编码速率的方法,包括以下步骤接收所述输入信号;判断在所述输入信号的各频率副带中是否存在声音信号;以及根据对所述输入信号的各频率副带中是否存在声音信号的判断来为所述输入信号选择所述编码速率。附图说明图1是本专利技术的方框图。具体实施例方式参见图1,把输入信号S(n)提供给副带能量计算部件4和副带能量计算部件6。输入信号S(n)包含音频信号和背景噪声。音频信号一般为话音,但也可以是音乐。在一个典型的实施例中,以每二十毫秒帧160样值的形式提供S(n)。在一个典型的实施例中,输入信号S(n)的频率分量从0kHz到4kHz,大约与人的话音信号的带宽相似。在一个典型的实施例中,把4kHz的输入信号S(n)滤波成两个分立的副带。这个分立的副带分别在0到2kHz和2kHz到4kHz之间。在一个典型的实施例中,可以用副带滤波器把输入信号分成副带,这种设计在已有技术中属于熟知的技术,并且在1994年2月1日提交的,名称为“频率选择自适应滤波”的美国专利申请No.08/189,819中有详细的描述,该申请已转让给本专利技术的受让人,援引在此以作参考。对于低通滤波器,副带滤波器的脉冲响应表示为hL(n),对于高通滤波器,副带滤波器的脉冲响应表示为hH(n)。可以如现有技术中所熟知的那样,简单地取副带滤波器输出的样值平方之和计算得到的信号的所产生的副带分量的能量,给出RL(0)和RH(0)值。在一个较佳实施例中,当把输入信号S(n)提供给副带能量计算部件4时,如下计算输入帧的低频分量的能量值RL(0)RL(0)=RS(0)·RhL(0)+2·Σi=1L-1RS(i)·RhL(i)---(1)]]>其中,L为具有脉冲响应hL(n)的低通滤波器内的抽头数,RS(i)为输入信号S(n)的自相关函数,它由下式给出RS(i)=Σn=1NS(n)·S(n-i),]]>对i∈ (2)其中,N为帧内的样值数,RhL是低通滤波器hL(n)的自相关函数,由下式给出RhL(i)=Σn=0L-1hL(n)·hL(n-i),]]>对i∈=0 其它(3)在副带能量计算部件6内用相似的方式计算高频能量RH(0)。可以在减小计算负荷之前计算副带滤波器的自相关函数的值。另外,把计算得到的一些RS(i)值在对输入信号S(n)进行编码时的另一些计算中使用,这进一步减轻了本专利技术的编码速率选择的方法的纯计算负荷。例如,运算LPC滤波器抽头值需要计算一组输入信号自相关系数。对LPC滤波器抽头值的计算在现有技术中是众所周知的,并且在上面提到美国专利申请08/004,484中有详细的描述。如果一种是用需要十个抽头的LPC滤波器对话音进行编码,除了在对信号进行编码所用的之外,仅需要计算i值从11到L-1的RS(i)值,因为,i值从0到10的RS(i)在计算LPC滤波器抽头值时已经使用了。在一个典型的实施例中,副带滤波器具有17个抽头,L=17。副带能量计算部件4向副带速率判定部件12提供计算得到的RL本文档来自技高网
...

【技术保护点】
一种为输入信号(S(n))选择编码速率的装置,其特征在于,包括:    声音信号检测部件,用于判断在所述输入信号(S(n))的各频率副带中是否存在声音信号;以及    编码速率选择部件,用于根据对所述输入信号(S(n))的各频率副带中是否存在声音信号的判断来为所述输入信号(S(n))选择编码速率。

【技术特征摘要】
US 1994-8-10 288,4131.一种为输入信号(S(n))选择编码速率的装置,其特征在于,包括声音信号检测部件,用于判断在所述输入信号(S(n))的各频率副带中是否存在声音信号;以及编码速率选择部件,用于根据对所述输入信号(S(n))的各频率副带中是否存在声音信号的判断来为所述输入信号(S(n))选择编码速率。2.如权利要求1所述的装置,其特征在于,所述声音信号检测部件包括多个副带能量计算部件(4,6),用于确定所述输入信号(S(n))的各频率副带的信号能量;以及多个阈值修正部件,各阈值修正部件耦合至所述多个副带能量计算部件中的相应的一个,其中各阈值修正部件用于使用所指定的一个频率副带的信号能量来判断在该指定的频率副带中是否存在声音信号。3.如权利要求2所述的装置,其特征在于,所述编码速率选择部件配置成根据由所述多个阈值修正部件的每一个所作出的判断来选择所输入信号(S(n))的编码速率。4.如权利要求3所述的装置,其特征在于,所述多个阈值修正部件中的每一个根据所指定的频率副带的信号能量和背景噪声估计值来确定一个阈值,该阈值用于判断在该指定的频率副带中是否存在声音信号。5.如权利要求2所述的装置,其特征在于,各阈值修正部件通过检查归一化的自相关函数来判断声音信号的存在,所述自相关函数由下式给出NACF=maxTΣn=0N-1e(n)·e(n-T)12[Σn=0N-1e2(n)+Σn=0N-1e2(n-T)]---(7)]]>其中,e(n)为输入信号(S(n))被LPC滤波器滤波后得到的特性分量残留信号。6.如权利要求1所述的装置,其特征在于,所述声音信号检测部件包括副带滤波器子系统(4,6),用于确定所述输入信号(S(n))的各频率副带的信号能量;所述编码速率选择部件包括速率选择子系统,用于根据所述输入信号(S(n))的各频率副带的信号能量来选择所述输入信号(S(n))的编码速率。7.如权利要求1所述的装置,其特征在于,所述编码速率是为一可变速率声码器确定的,其中所述声音信号检测部件包括副带能量计算装置(4,6),用于接收所述输入信号(S(n))并根据预定的副带能量计算公式来确定多个副带能量值(RL(0),RH(0))。8.如权利要求7所述的装置,其特征在于,所述编码速率选择部件包括副带速率确定部件(12,14),用于接收所述多个副带能量值(RL(0),RH(0)),并确定多个建议的副带编码速率。9.如权利要求8所述的装置,其特征在于,所述编码速率选择部件包括编码速率选择单元(16),用于接收所述多个建议的副带编码速率并根据所述多个建议的副带编码速率来确定所述编码速率。10.如权利要求7所述的装置,其特征在于,所述多个副带能量计算部件(4,6)根据下面的公式确定所述多个副带能量值(RL(0),RH(0))中的每个副带能量值 具中L为带通滤波器hbp(n)内的抽头数,RS(i)为输入信号S(n)的自相关函数,Rhbp为带通滤波器hbp(n)的自相关函数。11.如权利要求1所述的装置,其特征在于,所述编码速率是为一可变速率声码器确定的,其中所述装置还包括信噪比部件(8,10),用于接收输入信号(S(n))并根据所述输入信号(S(n))来确定信噪比值。12.如权利要求8所述的装置,其特征在于,还包括置于所述副带能量计算部件(4,6)和所述副带速率确定部件之间的阈值计算部件,用于接收所述副带能量值(RL(0),RH(0))并根据所述多个副带能量值(RL(0),RH(0))来确定一组编码速率阈值。13.如权利要求11或12中任一项所述的装置,其特征在于,所述阈值计算部件(8,10)根据所述多个副带能量值(RL(0),RH(0))来确定所述信噪比值。14.如权利要求13所述的装置,其特征在于,所述阈值计算部件(8,10)根据所述信噪比值来确定一个换算值。15.如权利要求14所述的装置,其特征在于,所述阈值计算部件(8,10)通过将背景噪声估计值乘以所述换算值来确定至少一个阈值。16.如权利要求15所述的装置,其特征在于,所述编码速率选择部件将至少一个所述多个副带能量值(RL(0),RH(0))与所述至少一个阈值相比较,来确定所述编码速率。17.如权利要求7所述的装置,其特征在于,所述编码速率选择部件确定多个建议的编码速率,其中各建议的编码速率对应于所述多个副带能量值(RL(0),RH(0))中相应的一个副带能量值,所述编码速率选择部件根据所述多个建议的编码速率来确定所述编...

【专利技术属性】
技术研发人员:安德鲁P德雅克威廉R加德纳
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1