语音中非话音部分的低数据位速率编码制造技术

技术编号:3047271 阅读:181 留言:0更新日期:2012-04-11 18:40
一种用于语音的非话音部分的低数据速率编码方案,它包括这样一些步骤:从语音帧获取高时间分辨率能量系数、使能量系数量化、从量化的能量系数中产生高时间分辨率的能量包络,以及用能量包络的量化值形成随机产生的噪声矢量从而重新构筑残留信号。能量包络可以采用线性插入技术来产生。可以获得后处理测量,并将其与预定的阈值比较,以确定编码规则是否执行恰当。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

技术介绍
I.专利
本专利技术总的涉及语音处理领域,本专利技术尤其涉及语音中非话音部分的低数据位速率编码的方法和装置。II.技术背景采用数字技术进行话音传输已经非常广泛,尤其是在长途和数字无线电话应用领域更是这样。接着,这又在确定可以在信道上发送的最少信息量并同时保持重新构筑的语音感觉质量方面,引起了人们的兴趣。如果发送信息是通过简单地进行取样和数字化来进行的,则为实现传统的模拟电话语音质量时需要每秒64千位(kbps)数量级的数据速率。然而,通过采用语音分析,随后采用适当的编码、传输,再在接收机处重新合成,可以大大减小数据速率。我们把采用获取与人的语音发生模型有关的参数对语音进行压缩的技术的装置称为语音编码器。语音编码器将输入的语音信号分为一些时间段,或者是一些分析帧。语音编码器通常包括编码器或译码器,或编码译码器。编码器对输入的语音帧进行分析,并获取某些相关的参数,随后将这些参数量化成二进制表述,即,量化成一组数据位或二进制的数据包。这些数据包在通信信道上传送到接收机和译码器。译码器对数据包进行处理,并将它们解量化,产生参数,随后再用这些解量化的参数,对这些语音帧进行重新合成。语音编码器的作用是通过去除语音中所有固有的自然冗余,将数字化的语音信号压缩成低数据位速率的信号。数字压缩是通过用一组参数来代表输入的语音帧并用量化来代表具有一组数据位的参数来实现的。如果输入的语音帧的数据位数是Ni,而由语音编码器所产生的数据包的数据位数是No,那么由语音编码器所实现的压缩倍数是Cr=Ni/No。我们所面临的挑战是在实现目标压缩倍数的同时,保持高话音质量的译码语音。语音编码器的性能取决于(1)上述语音模型或分析及合成处理过程的组合的良好程度,以及(2)在每帧的目标数据位速率No时,参数量化过程进行的量化程度。所以,语音模型的目标是用每帧较少的一组参数,来捕获语音信号的基本部分或目标话音质量。在低数据位速率下有效地对语音进行编码的一种有效的技术是多模式编码。多模式编码对不同类型的输入语音帧实施不同的模式规则或编译码规则。每一种模式或编译码过程以最有效的方式来表达某种类型的语音段(即,发声的、不发声的,或者是背景噪声)。采用一种外部模式决定机构来检查输入的语音帧,并对采用什么模式用于该帧作出决定。通常,通过从输入的帧中取出几个参数,并对它们进行评估,而作出采用哪一种模式的决定,以开环方式决定所采用的模式。所以,模式决定是在事先不知道输出语音的准确情况即按照语音质量或其他的特性测量来说输出语音与输入的语音有多大的相似程度而作出的。语音编译码器的一种典型的开环模式决定见美国专利5,414,796,该专利已转让给本专利技术的受让人。多模式编码可以是固定速率的,对每一帧采用相同数量的数据位No;也可以采用变速率的,这时,不同的模式采用不同的数据位速率。变速率编码仅采用将编译码器参数编码成适合获得目标质量水平的数据位数。因此,采用变数据位速率(VBR)技术,在明显较低的平均速率下,可以得到与固定速率、更高速率编码器相同的目标话音质量。典型的变速率语音编码器见美国专利5,414,796,该专利已转让给本专利技术的受让人。目前,人们无论是在商业上还是在研究兴趣上都强烈地希望开发一种能在中等的到较低数据位速率(在2.4到4kbps或以下的范围内)下工作的高质量的语音编码器。其应用范围包括无线电话、卫星通信、互联网电话、各种多媒体和话音流应用、话音邮件以及其他的话音储存系统。其驱动力是在数据包丢失的情况下,需要具有高容量,以及对较强性能的要求。近来建立各种语音编码标准的努力是推动低速语音编码规则的研究和开发的另一直接的驱动力。低速语音编码器在每一许可的应用带宽下生成更多的信道或用户,并且与合适信道编码附加层耦合的低速语音编码器可以适合编码器技术规范的整个数据位预算,并在信道出现差错的情况下,仍具有较强的性能。所以,多模式VBR语音编码是一种在低数据位速率下对语音进行编码的有效的机制。传统的多模式技术需要对各个语音段(如,非话音的、话音的以及过渡部分)设计有效的编码方案或模式以及用于背景噪声或无声的模式。语音编码器的全部性能取决于每一种模式工作的良好程度,而编码器的平均速率取决于用于非话音的、话音的、以及语音其他部分不同模式的数据位速率。为了实现低平均速率下的目标质量,必须设计一些有效的、高性能的模式,并且其中的某些模式必须在较低的数据位速率下工作。通常,话音的和非话音的语音段是在高数据速率下捕获的,而背景噪声和无声部分是用在明显较低的速率下工作的模式来代表的。所以,需要有一种低数据速率的编码技术,在采用每一帧最少数量的数据位的时候能够捕获语音的非话音部分。专利技术概述本专利技术是一种采用每一帧最少数量的数据位准确捕获语音的非话音部分的低数据速率编码技术。因此,按照本专利技术对语音的非话音部分进行编码的方法最好包括这样一些步骤,即,从一个语音帧中获取高时间分辨率的能量系数;对高时间分辨率的能量系数进行量化处理;从经量化的能量系数中产生高时间分辨率的能量包;并且通过使随机生成的噪声矢量具有能量包络的量化值来重新构筑剩余的信号。本专利技术还提供了一种对语音的非话音部分进行编码的语音编码器,它包括从一个帧的语音中获取高时间分辨率的能量系数的装置;使高时间分辨率的能量系数量化的装置;从量化的能量系数中产生高时间分辨率的能量包络的装置;以及通过使随机产生的噪声矢量具有量化的能量包络值来重新构筑残留信号的装置。本专利技术还提供了对语音的非话音部分进行编码的语音编码器,它最好包括从一个帧的语音中获取高时间分辨率的能量系数的模块;使高时间分辨率的能量系数量化的模块;从量化的能量系数中产生高时间分辨率的能量包络的模块;以及通过使随机产生的噪声矢量具有量化的能量包络值来重新构筑残留信号的模块。附图简述附图说明图1是由语音编码器在每一端处终断的通信信道的方框图。图2是一编码器的方框图。图3是一译码器的方框图。图4是描述对用于语音的非话音部分进行低数据速率编码的技术的步骤的流程图。图5A-E给出的是信号幅度对于离散时间的关系。图6是描绘锥形进位矢量量化编码过程的功能方框图。较佳实施例的详细描述图1中,第一编码器10接收数字化的语音取样s(n),并对取样信号s(n)进行编码,用于在传输介质12或通信信道12上传输到第一译码器14。译码器14对经编码的语音取样信号进行译码,并合成输出语音信号s合成(n)。对于沿相反方向上进行的传输,第二编码器16对数字化的语音取样信号s(n)进行编码,而该取样信号是在通信信道18上传输的。第二译码器20接收经编码的语音取样信号,并对其进行译码,产生经合成的输出语音信号s合成(n)。语音取样信号S(n)代表已经按照本领域方法(如,脉冲编码调制(PCM)、压扩μ律或A律)中的任何一种方法数字化和量化的语音信号。正如本领域中人们所知道的那样,语音取样信号S(n)被组织成输入数据帧,其中,每一帧包含预定数量的数字化语音取样信号s(n)。在一种典型的实施例中,采用8kHz的取样速率,这时,每一20毫秒的帧包含160个取样信号。在下面描述的实施例中,从8kbps(全速率)到4kbps(二分之一速率)到2kbps(四分之一速率)到1kbps(八分之一),数据传本文档来自技高网...

【技术保护点】
一种对语音的非话音部分进行编码的方法,其特征在于,它包含下述步骤: 从语音帧中获取高时间分辨率能量系数; 使高时间分辨率能量系数量化; 从量化的能量系数,产生高时间分辨率能量包络;以及 通过用能量包络的量化值形成随机产生的噪声矢量,重新构成残留信号。

【技术特征摘要】
US 1998-11-13 09/191,6331.一种对语音的非话音部分进行编码的方法,其特征在于,它包含下述步骤从语音帧中获取高时间分辨率能量系数;使高时间分辨率能量系数量化;从量化的能量系数,产生高时间分辨率能量包络;以及通过用能量包络的量化值形成随机产生的噪声矢量,重新构成残留信号。2.如权利要求1所述的方法,其特征在于,按照锥形进位矢量量化方案,执行所述量化步骤。3.如权利要求1所述的方法,其特征在于,所述产生步骤是用线性插入的方法来完成的。4.如权利要求1所述的方法,其特征在于,它还包含这样一个步骤,即,获得后处理性能测量,并且将所述后处理性能测量与一预定的阈值比较。5.如权利要求1所述的方法,其特征在于,所述产生步骤包含产生高时间分辨率能量包络,包括前一帧剩余预定个数的过去取样的能量表述。6.如权利要求1所述的方法,其特征在于,所述产生步骤包含产生高时间分辨率能量包络,包括下一帧剩余预定个数的未来取样的能量表述。7.一种对语音的非话音部分进行编码的语音编码器,其特征在于,它包含从一个语音帧获取高时间分辨率能量系数的装置;将所述高时间分辨率能量系数进行量化处理的装置;从量化的能量系数中产生高时间分辨率能量包络的装置;以及用能量包络的量化值随机产生噪声矢量从而重新构筑残留信号的装置。8.如权利要求7所述的语音编码器,其特征在于,所述量化装置包含按照锥形进位矢量量化方案进行量化的装置。9.如权利要求7所述的语音编码器,其特征...

【专利技术属性】
技术研发人员:A达斯S曼朱那什
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1