对宽带声码器的帧进行时间弯曲制造技术

技术编号:5425851 阅读:214 留言:0更新日期:2012-04-11 18:40
本发明专利技术揭示一种传送语音的方法,其包括:将残余低频带语音信号时间弯曲至所述残余低频带语音信号的经扩展或经压缩版本;将高频带语音信号时间弯曲至所述高频带语音信号的经扩展或经压缩版本;及合并所述经时间弯曲的低频带与高频带语音信号,以给出完整的经时间弯曲的语音信号。在所述低频带中,在对所述残余低频带信号进行时间弯曲之后合成所述残余低频带语音信号,而在所述高频带中,在对所述高频带语音信号进行时间弯曲之前合成未经弯曲的高频带信号。所述方法可进一步包括对语音段进行分类及对所述语音段进行编码。对所述语音段的所述编码可以是码激励线性预测、噪声激励线性预测或1/8帧(寂静)编码中的一者。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术大体来说涉及对声码器中的帧进行时间弯曲(即,扩展或压縮),且更特 定而言涉及对宽带声码器中的帧进行时间弯曲。
技术介绍
时间弯曲在包交换网络中具有若干应用,其中声码器包可不同步地到达。尽管时 间弯曲可在声码器内部或外部执行,但在声码器中执行时间弯曲可提供若干优点,例 如,经弯曲帧的质量更好且计算负载减小。
技术实现思路
本专利技术包括一种通过操纵语音信号来对语音帧进行时间弯曲的设备及方法。在一个方面中,揭示一种对第四代声码器(4GV)宽带声码器的码激励线性预测(CELP) 及噪声激励线性预测(NELP)帧进行时间弯曲的方法。更具体来说,对于CELP帧, 所述方法通过分别添加或删除音调周期以扩展或压縮语音来维持语音阶段。借助此方 法,可在残余中(即在合成之前)对低频带信号进行时间弯曲,而可在合成之后在8 kHz域中对高频带信号进行时间弯曲。所揭示的方法可应用于将CELP及/或NELP 用于低频带且/或使用分频带技术以对低频带及高频带进行单独编码的任何宽带声码 器。应注意,4GV宽带的标准名称为EVRC-C。鉴于以上所述,本专利技术所揭示的特征大体来说涉及用于传送语音的一个或一个以 上经改善系统、方法及/或设备。在一个实施例中,本专利技术包括一种传送语音的方法, 其包括将残余低频带语音信号时间弯曲至所述残余低频带语音信号的经扩展或经压 縮版本;将高频带语音信号时间弯曲至所述高频语音信号的经扩展或经压縮版本;及 合并所述经时间弯曲的低频带及高频带语音信号以给出完整的经时间弯曲的语音信 号。在本专利技术一个方面中,所述残余低频带语音信号在所述残余低频带信号的时间弯 曲后合成,而在高频带中,合成在高频带语音信号的时间弯曲之前执行。所述方法可 迸一步包括对语音段进行分类及对所述语音段进行编码。对所述语音段的编码可以是 码激励线性预测、噪声激励线性预测或1/8 (寂静)帧编码中的一者。所述低频带可 表示高达约4 kHz的频带,且所述高频带可表示从约3.5 kHz到7 kHz的频带。在另一实施例中,揭示一种具有至少一个输入及至少一个输出的声码器,所述声 码器包括编码器,其包括滤波器,所述滤波器具有可操作地连接到所述声码器的输入的至少一个输入及至少一个输出;及解码器,其包括合成器,所述合成器具有可操 作地连接到所述编码器的至少一个输出的至少一个输入及可操作地连接到所述声码 器的至少一个输出的至少一个输出。在此实施例中,所述解码器包括存储器,其中所 述解码器适于执行所述存储器中所存储的软件指令,所述软件指令包括将残余低频 带语音信号时间弯曲至所述残余低频带语音信号的经扩展或经压縮版本;将高频带语 音信号时间弯曲至所述高频带语音信号的经扩展或经压縮版本;及合并所述经时间弯 曲的低频带及高频带语音信号以给出完整的经时间弯曲的语音信号。所述合成器可包 括用于合成经时间弯曲的残余低频带语音信号的装置;及用于在对其进行时间弯曲 之前合成所述高频带语音信号的装置。所述编码器包括存储器且可适于执行所述存储 器中所存储的软件指令,所述指令包括将语音段分类为1/8 (寂静)帧、码激励线 性预测或噪声激励线性预测。根据以下详细说明、权利要求书及图式,本专利技术的其它适用范围将变得明显。然 而,应了解,尽管所述详细说明及具体实例指示本专利技术的优选实施例,但其仅以图解 说明的方式给出,因为所属领域的技术人员将明了归属于本专利技术精神及范围内的各种 变化及修改。附图说明根据下文给出的详细说明、所附权利要求书及附图,可更加完整地理解本专利技术, 其中图1为线性预测编码(LPC)声码器的方块图; 图2A为含有浊音语音的语音信号; 图2B为含有清音语音的语音信号; 图2C为含有瞬态语音的语音信号;图3为图解说明对低频带及高频带的时间弯曲的方块图; 图4A描绘通过内插来确定音调延迟; 图4B描绘识别音调周期;图5A表示呈音调周期形式的原始语音信号; 图5B表示使用重叠/添加来扩展的语音信号;且图5C表示使用重叠/添加来压縮的语音信号。具体实施例方式本文中使用"说明性"一词来意指"用作实例、示例、或图解说明"。本文中描 述为"说明性"的任何实施例未必解释为比其它实施例更优选或有利。时间弯曲在包交换网络中具有若干应用,其中声码器包可不同步地到达。尽管时 间弯曲可在声码器内部或外部执行,但在声码器中执行时间弯曲可提供若干优点,例如,经弯曲帧的质量更好且计算负载减小。本文中所描述的技术可容易地应用于使用类似技术(例如,4GV-宽带,其标准名称为EVRC-C)来对话音数据进行声编码的其 它声码器。声码器功能性的说明人类话音由两个分量构成。 一个分量包括对音调敏感的基波,且另一个是对音调 不敏感的固定谐波。所感知的声音的音调是耳朵对频率的响应,S口,对于大多数实际 用途来说,音调即是频率。谐波分量使个人话音具有独特的特性。其随声带及随声道 实际形状而改变,且被称为共振峰。人类话音可由数字信号s(n) IO来表示(参见图l)。假定s(n) IO是在典型谈话期间获得的数字语音信号,其包含不同的口声及寂静周期。可如图2A-2C中所示将语 音信号s(n)10分成若干帧20。在一个方面中,以8kHz对s(n)10进行数字取样。在 其它方面中,可以16 kHz或32 kHz或某一其它取样频率对s(n) 10进行数字取样。当前的编码方案通过移除语音中所固有的所有自然冗余(即,相关的元素)将数 字化语音信号IO压縮成低位速率信号。语音通常表现出由唇及舌头的机械动作而引 起的短期冗余,且表现出由声带的颤动而引起的长期冗余。线性预测编码(LPC)通 过移除所述冗余来对语音信号IO进行滤波,从而产生残余语音信号。然后,其将所 形成的残余信号模拟成白高斯(Gaussian)噪声。可通过对若干过去样本的和进行加 权来预测语音波形的取样值,所述若干过去样本中的每一者均被线性预测系数所乘。 因此,线性预测编码器通过传输滤波系数及量化噪声而非传输完整的带宽语音信号 IO来实现减小的位速率。图1中图解说明LPC声码器70的一个实施例的方块图。LPC的功能是使有限持续时间内原始语音信号与所估计语音信号之间的平方差的和最小化。此可产生唯一一组预测系数,在正常情况下每一帧20地对所述预测系数进行估计。帧20通常为20 ms长。时变数字滤波器75的转移函数可由下式给出G其中预测系数可由ak表示且增益由G表示。所述求和从k-l计算到k-p。如果使用LPC-10方法,则p-10。此意味着仅 前10个系数被传输到LPC合成器80。最常用来计算所述系数的两种方法是(但不限 于)协方差方法及自相关方法。典型声码器产生20微秒持续时间的帧20,其中包含160个优选的8 kHz速率下 的样本或320个16 kHz速率下的样本。此帧20的经时间弯曲压縮版本具有小于20 微秒的持续时间,而经时间弯曲扩展版本则具有大于20微秒的持续时间。当在包交 换网络上发送话音数据(其会将延迟抖动引入话音包的传输中)时,话音数据的时间 弯曲具有显著优点。在此类网络中,可使用时间弯曲来减轻此延迟抖动的影响并产生 看似"同步"的话音流。本专利技术的实施例涉及一种用于通过操纵语音残余来对声码器70内的帧20进行时 间弯曲的设备及方法。在一个实施例中,本方法及设备本文档来自技高网...

【技术保护点】
一种传送语音的方法,其包括: 将残余低频带语音信号时间弯曲至所述残余低频带语音信号的经扩展或经压缩版本; 将高频带语音信号时间弯曲至所述高频带语音信号的经扩展或经压缩版本;及 合并所述经时间弯曲的低频带与高频带语音信号,以 给出完整的经时间弯曲的语音信号。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:罗希特卡普尔塞拉芬斯平多拉迪亚斯
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1