当前位置: 首页 > 专利查询>西门子公司专利>正文

语音信号的编码方法技术

技术编号:3046640 阅读:125 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及对语音信号、特别是所谓的“语音爆破音”段进行编码的方法。通过确定第一放大系数,减少了表示第一或自适应放大系数和自适应代码本项的总和的数据量,以此可准确地表示在语音编码过程中所出现的其它参量。此外,本发明专利技术还涉及传输进行如此编码的语音信号的方法。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种语音信号编码的方法、特别是在有多种代码本,通过代码本的项使语音信号成为近似值,的情况下涉及的一种语音信号编码的方法,和涉及一种传输语音信号的方法。在数字语音通信系统、如固定网、因特网或数字移动网中,使用多种语音编码方法,以便降低要传输的比特率。语音编码方法通常提供一个已经进行语音编码的比特的比特流,该比特流被划分成分别代表譬如为20ms的语音信号的帧。一个帧内的多个比特一般表示参量的一个确定的组。一个帧又多次地划分成子帧,以致于某些参量一次按每帧传输,在下一次按每个子帧传输。作为举例给出了US-TDMA增强型全速率(EFR)语音编译码,其速率为7.4kbps,也即每20ms的帧为148比特。在此,一帧由4个子帧组成。下面就这种语音编码方法示范性地介绍在所谓的CELP(码激励线性预测)码中所出现的参量的意义-所谓的LPC(线性预测编码)合成滤波器的10个系数,它用26比特/帧被进行量化。滤波器在当前帧的区内显示语音信号的频谱包络。用于这种滤波器的激励信号以相加地方式组成,有一个用所谓的“自适应放大系数”g-1加权的所谓的“自适应激励信号”s-a和一个用所谓的“固定的放大系数”g-2加权的所谓的“固定的激励信号”s-f。-借助4×17个比特对固定激励信号的4个子帧量化。固定的激励信号s-f由所谓的“固定的代码本”的项组成,该项用固定的放大系数g-2加权。固定的代码本的项各由一脉冲序列组成,该脉冲序列只在很少时刻与0不同。-借助2×8个比特和2×5个比特表示语音基频的4个值。在所谓的通过合成进行分析的CELP编码方法中产生的自适应激励信号,在延迟语音基频一个周期的情况下,从LPC合成滤波器的激励信号中确定。所有可能的已量化的语音基频都构成所谓的“自适应代码本”,该代码本包括相应移位的激励信号。-借助4×7个比特对每帧4个放大系数对进行矢量量化。“自适应放大系数”被用到自适应激励信号上,“固定的放大系数”被用到固定的激励信号上。然后,如上所述,LPC合成滤波器的总激励信号以相加地方式由加权的自适应的和固定的激励信号组成。代码本的项一般称做代码字或代码矢量。自适应代码本之所以称之为“自适应”,是因为在该代码本中包含的代码矢量不是一个常数或更甚之以暂存的方式存在,而是对每个子帧都自适应地从过去的LPC合成滤波器的总激励信号中来确定该代码矢量。固定的代码本之所以是“固定”,是由于代码矢量或者是以固定存储方式存在(噪声激励)或者是至少通过所确定的计算规范算出(代数代码本),该计算规范不依赖于各自的子帧。分别分配的放大系数通常也称之为“自适应”或“固定”。需要说明的是,所有4种参量类型即自适应和固定的激励信号,以及自适应和固定的放大系数,自然都可在每个子帧中确定,并且在这种意义上所有的4种参量都具有“自适应性质”。此外,确应坚持以前引用的术语(在文献中也是常用的)或使用概念“第一放大系数”代替“自适应放大系数”和使用概念“第二放大系数”代替“固定的放大系数”。激励信号S`在进行LPC合成滤除之后,应尽可能准确地反映在这个时间出现的语音段、语音信号S。所以,应如此选择参量g-1、g-2、s-a、s-f,以致于能由此尽可能好地表示语音信号。激励信号s`=g-1*s-a+g-2*s-f以此在接收机一端进行LPC合成滤除之后近似为语音信号。对总的激励信号S`来说,各个被加数g-1*s-a或g-2*s-f的量值变化取决于语音信号段的语音特点。语音信号包括帧序列或子帧序列,在这些帧中语音信号可作为稳定的,也即无须按时间展开其统计特性进行模拟。在此系指周期性的段譬如可表示元音的段。这种周期性通过被加数g-1*s-a的量值进入总激励信号S`之内。但是也甚至于具有很不稳定的语音信号段,譬如象所谓的“突发开始”(“Onsets”)或“语音爆破音”(“Sprach-Onsets”)。在此譬如系指一个字开始的爆破音。在这种情况下,被加数g-2*s-f表示对激励信号S`的主要量值。一个具有突发开始的帧或子帧的统计特性通常不用从后面的帧或子帧就可估算出来。特别是在突发开始时确定不了长时间周期性,也即语音基频的值完全不能表达和不能使用。因而,为对语音信号段编码,在突发开始时,由自适应代码本的自适应放大系数和项组成的量值,确可表达语音信号的长时间周期性,与其说是有利不如说是不利。自适应激励信号的量值对总激励信号来说在突发开始时按规则是不利的如果根本就不出现周期性,也即在自适应代码本查找的范围内不出现合适的自适应激励信号,则得到的最佳的自适应放大系数为0。现在,自适应和固定的放大系数g-1和g-2作为数对(g-1、g-2)多次借助放大系数的其它代码本进行量化。在对参量进行并行的彼此相关的量化的这种情况下,称之为矢量量化。这种代码本自然只有一个有限的数量,典型为7比特,以此就可实现27=128项,这些项的标号譬如是从0-127。只传输标号到接收机上,由此在与常规传输相比在g-1和g-2进行标量量化后单独得到一个数据压缩的结果。标量量化可理解成是一种参量的单个的、彼此独立的量化。如上所述,在这个代码本中项的数量是有限的。因此,可作为在这个代码本中的项来使用那些数对(g-1、g-2),通过数对的总和,也即具有标号0-127的数对使尽可能地表示所有可能出现的g-1和g-2的组合。然后,这些按常规方式提供给一个所谓的矢量量化。在采用自适应放大系数g-1=0时,原则上可能出现固定放大系数g-2的任意值,因为在非周期性语音段中,如上所述,自适应部分g-1*s-a恰好比固定部分小得多,由此通过后者来确定LPC合成滤波器的激励信号S`,并且在这种情况下不可能从过去存在的值中计算固定部分。为了在这种情况下即g-1=0的情况下,在LPC合成滤波后通过参量g-1、g-2、s-a、s-f使激励信号S`与原语音信号S也可进行最佳匹配,因此必须将许多个一对值(g-1=0、g-2)纳入代码本,由于存储空间的原因,这自然是不可能的。就这方面来说,在情况g-1=0进行参量匹配时大多会得到g-2的一个匹配不佳的值。这在量化后将导致总的激励信号S`中出现非预期的信号部分。大多数常用的语音编码器根本不能解决这些问题。许多语音编码器譬如GSM增强型全速率编码器(GSM-EFR)都可进行放大系数的标量量化。这就是说在这种情况下,即每个子帧具有4个比特的自适应放大系数和每个子帧具有5个比特的固定的放大系数都可单个地和彼此独立地进行量化。这具有的优点是,在某些不稳定的语音段中譬如在突发开始时可以很容易使自适应放大系数量化为0,并且固定的放大系数可以在量化后成为一个与此不相关的值。可是,与矢量量化相比它就具有编码效率低的缺点在GSM-EFR编码器中对放大系数需要有4+5=9比特,而矢量量化7个比特就够了。在此,还有另一个缺点就是无附加比特提供使用,以便相当准确地量化固定的激励或固定的放大系数。在选择自适应放大系数为0的情况下,仍不使用自适应代码本的比特也即语音基频。相比之下,GSM-半速率编码器(GSM-HR)以多种模式工作。一种模式规定,在某些子帧中譬如表示突发开始的这样的子帧中,用第二个固定的代码本代替自适应代码本。这虽然以某种方式解决了问题,但是对第二代码本来本文档来自技高网...

【技术保护点】
语音信号编码的方法,-其中将语音信号分解成语音信号段,-其中合成滤波器的激励信号至少借助一固定的代码本和一分配的第二放大系数,并且可自由选择地借助一具有一所属第一放大系数的自适应代码本来组成,-其中按照语音的特点通过 一个信号分类器对语音信号段进行分类,并且-其中依赖信号分类器确定第一放大系数的值,以此减少了表示自适应代码本项和第一放大系数的总和所需的数据量。

【技术特征摘要】
DE 2001-5-18 10124420.71.语音信号编码的方法,-其中将语音信号分解成语音信号段,-其中合成滤波器的激励信号至少借助一固定的代码本和一分配的第二放大系数,并且可自由选择地借助一具有一所属第一放大系数的自适应代码本来组成,-其中按照语音的特点通过一个信号分类器对语音信号段进行分类,并且-其中依赖信号分类器确定第一放大系数的值,以此减少了表示自适应代码本项和第一放大系数的总和所需的数据量。2.按照权利要求1所述的方法,其中确定第一放大系数为0。3.按照权利要求1或2之一所述的方法,其中...

【专利技术属性】
技术研发人员:T芬谢德特H塔戴I瓦加
申请(专利权)人:西门子公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1