用于交织语音编码器中线性谱信息量化方法的方法和设备技术

技术编号:3047197 阅读:216 留言:0更新日期:2012-04-11 18:40
一种用于交织语音编码器中线状谱信息量化方法的方法和设备包括用两种矢量量化技术对线状谱信息进行量化,第一技术是基于非移动平均预测的技术,而第二技术是基于移动平均预测的技术。用第一技术对线状谱信息矢量进行矢量量化。计算用于第一技术的等效移动平均码矢量。用等效移动平均码矢量以经语音编码器预先处理的预定帧数更新码矢量移动平均码本的存储值。依据已更新的移动平均码本存储值来计算用于第二技术的目标量化矢量。用第二技术对目标量化矢量进行矢量量化来产生量化的目标码矢量。用已量化的目标码矢量来更新移动平均码本的存储值。从已量化的目标码矢量中导出量化线状谱信息矢量。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术通常涉及语音处理领域,并且特别针对用于对语音编码器中的线状谱信息进行量化的方法和设备。
技术介绍
通过数字技术进行语音传输已经变得很普遍,特别是在长距离和数字无线电话应用中。这反过来又使人们对在信道上所发送的能保持重构语音感知质量的信息最小量的确定产生了兴趣。如果语音是以简单的采样和数字化进行传输,那么就需要大约64千位每秒(kbps)的数据率才能达到传统模拟电话的语音质量。然而,通过语音分析的使用,后随合适的编码、传输和在接收器的再合成,可以使数据率明显下降。用于压缩语音的设备在许多电信领域中都能找到。一个示例领域就是无线通信。无线通信领域具有很多应用包括例如无绳电话、无线电寻呼、无线本地环路、无线电话例如蜂窝或PCS电话系统、移动网际协议(IP)电话和卫星通信系统。一种特别重要的应用就是用于移动用户的无线电话。针对无线通信系统包括例如频分多路访问(FDMA)、时分多路访问(TDMA)和码分多路访问(CDMA)已经开发出各种空中接口。与之连接中,建立了各种国内和国际标准包括例如高级移动电话服务(AMPS)、全球移动通信系统(GSM)和临时标准95(IS-95)。一种示范无线电话通信系统是码分多路访问(CDMA)系统。IS-95标准和其衍生物IS-95A、ANSI J-STD-008,IS-95B、提议的第三代标准IS-95C和IS-2000等(在此共同归类为IS-95)是由电信工业协会(TIA)和其他知名标准团体公布来说明用于蜂窝或PCS电话通信系统的CDMA空中接口的使用。大致根据使用的IS-95标准配置的示范无线通信系统在美国专利号5,103,459和4,901,307(已转让给本专利技术的受让人并在此作为合作参考)中有所描述。采用以提取与人类语音生成模型有关的参量来压缩语音的技术的设备被称为语音编码器。语音编码器将输入语音信号分为时间块或分析帧。语音编码器通常由编码器和译码器组成。编码器对输入语音帧进行分析来提取某些相关参量,并且随后将参量量化为二进制表示,即量化为一组位或二进制数据包。数据包在通信信道上向接收器和解码器传输。解码器对这些数据包进行处理,把它们去量化来产生参量,并且使用去量化参量来再合成语音帧。语音编码器的功能是通过去除语音中固有的所有自然冗余来将数字化的语音信号压缩为低比特率信号。通过用一组参量代表输入语音帧并对参量进行量化来用一组位表示参量就可以实现数字压缩。如果输入语音帧具有位数为Ni并且语音编码器产生的数据包具有位数No,语音编码器所达到的压缩系数为Cr=Ni/No。在压缩技术中所面临的挑战是在达到目标压缩系数的情况下还要保持解码语音的高语音质量。评价语音编码器性能的依据是(1)上述语音模型或分析和合成的混合处理完成的效果有多好,以及(2)以目标比特率每帧No位进行参量量化处理所执行的效果如何。语音模型的目标就是对于每帧用较小一组参量来获得语音信号的实质或目标语音质量。在语音编码器的设计中最重要的可能就是寻找一组好的参数(包括向量)来描述语音信号。一组好的参数需要较低的系统带宽用于感觉上准确的语音信号重构。音调、信号功率、谱包络(或共振峰)、振幅谱和相谱都是语音编码参数的实例。语音编码器可以作为时域编码器实现,时域编码器是试图通过每次使用高时间分辨率处理对较小的语音段(通常是5毫秒(ms)子帧)进行编码来捕获时域语音波形。对于每个子帧,依靠本领域中已知的各种搜索算法从码本空间中寻找高精度的代表。或者,语音编码器可以作为频域编码器来实现,频域编码器是试图用一组参量(分析)来捕获输入语音帧的短期语音频谱,并且使用相应的合成处理来从谱参量中重建语音波形。参量量化器根据A.Gersho & R.M.Gray,的矢量量化和信号压缩(Vector Quantization and Signal Compression)(1992)中描述的已有量化技术通过用已存储的码矢量代表表示这些参量来保存它们。一种著名的时域编码器是在L.B.Rabiner & R.W.Schafter,的语音信号数字处理(Digital Processing of Speech Signals)396-453(1978,在此作为合作参考)中所描述的代码激发线性预测(CELP)编码器。在CELP编码器中,通过线性预测(LP)分析去除了短期相关或冗余,该分析是找出短期共振峰滤波器的系数。对输入语音帧使用短期预测滤波器就产生LP剩余信号,该信号将进一步用长期预测滤波器参数和后续随机码本进行模拟和量化。这样,CELP编码将对时域语音波形的编码任务分为对LP短期滤波器系数编码和对LP剩余编码的独立任务。时域编码能以固定速率(即对每个帧使用相同的位数,N0)或可变速率(对不同类型的帧内容使用不同的速率)执行。可变速率编码器试图仅使用足够获得目标质量水平而对编解码器参量进行编码所需的位数。一种示范可变速率CELP编码器在美国专利号5,414,796(已转让给本专利技术的受让人,并在此作为合作参考)中有描述。时域编码器例如CELP编码器通常依靠较高的每帧位数N0来保持时域语音波形的精确度。这样的编码器通常以相对较大的每帧位数N0(例如8kbps或以上)所提供的极好的语音质量进行传输。然而,在较低比特率(4kbps和以下),时域编码器由于有限的可用位数而不能保持高质量传输和稳健的性能。在低比特率时,有限的码本空间削减了传统时域编码器的波形匹配能力,该编码器在更高比特率的商业应用中使用得非常成功。因此,虽然随时间进行了很多改进,但是,许多在低比特率上工作的CELP编码系统还是受到通常用噪声表征的明显感觉上失真的困扰。当前人们对开发在中到低比特率(即2.4到4kbps和以下的范围)工作的高质量语音编码器有着浓厚的研究兴趣和强烈的商业需求。其应用领域包括无线电话、卫星通信、因特网电话、各种多媒体和语音流应用程序、语音邮件和其他语音存储系统。其驱动力是人们对高容量的需求和在包丢失情况下对稳健性能的要求。各种新近的语音编码标准化工作是另一种推动低比特率语音编码算法研究和发展的直接驱动力。低比特率语音编码器在每个允许的应用带宽上创建更多的信道或用户,并且结合有适合信道编码的附加层的低比特率语音编码器能符合编码器规范的总体位预算,并能在信道错误的条件下提供稳健的性能。一种在低比特率下能有效对语音编码的有用技术是多模编码。一种示范多模编码技术在美国申请序列号09/217,341在1998.12.21申请的名为可变比特率语音编码(VARIABLE RATE SPEECH CODING,已转让给本专利技术的受让人并在此作为合作参考)中有描述。传统的多模编码器对不同类型的输入语音帧采用不同的模式或编码-解码算法。每种模式或编码-解码处理是为以最有效的方式最佳表示某种类型语音段而定制的,例如即有声语音、无声语音、过渡语音(例如有声和无声之间)和背景噪声(无语音)。一种外部开环模式判定机制对输入语音帧进行检验,并做出有关对帧采用什么模式的判定。开环模式判定通常是通过从输入帧中提取许多参量,对有关某些时间和频谱特性的参数进行评估,并以评估值作为模式判定的基础。在许多传统语音编码器中,通过未充分减少码率而对有声本文档来自技高网...

【技术保护点】
一种语音编码器,包括: 线性预测滤波器,配置为用于分析帧并依据分析生成线状谱信息码矢量;和 与所述线性预测滤波器耦合的量化器,配置为用于通过使用基于非移动平均预测矢量量化方案的第一矢量量化技术来对线状谱信息矢量进行矢量量化, 其特征在于,所述量化器进一步配置为用来计算用于第一技术的等效移动平均码矢量,用所述等效移动平均码矢量对经语音编码器预先处理的预定帧数的码矢量移动平均码本存储值进行更新,依据已更新的所述移动平均码本存储值计算用于第二技术的目标量化矢量,通过所述第二矢量量化技术对目标量化矢量进行量化来生成经量化的目标码矢量,所述第二矢量量化技术是使用基于移动平均预测的方案,用所述经量化的目标码矢量对所述移动平均码本存储值进行更新,并从所述经量化的目标码矢量中计算经量化的线状谱信息矢量。

【技术特征摘要】
US 1999-7-19 09/356,7551.一种语音编码器,包括线性预测滤波器,配置为用于分析帧并依据分析生成线状谱信息码矢量;和与所述线性预测滤波器耦合的量化器,配置为用于通过使用基于非移动平均预测矢量量化方案的第一矢量量化技术来对线状谱信息矢量进行矢量量化,其特征在于,所述量化器进一步配置为用来计算用于第一技术的等效移动平均码矢量,用所述等效移动平均码矢量对经语音编码器预先处理的预定帧数的码矢量移动平均码本存储值进行更新,依据已更新的所述移动平均码本存储值计算用于第二技术的目标量化矢量,通过所述第二矢量量化技术对目标量化矢量进行量化来生成经量化的目标码矢量,所述第二矢量量化技术是使用基于移动平均预测的方案,用所述经量化的目标码矢量对所述移动平均码本存储值进行更新,并从所述经量化的目标码矢量中计算经量化的线状谱信息矢量。2.如权利要求1所述的语音编码器,其特征在于,所述帧是语音帧。3.如权利要求1所述的语音编码器,其特征在于,所述帧是线性预测剩余帧。4.如权利要求1所述的语音编码器,其特征在于,所述目标量化矢量是根据下述公式进行计算UM≡{UMn=(LMn-α1nU^M-1n-α2nU^M-2n-....-αPnU^M-Pn)α0n;n=0.1....N-1},]]>其中{M-1n,M-2n,…,M-Pn;n=0,1,…,N-1}是对应于紧接在帧之前已处理的预定数目帧的线状谱信息参量的码本表项,而{α1n,α2n,…,αPn;n=0,1,…,N-1}是各参数权重,这样{α0n+α1n+,…,+αPn=1;n=0,1,…,N-1}。5.如权利要求1所述的语音编码器,其特征在于,所述经量化线状谱信息矢量是根据下述公式进行计算L^M≡{L^Mn=α0nU^Mn+α1nU^M-1n+....+αPnU^M-Pn;n=0,1,..,N-1},]]>其中{M-1n,M-2n,…,M-Pn;n=0,1,…,N-1}是对应于紧接在帧之前已处理的预定数目帧的线状谱信息参量的码本表项,而{α1n,α2n,…,αPn;n=0,1,…,N-1}是各参量权重,这样{α0n+α1n+,…,+αPn=1;n=0,1,…,N-1}。6.如权利要求1所述的语音编码器,其特征在于,所述等效移动平均码矢量是根据下述公式进行计算U^~M-K≡{U^~M-Kn=(L^M-Rn-β1nU^M-K-1n-β2nU^M-K-2n-....-βRnU^M-K-Pn)β0n;n=0,1....N-1}]]>其中{β1n,β2n,…,βPn;n=0,1,…,N-1}是各等效移动平均码矢量单元权重使得{β0n+β1n+,…,+βPn=1;n=0,1,…,N-1},并且其中初始条件 已确立。7.如权利要求1所述的语音编码器,其特征在于,所述语音编码器驻留在无线通信系统用户单元中。8.一种对帧的线状谱信息矢量进行矢量量化的方法,使用第一和第二量化矢量量化技术,第一技术使用基于非移动平均预测矢量量化方案,第二技术使用基于移动平均预测矢量量化方案,其特征在于,该方法包括下述步骤用所述第一矢量量化技术对线状谱信息矢量进行矢量量化;计算用于所述第一技术的等效移动平均码矢量;用所述等效移动平均码矢量更新经语音编码器预先处理的预定帧数的码矢量移动平均码本的存储值;依据所述已更新的移动平均码本的存储值来计算用于所述第二技术的目标量化矢量;用所述第二矢量量化技术对目标量化矢量进行矢量量化来产生量化的目标码矢量;用所述已量化的目标码矢量来更新所述移动平均码本的存储值;和从所述已量化的目标码矢量中导出量化线状谱信息矢量。9.如权利要求8所述的方法,其特征在于,所述帧是语音帧。10.如权利要求8所述的方法,其特征在于,所述帧是线性预测剩余帧。11.如权利要求8所述的方法,其特征在于,所述计算步骤包括根据下述公式计算所述目标量化UM≡{UMn=(LMn-α1nU^M-1n-α2nU^M-2n-....-αPnU^M-Pn)α0n;n=0,1,..,N-1},]]>其中{M-1n,M-2n,…,M-Pn;n=0,1,…,N-...

【专利技术属性】
技术研发人员:AK阿南塔帕德玛那伯汉S曼朱那什
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1