话音编码设备的频谱幅度量化制造技术

技术编号:3047156 阅读:243 留言:0更新日期:2012-04-11 18:40
一种低拉速率话音编码设备的幅度量化方案包含从帧提取频谱信息矢量的第1步骤。对矢量能量进行归一化(1301)以产生增益因数。将增益因数加以差分矢量量化。对归一化(1301)增益因数进行非均匀降频取样,以产生具有与一些非均匀频带关联的单元的固定量值矢量。固定量值矢量分解成2个以上子矢量。对子矢量进行差分量化,以便用谐波复制处理取得最佳效果。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

技术介绍
1.专利
本专利技术一般涉及话音处理领域,尤其涉及话音编码设备的参数量化。2.背景采用数字技术的话音传输日益普遍,尤其在长途数字无线电话应用中,这又引起关注决定能在信道上发送而保持重构话音感受质量的最少信息量。如果仅用取样和数字化发送话音,要达到常规模拟电话的话音质量,需要每秒64千位(kbps)的数据速率。然而,通过采用话音分析后,进行适当的编码、发送、并且在接收机重新综合,能达到数据速率显著降低。在许多电信领域采用话音压缩装置。典型的是无线通信。无线通信领域有许多应用,包括例如无绳电话、寻呼、无线本地环路、诸如蜂窝网和PCS电话系统等无线电话、移动互联的协议(IP)电话和卫星通信系统。特别重要的应用是移动用户的无线电话。无线通信系统已开发各种空中接口,例如频分多址(FDMA)、时分多址(TDMA)和码分多址(CDMA)。这方面已建立各种国内和国际标准,包括例如“先进移动电话业务”(AMPS)、“通用移动通信系统”(GSM)和“过渡标准”95(IS-95)。典型的无线电话系统是码分多址(CDMA)系统。电信业协会(TIA)和其他公知标准机构颁布IS-95标准及其派生标准IS-95A,ANSI J-STD-008、IS-95B、建立的第3代标准IS-95C和IS-2000等(这里通称为IS-95),以规定蜂窝网或PCS电话系统的CDMA空中接口的使用5103459号和4901307号美国专利阐述实质上根据IS-95标准用法配置的示范无线通信系统,这些专利转让给本专利技术受让人,按参考文献在此完全引入。通过提取人类话音产生模型有关参数对话音用各种方法进行压缩的装置称为话音编码设备。该设备将输入话音信号分成时间块或分析帧。话音编码设备通常包含编码器和解码器。编码器分析输入的话音帧,提取某些相关参数后,将其量化为二进制表示,即二进制位组或二进制数据分组。这些数据分组在信道上发送到接收机和解码器。解码器对数据分组进行处理,使其去量化以产生参数,并且用去量化的参数重新合成话音帧。话音编码设备的功能是通过去除话音固有的自然冗余将数字话音信号压缩成低位速率信号。通过用一组参数代表输入话音帧,并利用量化以二进制位组表示这些参数,达到数字压缩。如果输入话音帧具有Ni个位,话音编码设备产生的数据分组具有N0个位,则话音编码设备达到的压缩因数Cr=Ni/N0。存在的挑战是保持解码话音的话音质量高,同时又达到目标压缩因数。话音编码设备的性能取决于(1)话音模型完善程度或进行上述分析和综合处理的组合的完善程度,以及(2)在每帧No位的目标位速率下进行参数量化处理的完善程度。因此,话音模型的目标是每帧用少量参数获取话音要素或目标话音质量。话音编码设备设计中最重要的可能是寻找描述话音信号的良好参数组(包括矢量)。良好的参数组重构感受上正确的话音信号需要系统带宽小。音调、信号功率、频谱包络(或共振峰)、幅度频谱和相位频谱是话音编码参数的例子。话音编码设备可做成时域编码设备,该设备每次利用高时间分辨率处理对小话音段(通常是5毫秒(ms)子帧)进行编码,试捕获时域话音波形每一子帧借助本领域公知的各种寻找算法求来自码本空间的高准确代表。或者,话音编码设备可做成频域编码设备,该设备用参数值(分析)试捕获输入话音帧的短期话音频谱,并利用相应的综合处理,从频谱参数重构话音波形。根据《矢量量化和信号压缩(Vecter Quantization and Signal Compression)》(A.Gersho和R.M.Gray著,1992年)说明的公知量化技术,参数量化器通过用存储的码矢量表示,代表参数,保留这些参数。公知的时域话音编码设备是码激励线性预测(CELP)编码设备,《话音信号数字处理(Digital Processing of Speech Signals)》(396~453页,L.B.Rabiner和P.W.Schafer著,1978年)阐述该编码设备,按参考文献在此完全引入。CELP编码设备中,通过线性预测(LP分析)求短期共振峰滤波器的系数,去除话音信号中的短期相关和冗余。对输入话音帧施加短期预测滤波,产生LP残留信号,并且用长期预测滤波器参数和后续随机码本进一步对其进行建模和量化。因此,CELP编码将时域话音波形编码任务分成LP短期滤波器系数编码和LP残数编码的独立任务。可按固定速率(即每帧采用相同数量的位No)或可变速率(不同类型的帧内容用不同位速率)进行时域编码。可变速率编码设备试图仅用将编解码器参数编码成取得目标质量的适当程度所需数量的位。5414796号美国专利阐述可变速率CELp编码设备的范例,按照参考文献在此引入。诸如CELP编码设备等时域编码设备通常依靠每帧位数No大而保持时域话音波形准确。如果每帧位数No较大(例如8kbps或更大),该编码设备通常提供优越的话音质量。然而,位速率低(4kbps以下)时,时域编码设备由于可用位数有限,不能保持高质量和性能率靠。位速率低时,有限的码本空间使高速率商用中部署很成功的常规时域编码设备的波形匹配性能受到抑制。因此,尽管时时改进,工作在低位速率的许多CELP编码系统仍遭受感受上的显著失真,其特征通常为噪声。目前存在开发工作于中低位速率(即2.4至4kbps范围以下)的高质量话音编码设备的研究关注热潮和强烈商业需求。应用领域包括无线电话、卫星通信、因特网电话、各种多媒体和声音流应用、话音函件及其他声音存储系统。其驱动力为数据分组丢失的情况下要求高容量和牢靠性能的需求。各种近期话音编码标准化机构的工作是另一直接驱动力,推进低速率话音编码算法的研究开发。低位速率话音编码设备在每一可用频宽形成较多信道或用户,与适当信道编码附加层结合的低速率话音编码设备能适应该设备规范的总预算位,并且在信道差错状态下提供牢靠的性能。低位速率下对话音有效编码的有效方法是多模式编码。序列号09/217341的美国专利申请阐述多模式编码技术的范例,该申请题目为“可变速率话音编码(VARIARLE RATE SPEECH CODING)”(1998年12月21日提交),转让给本专利技术受让人,按参考文献在此引入。常规变模式编码设备对不同类型的输入话音帧施加不同的模式或编解码算法。专门编制每一模式或编解码处理,以便用最有效的方式最佳表示某类型话音段,诸如浊音语、清音语、过渡语(例如处于浊音与清音之间)和背景噪声(非话音)。外部开环模式判决机构审查输入话音帧,判决对该帧用何模式。通常通过从输入帧提取一些参数,就某些时间特性和频谱特性对其进行评价,并使模式判决基于该评价,从而进行开环模式判决。工作在2.4kbps左右速率的编码系统一般是参数性。即该编码系统通过在规定时间间隔发送描述话音信号音调周期和频谱包络(或共振峰)的参数,进行工作。这些参数性编码设备的说明例是LP声码器系统。LP声码器用每一音调周期一个脉冲模式浊音语信号。此基本方法可扩大到包括在各种性能中发送有关频谱包络的信息。虽然LP声码器提供适当的性能,但一般会引入感受上显著失真,其特征通常为蜂音。近年来,编码设备出现波形编码设备和参数编码设备的混合体。这些“混合编码设备”的说明例是原型波形插空(PWI)话音编码系统。PWI编码系统也可称为本文档来自技高网...

【技术保护点】
一种在话音编码设备中量化频谱信息的方法,其特征在于包含以下步骤: 从帧提取频谱信息的矢量,所述矢量具有一矢量能量值; 将矢量能量值归一化,以产生多个增益因数; 对多个增益矢量进行差分矢量量化; 对多个归一化增益因数进行非均匀降频取样,以产生具有分别与多个非均匀频带关联的多个单元的固定量值矢量; 将固定量值矢量分解成多个子矢量; 对多个子矢量进行差分量化。

【技术特征摘要】
US 1999-7-19 09/356,7561.一种在话音编码设备中量化频谱信息的方法,其特征在于包含以下步骤从帧提取频谱信息的矢量,所述矢量具有一矢量能量值;将矢量能量值归一化,以产生多个增益因数;对多个增益矢量进行差分矢量量化;对多个归一化增益因数进行非均匀降频取样,以产生具有分别与多个非均匀频带关联的多个单元的固定量值矢量;将固定量值矢量分解成多个子矢量;对多个子矢量进行差分量化。2.如权利要求1所述的方法,其特征在于,还包含以下步骤形成频带加权矢量,以跟踪对应于空频带的单元的位置。3.如权利要求1所述的方法,其特征在于,提取步骤包含提取幅度频谱信息的矢量。4.如权利要求1所述的方法,其特征在于,所述帧是话音帧。5.如权利要求1所述的方法,其特征在于,所述帧是线性预测残留帧。6.如权利要求1所述的方法,其特征在于,归一化步骤包含用2个子频带对矢量能量值进行量化,以产生2个增益因数。7.如权利要求1所述的方法,其特征在于,在对数域中进行差分矢量量化步骤。8.如权利要求1所述的方法,其特征在于,差分矢量量化步骤还包含以下步骤量化期间使泄漏最小,以免信道差错无限传播。9.如权利要求1所述的方法,其特征在于,多个非均匀频带包含22个非均匀频带。10.如权利要求1所述的方法,其特征在于,非均匀降频取样步骤包含以下步骤使多个谐波与多个非均匀频带关联,并计算每一频带中谐波的平均幅值;其中固定量值矢量的单元是各频带的平均谐波幅值。11.如权利要求1所述的方法,其特征在于,差分量化步骤包含谐波复制。12.如权利要求1所述的方法,其特征在于,差分量化步骤还包含以下步骤量化期间使泄漏最小,以免信道差错无限传播。13.如权利要求1所述的方法,其特征在于,差分量化步骤还包含以下步骤用频谱加权技术计算差错判定基准。14.如权利要求1所述的方法,其特征在于,还包含以下步骤对多个增益因数解码,以产生多个解码的增益因数,并且对差分量化步骤所得结果的量化值进行解码,以产生解码的归一化频谱信息;对解码的归一化频谱信息进行升频取样,并且用多个解码的增益素数对升频取样的解码的归一化频谱信息进行去归一化。15.如权利要求1所述的方法,其特征在于,话音编码设备驻留在无线通信系统的用户单元。16.一种话音编码设备,其特征在于包含以下步骤从帧提取频谱信息的矢量的装置,所述矢量具有一矢量能量值;将矢量能量值归一化,以产生多个增益因数的装置;对多个增益矢量进行差分矢量量化的装置;对多个归一化增益因数进行非均匀降频取样,以产生具有分别与多个非均匀频带关联的多个单元的固定量值矢量的装置;将固定量值矢量分解成多个子矢量的装置;对多个子矢量进行差分量化的装置。17.如权利要求16所述的话音编码设备,其特征在于,还包含形成频带加权矢量以跟踪对应于空频带的单元的位置的装置。18.如权利要求16所述的话音编码设备,其特征在于,提取装置包含提取幅度频谱信息矢量的装置。19.如权利要求16所述的话音编码设备,其特征在于,所述帧量话音帧。20.如权利要求16所述的话音编码设备,其特征在于,所述帧是线性预测残留帧。21.如权利要求16所述的话音编码设备,其特征在于,归一化装置包含用2个子频带对矢量能量值进行归一化以产生2个增益因数的装置。22.如权利要求16所述的话音编码设备,其特征在于,差分矢量量化装置包含在对数域中进行差分矢量量化的装置。23.如权利要求16所述的话音编码设备,其特征在于,差分矢量量量化还包含量化期间使泄漏最小以免信道差错无限传播的装置。24.如权利要求16所述的话音编码设备,其特征在于,所述多个非均匀频带包含22个非均匀频带。25.如权利要求16所述...

【专利技术属性】
技术研发人员:ELT肖依S曼祖那什
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1