编码方法、编码器、解码方法及解码器技术

技术编号:4190752 阅读:199 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例提供一种清音或过渡音模式下的编码方法,包括:获得去均值后的无偏矢量;对所述去均值后的无偏矢量进行矢量分裂,得到多个分裂子矢量;对所述多个分裂子矢量进行矢量量化,得到一组码字索引值。本发明专利技术还提供清音或过渡音模式下的编码器、解码方法、解码器、矢量量化系统、浊音或一般音模式下的编码方法、编码器、解码方法、解码器、矢量量化系统和矢量量化方法、装置。

【技术实现步骤摘要】

本专利技术涉及通信领域,尤其涉及矢量量化技术。
技术介绍
随着通信系统中高速率数据服务的发展,宽带语音(50-7000Hz)编码 技术得到了越来越广泛的应用。线性预测分析技术(LPA, Linear Predictive Analysis)是目前进行语音信号分析的最有效的技术之一,也是代数码激励线 性预测沖莫型(ACELP, Algebraic Code Excited Linear Prediction)中的一个关 键环节,它为模拟声道的频率特性提供了一组简洁的模型参数。LPA的模型 参数具有多种表达形式,其中,导抗谱频率(ISF, Immittance Spectral Frequencies )参数因其许多优良的特性更加适合矢量量化,得到了广泛的应用。 例如,在第3代合作伙伴计划2 ( 3GPP2, 3rd Generation Partnership Project 2 ) 的宽带自适应多速率(AMR-WB , Adaptive Multi-Rate-Wideband)和宽带变 速率多模式(VMR-WB, Variable-Rate Multimode Wideband)语音编码标准中, 都采用了 ISF参数。宽带语音通常需要16阶线性预测系数才能较好的表征语音的谱包络信 息。如果直接对整个矢量进行矢量量化,将导致非常高的空间和时间复杂度。 因此, 一些针对谱参数量化的次优量化方法相继提出,如预测矢量量化、分 裂矢量量化、多级矢量量化、代数矢量量化等。预测分裂矢量量化方法结合 了预测矢量量化和分裂矢量量化的优点,利用谱参数的帧间相关性,使用预 测的方法减小了待量化矢量的动态范围,使用分裂的方法减小了时间和空间 复杂度,对ISF参数有良好的量化效果,获得了广泛的应用。专利技术人在实现本专利技术的过程中,发现现有技术至少存在以下缺点虽然 预测技术提高了量化的效果,但是由于预测要使用量化的历史值,所以,在 发生帧丟失的情况下,就会有错误的延续。现有的预测模型主要有移动平均 (MA, Moving Average )予贞测和自回归(AR, Autoregressive )子贞观'J。在相同 量化比特数下,AR预测的量化效果更好,但是,在帧丢失情况下,错误延续 比较严重,会严重影响语音质量,MA预测虽然可以把错误的延续控制在下一li帧,但会严重降低量化效果。由此可见,现有的矢量量化的量化质量比较低。
技术实现思路
本专利技术目的在于提供编码方法、编码器、解码方法、解码器、矢量量化 系统、矢量量化方法及装置,用以提高矢量量化的量化质量。一种清音或过渡音模式下的编码方法,包括获得去均值后的无偏矢量; 对所述去均值后的无偏矢量进行矢量分裂,得到多个分裂子矢量;对所述多 个分裂子矢量进行矢量量化,得到一组码字索引值。一种清音或过渡音模式下的编码器,包括无偏矢量获得单元,用于获 得去均值后的无偏矢量;矢量分裂单元,用于对所述无偏矢量获得单元获得 的去均值后的无偏矢量进行矢量分裂,得到多个分裂子矢量;矢量量化单元, 用于对所述矢量分裂单元得到的多个分裂子矢量进行矢量量化,得到一组码 字索引值。一种清音或过渡音模式下的解码方法,包括获得一组码字索引值;根 据每个码字索引值获得对应的分裂子矢量;将获得的分裂子矢量重构为去均值后的无偏矢量;根据所述去均值后的无偏矢量,获得量化后的目标矢量。一种清音或过渡音模式下的解码器,包括码字索引值获得单元,用于 获得一组码字索引值;分裂子矢量获得单元,用于根据所述码字索引值获得 单元获得的每个码字索引值获得对应的分裂子矢量;无偏矢量重构单元,用 于将所述分裂子矢量获得单元获得的分裂子矢量重构为去均值后的无偏矢 量;目标矢量获得单元,用于根据所述无偏矢量重构单元重构的去均值后的 无偏矢量,获得量化后的目标矢量。一种浊音或一般音模式下的编码方法,包括获得去均值后的无偏矢量; 对所述去均值后的无偏矢量分别进行有记忆分裂矢量量化处理和无记忆分裂 矢量量化处理,得到两组侯选码字索引值;从两组侯选码字索引值中,选择 一组码字索引值。一种浊音或一般音模式下的编码器,包括无偏矢量获得单元,用于获 得去均值后的无偏矢量;无偏矢量处理单元,用于对所述无偏矢量获得单元 获得的去均值后的无偏矢量分别进行有记忆分裂矢量量化处理和无记忆分裂 矢量量化处理,得到两组侯选码字索引值;码字索引值选择单元,用于从所 述无偏矢量处理单元得到的两组侯选码字索引值中,选择一组码字索引值。一种浊音或一般音模式下的解码方法,包括获得一组码字索引值和选择标识,所述选择标识用于标识所述码字索引值所经过的矢量量化处理的种类;对所述一组码字索引值进行与所述选择标识对应的解码处理,得到去均 值后的无偏矢量;才艮据所述去均值后的无偏矢量,得到量化后的目标矢量。一种浊音或一般音模式下的解码器,包括码字索引值和选择标识获得 单元,用于获得一组码字索引值和选择标识,所述选择标识用于标识所述码 字索引值所经过的矢量量化处理的种类;解码处理单元,用于对所述码字索 引值和选择标识获得单元获得的一组码字索引值进行与所述选择标识对应的 解码处理,得到去均值后的无偏矢量;量化后的目标矢量获得单元,用于根 据所述矢量量化处理单元得到的去均值后的无偏矢量,得到量化后的目标矢 量。一种清音或过渡音模式下的矢量量化系统,包括编码器,用于获得去 均值后的无偏矢量,对所述去均值后的无偏矢量进行矢量分裂,得到多个分 裂子矢量;对所述多个分裂子矢量进行矢量量化,得到一组码字索引值;解 码器,用于获得所述编码器得到的所述一组码字索引值,根据每个码字索引 值获得对应的分裂子矢量,将获得的分裂子矢量重构为去均值后的无偏矢量, 根据所述去均值后的无偏矢量,获得量化后的目标矢量。一种浊音或一般音模式下的矢量量化系统,包括编码器,用于获得去 均值后的无偏矢量,对所述去均值后的无偏矢量分别进行有记忆分裂矢量量 化处理和无记忆分裂矢量量化处理,得到两组侯选码字索引值,从两组侯选 码字索引值中,选择一组码字索引值;解码器,用于获得所述编码器选择的 所述一组码字索引值和所述解码器提供的选择标识,所述选择标识用于标识 所述码字索引值所经过的矢量量化处理的种类,对所述一组码字索引值进行 与所述选择标识对应的解码处理,得到去均值后的无偏矢量,根据所述均值 后的无偏矢量,得到量化后的目标矢量。一种矢量量化方法,包括获得语音信号;判断所述语音信号所属的种 类;如果所述语音信号是清音信号或过渡音信号,则使用上述清音或过渡音 模式下的编码方法,对待量化的目标矢量进行编码处理,并使用上述清音或 过渡音模式下的解码方法,对编码后得到的码字索引值进行解码处理;如果 所述语音信号是浊音信号或一般音信号,则使用上述浊音或一般音模式下的编码方法,对待量化的目标矢量进行编码处理,并使用上述浊音或一般音模 式下的解码方法,对编码后得到的码字索引值进行解码处理。一种矢量量化装置,包括语音信号获得单元,用于获得语音信号;语 音信号种类判断单元,用于判断所述语音信号获得单元获得的语音信号所属 的种类;第一矢量量化处理单元,包括上述清音或过渡音模式下的编码器及 上述清音或过渡音模式下的解码器,所述上述清音或过渡音模式下的编码器 用本文档来自技高网
...

【技术保护点】
一种清音或过渡音模式下的编码方法,其特征在于,包括: 获得去均值后的无偏矢量; 对所述去均值后的无偏矢量进行矢量分裂,得到多个分裂子矢量; 对所述多个分裂子矢量进行矢量量化,得到一组码字索引值。

【技术特征摘要】
1.一种清音或过渡音模式下的编码方法,其特征在于,包括获得去均值后的无偏矢量;对所述去均值后的无偏矢量进行矢量分裂,得到多个分裂子矢量;对所述多个分裂子矢量进行矢量量化,得到一组码字索引值。2. 如权利要求1所述的方法,其特征在于,获得去均值后的无偏矢量具体 为将待量化的目标矢量与所述待量化的目标矢量的均值矢量相减,得到去 均值后的无偏矢量。3. 如权利要求1所述的方法,其特征在于,对所述多个分裂子矢量进行矢 量量化,得到一组码字索引值,具体为根据平方误差最小准则,得到所述 一组码字索引值。4. 如权利要求1所述的方法,其特征在于,对所述多个分裂子矢量进行矢 量量化,得到一组码字索引值,具体为从每个分裂子矢量对应的无偏码书 中查找到对应的码字索引值。5. 如权利要求1所述的方法,其特征在于,所述去均值后的矢量为去均值 后的无偏导抗i普频率ISF矢量。6. —种清音或过渡音模式下的编码器,其特征在于,包括 无偏矢量获得单元,用于获得去均值后的无偏矢量; 矢量分裂单元,用于对所述无偏矢量获得单元获得的去均值后的无偏矢量进行矢量分裂,得到多个分裂子矢量;矢量量化单元,用于对所述矢量分裂单元得到的多个分裂子矢量进行矢 量量化,得到一组码字索引值。7. 如权利要求6所述的编码器,其特征在于,所述去均值后的无偏矢量为 去均值后的ISF矢量。8. —种清音或过渡音模式下的解码方法,其特征在于,包括 获得一组码字索引值;根据每个码字索? 1值获得对应的分裂子矢量; 将获得的分裂子矢量重构为去均值后的无偏矢量; 才艮据所述去均值后的无偏矢量,获得量化后的目标矢量。9. 如权利要求8所述的方法,其特征在于,根据每个码字索引值获得对应的分裂子矢量具体为在每个码字索引值对应的无偏码书中得到对应的分裂 子矢量。10. 如权利要求8所述的方法,其特征在于,根据所述去均值后的无偏矢 量,获得量化后的目标矢量,具体为将所述去均值后的无偏矢量加上量化 后的目标矢量的均值矢量,得到量化后的目标矢量。11. 如权利要求8所述的方法,其特征在于,所述去均值后的无偏矢量为 去均值后的ISF矢量,所述量化后的目标矢量为量化后的ISF参数。12. —种清音或过渡音模式下的解码器,其特征在于,包括 码字索引值获得单元,用于获得一组码字索引值;分裂子矢量获得单元,用于根据所述码字索引值获得单元获得的每个码 字索引值获得对应的分裂子矢量;无偏矢量重构单元,用于将所述分裂子矢量获得单元获得的分裂子矢量 重构为去均值后的无偏矢量;目标矢量获得单元,用于根据所述无偏矢量重构单元重构的去均值后的 无偏矢量,获得量化后的目标矢量。13. 如权利要求12所述的解码器,其特征在于,所述去均值后的无偏矢量 为去均值后的ISF矢量,所述量化后的目标矢量为量化后的ISF参数。14. 一种浊音或一般音模式下的编码方法,其特征在于,包括 获得去均值后的无偏矢量;对所述去均值后的无偏矢量分别进行有记忆分裂矢量量化处理和无记忆 分裂矢量量化处理,得到两组侯选码字索引值;从两组侯选码字索引值中,选择一组码字索引值。15. 如权利要求14所述的方法,其特征在于,对所述去均值后的无偏矢量 进行有记忆分裂矢量量化处理,得到第一组侯选码字索引值,具体包括将去均值后的无偏矢量与预测矢量相减,得到预测残差矢量;对预测残差矢量进行分裂矢量量化,得到所述第一组侯选码字索引值。16. 如权利要求15所述的方法,其特征在于,所述预测矢量由下述方式获 得A()『()[义(-l)-7k)], i二0,…,15,其中,A()为所述预测矢量,/( —1) 表示前一帧的量化后的目标矢量,/()表示当前帧的均值矢量,,()是预测 系数。17. 如权利要求16所述的方法,其特征在于,a,(w)由下述方式获得通过 平方预测误差最小准则,从训练数据中估计出来。18. 如权利要求17所述的方法,其特征在于,通过平方预测误差最小准则, 从训练数据中估计出来,具体包括令第,'个目标矢量的平方预测误差为E「Ih(n)]^Zh(n)-P,(n)Tn=l n=l ,其中,£,.表示第/个目标矢量的平方预测误差, 表示训练数据的总帧数, z, (w)表示去均值后的无偏矢量,。()表示预测残差矢量;令眠'=(),预测系数^()被确定的过程如下<formula>formula see original document page 4</formula>其中,;,()表示当前帧重构后的无偏矢量,;(-l)表示前一帧重构后的无偏矢量。19. 如权利要求14所述的方法,其特征在于,对所述去均值后的无偏矢量 进行无记忆分裂矢量量化处理,得到第二组侯选码字索引值,具体为对去 均值后的无偏矢量进行分裂矢量量化,得到所述第二组侯选码字索引值。20. 如权利要求14所述的方法,其特征在于,从两组侯选码字索引值中, 选择一组码字索引值,具体包括对分别经过记忆分裂矢量量化处理和无记忆分裂矢量量化处理得到的两 组侯选码字索引值,分别进行与有记忆分裂矢量量化处理对应的解码处理和 与无记忆分裂矢量量化处理对应的解码处理,重构两个去均值后的无偏矢量;从所述两个重构后的去均值后的无偏矢量中,选择一个重构后的去均值 后的无偏矢量,所述重构后的去均值后的无偏矢量对应的 一组侯选码字索引 值即为选择的 一 组码字索引值。21. 如权利要求20所述的方法,其特征在于,从所述两个重构后的去均值 后的无偏矢量中,选择一个重构后的去均值后的无偏矢量,具体包括当以下其中 一个条件成立时,选择经过无记忆分裂矢量量化处理重构后的去均值后的无偏矢量,否则,选择经过有记忆分裂矢量量化处理重构后的 去均值后的无偏矢量条件l、 Errl<ErrO*Ratio其中,ErrO表示^f吏用预测和前一帧自回归AR预测的历史进行量化的平 方误差,Errl表示进行无记忆分裂矢量量化的平方误差,Ratio4.15是一个常 数因子;条件2、 ErrKThres其中,Thres二50000或40000,是一个门限值; 条件3、 Stable〈2其中,Stable是表示前一帧和当前帧稳定性的变量。22. 如权利要求14所述的方法,其特征在于,选择一组码字索引值后,还 包括将选择的一组码字索引值及选择标识写入比特流,其中,所述选择标 识用于标识选择的一组码字索引值所经过的矢量量化处理的种类。23. 如权利要求20所述的方法,其特征在于,选择一个重构后的去均值后 的无偏矢量之后,还包括根据选择的重构后的去均值后的无偏矢量,获得量化后的目标矢量;用所述量化后的目标矢量更新前一帧量化后的目标矢量,以用于帧间预测。24. 如权利要求14所述的方法,其特征在于,所述去均值后的无偏矢量为 去均值后的无偏ISF矢量。25. —种浊音或一般音模式下的编码器,其特征在于,包括 无偏矢量获得单元,用于获得去均值后的无偏矢量; 无偏矢量处理单元,用于对所述无偏矢量获得单元获得的去均值后的无偏矢量分别进行有记忆分裂矢量量化处理和无记忆分裂矢量量化处理,得到两组侯选码字索引值;码字索引值选择单元,用于从所述无偏矢量处理单元得到的两组侯选码 字索引值中,选择一组码字索引值。26. 如权利要求25所述的编码器,其特征在于,所述无偏矢量处理单元用 于有记忆分裂矢量量化处理时,包括预测残差矢量获得单元,用于将去均值后的无偏矢量与预测矢量相减, 得到预测残差矢量;分裂矢量量化单元,用于对所述预测残差矢量获得单元获得的预测残差 矢量进行分裂矢量量化,得到所述一组侯选码字索引值。27. 如权利要求25所述的编码器,其特征在于,所述码字索引值选择单元 包括无偏矢量重构单元,用于对分别经过记忆分裂矢量量化处理和无记忆分 裂矢量量化处理得到的两组侯选码字索引值,分别进行与有记忆分裂矢量量 化处理对应的解码处理和与无记忆分裂矢量量化处理对应的解码处理,重构两个去均值后...

【专利技术属性】
技术研发人员:鲍长春辛杰
申请(专利权)人:北京工业大学华为技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1