语音编码装置和语音编码方法制造方法及图纸

技术编号:5372708 阅读:171 留言:0更新日期:2012-04-11 18:40
公开了可在语音编码中对代数码本进行分割搜索并提高编码性能的语音编码装置。在CELP编码装置的失真最小化部(112)中,最大相关值计算部(221)针对构成固定码本的四条脉冲,使用各候选位置的各脉冲与目标信号计算相关值,针对每条脉冲求出相关值的最大值,并计算使用了该相关值的最大值的最大相关值,排序部(222)将四条脉冲两条两条分割为两个子集,搜索部(224)对固定码本进行分割搜索,得到表示编码失真最小的四条脉冲的位置和极性的代码。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及,特别涉及进行固定码本搜索的语音编码装置和语音编码方法
技术介绍
在移动通信中,为了有效地利用传输频带,必须对语音和图像的数字信息进行压 縮编码。其中,对于广泛应用在手机中的语音编解码器(编码/解码)技术的期待很大,针 对压縮率高的以往的高效率编码,音质方面的要求进一步增强。 近年来,在ITU-T (International Telecommunication UnionTelecomm皿ication Standardization Sector,国际电信联盟电信标准化部门)、MPEG(Moving Picture Expert Group,运动图像专家组)等组织探讨具有多层结构的可扩展编解码器的标准化,谋求更高 效且高品质的语音编解码器。 语音编码技术通过将语音的发声结构模型化并巧妙应用了矢量量化的基本方式 "CELP" (Code Excited Linear Prediction,码激励线性预测)使性能大幅提高,并且通过 利用像非专利文献l中记载的代数码本(AlgebraicCodebook)那样的少数脉冲的固定激 励的技术,使性能进一步提高。ITU-T标准G. 729和ETSI (European Telecommunications Standards Institute,欧洲电信标准协会)标准AMR (Adaptive Multi-Rate,自适应多速 率)是使用了代数码本的CELP的代表性编解码器,其在世界范围内被广泛使用。 在使用代数码本进行语音编码的情况下,优选考虑构成代数码本的每条脉冲的相 互影响,并搜索全部的脉冲的组合(以下称为整体搜索)。但是,如果脉冲数增多,那么搜索 所需的计算量会呈指数式增加。对此,在非专利文献2中公开了分割搜索、剪枝搜索、维特 比搜索等,作为可大致维持整体搜索时的性能,同时可大幅减少计算量的代数码本的搜索 方法。 其中,分割搜索是最简单且计算量的削减效果很大的方法。所谓分割搜索是指将 一个闭环搜索分割成多个更小的闭环,使其成为多个闭环搜索的开环搜索的方法。在分割 搜索中,可对应于分割数而大幅降低计算量。分割搜索也被用在国际标准方式中,在3G手 机的标准编解码器即ETSI标准AMR的代数码本的搜索中,将四条脉冲分成两个子集进行分 割搜索。 例如,考虑存在四条具有八个位置候选的脉冲的情况,如果由一个闭环对全部的 四条脉冲进行搜索,那么必须评估的脉冲的组合为8的4次方即4096个。与之相对,ETSI 标准AMR将四条脉冲两条两条地分割为两个子集,并以闭环对它们分别进行搜索。因此,在 ETSI标准AMR中,必须评估的脉冲的组合为8的2次方的2倍即128个,其计算量为整体搜 索时的计算量的1/32。而且,ETSI标准AMR中的各个评估因对比四条脉冲少的两条脉冲进 行,所以计算量进一步减少。非专利文献lSalami,Laflamme,Adoul,"8kbit/s ACELP Coding ofSpeech with 10ms Speech—Frame :a Candidate for CCITT Standardization,,, IEEEProc. ICASSP94,pp.II-97n非专利文献2野村等人,"CELP中的脉冲激振源的有效搜索法",日本声响学会春 季演讲论文集2-P-5, 1996年3月,pp. 311-31
技术实现思路
专利技术需要解决的问题 但是,利用代数码本的分割搜索的语音编码的性能一般低于整体搜索时的性能。原因在于最先决定的两条脉冲的位置未必最佳。 因此,在分割搜索中,存在通过如何选择作为构成要先行搜索的子集的脉冲而改 善语音编码的性能的余地。例如,可考虑以下方法,即多次随机地选择四条脉冲中的两条 脉冲进行搜索,得到其中编码性能最佳的结果。例如,通过准备四种子集对,对四种子集对 分别进行搜索,从而可使语音编码的性能接近于整体搜索的编码性能。在此情况下,需要 128(8的2次方的2倍)的4倍即512次计算,但即便如此,其计算量仍仅为整体搜索时的 计算量的1/8。但是,在上述例子中,任意地构成子集,且对于四种子集对中的任意一个,均 不特别地存在先行进行搜索的理由。因此,针对多种情况进行搜索时实现的编码性能存在 偏差,综合而言,编码性能还不充分。 本专利技术的目的在于提供可对代数码本进行分割搜索且可提高编码性能的语音编码装置和语音编码方法。 解决问题的方案 本专利技术的语音编码装置所采用的结构,包括计算单元,使用构成固定码本的多条脉冲中的每一条脉冲和目标信号,计算各个脉冲候选位置的相关值,并针对每条脉冲,使用所述相关值的最大值来计算与脉冲相关的代表值;排序单元,对针对每条脉冲而得到的所述代表值进行排序,将与排序后的所述代表值对应的各条脉冲分组到预先设定的多个子集中,从所述多个子集中决定要最先搜索的第一子集;以及搜索单元,使用所述第一子集来搜索所述固定码本,得到表示编码失真最小的所述多条脉冲的位置和极性的代码。 本专利技术的语音编码方法包括以下步骤使用构成固定码本的多条脉冲中的每一条脉冲和目标信号,计算各个脉冲候选位置的相关值,并针对每条脉冲,使用所述相关值的最大值计算与脉冲相关的代表值;对针对每条脉冲而得到的所述代表值进行排序,将与排序后的所述代表值对应的各条脉冲分组到预先设定的多个子集中,从所述多个子集中决定要 最先搜索的第一子集;以及使用所述第一子集搜索所述固定码本,生成表示编码失真最小的所述多条脉冲的位置和极性的代码。 专利技术的效果 根据本专利技术,当在语音编码中对固定码本进行分割搜索时,由于使用例如像最大 相关值那样的、与脉冲相关的代表值决定要先搜索的子集,因此可对代数码本进行分割搜 索并可提高编码性能。附图说明 图1是表示本专利技术的实施方式1所涉及的CELP编码装置的结构的框图。 图2是表示本专利技术的实施方式1所涉及的失真最小化部的内部结构的框图。 图3是表示本专利技术的实施方式1所涉及的最大相关值计算部中的各脉冲的最大相 关值的计算流程的流程图。 图4是表示本专利技术的实施方式1所涉及的排序部中的、对于各脉冲的最大相关值 的排序处理的流程的流程图。 图5是表示本专利技术的实施方式1所涉及的搜索部中的固定码本的分割搜索流程的 流程图。 图6是表示本专利技术的实施方式1所涉及的搜索部中的固定码本的分割搜索流程的 流程图。 图7是表示本专利技术的实施方式2所涉及的排序部中的、对于各脉冲的最大相关值 的排序处理的流程的流程图。 图8是表示本专利技术的实施方式3所涉及的排序部中的、对于各脉冲的最大相关值 的排序处理的流程的流程图。 图9是表示本专利技术的实施方式3所涉及的排序部中的脉冲的顺序的重新排列处理 的流程的流程图。具体实施例方式以下,参照附图详细说明本专利技术的实施方式。 (实施方式1) 图1是表示本专利技术的实施方式1所涉及的CELP编码装置100的结构的框图。这 里,例举CELP方式的编码装置作为本专利技术所涉及的语音编码装置进行说明。 在图1中,对于包含声道信息与激励信息的语音信号Sl 1 , CELP编码装置100通过 求取LPC参数(线性预测系数)对声道信息进行编码,并通过求取以下的索引对激励信息 进行编码,该索引用于确定使用预先存储的语音模型中的哪一个本文档来自技高网
...

【技术保护点】
语音编码装置,包括:计算单元,使用构成固定码本的多条脉冲中的每一条脉冲和目标信号,计算各个脉冲候选位置的相关值,并针对每条脉冲,使用所述相关值的最大值来计算与脉冲相关的代表值;排序单元,对针对每条脉冲而得到的所述代表值进行排序,将与排序后的所述代表值对应的各条脉冲分组到预先设定的多个子集中,从所述多个子集中决定要最先搜索的第一子集;以及搜索单元,使用所述第一子集来搜索所述固定码本,得到表示编码失真最小的所述多条脉冲的位置和极性的代码。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:森井利幸
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利