矢量量化器制造技术

技术编号:12928943 阅读:61 留言:0更新日期:2016-02-28 23:59
公开了例如变换音频编解码中用于高效矢量量化的矢量量化器和其中的方法。所述方法包括:将输入目标矢量s与多个质心进行比较,每个质心表示码本中码矢量的相应类别。此外,基于比较结果确定码本中与输入目标矢量相关的搜索的起点。根据反映每个码矢量与类别的质心之间的距离的失真测量对码本中的码矢量排序。所述矢量量化器和方法使得能够首先搜索包括关于输入矢量s的最可能候选码矢量的码矢量类别。

【技术实现步骤摘要】
【国外来华专利技术】矢量量化器
所建议的技术大致涉及矢量量化(VQ),且尤其涉及矢量量化的精确度和计算复杂度。
技术介绍
存在两个主要类别的量化算法,即:标量量化器(SQ),用于逐项处理输入矢量;以及矢量量化器(VQ),用于将输入矢量作为一个单元来进行量化(对全部矢量维度进行联合量化)。以给定的比特率,VQ要优于SQ,但是以计算复杂度和存储器存储增加为代价。设要量化的目标矢量是M个维度:s=[s(1)s(2)…s(M)]。VQ算法在预存储的M维码矢量ck=[ck(1)ck(2)…ck(M)]的大小为K的码本(CB)中执行搜索。这种搜索返回基于失真测量d(s,ck)提供最佳匹配kopt的码本索引。下面的等式(1-2)描述了该操作,假设搜索准则基于均方误差:向解码器发送最佳索引kopt,以及从CB(相同的CB可用于编码器和解码器二者)提取对应的码矢量并将其用于重构目标矢量。CB通常是离线训练的,并捕捉到数据的统计特性。在很多情况下,使用权重来修改简单的均方误差(例如,等式(2)),以使得:其中,权重w(m)取决于应用。在本文中为了陈述简洁,在下面的描述中将仅使用等式(2)中定义的均方误差。然而,应该注意到的是,本文中讨论的原理在使用更复杂的准则(例如,等式(3)中的准则)时也是有效的。从以上描述可以总结出,所重构的目标信号的精确度或质量取决于码本的大小K;其中,与较小的CB相比,较大的CB导致更高的精确度,以及因此更好的质量。同时,根据等式(1),可以总结出主要的计算复杂度也与CB的大小有关,假设矢量维度被应用所固定。通常在有限计算复杂度的约束之下来建造音频传输系统。亦即,最差情况的复杂度不应超过某个预定等级LMAX。例如,通常通过加权的每秒百万次操作(WMOPS)来衡量音频编解码的计算复杂度,然而当考虑VQ模块时,复杂度直接与搜索空间的大小(CB的大小)相关。VQ通常是编解码器中最复杂的模块,且此外,CB搜索(与CB矢量的比较次数)是VQ如此复杂的原因。如果VQ系统要每次量化一个目标矢量S,必须要优化搜索空间K,以使得复杂度不超过LMAX。给定矢量S的特性和重构矢量质量要求,某些离线优化技术(例如,拆分及多级VQ)可以提供复杂度(以及存储)的一定减少。如果VQ系统要一次量化多个目标(输入)矢量(矢量的数目N是变化的),上述离线优化技术不能够维持复杂度和质量约束。在这种情况下,离线优化必须在矛盾的要求(A)限制要同时量化大量的输入矢量时的复杂度(=限制搜索)以及(B)维持要量化少量矢量时的高精确度(=在大码本中搜索)之间找到平衡,这不是简单的任务。
技术实现思路
本文中描述的技术例如可应用于对输入流执行有损压缩的音频和视频压缩/传输系统,并可通过众多的不同方案来进行描述。本文中描述的技术涉及码本(将其划分为各个类别并排序)以及对要被量化到所述类别之一中的输入目标矢量s的分类。本文中描述的技术使得在码本中的类别中,首先搜索码本中包括与输入矢量s有关的最有可能的候选码矢量集合的码矢量类别。因此,在搜索中可以及早找到输入矢量s的最佳匹配码矢量,并且可降低计算复杂度。根据第一方案,提供了矢量量化器中的方法。所述方法包括将输入目标矢量s与多个质心(centroid)(即,参考矢量)进行比较,每个质心表示码本中码矢量的相应类别。所述方法还包括:确定码本中与码本中的输入目标矢量相关的搜索的起点,其中,该起点是基于比较结果确定的。根据反映每个码矢量与质心之间的距离的失真测量对码本中的码矢量排序。该方法使得在码本中的类别中,首先搜索码本中包括与输入矢量s有关的最有可能的候选码矢量集合的码矢量类别。根据第二方案,提供了矢量量化器,包括适于执行根据第一方案的方法的功能单元。矢量量化器包括比较单元,适于将输入目标矢量s与多个质心进行比较,每个质心表示码本中码矢量的相应类别。矢量量化器还包括:确定单元,适于基于比较结果确定针对所述码本中的搜索的起点。根据反映每个码矢量与质心之间的距离的失真测量对码本中的码矢量排序。矢量量化器使得在码本中的类别中,首先搜索包括与输入矢量s有关的最有可能的候选码矢量的码矢量类别。根据第三方案提供编解码器,该编解码器包括根据第二方案的矢量量化器。根据第四方案提供移动终端,该移动终端包括根据上述第二方案的矢量量化器。根据第五方案,提供了将码本用于矢量量化的方法,所述码本被布置为使得所述码本的码矢量被划分为多个类别,由质心表示各个类别,以及其中,还根据反映所述码矢量与所述多个类别的质心的距离的失真测量对所述码矢量排序。可根据下降或上升的失真值来对码矢量排序。根据第六方案,提供了针对矢量量化的码本使用,所述码本被布置为使得所述码本的码矢量被划分为多个类别,由质心表示各个类别,以及其中,还根据反映所述码矢量与所述多个类别的质心的距离的失真测量对所述码矢量排序。可根据下降或上升的失真值来对码矢量排序。根据第七方案,提供了计算机程序,包括计算机可读代码,当在处理单元中运行时,使矢量量化器执行根据第一方案的方法。根据第八方案,提供计算机程序产品,包括计算机可读介质和根据第六方案的计算机程序,该计算机程序存储在计算机可读介质上。可基于输入目标矢量的数目和最大复杂度约束来适配码本中执行搜索的搜索区域的大小。每编码单位的输入目标矢量数目可以是可变的。此外,可以动态设置最大复杂度约束。此外,可以在所确定的搜索空间中在码本中执行搜索,该搜索开始于所确定的起点,其中,搜索传递与输入目标矢量s的最佳匹配。“最佳匹配”在此处意指最接近的匹配、关于输入目标矢量和码本中的候选矢量之间的距离的最短距离,即,最佳匹配是根据距离测量与输入目标矢量具有最短距离的码矢量。第五方案可以是包括根据第二方案的矢量量化器的编解码器。第六方案可以是包括根据第二方案的矢量量化器的移动终端。附图说明现在将通过示例性实施例的方式并参考附图来更详细地描述所建议的技术,在附图中:图1a和1b示出了根据本文中描述的解决方案的有序CB的结构。所述从点0或点1向CB的另一端开始。图2示出利用了对称的示例性CB结构。在ROM存储器中仅存储码矢量C0和C1。图3示出了通过将输入矢量s与多个质心{C0C1C1,flipC0,flip}中的每个质心进行比较来确定输入矢量s的最优类别的示例性功能单元,每个质心与码本的类别相关联。图4示出了基于在当前帧中检测到的频谱峰值的数目(且很可能基于编解码的比特速率)来确定搜索区域的大小的功能单元。图5是示出搜索区域随着每帧峰值的数目降低而增加的表。在该示例中,在17个峰值(=17个输入矢量)的情况下,仅在7比特CB(在本示例中定义为最小搜索空间)中执行搜索,然而在8个峰值或更少峰值的情况下,在8比特CB(最大搜索空间)中执行搜索,因为在最大复杂度约束下,这是可“负担”的。图6a-d示出了不同搜索区域的示例。图7示出了可从外部实体向系统信号通知所允许的复杂度LMAX。参数LMAX可例如基于CPU负荷或电池状态。图8是示出在创建要在所建议的技术中使用的码本CB的过程中的动作的流程图。图9a-c是示出根据本文中建议的技术的示例,矢量量化VQ的过程中的动作的流程图。图10是示出根据本文中建议的技术的示例的矢量量化器的框图。图11是示出根据本文中建议的技术的示例本文档来自技高网
...
矢量量化器

【技术保护点】
一种矢量量化器中的方法,所述方法包括:‑将输入目标矢量s与多个质心进行比较(902),每个质心表示码本中码矢量的相应类别,‑基于比较结果,确定(906)所述码本中与所述输入目标矢量相关的搜索的起点,其中,根据反映每个码矢量与所述质心之间的距离的失真测量,对所述码本中的码矢量进行排序。

【技术特征摘要】
【国外来华专利技术】2012.03.29 US 61/617,1511.一种应用于包括在变换编码器中的矢量量化器的方法,所述方法包括:-将输入目标矢量s与多个质心进行比较(902),其中输入目标矢量s表示正在被处理的数据信号的分段的频谱峰值或频谱峰值区域,每个质心表示码本中码矢量的相应类别,-基于比较结果,确定(906)所述码本中与所述输入目标矢量相关的搜索的起点,-在所述码本中执行(910)搜索,所述搜索开始于所确定的起点;并识别表示所述输入目标矢量s的码矢量,其中,根据反映每个码矢量与所述多个质心中的两个质心之间的距离的失真测量,对所述码本中的码矢量进行排序;以及每个块或时间段的输入目标矢量的数目是可变的,并且搜索空间基于输入目标矢量的数目动态调整。2.根据权利要求1所述的方法,其中,确定步骤(906)通过基于输入目标矢量的数目增大或减小搜索空间的大小来动态调整搜索空间。3.根据权利要求1或2所述的方法,其中,对码本中的码矢量进行排序,使得最接近第一质心C0且最远离第二质心C1的码字在码本的一侧,而最接近C1且最远离C0的码字在码本的另一侧。4.根据权利要求1或2所述的方法,其中比较步骤(902)将输入目标矢量s与四个质心C0、C1、C0,flip和C1,flip进行比较,其中针对类别C0,flip的码矢量是针对类别C0的码矢量的翻转版本,以及针对类别C1,flip的码矢量是针对类别C1的码矢量的翻转版本。5.根据权利要求4所述的方法,其中,通过下式给出类别Cj,flip中的码矢量ck,flip的各项:ck,flip=[ck(M)ck(M-1)...ck(1)],其中,ck(m)是对应类别Cj的矢量项,M是码矢量的长度,以及k是码矢量的索引。6.一种包括在变换编码器中的矢量量化器(1000),所述矢量量化器(1000)包括:-比较单元(1004),适于将输入目标矢量s与多个质心进行比较,其中输入目标矢量s表示正在被处理的数据信号的分段的频谱峰值或频谱峰值区域,每个质心表示码本(1014)中码矢量的相应类别;-确定单元(1008),适于基于比较结果确定在所述码本中进行搜索的起点;以及-搜索单元(1010),适于在所述码本中执行搜索,所述搜索开始于所确定的起点;并识别表示所述输入目标矢量s的码矢量;其中,根据反映每个码矢量与所述多个质心中的两个质心之间的距离的失真测量,对所述码本(1014)中的码矢量进行排序;以及每个块或时间段的输入目标矢量的数目是可变的,并且搜索空间基于输入目标矢量的数目动态调整。7.根据权利要求6所述的矢量量化器,其中所述确定单元(1008)通过基于输入目标矢量的数目增大或减小搜索空间的大小来动态调整搜索空间。8.根据权利要求6或7所述...

【专利技术属性】
技术研发人员:沃洛佳·格兰恰诺夫托马斯·詹森·托夫特戈德
申请(专利权)人:瑞典爱立信有限公司
类型:发明
国别省市:瑞典;SE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1