使用统计特性编码脉冲矢量的方法技术

技术编号:15344400 阅读:85 留言:0更新日期:2017-05-17 00:44
改进的编码全体脉冲矢量的方法针对全体脉冲矢量利用统计模型(即概率模型),以更有效地编码全体中的各脉冲矢量。使用针对给定脉冲矢量的统计模型和非零脉冲位置的数量,编码描述给定脉冲矢量的非零脉冲的至少一个脉冲参数。在一些实施例中,使用距离信息编码来编码非零脉冲位置的数量。可使用条件(状态驱动)逐位算术编码来编码单位量值脉冲的总数。可使用自适应性算术编码来编码非零脉冲位置的位所。可使用基于概率的组合编码来编码非零脉冲位置量值,并且可使用逐位算术编码来编码对应的符号信息。这样的方法非常适于编码诸如编码视频信息的非独立同分布信号。

【技术实现步骤摘要】
【国外来华专利技术】使用统计特性编码脉冲矢量的方法
本申请涉及编码和解码视频信号。更特别地,本申请涉及使用对脉冲矢量的统计分析来编码和解码表示视频帧的部分的脉冲矢量。
技术介绍
近来,已经建立了编码在许多音频和语言压缩系统中呈现的整数化脉冲序列(类似于线性PCM信号)的一般方法。被称为阶乘脉冲编码或FPC的方法克服了与音频信号矢量的组合编码关联的一些技术局限,最值得注意地,与实现涉及二项式(N-choose-K)型组合运算的高阶阶乘表达式关联的高计算复杂度。要注意,不同于音频,视频分辨率持续增加。另外,不同于音频,针对视频信息的发送和存储二者的带宽要求以与视频显示器的水平和垂直分辨率的乘积成正比的方式增大。在高分辨率视频显示器已变得寻常的情况下,这不仅对于内容供应商和视频服务商(例如,和)而且对于无线服务供应商和装置制造商是重要的。因此,通信行业中的有效视频信号编码的重要性持续升高。因此,需要一种以更有效的紧凑方式编码和解码视频信号的方法,该方式使用FPC的益处的一些方面,但是进一步适于并且被构造成有效地针对各种视频编解码进行操作并且为视频信号提供更有效的编码。附图说明为了更完全地理解,现在参照下面结合附图进行的描述,其中:图1是涉及使用统计学和概率性质来编码脉冲矢量的方法的实施例的用户设备(UE)的框图和功能流程图;图2是示出不包括使用概率模型的编码量化脉冲序列的现有技术方法的流程图;图3是描述编码量化脉冲矢量的编码器实施例的流程过程的流程图;图4是提供关于编码量化脉冲矢量的脉冲计数的过程的细节的流程图;图5是提供关于编码包括状态处理的量化脉冲矢量的脉冲计数的过程的额外细节的流程图;图6提供说明用于确定条件概率的实施例中使用的递归过程的网格流程图;图7是提供关于编码量化脉冲矢量脉冲位置信息的过程的细节的流程图;图8是提供量化脉冲矢量非零位置的VPCC编码量值所使用的步骤序列的概述的流程图;图9是提供使用可变阶乘脉冲编码VFPC来编码平均值矢量以创建表示编码脉冲矢量xk的输出码字的过程的详述的流程图;以及图10是详述用于重新创建量化脉冲矢量xk的按照实施例的解码码字的处理的流程图。具体实施方式现在参照其中在本文中始终使用相同附图标记来指代相同的元件的附图,示出和描述了使用统计学性质编码脉冲矢量的方法的各种视图和实施例,并且描述了其他可能的实施例。这些图不一定按比例绘制,并且在一些情形下,已经在某些地方夸大和/或简化了附图,这只是出于例示目的。本领域的普通技术人员应该基于可能实施例的以下示例理解许多可能的应用和变形。另外,在详细描述按照本专利技术的实施例之前,应该观察到,实施例主要具备与数字视频编码和解码相关的方法步骤和设备的组合,以减小在这样的数字视频信号的通信中所需的必要带宽。因此通过在附图中用传统符号在适当位置表示设备组件和方法步骤,设备组件和方法步骤仅示出了有关本专利技术的实施例的理解的那些具体细节,以便没有用得益于本文中提供的描述和附图的本领域的普通技术人员将容易清楚的细节混淆本公开。作为阶乘脉冲编码(FPC)的概述,FPC是编码音频序列中开发使用的技术。虽然是针对音频压缩应用开发的,但FPC通常针对符合以下基本约束的任何量化独立同分布(i.i.d)拉普拉斯(Laplacian)随机信号xi进行工作:其中,x={x0,x1,...,xn-1}是包含整数值的量化信号矢量,n是矢量长度,并且m是矢量x内单位量值“脉冲”的总数,使得所有矢量元素在范围-m≤xi≤m内。已经发现,源自方程1的视频帧中特有脉冲组合的总数N是:其中,F(n,k)是n个矢量位置的k个非零元素的组合的数量:D(m,k)是m个单位量值脉冲可落到k个非零矢量元素上的组合的数量,(其中,k≤m):并且2k是k个非零矢量位置的特有符号组合的数量。在给定组合的总数N并且N个组合中的每个是等概率的情况下,那么编码矢量序列x所需的位的总数M是:M=log2(N)。如可观察到的,组合的数量N(和对应的位数M)可变得十分大,即使是对于n和m的最适当值。存在所谓的金字塔矢量量化(PVQ)的方法,该方法是为了使用方程1中给定的形式约束来编码拉普拉斯随机变量所推荐的方法。最近,在部分基于CELT编解码的开源编解码Opus中出现了在音频压缩中另外使用PVQ。另外,名称为“Daala”的新开源视频编解码代码使用PVQ上的变量。虽然图1中给定的基础约束对于FPC和PVQ二者是通用的,但重要的是理解FPC和PVQ之间的主要差异在于列举算法和FPC在保持用于编码的最小位数的同时以高得多的m和n值进行操作的能力。如此,PVQ方法通常使用可通常拟合在32位操作数内的m和n的范围。相反地,并且通过以上理解不了的,FPC可扩大至数百或甚至数千位,同时其计算复杂度仅线性增大。专利技术人已经发现FPC在非常高阶的系统中也是有用的,包括用于编码高分辨率变换域系数,其中,码字域可包含数百(或数千)位。FPC也已经包括在以下音频行业标准中:3GPP2EVRC-B和EVRC-WB、和ITU—TG.718。在这些标准中,需要低复杂度固定点软件实现作为分布包的部分。因此,FPC优于PVQ的主要技术优点是:1)可扩大至n和m的大值,以及2)在这样做的同时保持低计算复杂度的能力。为了评价视频中的FPC使用,将(方程1至5中给定的)FPC位速率估计器“插”入到现有视频编解码器中。然后,在保持视频质量恒定的同时,测量FPC相对于默认编码方法增加的位速率(对于视频编解码器所使用的默认编码方法)。只对被执行等同FPC操作的默认视频编解码器所使用的位进行计数。通过保持视频质量恒定(即,对于默认编解码操作精确的位),可集中到位速率方面,并不关心尝试测量相对质量差异。然而,保持位精确度并没有造成其他编解码特定问题,以下将对此进行讨论。参照图1,描绘了移动通信装置、电子平板装置、视频创建/回放装置或具有用户接口(未具体示出)的其他用户设备(UE)1的示例。UE1具有视频块10,视频块10包括适于编码或解码数字视频信号的硬件和/或软件块。如本领域中熟知的,数字视频信号可被划分成多个帧。通常,帧具有不同的帧类型,利用这些帧来补偿运动并且同时减小将帧区域内的运动表现发送到解码器的位速率。通常,存在本领域中熟知的数字视频信号中的数据的I、B和P编码域或帧。本专利技术的实施方式针对视频数据的各种类型的I、B和P数据域或数据帧中的每个同样好地工作。这里,在图1中,在视频块10内的是表示可按照各种实施例并入视频FPC(FPC)的视频编解码器的高阶视图的框图。基本上是视频画面(单个视频帧)的空间域快照的数据帧12被划分成栅格或矩阵形式的多个宏块14。各宏块14的尺寸可以是例如32×32个像素。在各种实施方式中,各宏块可被分割成64×64、32×32、16×16或8×8个像素。宏块14还可被细分成可例如是8×8或4×4个像素的子块16。子块16中的每个作为数据的阵列提供到变换块18。在一些实施例中,变换块18对子块16中的每个执行离散余弦变换(DCT)19,子块16将各子块的XY坐标系转换成空间-频率域。DCT19块输出变换系数。然后,在量化块20中量化变换系数。在其他实施例中,可对子块16中的每个执行不同变换。例如,可使用Walsh-H本文档来自技高网...
使用统计特性编码脉冲矢量的方法

【技术保护点】
一种编码全体脉冲矢量的方法,所述方法包括:通过编码器接收所述全体脉冲矢量;通过所述编码器针对所述全体脉冲矢量中的每个相应脉冲矢量,确定描述所述相应脉冲矢量内的非零脉冲位置的相应多个脉冲参数,所述相应多个脉冲参数中的一个对应于所述相应脉冲矢量内的非零脉冲位置的数量;通过所述编码器生成针对所述全体脉冲矢量的统计参数组;通过所述编码器编码所述统计参数组,以生成与所述全体矢量对应的统计模型码字组;针对所述全体脉冲矢量中的每个相应脉冲矢量:编码与所述相应脉冲矢量内的非零脉冲位置的数量对应的所述脉冲参数,以生成相应矢量码字组的第一码字;以及基于所述相应脉冲矢量内的非零脉冲位置的数量和针对所述全体的所述统计参数组,编码描述所述相应脉冲矢量内的非零脉冲位置的剩余多个脉冲参数中的至少一个,以生成与所述相应矢量码字组中的至少一个对应码字。

【技术特征摘要】
【国外来华专利技术】2014.08.15 US 14/460,4641.一种编码全体脉冲矢量的方法,所述方法包括:通过编码器接收所述全体脉冲矢量;通过所述编码器针对所述全体脉冲矢量中的每个相应脉冲矢量,确定描述所述相应脉冲矢量内的非零脉冲位置的相应多个脉冲参数,所述相应多个脉冲参数中的一个对应于所述相应脉冲矢量内的非零脉冲位置的数量;通过所述编码器生成针对所述全体脉冲矢量的统计参数组;通过所述编码器编码所述统计参数组,以生成与所述全体矢量对应的统计模型码字组;针对所述全体脉冲矢量中的每个相应脉冲矢量:编码与所述相应脉冲矢量内的非零脉冲位置的数量对应的所述脉冲参数,以生成相应矢量码字组的第一码字;以及基于所述相应脉冲矢量内的非零脉冲位置的数量和针对所述全体的所述统计参数组,编码描述所述相应脉冲矢量内的非零脉冲位置的剩余多个脉冲参数中的至少一个,以生成与所述相应矢量码字组中的至少一个对应码字。2.根据权利要求1所述的方法,其中,编码与所述相应脉冲矢量内的非零脉冲位置的数量对应的所述脉冲参数包括:其中,np(k)是第k个脉冲矢量xk中的非零位置的数量,n是每个脉冲矢量xk的长度,以及N是所述全体中的脉冲矢量的数量。3.根据权利要求2所述的方法,其中:编码与所述相应脉冲矢量内的非零脉冲位置的数量对应的所述脉冲参数是基于针对所述全体的所述统计参数组;以及针对所述全体脉冲矢量生成统计参数组包括生成按照以下出现的特定np(k)的概率组:4.根据权利要求3所述的方法,其中,编码与所述相应脉冲矢量内的非零脉冲位置的数量对应的所述脉冲参数包括使用按照以下估计的位数Mp来对np(k)进行距离信息编码:5.根据权利要求1所述的方法,其中,描述所述相应脉冲矢量内的非零脉冲位置的所述剩余多个脉冲参数包括:与在所述相应脉冲矢量内的所述非零脉冲位置的量值的和对应的脉冲参数;与在所述相应脉冲矢量内的所述非零脉冲位置的位所对应的脉冲参数;以及与所述相应脉冲矢量内的所述非零脉冲位置的量值对应的脉冲参数。6.根据权利要求5所述的方法,其中,描述所述相应脉冲矢量内的非零脉冲位置的剩余多个脉冲参数包括:与在所述相应脉冲矢量内的每个非零位置的代数符号对应的脉冲参数。7.根据权利要求6所述的方法,其中,编码描述在所述相应脉冲矢量内的非零脉冲位置的所述剩余多个脉冲参数中的至少一个包括基于所述相应脉冲矢量内的非零脉冲位置的数量和针对所述全体的所述统计参数组,编码以下中的每个,以生成所述相应矢量码字组中的对应码字:与所述相应脉冲矢量内的所述非零脉冲位置的量值的和对应的脉冲参数;与所述相应脉冲矢量内的所述非零脉冲位置的位所对应的脉冲参数;与在所述相应脉冲矢量内的所述非零脉冲位置的量值对应的脉冲参数;以及与所述相应脉冲矢量内的每个非零位置的代数符号对应的脉冲参数。8.根据权利要求1所述的方法,其中,编码描述所述相应脉冲矢量内的非零脉冲位置的所述剩余多个脉冲参数中的至少一个还包括:编码与所述相应脉冲矢量内的所述非零位置的量值的和对应的相应脉冲参数,以生成所述相应矢量码字组中的对应码字,所述编码是基于所述相应脉冲矢量内的非零脉冲位置的数量和针对所述全体的所述统计参数组。9.根据权利要求8所述的方法,其中,编码与所述相应脉冲矢量内的所述非零脉冲位置的量值的和对应的所述相应脉冲参数包括:生成所述全体中的每个相应脉冲矢量的量值的相应和;以及针对非零位置的每个可能数量,生成所述全体脉冲矢量的量值的和的概率组;然后使用针对所述相应脉冲矢量的非零位置的相应数量和所述概率组来编码每个相应脉冲矢量的量值的相应和,以生成所述相应矢量码字组中的对应码字。10.根据权利要求1所述的方法,其中,所述全体脉冲矢量表示视频帧,并且其中所述全体脉冲矢量中的每个相应脉冲矢量表示已经被变换、量化和映射成一维矢量的所述视频帧的相应二维块。11.根据权利要求10所述的方法,其中,所述全体脉冲矢量中的每个相应脉冲矢量表示已经使用White-Hadagard变换被变换和量化,然后被映射成一维矢量的所述视频帧的相应二维块。12.根据权利要求10所述的方法,所述方法还包括:发送或存储针对所述全体脉冲矢量中的每个相应脉冲矢量的所述相应矢量码字组和所述统计模型码字组;其中,基于整个视频帧来生成所述统计参数组;其中,每帧发送或存储所述统计模型码字组一次;以及其...

【专利技术属性】
技术研发人员:詹姆斯·P·阿什利乌达·米塔尔
申请(专利权)人:谷歌技术控股有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1