熵编码中的上下文初始化制造技术

技术编号:16784088 阅读:25 留言:0更新日期:2017-12-13 02:29
一种用于从数据流中解码视频的解码器,其中,使用语法元素的二元化值来将语法元素编码到数据流中,该解码器包括:熵解码器,配置为根据数据流的先前解码部分,通过在不同上下文之间选择上下文并且更新与不同上下文相关联的概率状态,使用二元熵解码来从数据流中导出二元化值的多个段;解符号化器,配置为对语法元素的二元化值进行解二元化,以获得语法元素的整数值;重构器,配置为使用量化参数,基于语法元素的整数值来重构视频,其中,熵解码器配置为在126个概率状态之间进行区分,并且根据量化参数的线性方程对与不同上下文相关联的概率状态初始化,其中,熵解码器配置为针对不同上下文中的每一个,从相应8比特初始化值的前4个比特部分和后4个比特部分中导出线性方程的斜率和偏移。

【技术实现步骤摘要】
熵编码中的上下文初始化本申请是申请日为2012年6月18日、优先权日为2011年6月16日的中国专利申请CN201280039832.3(“熵编码中的上下文初始化”)的分案申请。
本专利技术涉及用于编码视频数据的熵编码构思。
技术介绍
本领域中已知许多视频编解码器。通常,这些编解码器为了表示视频内容而降低了必需的数据量,即,这些编解码器对数据进行压缩。在熵编码中,主要使用概率估计来编码符号,概率估计尽可能接近地对应于实际符号统计。可以假定,概率估计将概率值与符号的每个可能值相关联来进行编码。例如,在二元熵编码的情况下,符号具有二元属性,并且仅存在这样的两个可能数值。在视频编码的情况下,要编码的符号属于满足不同任务的不同语法元素以便描述视频内容:存在运动矢量差值、编码模式、表示预测残差的变换系数级别等。首先,所有这些语法元素具有不同域的可能值,并且甚至具有在相同域的可能值上定义的那些可能值,这些可能值很可能在该域的可能值上示出不同频率直方图。相应地,这些语法元素的符号化/二元化的符号串/段(bin)串的符号/段也在符号字母表上示出了与概率分布有关的不同统计。相应地,使用上下文自适应熵编码:第一不同上下文具备各与不同概率估计相关联的每个上下文。相应地,例如,可以灵活地向不同上下文分配不同语法元素的段。甚至可以使用与视频图像的邻域部分有关的语法元素的段/符号之间的空间互相关关系,以便在提供的多个上下文之中进行选择。通过这种措施,能够将段/符号分类成组,组的符号统计同样针对不同视频内容而改变。然而,除此之外,与这些上下文相关联的概率估计在编码期间不断适应于实际符号统计。从以上描述直接可知:仔细设计上下文并且适当地初始化上下文的概率估计是重要的。例如,如果上下文数目太多,则由于单独上下文内符号的频率太低,导致概率估计的适应会失败。另一方面,如果上下文数目太少,则单独上下文内收集的符号实际上具有不同统计,并且概率估计不能精密地近似相应上下文内所有这些符号的实际符号统计。只要关注概率估计的初始化,就可以根据执行某些训练阶段来获得相同效果,在一些训练阶段内对视频内容进行典型混合以进行编码,以便研究语法元素的样本统计。在这种情况下,例如在H.264中已经开发了:H.264的不同上下文部分示出了对量化参数的QP的依赖性,其中,编码器选择视频的单独分片。相应地,在H.264中,已经使用量化参数相关概率估计初始化。具体地,在H.264编解码器针对每个上下文定义了一对值,即,线性量化参数相关因素(即,斜率)以及偏移值(即,量化参数无关初始化值)。两个值均以8比特来定义。目前希望进一步提高视频编码的编码效率,并且相应地,期待在效率方面(即,一方面压缩率与另一方面实现复杂度之间的折衷方面)进一步提高以上概括的上下文自适应二元熵编码。因此本专利技术的目的在于提供这种编码构思。通过所附独立权利要求的主题来实现该目的。
技术实现思路
本专利技术的基本发现由专利技术人的以下发现产生:上下文自适应二元熵编码中以上识别斜率和偏移的精度不应当太高,以免其中检查出视频内容的典型混合的任一序列阶段,以便为最优值左右的单独上下文导出斜率和偏移对,事实上,最优值与视频的统计总体的典型值相比更接近地表示实际上检查到的视频内容混合。相应地,本专利技术的专利技术人发现,有利地降低提供斜率和偏移值的精度,以初始化上下文的概率估计。例如,本专利技术人实现了,该降低不仅引起视频编码器和解码器上强加的用于存储针对每个上下文的斜率和偏移对的存储器需求降低,而且还引起当现场测试编码效率时编码效率的略微增加。附图说明以下关于附图描述的本申请的优选实施例,在附图中:图1示出了根据实施例的编码器的框图;图2a-2c示意性示出了样本阵列(例如,画面)到块的不同再划分;图3示出了根据实施例的解码器的框图;图4更详细地示出了根据实施例的编码器的框图;图5更详细地示出了根据实施例的解码器的框图;图6示意性示出了来自空间域的块到频域的变换、生成的变换块及其再变换;图7示出了根据实施例的编码器的框图;图8示出了根据实施例的适合于解码图8的编码器产生的比特流的解码器的框图;图9是示出了根据实施例的具有多像素化部分比特流的数据分组的示意图;图10是示出了根据另一实施例的具有使用固定尺寸区段的备选分割的数据分组的示意图;图11示出了根据实施例的支持模式切换的解码器;图12示出了根据另一实施例的支持模式切换的解码器;图13示出了根据实施例的适合于图11的解码器的编码器;图14示出了根据实施例的适合于图12的解码器的编码器;图15示出了pStateCtx和fullCtxState/256的映射;图16示出了根据本专利技术实施例的解码器;以及图17示出了根据本专利技术实施例的编码器。具体实施方式应当注意,在附图的描述期间,在这些附图的若干附图中出现的元件在这些附图的每个附图中用于相同附图标记来指示,并且避免关于这些元件的功能的重复描述,以免不必要的重复。然而,关于一幅图提供的功能和描述同样应当应用于其他附图,除非明确指示相反。在以下中,首先,关于图1至17描述一般视频编码构思的实施例。图1至6涉及在语法级别上操作的视频编解码器的一部分。后续的图8至17涉及与语法元素流到数据流的转换以及数据流到语法元素流的转换有关的代码的一部分的实施例。本专利技术的特定方面和实施例以关于图1至17概括的一般构思的可能实施例的形式来描述。图1示出了其中可以实现本申请的方面的编码器10的示例。编码器将信息样本20的阵列编码到数据流中。信息样本阵列可以表示与例如明亮度值、颜色值、亮度值、色度值等相对应的信息样本。然而,在样本阵列20是例如光传感器等的时间产生的深度图的情况下,信息样本也可以是深度值。编码器10是基于块的编码器。即,编码器10以块40为单位将样本阵列20编码到比特流30中。以块40为单位的编码并不意味着,编码器10彼此无关地对这些块40进行总体编码。相反,编码器10可以使用先前编码块的重构,以便对剩余块进行外推或帧内预测,并且可以使用块的粒度来设置编码参数,即,设置对与相应块相对应的每个样本阵列区域的编码方式。此外,编码器10是变换编码器。即,编码器10通过使用变换对块40编码,以便将每个块40内的信息样本从空间域传送到频域。可以使用二维变换,例如,FFT的DCT等。优选地,块40具有方形形状或矩形形状。图1中示出的样本阵列20到块40的再划分仅用于示意性目的。图1示出了将样本阵列20再划分成方形或矩形块40的规则二维排列,方形或矩形块40以非交叠方式彼此邻接。块40的尺寸可以预定。即,编码器10可以不将数据流30内与块40的块尺寸有关的信息传送到解码侧。例如,解码器可以预期预定的块尺寸。然而,多种备选方案是可能的。例如,块可以彼此交叠。然而,交叠限于以下程度:每个块具有没有与任一邻近块交叠的部分,或者使得块的每个样本最多与邻近块之中的一个块交叠,邻近块排列为沿预定方形与当前块毗邻。后一种情况意味着左手邻域块和右手领域块可以与当前块交叠,以便完全覆盖当前块,但是它们可以彼此不交叠,并且这同样适用于垂直和对角方向上的邻域。作为另一备选方式,编码器10将样本阵列20再划分成块40可以适用于样本阵列20的内容,其中将与所使用的再划分有关的再划分本文档来自技高网
...
熵编码中的上下文初始化

【技术保护点】
一种从数据流(401)中解码视频的解码器,其中,使用语法元素(327)的二元化值将语法元素编码到数据流(401)中,所述解码器包括:熵解码器(409),配置为根据数据流(401)的先前解码部分,通过在不同上下文之中选择上下文并且更新与不同上下文相关联的概率状态,使用二元熵解码来从数据流(401)中导出二元化值的多个段(326);解符号化器(314),配置为对语法元素(327)的二元化值进行解二元化,以获得语法元素的整数值;重构器(404),配置为使用量化参数,基于语法元素的整数值来重构视频,其中,熵解码器(409)配置为在126个概率状态之间进行区分,并且根据量化参数的线性方程对与不同上下文相关联的概率状态初始化,其中,熵解码器配置为针对不同上下文中的每一个,从相应8比特初始化值的前4个比特部分和后4个比特部分中导出线性方程的斜率和偏移。

【技术特征摘要】
2011.06.16 US 61/497,794;2011.07.15 US 61/508,5061.一种从数据流(401)中解码视频的解码器,其中,使用语法元素(327)的二元化值将语法元素编码到数据流(401)中,所述解码器包括:熵解码器(409),配置为根据数据流(401)的先前解码部分,通过在不同上下文之中选择上下文并且更新与不同上下文相关联的概率状态,使用二元熵解码来从数据流(401)中导出二元化值的多个段(326);解符号化器(314),配置为对语法元素(327)的二元化值进行解二元化,以获得语法元素的整数值;重构器(404),配置为使用量化参数,基于语法元素的整数值来重构视频,其中,熵解码器(409)配置为在126个概率状态之间进行区分,并且根据量化参数的线性方程对与不同上下文相关联的概率状态初始化,其中,熵解码器配置为针对不同上下文中的每一个,从相应8比特初始化值的前4个比特部分和后4个比特部分中导出线性方程的斜率和偏移。2.根据权利要求1所述的解码器,其中,熵解码器(409)配置为使用二元算术解码或二元PIPE解码,从数据流(401)中导出二元化值的多个段(326)。3.根据权利要求1或2所述的解码器,其中,熵解码器(409)配置为根据以下中的一个或更多个,执行针对当前要导出的段的上下文选择:当前要导出的段所属的二元化值内当前要导出的段的段位置,语法元素的语法元素类型,该语法元素的整数值是通过对当前要导出的段所属的二元化值解二元化而获得的,以及先前从数据流(401)导出的一个或更多个段,或者先前解二元化的语法元素的整数值。4.根据权利要求1所述的解码器,其中,熵解码器(409)配置为针对当前导出的段,通过从126个概率状态内与针对当前导出的段而选择的上下文相关联的当前概率状态过渡到126个概率状态之中依赖于当前导出的段的新概率状态,来执行概率状态更新。5.根据权利要求1至4中任一项所述的解码器,其中,熵解码器(409)配置为通过以下操作对当前要导出的段进行二元算术解码:对表示当前概率区间的当前概率区间宽度值进行量化来获得概率区间索引;并且根据与针对当前要导出的段而选择的上下文相关联的当前概率状态,通过使用概率区间索引和概率状态索引对表条目之中的表条目编索引来执行区间再划分,以获得当前概率区间到两个部分区间的再划分。6.根据权利要求5所述的解码器,其中,熵解码器(409)配置为使用针对当前概率区间宽度值的8比特表示,并且在量化当前概率区间宽度值时获取出所述8比特表示的2个或3个最高有效位。7.根据权利要求5或6所述的解码器,其中,熵解码器(409)配置为基于来自当前概率区间内部的偏移状态值,在两个部分区间之间进行选择;更新概率区间宽度值和偏移状态值,并且使用所选部分区间推断当前要导出的段的值;并且执行更新的概率区间宽度值和偏移状态值的再归一化,包括从数据流(401)中连续读取比特。8.根据权利要求1至7中任一项所述的解码器,其中,熵解码器(409)配置为在视频分片的开始处初始化与不同上下文相关联的概率状态。9.根据权利要求8所述的解码器,其中,熵解码器(409)配置为单独确定每个视频分片的量化参数。10.根据权利要求1至9中任一项所述的解码器,其中,熵解码器(409)配置为通过以下操作来在视频分片开始处初始化与不同上下文相关联的概率状态:从数据流(401)中读取当前分片的量化参数,并且根据当前分片的量化参数的线性方程,初始化与不同上下文相关联的概率状态,其中熵解码器(409)配置为,针对每个分片,从相同相应8比特初始化值的前4个比特部分和后4个比特部分导出线性方程的斜率和偏移。11.根据权利要求1至10中任一项所述的解码器,其中,重构器(404)配置为在基于语法元素的整数值重构视频(405)时,使用量化参数对语法元素包括的变换系数级进行解量化,对解量化的变换系数级执行再变换,以获得预测残差;执行空间和/或时间预测,以获得预测信号;并且将预测残差与预测信号相组合,以重构视频(405)。12.根据权利要求1至11中任一项所述的解码器,其中,熵解码器(409)配置为针对不同上下文中的每一个,彼此独立地从相应8比特初始化值的前4个比特部分和后4个比特部分导出线性方程的斜率和偏移。13.根据权利要求1至12中任一项所述的解码器,其中,熵解码器配置为针对不同上下文中的每一个,通过表查找或使用算术运算,从相应8比特初始化值的前4个比特部分和后4个比特部分导出线性方程的斜率和偏移。14.根据权利要求1至12中任一项所述的解码器,其中,熵解码器配置为,针对不同上下文中的每一个,通过将前4个比特部分与第一对参数相乘并偏移来导出线性方程的斜率和偏移,并且通过将后4个比特部分与第二对参数相乘并偏移来导出偏移。15.一种将视频编码到数据流中的编码器,通过使用语法元素的二元化值将语法元素编码到数据流中,所述编码器包括:重构器,配置为通过根据量化参数设置语法元素的整数值来表示视频,符号化器,配置为对语法元素的整数值进行二元化,来获得语法元素的二元化值,熵编码器,配置为根据数据流的先前编码部分,通过在不同上下文之中选择上下文并且更新与不同上下文相关联的概率状态,使用二元熵编码来将二元化值的多个段编码到数据流中;其中,熵编码器配置为在...

【专利技术属性】
技术研发人员:瓦勒日·乔治本杰明·布鲁斯汉勒·科什弗德特勒夫·马尔佩唐·源马西斯·佩斯米沙·斯科曼让·斯特格曼托马斯·威甘德
申请(专利权)人:GE视频压缩有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1