【技术实现步骤摘要】
熵编码中的上下文初始化本申请是申请日为2012年6月18日、优先权日为2011年6月16日的中国专利申请CN201280039832.3(“熵编码中的上下文初始化”)的分案申请。
本专利技术涉及用于编码视频数据的熵编码构思。
技术介绍
本领域中已知许多视频编解码器。通常,这些编解码器为了表示视频内容而降低了必需的数据量,即,这些编解码器对数据进行压缩。在熵编码中,主要使用概率估计来编码符号,概率估计尽可能接近地对应于实际符号统计。可以假定,概率估计将概率值与符号的每个可能值相关联来进行编码。例如,在二元熵编码的情况下,符号具有二元属性,并且仅存在这样的两个可能数值。在视频编码的情况下,要编码的符号属于满足不同任务的不同语法元素以便描述视频内容:存在运动矢量差值、编码模式、表示预测残差的变换系数级别等。首先,所有这些语法元素具有不同域的可能值,并且甚至具有在相同域的可能值上定义的那些可能值,这些可能值很可能在该域的可能值上示出不同频率直方图。相应地,这些语法元素的符号化/二元化的符号串/段(bin)串的符号/段也在符号字母表上示出了与概率分布有关的不同统计。相应地,使用上下文自适应熵编码:第一不同上下文具备各与不同概率估计相关联的每个上下文。相应地,例如,可以灵活地向不同上下文分配不同语法元素的段。甚至可以使用与视频图像的邻域部分有关的语法元素的段/符号之间的空间互相关关系,以便在提供的多个上下文之中进行选择。通过这种措施,能够将段/符号分类成组,组的符号统计同样针对不同视频内容而改变。然而,除此之外,与这些上下文相关联的概率估计在编码期间不断适应于实际符号 ...
【技术保护点】
一种从数据流(401)中解码视频的解码器,其中,使用语法元素(327)的二元化值将语法元素编码到数据流(401)中,所述解码器包括:熵解码器(409),配置为根据数据流(401)的先前解码部分,通过在不同上下文之中选择上下文并且更新与不同上下文相关联的概率状态,使用二元熵解码来从数据流(401)中导出二元化值的多个段(326);解符号化器(314),配置为对语法元素(327)的二元化值进行解二元化,以获得语法元素的整数值;重构器(404),配置为使用量化参数,基于语法元素的整数值来重构视频,其中,熵解码器(409)配置为在126个概率状态之间进行区分,并且根据量化参数的线性方程对与不同上下文相关联的概率状态初始化,其中,熵解码器配置为针对不同上下文中的每一个,从相应8比特初始化值的前4个比特部分和后4个比特部分中导出线性方程的斜率和偏移。
【技术特征摘要】
2011.06.16 US 61/497,794;2011.07.15 US 61/508,5061.一种从数据流(401)中解码视频的解码器,其中,使用语法元素(327)的二元化值将语法元素编码到数据流(401)中,所述解码器包括:熵解码器(409),配置为根据数据流(401)的先前解码部分,通过在不同上下文之中选择上下文并且更新与不同上下文相关联的概率状态,使用二元熵解码来从数据流(401)中导出二元化值的多个段(326);解符号化器(314),配置为对语法元素(327)的二元化值进行解二元化,以获得语法元素的整数值;重构器(404),配置为使用量化参数,基于语法元素的整数值来重构视频,其中,熵解码器(409)配置为在126个概率状态之间进行区分,并且根据量化参数的线性方程对与不同上下文相关联的概率状态初始化,其中,熵解码器配置为针对不同上下文中的每一个,从相应8比特初始化值的前4个比特部分和后4个比特部分中导出线性方程的斜率和偏移。2.根据权利要求1所述的解码器,其中,熵解码器(409)配置为使用二元算术解码或二元PIPE解码,从数据流(401)中导出二元化值的多个段(326)。3.根据权利要求1或2所述的解码器,其中,熵解码器(409)配置为根据以下中的一个或更多个,执行针对当前要导出的段的上下文选择:当前要导出的段所属的二元化值内当前要导出的段的段位置,语法元素的语法元素类型,该语法元素的整数值是通过对当前要导出的段所属的二元化值解二元化而获得的,以及先前从数据流(401)导出的一个或更多个段,或者先前解二元化的语法元素的整数值。4.根据权利要求1所述的解码器,其中,熵解码器(409)配置为针对当前导出的段,通过从126个概率状态内与针对当前导出的段而选择的上下文相关联的当前概率状态过渡到126个概率状态之中依赖于当前导出的段的新概率状态,来执行概率状态更新。5.根据权利要求1至4中任一项所述的解码器,其中,熵解码器(409)配置为通过以下操作对当前要导出的段进行二元算术解码:对表示当前概率区间的当前概率区间宽度值进行量化来获得概率区间索引;并且根据与针对当前要导出的段而选择的上下文相关联的当前概率状态,通过使用概率区间索引和概率状态索引对表条目之中的表条目编索引来执行区间再划分,以获得当前概率区间到两个部分区间的再划分。6.根据权利要求5所述的解码器,其中,熵解码器(409)配置为使用针对当前概率区间宽度值的8比特表示,并且在量化当前概率区间宽度值时获取出所述8比特表示的2个或3个最高有效位。7.根据权利要求5或6所述的解码器,其中,熵解码器(409)配置为基于来自当前概率区间内部的偏移状态值,在两个部分区间之间进行选择;更新概率区间宽度值和偏移状态值,并且使用所选部分区间推断当前要导出的段的值;并且执行更新的概率区间宽度值和偏移状态值的再归一化,包括从数据流(401)中连续读取比特。8.根据权利要求1至7中任一项所述的解码器,其中,熵解码器(409)配置为在视频分片的开始处初始化与不同上下文相关联的概率状态。9.根据权利要求8所述的解码器,其中,熵解码器(409)配置为单独确定每个视频分片的量化参数。10.根据权利要求1至9中任一项所述的解码器,其中,熵解码器(409)配置为通过以下操作来在视频分片开始处初始化与不同上下文相关联的概率状态:从数据流(401)中读取当前分片的量化参数,并且根据当前分片的量化参数的线性方程,初始化与不同上下文相关联的概率状态,其中熵解码器(409)配置为,针对每个分片,从相同相应8比特初始化值的前4个比特部分和后4个比特部分导出线性方程的斜率和偏移。11.根据权利要求1至10中任一项所述的解码器,其中,重构器(404)配置为在基于语法元素的整数值重构视频(405)时,使用量化参数对语法元素包括的变换系数级进行解量化,对解量化的变换系数级执行再变换,以获得预测残差;执行空间和/或时间预测,以获得预测信号;并且将预测残差与预测信号相组合,以重构视频(405)。12.根据权利要求1至11中任一项所述的解码器,其中,熵解码器(409)配置为针对不同上下文中的每一个,彼此独立地从相应8比特初始化值的前4个比特部分和后4个比特部分导出线性方程的斜率和偏移。13.根据权利要求1至12中任一项所述的解码器,其中,熵解码器配置为针对不同上下文中的每一个,通过表查找或使用算术运算,从相应8比特初始化值的前4个比特部分和后4个比特部分导出线性方程的斜率和偏移。14.根据权利要求1至12中任一项所述的解码器,其中,熵解码器配置为,针对不同上下文中的每一个,通过将前4个比特部分与第一对参数相乘并偏移来导出线性方程的斜率和偏移,并且通过将后4个比特部分与第二对参数相乘并偏移来导出偏移。15.一种将视频编码到数据流中的编码器,通过使用语法元素的二元化值将语法元素编码到数据流中,所述编码器包括:重构器,配置为通过根据量化参数设置语法元素的整数值来表示视频,符号化器,配置为对语法元素的整数值进行二元化,来获得语法元素的二元化值,熵编码器,配置为根据数据流的先前编码部分,通过在不同上下文之中选择上下文并且更新与不同上下文相关联的概率状态,使用二元熵编码来将二元化值的多个段编码到数据流中;其中,熵编码器配置为在...
【专利技术属性】
技术研发人员:瓦勒日·乔治,本杰明·布鲁斯,汉勒·科什弗,德特勒夫·马尔佩,唐·源,马西斯·佩斯,米沙·斯科曼,让·斯特格曼,托马斯·威甘德,
申请(专利权)人:GE视频压缩有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。