基于上下文切换的视频编码和解码的方法和装置制造方法及图纸

技术编号:25812086 阅读:41 留言:0更新日期:2020-09-29 18:47
提供了用于视频编码和解码的方法和装置。视频编码的方法包括:访问(1410)与视频图片中的块相关联的句法元素的二进制位;从与块的块类型相关联的一组上下文中确定(1420)句法元素的二进制位的上下文,该组上下文至少包括第一上下文和第二上下文,与第一上下文相比,第二上下文与更大数量的块类型相关联;以及基于所确定的上下文对句法元素的二进制位进行熵编码(1430)。还描述了被格式化为包括编码数据的比特流、计算机可读存储介质和计算机可读程序产品。

【技术实现步骤摘要】
【国外来华专利技术】基于上下文切换的视频编码和解码的方法和装置
本实施例一般涉及视频编码和解码,特别地,涉及基于上下文模型切换(contextmodelswitching)的熵编码和解码。
技术介绍
本文描述的任何背景信息旨在向读者介绍本领域的各个方面,这些方面可能与下面描述的当前实施例相关。该讨论被认为有助于向读者提供背景信息,以便于更好地理解本公开的各个方面。因此,应该理解的是,应该以这个角度来理解这些陈述。为了实现高压缩效率,图像和视频编码方案通常采用预测和变换来均衡(leverage)视频内容中的空域(spatial)和时域(temporal)冗余。一般,使用帧内或帧间预测来利用帧内或帧间相关性,然后对原始图像和预测图像之间的差(通常表示为预测误差或预测残差)进行变换、量化和熵编码。为了重构视频,通过与预测、变换、量化和熵编码相对应的逆过程来对压缩数据进行解码。在高效视频编码(HighEfficiencyVideoCoding,HEVC)标准(“ITU的ITU-TH.265ITU电信标准部(10/2014),系列H:视听和多媒体系统,视听服务的基础设施-移动视频的编码,高效视频编码,建议ITU-TH.265”)中,图片被分割(partition)为正方形形状的编码树单元(codingtreeunit,CTU),其具有通常为64x64、128x128或256x256的可配置大小。如图1所示,CTU110是被分割为叶(称为编码单元(CodingUnit,CU))的四叉树的根。对于每个CU,用信号通知(signal)指示CU是使用帧内预测还是帧间预测进行编码的预测模式。如图2所示,连续的一组CTU(例如,CTU220)可以被分组到条带(slice)210中。CU(例如,CU230)可以被分割为一个或多个预测单元(PredictionUnit,PU),并且形成被分割为变换单元(TransformUnit,TU)的四叉树(称为变换树)的根。在帧间预测中,将CU非对称地细分为PU也是可能的,即如果CU具有大小NxN,则PU可以具有大小N/4xN、3N/4xN、NxN/4、Nx3N/4。每个PU被分配一些预测信息,例如运动信息、空域帧内预测等。四叉树加二叉树(Quad-Treeplusbinary-Tree,QTBT)编码工具是一种新的视频编码工具,与HEVC标准的CU/PU/TU排列相比,其提供了更灵活的CTU表示和更高的压缩效率。如图3所示,四叉树加二叉树(QTBT)编码工具定义了编码树310,其中编码单元可以以四叉树和二叉树两种方式被划分(split)。图3示出了编码树单元320的示例性编码树表示,其中实线指示四叉树分割,且虚线指示CTU320内的CU330的二叉分割,CU330在空域上嵌入在四叉树叶中。在编码器侧决定将CTU划分为编码单元,例如通过率失真优化过程,该过程包括以最小率失真成本确定CTU的QTBT表示。在QTBT表示中,CU可以是正方形或矩形。编码单位的大小总是2的幂,通常从4到128。CTU的QTBT分解包括两个阶段:CTU首先以四叉树方式被划分为4个CU,然后可以以二叉方式被进一步细分(divide)为两个CU或者以四叉树方式被分为4个CU,如图3所示。利用QTBT表示,CU可能不被进一步分割为PU或TU。换句话说,每个CU被认为是单个预测单元和单个变换单元。然而,如图3所示,这种QTBT表示仅允许CU的对称划分。QTBT允许的四种划分模式是:NO_SPLIT(CU不划分)、QT_SPLIT(划分为四个象限)、HOR(水平划分为两个相等大小的CU)和VER(垂直划分为两个相等大小的CU)。最近,具有新的矩形形状的CU被提出,这是从称为非对称划分模式的新的二叉划分模式产生的,如图4和图5所示。图4示出了QTBT中被称为非对称划分模式的CU二叉划分模式,并描绘了4个示例性划分模式410至440。在图4中,新的矩形形状包括宽度和/或高度等于3·2n的大小。此外,具有宽度或高度为3的倍数的大小的CU可以以二叉方式被进一步水平或垂直划分。通过所提出的非对称二叉划分模式中的一个(例如HOR_UP(horizontal-up,水平向上)410)划分的、具有大小(w,h)(宽度和高度)的正方形CU产生具有相应矩形大小和的2个子编码单元。因此,宽度或高度等于3·2n的CU可以由编码器选择。在这种情况下,具有3的倍数的大小的矩形块的帧内预测或帧间预测处理被执行。此外,宽度或高度为3·2n的2D变换,以及随后的变换系数熵编码过程被执行。如图5所示的其他CU划分模式(称为水平510和垂直520三叉树划分模式),包括将CU分为3个子编码单元(子CU),分别具有与在所考虑的空域划分的方向上的父CU大小的1/4、1/2和1/4相等的相应大小。
技术实现思路
根据本公开的方面,提供了一种视频编码方法,包括:访问与视频图片中的块相关联的句法元素(syntaxelement)的二进制位(bin);从与块的块类型相关联的一组上下文中确定句法元素的二进制位的上下文,该组上下文至少包括第一上下文和第二上下文,与第一上下文相比,第二上下文与更大数量的块类型相关联;以及基于所确定的上下文对句法元素的二进制位进行熵编码。根据本公开的方面,提供了一种用于视频编码的装置,该装置包括:用于访问与视频图片中的块相关联的句法元素的二进制位的部件;用于从与块的块类型相关联的一组上下文中确定句法元素的二进制位的上下文的部件,该组上下文至少包括第一上下文和第二上下文,与第一上下文相比,第二上下文与更大数量的块类型相关联;以及用于基于所确定的上下文对句法元素的二进制位进行熵编码的部件。根据本公开的方面,提供了一种用于视频编码的装置,该装置包括处理器和耦合到该处理器的至少一个存储器,该处理器被配置为:访问与视频图片中的块相关联的句法元素的二进制位;从与块的块类型相关联的一组上下文中确定句法元素的二进制位的上下文,该组上下文至少包括第一上下文和第二上下文,与第一上下文相比,第二上下文与更大数量的块类型相关联;以及基于所确定的上下文对句法元素的二进制位进行熵编码。根据本公开的方面,提供了被格式化为包括表示图片的块的编码数据的比特流,该编码数据通过以下来编码:访问与视频图片中的块相关联的句法元素的二进制位;从与块的块类型相关联的一组上下文中确定句法元素的二进制位的上下文,该组上下文至少包括第一上下文和第二上下文,与第一上下文相比,第二上下文与更大数量的块类型相关联;以及基于所确定的上下文对句法元素的二进制位进行熵编码。根据本公开的方面,提供了包括被格式化为包括表示图片的块的编码数据的比特流的信号,该编码数据通过以下来编码:访问与视频图片中的块相关联的句法元素的二进制位;从与块的块类型相关联的一组上下文中确定句法元素的二进制位的上下文,该组上下文至少包括第一上下文和第二上下文,与第一上下文相比,第二上下文与更大数量的块类型相关联;以及基于所确定的上下文对句法元素的二进制位进行熵编码。根据本公开的方面,提本文档来自技高网
...

【技术保护点】
1.一种视频编码方法,包括:/n访问(1410)与视频图片中的块相关联的句法元素的二进制位;/n基于句法元素的二进制位的上下文的在先选择的数量,从与块的块类型相关联的一组上下文中选择(1420)所述句法元素的二进制位的上下文,所述一组上下文至少包括第一上下文和第二上下文,所述第二上下文与包括与所述第一上下文相关联的块类型的更大数量的块类型相关联;以及/n基于所确定的上下文对句法元素的二进制位进行熵编码(1430)。/n

【技术特征摘要】
【国外来华专利技术】20171222 EP 17306896.61.一种视频编码方法,包括:
访问(1410)与视频图片中的块相关联的句法元素的二进制位;
基于句法元素的二进制位的上下文的在先选择的数量,从与块的块类型相关联的一组上下文中选择(1420)所述句法元素的二进制位的上下文,所述一组上下文至少包括第一上下文和第二上下文,所述第二上下文与包括与所述第一上下文相关联的块类型的更大数量的块类型相关联;以及
基于所确定的上下文对句法元素的二进制位进行熵编码(1430)。


2.一种用于视频编码的装置,包括:
用于访问与视频图片中的块相关联的句法元素的二进制位的部件;
用于基于句法元素的二进制位的上下文的在先选择的数量,从与块的块类型相关联的一组上下文中选择所述句法元素的二进制位的上下文的部件,所述一组上下文至少包括第一上下文和第二上下文,所述第二上下文与包括与所述第一上下文相关联的块类型的更大数量的块类型相关联;以及
用于基于所确定的上下文对句法元素的二进制位进行熵编码的部件。


3.一种视频解码方法,包括:
访问(1710)与编码视频图片中的块相关联的句法元素的编码二进制位;
基于句法元素的二进制位的上下文的在先选择的数量,从与块的块类型相关联的一组上下文中选择(1720)所述句法元素的二进制位的上下文,所述一组上下文至少包括第一上下文和第二上下文,所述第二上下文与包括与所述第一上下文相关联的块类型的更大数量的块类型相关联;以及
基于所确定的上下文对句法元素的编码二进制位进行熵解码(1730)。


4.一种用于视频解码的装置,包括:
用于访问与编码视频图片中的块相关联的句法元素的编码二进制位的部件;
用于基于句法元素的二进制位的上下文的在先选择的数量,从与块...

【专利技术属性】
技术研发人员:F莱林内克T波里尔Y陈E弗朗索瓦
申请(专利权)人:交互数字VC控股公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1