视频编码方法、视频解码方法、视频编码设备、视频解码设备以及程序技术

技术编号:19248487 阅读:59 留言:0更新日期:2018-10-24 10:11
该视频编码设备10包括:四叉树划分标记编码单元11,熵编码指示块是否基于四叉树结构而被划分的标记分割;跳过标记编码单元12,熵编码四叉树端子节点中的跳过标记;二叉树信息编码单元13,熵编码指示四叉树的端节点中的块是否基于二叉树结构而被划分的标记和指示分割划分方向的水平/竖直分割划分方向标记;以及尺寸多路复用单元14,将指示基于二叉树结构的划分的最小尺寸的信息多路复用到比特流中。在尺寸等于最小尺寸的节点基于二叉树结构而被进一步划分的情况下,二叉树信息编码单元13不熵解码该节点处的水平/竖直分割划分方向标记。

Video coding method, video decoding method, video encoding device, video decoding device and program

The video encoding device 10 comprises a quadtree partitioning tag encoding unit 11, an entropy encoding indicating whether a block is partitioned based on a quadtree structure, a skip tag encoding unit 12, an entropy encoding of a skip tag in a quadtree terminal node, and a binary tree information encoding unit 13, an entropy encoding indicating the end node of a quadtree. Whether a block is divided based on a binary tree structure and a horizontal/vertical division direction mark indicating the division direction; and a size multiplexing unit 14 multiplexes information indicating the minimum size of the division based on a binary tree structure into a bit stream. The binary tree information encoding unit 13 decodes the horizontal/vertical partitioning direction marker at the node where the size equals the minimum size and is further partitioned based on the binary tree structure.

【技术实现步骤摘要】
【国外来华专利技术】视频编码方法、视频解码方法、视频编码设备、视频解码设备以及程序
本专利技术涉及一种使用基于四叉树和二叉树的块划分结构的视频编码技术。
技术介绍
在非专利文献1中描述的视频编码系统中,数字化视频的每个帧被分割成编码树单元(CTU),并且按照光栅扫描的顺序对每个CTU编码。在四叉树结构中,每个CTU被分割成编码单元(CU)并且被编码。每个CU被分割成预测单元(PU)并且被预测编码。预测编码包括帧内预测(intraprediction)和帧间预测(inter-frameprediction)。在四叉树结构中,每个CU的预测误差被分割成变换单元(TU)并且基于频率变换而被变换编码。最大尺寸的CU被称为最大CU(最大编码单元:LCU),并且最小尺寸的CU被称为最小CU(最小编码单元:SCU)。LCU尺寸和CTU尺寸相同。下面描述帧内预测和帧间预测、以及CTU、CU、PU和TU的信号通知。帧内预测是用于从与待编码帧具有相同显示时间的重构图像中生成预测图像的预测。非专利文献1定义了如图9所示的33种角度帧内预测。在角度帧内预测中,使用靠近待编码块的重构像素以用于在33个方向中的任何一个方向上外插,以生成帧内预测信号。除了33种角度帧内预测之外,非专利文献1还定义了用于对靠近待编码块的重构像素平均的DC帧内预测,以及用于对靠近待编码块的重构像素线性插值的平面帧内预测。下文中,基于帧内预测而被编码的CU被称为帧内CU。帧间预测是用于从与待编码帧的显示时间不同的重构图像(参考图片)中生成预测图像的预测。下文中,帧间预测被称为帧间预测(interprediction)。图10是描绘了帧间预测的示例的说明图。运动向量MV=(mvx,mvy)指示参考图片的重构图像块相对于待编码块的平移量。在帧间预测中,基于参考图片的重构图像块来生成帧间预测信号(如有必要,使用像素插值)。下文中,基于帧间预测而被编码的CU被称为“帧间CU”。编码后的仅包括帧内CU的帧被称为“I帧”(或“I图片”)。编码后的不仅包括帧内CU还包括帧间CU的帧被称为“P帧”(或“P图片”)。编码后的包括帧间CU、且每个帧间CU使用不止一个参考图片而是同时使用两个参考图片以用于块的帧间预测的帧被称为“B帧”(或“B图片”)。跳过模式是指:基于下面提到的PU划分形状的2N×2N形状和下面提到的变换量化值不存在,通过帧预测来对待处理的CU预测编码。每个CU是否为跳过模式由非专利文献1中描述的skip_flag语法来信号通知。每个不为跳过模式的CU是帧内CU还是帧间CU由非专利文献1中描述的pred_mode_flag语法来信号通知。图11是描绘了在帧的空间分辨率为通用中间格式(CIF)并且CTU尺寸为64的情况下、帧t的CTU划分的示例和帧t中包括的第8个CTU(CTU8)的CU划分的示例的说明图。图12是描绘了与CTU8的CU划分示例相对应的四叉树结构的说明图。每个CTU的四叉树结构、即CU划分形状,由非专利文献1中描述的cu_split_flag语法来信号通知。图13是描绘了CU的PU划分形状的说明图。在CU是帧内CU的情况下,可选择方形PU划分。在CU是帧间CU的情况下,不仅可选择方形PU划分,还可选择矩形PU划分。每个CU的PU划分形状由非专利文献1中描述的part_mode语法来信号通知。图14是描绘了CU的TU划分的示例的说明图。在该图的上半部分中描绘了具有2N×2N的PU划分形状的帧内CU的TU划分的示例。在CU是帧内CU的情况下,四叉树的根位于PU中,并且每个PU的预测误差由四叉树结构表示。在该图的下半部分中描绘了具有2N×N的PU划分形状的帧间CU的TU划分的示例。在CU是帧间CU的情况下,四叉树的根位于CU中,并且每个CU的预测误差由四叉树结构表示。预测误差的四叉树结构、即每个CU的TU划分形状,由非专利文献1中描述的split_tu_flag语法来信号通知。这完成了对帧内预测和帧间预测,以及CTU、CU、PU和TU的信号通知的描述。下面参照图15中的框图来描述典型视频编码设备的结构和操作,该视频编码设备接收数字化视频的每个帧的每个CU作为输入图像并且输出比特流。图15中描绘的视频编码设备包括变换器/量化器101、熵编码器102、逆量化器/逆变换器103、缓冲器104、预测器105和多路复用器106。预测器105针对每个CTU来确定用于确定使编码成本最小化的CU划分形状的cu_split_flag语法值。预测器105然后针对每个CU来确定用于确定帧内预测/帧间预测的pred_mode_flag语法值、用于确定PU划分形状的part_mode语法值、用于确定TU划分形状的split_tu_flag语法值、帧内预测方向、以及使编码成本最小化的运动向量。预测器105进一步确定用于确定跳过模式的skip_flag语法值。详细地讲,对于待处理的CU而言,在确定的pred_mode_flag指示帧间预测、确定的part_mode指示2N×2N、并且下面提到的变换量化值不存在的情况下,预测器105将skip_flag设置为1(即,设置跳过模式)。否则,预测器105将skip_flag设置为0(即,不设置跳过模式)。预测器105基于确定的cu_split_flag语法值、pred_mode_flag语法值、part_mode语法值、split_tu_flag语法值、帧内预测方向、运动向量等来生成与每个CU的输入图像信号相对应的预测信号。该预测信号是基于上面提到的帧内预测或者帧间预测来生成的。变换器/量化器101基于由预测器105确定的TU划分形状,对通过从输入图像信号减去预测信号而获得的预测误差图像进行频率变换。变换器/量化器101进一步对频率变换后的预测误差图像(频率变换系数)进行量化。下文中,量化的频率变换系数被称为“变换量化值”。熵编码器102熵编码变换量化值以及由预测器105确定的cu_split_flag语法值、skip_flag语法值、pred_mode_flag语法值、part_mode语法值、split_tu_flag语法值、帧内预测方向的差异信息和运动向量的差异信息(下文中,这些与预测相关的信息也都被称为“预测参数”)。逆量化器/逆变换器103对变换量化值进行逆量化。逆量化器/逆变换器103进一步对通过逆量化获得的频率变换系数进行逆频率变换。预测信号被添加到通过逆频率变换而获得的重构预测误差图像,并且结果被供应给缓冲器104。缓冲器104存储重构图像。多路复用器106多路复用并且输出从熵编码器102供应的熵编码后的数据作为比特流。该典型视频编码设备通过上述操作生成比特流。下面参照图16描述典型视频解码设备的结构和操作,该视频解码设备接收比特流作为输入并且输出解码后的视频帧。图16中描绘的视频解码设备包括多路分用器201、熵解码器202、逆量化器/逆变换器203、预测器204和缓冲器205。多路分用201对输入的比特流进行多路分用以提取熵编码后的视频比特流。熵解码器202熵解码视频比特流。熵解码器202熵解码预测参数和变换量化值,并且将它们供应给逆量化器/逆变换器203和预测器204。逆量化器/逆变换器203对变换量化值进行逆量化。逆量本文档来自技高网...

【技术保护点】
1.一种使用基于四叉树和二叉树的块划分结构的视频编码方法,所述视频编码方法包括:熵编码指示块是否基于四叉树结构而被划分的标记的步骤;熵编码四叉树结构中的端节点的跳过标记的步骤;熵编码指示所述四叉树结构中的所述端节点的块是否基于二叉树结构而被划分的标记、以及指示分割方向的水平/竖直分割方向标记的步骤;以及将指示基于所述二叉树结构的划分的最小尺寸的信息多路复用在比特流中的步骤,其中在尺寸等于所述最小尺寸的节点基于所述二叉树结构而被进一步划分的情况下,所述节点处的所述水平/竖直分割方向标记不被熵编码。

【技术特征摘要】
【国外来华专利技术】2016.12.26 JP 2016-2512901.一种使用基于四叉树和二叉树的块划分结构的视频编码方法,所述视频编码方法包括:熵编码指示块是否基于四叉树结构而被划分的标记的步骤;熵编码四叉树结构中的端节点的跳过标记的步骤;熵编码指示所述四叉树结构中的所述端节点的块是否基于二叉树结构而被划分的标记、以及指示分割方向的水平/竖直分割方向标记的步骤;以及将指示基于所述二叉树结构的划分的最小尺寸的信息多路复用在比特流中的步骤,其中在尺寸等于所述最小尺寸的节点基于所述二叉树结构而被进一步划分的情况下,所述节点处的所述水平/竖直分割方向标记不被熵编码。2.一种使用基于四叉树和二叉树的块划分结构的视频解码方法,所述视频解码方法包括:熵解码四叉树结构中的端节点的跳过标记的步骤;熵解码指示所述四叉树结构中的所述端节点的块是否基于二叉树结构而被划分的标记、以及指示分割方向的水平/竖直分割方向标记的步骤;以及从比特流提取指示基于所述二叉树结构的划分的最小尺寸的信息的步骤,其中在尺寸等于所述最小尺寸的节点基于所述二叉树结构而被进一步划分的情况下,所述节点处的所述水平/竖直分割方向标记不被熵解码。3.根据权利要求2所述的视频解码方法,其中满足所述最小尺寸的值被设置为未被熵解码的所述水平/竖直分割方向标记的值。4.一种使用基于四叉树和二叉树的块划分结构的视频编码设备,所述视频编码设备包括:四叉树分割标记编码装置,用于熵编码指示块是否基于四叉树结构而被划分的标记;跳过标记编码装置,用于熵编码四叉树结构中的端节点的跳过标记;二叉树信息编码装置,用于熵编码指示所述四叉树结构中的所述端节点的块是否基于二叉树结构而被划分的标记、以及指示分割方向的水平/竖直分割方向标记;以及尺寸多路复用装置,用于将指示基于所述二叉树结构的划分的最小尺寸的信息多路复用在比特流中,其中在尺寸等于所述最小尺寸的节点基于所述二叉树结构而被进一步划分的情况下,所述二叉树信息编码装置不熵编码所述节点处的所述水平/竖直分割方向标记。5.一种...

【专利技术属性】
技术研发人员:蝶野庆一
申请(专利权)人:日本电气株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1