用于使用分层数据单元进行编码和解码的方法和设备技术

技术编号:12241251 阅读:58 留言:0更新日期:2015-10-26 13:28
提供了一种用于使用分层数据单元进行编码和解码的方法和设备。所述视频编码方法包括:基于具有分层结构的数据单元对视频进行编码;基于数据单元的至少一条附加信息确定用于对数据单元的语法元素进行熵编码的上下文模型;通过使用确定的上下文模型对语法元素进行熵编码。

【技术实现步骤摘要】
用于使用分层数据单元进行编码和解码的方法和设备本申请是申请日为2012年07月02日,申请号为“201280042737.9”,标题为“用于使用分层数据单元进行熵编码的方法和设备、以及用于解码的方法和设备”的专利技术专利申请的分案申请。
本专利技术涉及对视频进行编码和解码,更具体地讲,涉及对形成视频数据的语法元素进行熵编码和熵解码。
技术介绍
在图像压缩方法(诸如,MPEG-1、MPEG-2和MPEG-4H.264/MPEG-4先进视频编码(AVC))中,将图像划分为具有预定尺寸的多个块,随后经由帧间预测或帧内预测获得块的残差数据。经由变换、量化、扫描、行程编码和熵编码对残差数据进行压缩。在熵编码期间,通过对语法元素(诸如,离散余弦变换(DCT)系数或运动矢量)进行熵编码来输出比特流。在解码器方面,从比特流提取语法元素,并基于提取的语法元素执行解码。
技术实现思路
技术问题本专利技术提供一种用于将包括语法元素的附加信息组合来选择用于对语法元素进行熵编码的上下文模型从而有效地对语法元素进行熵编码和熵解码的方法和设备。解决方案根据本专利技术的一个或更多个实施例,基于当前数据单元的可用语法元素,确定用于对当前数据单元的语法元素进行熵编码的上下文模型。有益效果根据本专利技术的一个或更多个实施例,可通过基于包括当前语法元素的关于数据单元的信息而不是使用先前恢复的周边信息选择上下文模型,来减少用于存储预恢复的周边信息所需的存储器的大小。附图说明图1是根据本专利技术的实施例的视频编码设备的框图。图2是根据本专利技术的实施例的视频解码设备的框图。图3是用于描述根据本专利技术的实施例的编码单元的概念的示图。图4是根据本专利技术的实施例的基于具有分层结构的编码单元的图像编码器的详细框图。图5是根据本专利技术的实施例的基于具有分层结构的编码单元的图像解码器的详细框图。图6是示出根据本专利技术的实施例的根据深度的较深层编码单元和分区(partition)的示图。图7是用于描述根据本专利技术的实施例的编码单元和变换单元之间的关系的示图。图8是用于描述根据本专利技术的实施例的与编码深度相应的编码单元的编码信息的示图。图9是根据本专利技术的实施例的根据深度的较深层编码单元的示图。图10至图12是用于描述根据本专利技术的实施例的编码单元、预测单元和变换单元之间的关系的示图。图13是用于描述根据表1的编码模式信息的编码单元、预测单元(或分区)和变换单元之间的关系的示图。图14是根据本专利技术的实施例的熵编码设备的框图。图15是图14的上下文建模器的框图。图16是用于描述根据本专利技术的实施例的具有分层结构的数据单元和具有分层结构的数据单元划分信息的示图。图17A和图17B是根据本专利技术的实施例的指示数据单元的分层结构的符号的参考示图。图18A和图18B是根据本专利技术的实施例的用于根据附件信息的组合来确定上下文模型的上下文索引的示图。图19是根据本专利技术的实施例的上下文模型的参考示图。图20是根据本专利技术的实施例的最大概率符号(MPS)的概率值的曲线图。图21是用于描述由图14的常规编码引擎执行的二进制算术编码操作的示图。图22是示出根据本专利技术的实施例的熵编码方法的流程图。图23是根据本专利技术的实施例的熵解码设备的框图。图24是示出根据本专利技术的实施例的熵解码方法的流程图。最佳模式根据本专利技术的一方面,提供一种视频编码方法,包括:基于具有分层结构的数据单元对视频进行编码;基于当前数据单元的至少一个第二语法元素确定用于对将被熵编码的当前数据单元的第一语法元素进行熵编码的上下文模型,其中,所述至少一个第二语法元素可用并且与当前数据单元的第一语法元素不同;通过使用确定的上下文模型对当前数据单元的第一语法元素进行熵编码。根据本专利技术的另一方面,提供一种视频编码设备,包括:分层编码器,用于基于具有分层结构的数据单元对视频进行编码;熵编码器,用于基于当前数据单元的至少一个第二语法元素确定用于对将被熵编码的当前数据单元的第一语法元素进行熵编码的上下文模型,并通过使用确定的上下文模型对当前数据单元的第一语法元素进行熵编码,其中,所述至少一个第二语法元素可用并且与当前数据单元的第一语法元素不同。根据本专利技术的另一方面,提供一种视频解码方法,包括:通过对编码的比特流进行解析来提取基于具有分层结构的数据单元编码的画面的语法元素;基于当前数据单元的至少一个第二语法元素确定用于对将被熵解码的当前数据单元的第一语法元素进行熵解码的上下文模型,其中,所述至少一个第二语法元素可用并且与当前数据单元的第一语法元素不同;通过使用确定的上下文模型对第一语法元素进行熵解码。根据本专利技术的另一方面,提供一种视频解码设备,包括:语法元素提取器,用于通过对编码的比特流进行解析来提取基于具有分层结构的数据单元编码的画面的语法元素;熵解码器,用于基于当前数据单元的至少一个第二语法元素确定用于对将被熵解码的当前数据单元的第一语法元素进行熵解码的上下文模型,并通过使用确定的上下文模型对第一语法元素进行熵解码,其中,所述至少一个第二语法元素可用并且与当前数据单元的第一语法元素不同。具体实施方式在下文中,在本专利技术的各种实施例中使用的“图像”不仅可表示静止图像,还可表示诸如视频的运动图像。当对与图像相关的数据执行各种操作时,可将与图像相关的数据划分为多个数据组,并可对包括在相同的数据组中的数据执行相同的操作。在下文中,根据预定的标准形成的数据组被称为“数据单元”。此外,根据“数据单元”执行的操作通过使用包括在相应的数据单元中的数据来执行。在下文中,将参照图1至图13描述根据本专利技术实施例的用于基于根据分层树结构的编码单元对具有树结构的语法元素进行编码和解码的视频编码和解码设备。此外,将参照图14至图24详细描述图1至图14的视频编码和解码方法中使用的熵编码和熵解码处理。图1是根据本专利技术的实施例的视频编码设备100的框图。视频编码设备100包括分层编码器110和熵编码器120。分层编码器110把将被编码的当前画面划分为具有预定尺寸的数据单元,并对数据单元进行编码。详细地,分层编码器110可基于最大编码单元划分当前画面。根据本专利技术的实施例的最大编码单元可以是尺寸为32×32、64×64、128×128、256×256等的数据单元,其中,数据单元的形状是宽度和长度均是2的倍数并大于8的正方形。根据本专利技术的实施例的编码单元可由最大尺寸和深度来表征。深度表示编码单元在空间上从最大编码单元开始被划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度是最高深度,最小编码单元的深度是最低深度。由于与每个深度相应的编码单元的尺寸随着最大编码单元的深度加深而减小,因此与较高深度相应的编码单元可包括与较低深度相应的多个编码单元。如上所述,根据编码单元的最大尺寸将当前画面的图像数据划分为最大编码单元,每个最大编码单元可包括根据深度划分的较深层编码单元。由于根据本专利技术的实施例的最大编码单元根据深度被划分,因此包括在最大编码单元中的空间域的图像数据可根据深度被分层地分类。可预先确定编码单元的最大深度和最大尺寸,其中,所述最大深度和最大尺寸限制最大编码单元的高度和宽度被分层划分的总次数。分层编码器110对通过根据深度划分最大编码单元的区域而获得的至本文档来自技高网...

【技术保护点】
一种视频解码方法,包括:从比特流获取指示包括在编码单元中的变换单元是否被划分的划分变换标志;基于划分变换标志确定变换单元的尺寸;基于所述变换单元的尺寸和包括所述变换单元的画面的颜色分量,确定上下文模型;通过基于上下文模型对比特流进行熵解码来获取变换系数标志,其中,变换系数标志指示至少一个非零系数是否包括在所述变换单元的块中;基于变换系数标志获取包括在至少一个变换单元中的变换系数,其中,颜色分量是指示亮度分量、第一色度分量和第二色度分量之中的一个颜色分量的索引。

【技术特征摘要】
2011.07.01 US 61/503,685;2011.10.18 US 61/548,4231.一种视频解码方法,包括:从比特流获取指示包括在编码单元中的变换单元是否被划分的划分变换标志;基于划分变换标志从编码单元获取当前变换单元;基于划分变换标志确定当前变换单元的尺寸;使用上下文模型索引来确定上下文模型,其中,上下文模型索引是基于所述当前变换单元的尺寸和包括所...

【专利技术属性】
技术研发人员:李泰美陈建乐
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1