用于确定视频数据的上下文模型的方法和系统技术方案

技术编号:10159143 阅读:147 留言:0更新日期:2014-07-01 13:34
在多种实施例中,使用基于上下文的自适应二进制算术编码(CABAC)对视频数据系数的矩阵的重要图进行编码或解码。沿着扫描图案逐行扫描重要图。每行可以是扫描图案的垂直、水平、或对角线截面。基于不在一行上的相邻元素的值,选择用于在特定行中处理的每个元素的上下文模型。相邻元素可以限于在一个或两个其他扫描行内包含的那些元素。避免对相同扫描行中的邻居的依赖性有助于并行处理。

【技术实现步骤摘要】
【国外来华专利技术】用于确定视频数据的上下文模型的方法和系统
本专利技术总体涉及视频图像处理,并且更具体地,涉及对视频图像数据编码和解码。相关申请的交叉引用本申请要求由Lou等人于2011年2月16日提交的题为“LowComplexityandParallelProcessingFriendlyContextSelectionforAdaptiveScanningPattern(对于自适应扫描图案的低复杂度且并行处理友好的上下文选择)”的序列号为61/443700的美国临时专利申请的优先权,通过引用其整体而结合于此。本申请涉及由Lou等人于2011年10月5日提交的题为“CodingandDecodingUtilizingAdaptiveContextModelSelectionwithZigzagScan(利用具有Z字形扫描的自适应上下文模型选择的编码与解码)”的美国专利申请No.13/253385、由Lou等人于2011年10月5日提交的题为“CodingandDecodingUtilizingContextModelSelectionwithAdaptiveScanPattern(利用具有自适应扫描图案的上下文模型选择的编码与解码)”的美国专利申请No.13/253933、以及由Lou等人于2012年1月9日提交的题为“MethodandSystemforProcessingVideoData(用于处理视频数据的方法与系统)”的美国专利申请No.13/345784。
技术介绍
对于许多操作,视频压缩使用块处理。在块处理中,相邻像素的块被分组为编码单元,并且压缩操作将该组像素看做一个单元,以利用编码单元内的相邻像素之间的相关性。基于块的处理通常包括预测编码和变换编码。具有量化的变换编码是一种类型的数据压缩,由于从源图片获得的变换块的量化通常丢弃与源图片中的变换块相关的数据,所以其通常是“有损的”,由此降低其带宽要求,但是通常也导致来自源图片的原始变换块的再生时的质量损失。还被已知为H.264的MPEG-4AVC是已建立的视频压缩标准,其在块处理中使用变换编码。在H.264中,图片被划分为16×16像素的宏块(MB)。每个MB通常被进一步划分为更小的块。使用图片内/图片间预测,预测尺寸等于或小于MB的块,并且对预测残差应用空间变换以及量化。通常使用熵编码方法(即,可变长度编码或算术编码)对残差的量化后的变换系数进行编码。在H.264中引入上下文自适应二进制算术编码(CABAC),以通过结合自适应二进制算术编码技术与上下文模型的集合,提供基本无损的压缩效率。上下文模型选择在提供自适应程度和冗余缩减方面在CABAC中发挥作用。H.264指定在2D块上的两种扫描图案。Z字形扫描被用于以逐行视频压缩技术编码的图片,并且交错扫描用于以隔行视频压缩技术编码的图片。继H.264之后开发的国际视频编码标准HEVC(高效视频编码)将变换块尺寸扩展至16×16和32×32像素,以有助于高清(HD)视频编码。附图说明以下参考附图更详细地描述本专利技术的多种实施例。然而,注意,附图示出本专利技术的实施例,并且从而不被认为是其范围的限制,对于本专利技术,可以允许其他同效的实施例。图1A是可以在其中使用本专利技术的多种实施例的视频系统;图1B是可以在其上实现本专利技术的实施例的计算机系统;图2A、图2B、图3A和图3B示出根据本专利技术的实施例的特定视频编码原理;图4A和图4B示出对于根据本专利技术的实施例的编码器和解码器的可能结构;图5A和图5B示出根据本专利技术的实施例的进一步的视频编码原理;图6A至图6E示出可以结合本专利技术的多种实施例使用的可能的扫描图案;图7A和图7B示出可以在本专利技术的实施例中使用的处理方法;图8至图15示出在本专利技术的实施例中相邻元素如何用于确定上下文模型;以及图16至图51示出本专利技术的替换实施例。具体实施方式现在描述本专利技术的多种实施例和特征。在本专利技术的一个实施例中,使用基于上下文的自适应二进制算术编码(CABAC),对视频数据系数的矩阵的重要图(significancemap)进行编码或解码。更具体地,沿着扫描图案逐行(称为扫描行)扫描(编码或解码)用于量化和变换后的系数的矩阵的重要图。每个扫描行都可以是扫描图案的垂直、水平、或对角线截面。基于不在特定扫描行中而是在其他扫描行中的相邻元素的值,选择用于在该特定扫描行中处理的每个元素的上下文模型。在一些实施例中,相邻元素在不超过两个其他扫描行中。在其他实施例中,相邻元素仅在一个其他扫描行中。避免依赖于相同扫描行中的邻居有助于并行处理。例如,第一编码器可以处理沿着扫描行的二进制数,同时第二编码器可以并行地处理同一扫描行中的另一个二进制数。通过用于两个二进制数中的每个的上下文模型不相互依赖的事实,有助于同步处理。也就是说,由第一编码器处理的二进制数对于其上下文模型的选择不取决于正被第二编码器处理的二进制数。在本专利技术的另一个实施例中,给出变换域中的块,按照扫描图案对相关联的重要图进行编码。扫描图案对于当前块、当前片、当前图片或当前序列被预先确定,或者其能够是可用于当前块、当前片、当前图片或当前序列的几个可能的扫描图案之一。在本专利技术的还有的另一个实施例中,基于变换域中的元素的频率位置,选择用于重要图中的元素的上下文模型。因为相同频率位置处的那些元素之间的可能的高相关性,变换域中的低频位置中的元素可以与在其他变换块中但是在相同频率位置中的其他元素共享相同的上下文模型。可以基于在相同块内的元素的编码的邻居的值(0或1),除了沿着相同扫描行的编码的邻居之外,来确定变换域中的高频位置中的元素。现在将描述可以在其中使用本专利技术的实施例的视频系统的示例。将理解,在图中被描绘为功能块的元件可以被实现为硬件、软件、或其组合。而且,还可以在诸如个人计算机、智能手机或平板电脑的其他系统上采用本专利技术的实施例。参考图1A,总体标记为10的视频系统包括有线电视网络的头端100。头端100被配置成将视频内容传送到邻居129、130和131。头端100可以在头端的层级内操作,层级中较高的头端通常具有更多的功能。头端100通信地链接至卫星碟型天线112,并且从其接收用于非本地节目的视频信号。头端100还通信地链接至将本地节目传送到头端100的本地台114。头端100包括:对从卫星碟型天线112接收的视频信号进行解码的解码器104、从本地台114接收本地节目的离播(off-air)接收器106、在头端100的多种组件之间路由数据业务的交换机102、对用于传送到用户的视频信号进行编码的编码器116、对用于传送到用户的信号进行调制的调制器118、以及将多个信号组合到单个多信道传输的组合器120。头端100还通信地链接至混合光纤电缆(HFC)网络122。HFC网络122通信地链接至多个节点124、126和128。节点124、126和128中的每个都由同轴电缆链接至邻居129、130和131之一,并且将有线电视信号传送到邻居。更详细地示出图1A的邻居130之一。邻居130包括多个住宅,包括图1A中所示的家庭132。在家庭132中有通信地链接至视频显示器136的机顶盒134。机顶盒134包括第一解码器138和第二解码器140。第一解码器138和本文档来自技高网...
用于确定视频数据的上下文模型的方法和系统

【技术保护点】
一种用于处理视频数据的方法,所述视频数据与多个元素的矩阵相关联,所述方法包括:使用通过所述矩阵的预定扫描图案读取所述视频数据,所述扫描图案包括多个扫描行,每个扫描行均包括所述多个元素中的至少一个;基于所述多个元素中的其他元素的值,确定用于所述多个扫描行中的第一扫描行的元素的上下文模型,其中,所述其他元素不沿着所述第一扫描行,并且其中,所述其他元素包括在所述多个扫描行中的不超过两个的其他扫描行中;以及基于所确定的上下文模型处理所述元素。

【技术特征摘要】
【国外来华专利技术】2011.02.16 US 61/443,700;2012.02.01 US 13/363,4321.一种用于处理视频数据的方法,所述视频数据与多个元素的矩阵相关联,所述方法包括:使用通过所述矩阵的预定扫描图案读取所述视频数据,所述多个元素中的每个元素具有位置(y,x),其中,0≤y≤(height-1),并且0≤x≤(width-1),并且所述矩阵的维度是height×width;通过以下来从在位置(0,0)的元素至在位置(height-1,width-1)的元素确定用于所述预定扫描图案中的所述多个元素中的每个元素的上下文模型:当所述预定扫描图案是Z字形图案时:对于在位置(0,0)处的元素,将所述上下文模型确定为用于在具有所述矩阵的所述维度的不同矩阵中的位置(0,0)处的对应元素的上下文模型;对于在位置(1,0)处的元素,将所述上下文模型确定为用于在所述不同矩阵中的位置(1,0)处的对应元素的上下文模型;对于在位置(0,1)处的元素,将所述上下文模型确定为用于在所述不同矩阵中的位置(0,1)处的对应元素的上下文模型;以及对于除在位置(0,0)、(1,0)和(0,1)处的元素以外的元素,基于所述多个元素中的其他元素的值确定用于多个Z字形扫描行中的一个Z字形扫描行的每个元素的上下文模型,其中,所述其他元素不沿着与所述元素相同的Z字形扫描行,并且其中,所述其他元素包括在所述多个Z字形扫描行中的不超过两个的其他Z字形扫描行中;当所述预定扫描图案是垂直图案时:对于在其中0≤k≤(height-1)的每个位置(k,0)处的元素,将所述上下文模型确定为用于在具有所述矩阵的所述维度的所述不同矩阵中的位置(k,0)处的对应元素的上下文模型;以及对于除在所述位置(k,0)处的元素以外的元素,基于所述多个元素中的其他元素的值确定用于多个垂直扫描行中的一个垂直扫描行的每个元素的上下文模型,其中,所述其他元素不沿着与所述元素相同的垂直扫描行,并且其中,所述其他元素包括在所述多个垂直扫描行中的不超过两个的其他垂直扫描行中;当所述预定扫描图案是水平图案时:对于在其中0≤p≤(width-1)的每个位置(0,p)处的元素,将所述上下文模型确定为用于在具有所述矩阵的所述维度的所述不同矩阵中的位置(0,p)处的对应元素的上下文模型;以及对于除在所述位置(0,p)处的元素以外的元素,基于所述多个元素中的其他元素的值确定用于多个水平扫描行中的一个水平扫描行的每个元素的上下文模型,其中,所述其他元素不沿着与所述元素相同的水平扫描行,并且其中,所述其他元素包括在所述多个水平扫描行中的不超过两个的其他水平扫描行中;以及基于所确定的相应上下文模型处理每个元素。2.根据权利要求1所述的方法,其中:当所述预定扫描图案是Z字形图案时,所述其他元素仅包括在所述多个Z字形扫描行中的一个其他Z字形扫描行中;当所述预定扫描图案是垂直图案时,所述其他元素仅包括在所述多个垂直扫描行中的一个其他垂直扫描行中;以及当所述预定扫描图案是水平图案时,所述其他元素仅包括在所述多个水平扫描行中的一个其他水平扫描行中。3.根据权利要求1所述的方法,其中,所述矩阵包括重要图,所述多个元素中的每个元素表示视频压缩系数的存在或不存在。4.根据权利要求1所述的方法,其中,所述多个元素中的每个是二进制数,每个二进制数均指示用于视频块的量化的变换系数是零还是非零。5.根据权利要求1所述的方法,其中,所述其他Z字形扫描行是所述Z字形扫描图案的先前处理的Z字形扫描行,所述其他垂直扫描行是所述垂直扫描图案的先前处理的垂直扫描行,以及所述其他水平扫描行是所述水平扫描图案的先前处理的水平扫描行。6.根据权利要求1所述的方法,其中,所述处理步骤包括:将所述上下文模型映射至概率值。7.根据权利要求1所述的方法,其中,所述视频数据表示视频图片的块,所述方法进一步包括:对所述视频数据应用变换,以获得变换系数;量化所述变换系数,其中,所述元素表示所量化的变换系数中的一个的值是否为零。8.根据权利要求1所述的方法,其中,所述处理步骤包括:基于所确定的上下文模型对所述元素进行编码。9.根据权利要求1所述的方法,其中,所述处理步骤包括:基于所确定的上下文模型对所述元素进行解码。10.根据权利要求1所述的方法,其中,对于第一元素的所述确定和处理步骤与对于第二元素的所述确定和处理步骤并行地执行,其中,所述第一元素和所述第二元素位于所述多个Z字形扫描行中的一个Z字形扫描行、所述多个垂直扫描行中的一个垂直扫...

【专利技术属性】
技术研发人员:娄健克里特·帕努索波内王利民
申请(专利权)人:摩托罗拉移动有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1