一种使用列的图像编码方法和设备、解码方法和设备、以及计算机可读存储介质技术

技术编号:15654427 阅读:230 留言:0更新日期:2017-06-17 11:00
本发明专利技术公开了使用列的图像分割方法和系统。描述了在视频编码和解码中通过列和片的图像分割。将视频图像分割成多个列,每个列仅在水平维度中覆盖视频图像的一部分。属于一个片的全部编码树块(“CTB”)可能属于一个或多个列。列可用于破坏视频编码的相同的或不同的预测或环路滤波机制,并且用于编码和/或解码的CTB扫描次序可以是局部用于列的。可以在参数集合中指示并且/或者可以在片等级调整列宽度。在解码器处,可以从比特流解析列宽度,并且片解码可以发生在一个或多个列中。

【技术实现步骤摘要】
使用列的图像分割方法和系统本申请是申请日为2011年12月28日、题为“使用列的图像分割方法和系统”的专利技术专利申请201180062299.8的分案申请。本申请要求2010年12月28日提交的、标题为"PICTURESEGMENTATIONUSINGGENERALIZEDSLICES”的美国临时专利申请序列号61/427,569以及2011年12月23日提交的、标题为“METHODANDSYSTEMFORPICTURESEGMENTATIONUSINGCOLUMNS”的美国专利申请号13/336,675的优先权,以引用的方式将以上每个申请的全文并入本申请中。
本专利技术的实施方式涉及视频编码,并且更具体而言涉及将编码图像分割成一个或多个列或片。
技术介绍
可以将数字视频能力包括在范围广泛的设备中,包括数字电视机、数字直接广播系统、无线广播系统、个人数字助理(PDA)、膝上型计算机或桌上型计算机、摄像机、数字记录设备、视频游戏设备、视频游戏控制台、蜂窝或卫星无线电话等等。数字视频设备可以实现视频压缩技术,如诸如MPEG-2、MPEG-4的标准中所述的那些视频压缩技术,其中,可以从位于瑞士CH—1211日内瓦20,邮政信箱56,Voie-Creuse第一大道的国际标准组织(“ISO”)或www.iso.org或ITU-TH.264/MPEG-4第十部分,高级视频编码(“AVC”)获得,从位于瑞士CH-1211日内瓦20万国宫广场的国际电信联盟(“ITU'’)或www.im.int获得MPEG-2、MPEG-4标准,以引用的方式将以上每个标准的全文并入本申请中,或者根据其他标准或非标准规范实现视频压缩技术,以有效地编码并且/或者解码数字视频信息。视频编码器可以接收未编码视频信息以便处理成任意合适的格式,该格式可以是符合(可从位于瑞士CH-1211日内瓦20万国宫广场的国际电信联盟(“ITU'’)或wvw.讧u.int获得的并且以引用的方式全文并入本申请的)ITU-RBT6016勺数字格式或者一些其他数字格式。可以将未编码视频在空间上组织成配置在一个或多个二维矩阵中的像素值并且在时间上组织成一系列未编码图像,其中,每个未编码图像包括一个或多个上述提到的二维像素值矩阵。此外,每个像素可以包括用于以数字格式表示色彩的多个独立的分量。用于被输入到视频编码器的未编码视频的一个常用格式对于具有四个像素的每个分组具有四个辉度样本和两个色度样本,其中,该辉度样本包括关于像素的亮度/光亮或黑暗的信息,该色度样本包括颜色信息(例如YCrCb4:2:0)。视频编码器的一种功能是将未编码图像转译(更普遍而言“转换”)成比特流、分组流、NAL单元流或其他合适的传输格式(全都被在今后称为“比特流”),其目标在于例如降低编码到比特流中的冗余的数量以由此增加传输速率,增加比特流的恢复能力以抑制在传输期间可能发生的比特错误或分组擦除(统称为“差错恢复能力”)或其他专用目标。本专利技术的实施方式具备以下之中的至少一个:冗余的去除或降低、差错恢复能力的增加以及并行处理架构中的视频编码器和/或相关解码器的实现。视频解码器的一个功能在于接收由符合相同的视频压缩标准的视频编码器产生的比特流形式的编码视频作为它的输入。视频编码器然后将接收编码比特流转译(更普遍而言“转换”)成可以被显示、存储或以其它方式处理的未编码视频信息。可以使用包括硬件和软件的组合的硬件和/或软件配置实现视频编码器和视频解码器。视频编码器和视频解码器中的任意一个或两个的实现可以包括可编程硬件组件如(如个人计算机(PC)中发现的那些)通用中央处理器CPU、嵌入式处理器、图形卡处理器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)等等的使用。为了实现视频编码或解码的至少一部分,可能需要指令,并且可以使用一个或多个非瞬态的计算机可读介质存储并且分配那些指令。计算机可读介质选择包括压缩盘只读存储器(CD-ROM)、数字视频盘只读存储器(DVD-ROM)、记忆棒、嵌入式ROM等等。在下文中,将描述与视频压缩和解压缩的至少一个广义方案(即视频编码器和/或解码器中执行的操作)关联的特定系统、方法和/或方案。视频解码器可以执行与编码操作相逆的操作的全部或子集。若非另外注释,则本文所述的视频编码技术还适用于包括所述视频编码技术的逆向(即与视频解码相关联)。可以将未压缩的数字表示的视频视为样本流,其中,可以由视频显示器在扫描次序中处理样本。在该样本流中通常出现的一种类型的边界是样本流的图像之间的边界。许多视频压缩标准识别该边界并且通常例如通过在每个未编码图像的开头插入图像报头或其他元数据来分割在这些边界上的编码比特流。对于一些应用,将编码图像分割成更小的数据块可能是有利的,其中,该分割可以发生在编码之前或期间。下文描述了可以受益于图像分割的两个使用情况。第一种该使用情况涉及并行处理。在以前,标清视频(例如720x480或720x576个像素)是广泛的商业使用中的最大格式。最近,出现并且在各种各样的应用空间使用(高达1920x1080个像素的)HD格式以及4k(4096x2048个像素)、8k(8192x4096个像素)以及更大的格式。尽管近些年来可负担的计算能力增加,但是由于与这些更新的或更大的格式中的一些格式相关联的的非常大的图像尺寸,调节并行处理的效率对编码并且解码过程通常是有利的。并行编码和解码可以发生在指令等级(例如使用SIMD)、在可以在不同阶段上同时处理多个视频编码单元的流水线中或者在由独立的计算引擎作为独立的实体(例如多核通用处理器)来处理视频编码子单元的集合的大型结构基础上。并行处理的最后一个形式需要图像分割。第二种该使用情况涉及图像分割以便创建适用于在分组网络上的有效传输的比特流。基于IP或其他分组网络协议来传输编码视频的编解码器可能受到最大传输单元(“MTU”)尺寸限制。对于编码片尺寸而言,有时候包括编码片的结果分组尽可能地接近MTU尺寸而不超过该尺寸是有利的,以便保持高的有效载荷/分组化开销比率,同时避免被网络分段(以及结果导致的更高的损失概率)。MTU尺寸在一个网络到另一个网络之间变化很大。例如,可以由通常用于因特网的网络基础设施的最小MTU尺寸设置许多因特网连接的MTU尺寸,其中,该最小MTU尺寸通常对应于以太网中的极限并且可以大致为1500个字节。编码图像中的比特的数量依赖于许多因素如源图像的尺寸、希望的质量、就预测适宜性而言的内容复杂度、视频编码标准的编码效率以及其他因素。然而,即使在适中的设置质量和内容复杂度上,对于HD分辨率以及更高分辨率的序列,平均编码图像的尺寸轻易地超过MTU尺寸。视频会议编码器可能例如需要大约2Mbit/sec,以编码720p60视频序列。这导致大致33000比特或4215字节的平均编码图像尺寸,这比因特网的MTU尺寸的近似1500个字节多相当多。在更高的分辨率上,平均图像尺寸增加到显著高于因特网的MTU尺寸的值。假设与以上720p60中类似的压缩比,60fps上的4096x2048(4k)视频(4kp60)可能对于每个编码视频图像需要超过300000个比特或25个MUT大小的分组。在许多视频编码标准中,图像段(或至少一种形式的本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/62/201611024992.html" title="一种使用列的图像编码方法和设备、解码方法和设备、以及计算机可读存储介质原文来自X技术">使用列的图像编码方法和设备、解码方法和设备、以及计算机可读存储介质</a>

【技术保护点】
一种用于编码视频图像的方法,所述视频图像包括被配置成至少两个CTB行和至少两个CTB列的多个编码树块CTB,所述方法包括:编码列中的每个列的对应的列宽度,每个列宽度大于零并且所有列宽度的和等于所述视频图像的水平尺寸;并且编码所述视频图像的至少一个片,其中,所述至少一个片包括位于至少两个CTB行中的至少两个CTB,其中,列从图像上部去到图像下部,并且列宽度从图像上部到图像下部是均匀的;其中,该图像从最左边的列到最右边的列被扫描;并且其中,在紧接第一列右边的第二列的CTB被扫描之前,第一列内的全部CTB从左到右并且从上到下被扫描;其中,编码所述视频图像的至少一个片包括对片中的块进行变换。

【技术特征摘要】
2010.12.28 US 61/427,569;2011.12.23 US 13/336,6751.一种用于编码视频图像的方法,所述视频图像包括被配置成至少两个CTB行和至少两个CTB列的多个编码树块CTB,所述方法包括:编码列中的每个列的对应的列宽度,每个列宽度大于零并且所有列宽度的和等于所述视频图像的水平尺寸;并且编码所述视频图像的至少一个片,其中,所述至少一个片包括位于至少两个CTB行中的至少两个CTB,其中,列从图像上部去到图像下部,并且列宽度从图像上部到图像下部是均匀的;其中,该图像从最左边的列到最右边的列被扫描;并且其中,在紧接第一列右边的第二列的CTB被扫描之前,第一列内的全部CTB从左到右并且从上到下被扫描;其中,编码所述视频图像的至少一个片包括对片中的块进行变换。2.如权利要求1所述的方法,进一步包括将列的数量和列的宽度中的至少一个编码到参数集合中。3.一种用于解码编码视频图像的方法,所述编码视频图像包括被配置成至少两个CTB行和至少两个CTB列的多个编码树块CTB,所述方法包括:获得(i)列中的每个列的对应的列宽度或(ii)列数量中的至少一个;导出列中的每个列的所述对应的列宽度;并且解码所述编码视频图像的至少一个片,其中,所述至少一个片包括位于至少两个CTB行中的至少两个CTB,其中...

【专利技术属性】
技术研发人员:迈克尔·霍罗威茨
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1