用于选择性地破坏视频编码中的预测的方法和系统技术方案

技术编号:14641165 阅读:92 留言:0更新日期:2017-02-15 15:32
本公开涉及用于选择性地破坏视频编码中的预测的方法和系统。描述了在视频编码和/或解码中允许选择性地破坏跨视频图像的不同段之间的段边界的预测和/或环内滤波的技术。无论是否可以跨段边界地应用相关联的预测或环路滤波工具,高级语法元素(例如参数集或片报头)都可以包括向编码器和/或解码器发送信号的一个或多个指示。响应于该一个或多个指示,然后编码器和/或解码器可以相应地控制预测或环路滤波工具。

【技术实现步骤摘要】
本申请是申请号为201180062300.7、申请日为2011年12月28日、专利技术名称为“用于选择性地破坏视频编码中的预测的方法和系统”的专利技术专利申请的分案申请。相关申请的交叉引用本中请要求2010年12月28日提交的、标题为“PICTURESEGMENTATIONUSINGGENERAL1ZEDSL1CES”的美国临时专利申请No.61/427,569和2011年12月23日提交的、标题为“METHODANDSYSTEMFORSELECTIVELYBREAKINGPREDICTIONINVIDEOCODING”的美国专利申请No.13/336,475的优先权,通过引用方式将以上每个申请的全部内容并入本文中。
本专利技术的实施例涉及视频压缩,并且更具体而言,涉及在视频图像的图像段边界处选择性地使用预测和环内滤波器机制。
技术介绍
可以将数字视频能力并入到范围广义的设备中,包括数字电视、数字直接广播系统、无线广播系统、个人数字助理(PDA)、膝上型计算机或者桌上型计算机、摄像机、数字记录设备、视频游戏设备、视频游戏控制器、蜂窝或卫星无线电话等等。数字视频设备可以实现视频压缩技术,例如在类似MPEG-2、MPEG-4的标准中所描述的那些视频压缩技术,其中,可以从位于瑞士CH-1211日内瓦20,邮政信箱56,Voie-Creuse第一大道的国际标准组织(“ISO”)或www.iso.org或ITU-TH.264/MPEG-4第十部分,高级视频编码(“AVC”)获得,从位于瑞士CH-1211日内瓦20万国宫广场的国际电信联盟(“ITU”)或www.itu.int获得MPEG-2、MPEG-4标准,通过引用方式将以上每个标准的全部内容并入本文中,或者根据其它标准或非标准规范实现视频压缩技术,从而有效地编码和/或解码数字视频信息。其它的压缩技术仍然可能在将来被开发或者目前正处于开发中。例如,被称为HEVC/H.265的新视频压缩标准正处于JCT-VC委员会的开发中。在由Wiegand等人于2011年3月所著的“WD3:WorkingDraft3ofHigh-EfficiencyVideoCoding,JCTVC-E603”中阐释了HEVC/H.265的工作草案被提出,“WD3:WorkingDraft3ofHigh-EfficiencyVideoCoding,JCTVC-E603”在后文中称为“WD3”并且通过引用方式被整体并入到本文中。视频编码器可以接收未编码的视频信息,以便于处理成任何合适的格式,该格式可以是符合(可从位于瑞士CH-1211日内瓦20万国宫广场的国际电信联盟(“ITU”)或www.itu.int获得的并且以引用的方式将其全部内容并入本申请的)ITU-RBT601的数字格式或一些其它数字格式。可以将未编码视频在空间上组织成布置在一个或多个二维矩阵中的像素值并且在时间上组织成一系列未编码图像,每个未编码图像包括一个或多个上述提到的二维像素值矩阵。此外,每个像素可以包括用于以数字格式表示色彩的大量独立的分量。用于被输入到视频编码器的未编码视频的一个通用格式针对具有四个像素的每个分组来说具有四个辉度样本(其包括有关像素的亮度/光亮度或暗度的信息)和两个色度样本(其包括颜色信息(例如,YCrCb4:2:0))。视频编码器的一个功能是将未编码图像转译(更通常“转换”)为比特流、分组流、NAL单元流或其它合适的传输格式(在后文都被称为“比特流”),其目的在于例如减少编码到比特流中的冗余的数量,以因此增加传输速率,增加比特流的恢复,从而抑制在传输期间可能发生的比特错误或分组擦除(统称为差错恢复),或其它专用的目标。本专利技术的实施例提供冗余的去除或减少、差错恢复的增加以及并行处理架构中的视频编码器和/或相关联的解码器的实现中的至少一个。视频解码器的一个功能在于接收由符合相同的视频压缩标准的视频编码器产生的比特流形式的编码视频作为它的输入。视频编码器然后将接收到的编码比特流转译(更通常“转换”)为可以被显示、存储或以其它方式处理的未编码视频信息。可以使用硬件和/或软件配置(包括硬件和软件二者的组合)实现视频编码器和视频解码器。视频编码器和视频解码器中的任何一个或两个的实现可以包括可编程的硬件组件例如(例如,个人计算机(PC)中找到的那些)通用中央处理器(CPU)、嵌入式处理器、图形卡处理器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)等等的使用。为了实现视频编码或解码的至少一部分,可能需要指令,并且可以使用一个或多个非瞬态的计算机可读介质来存储和分配那些指令。计算机可读介质选择包括压缩盘只读存储器(CD-ROM)、数字视频盘只读存储器(DVD-ROM)、记忆棒、嵌入式ROM等等。视频压缩和解压缩指的是视频编码器和/或解码器中执行的特定操作。视频解码器可以执行编码操作的反向操作的全部或子集。除非另有说明,本文所描述的视频编码技术还旨在包括所描述的视频编码技术的反向操作(即相关的视频解码技术)。可以把未压缩、数字表示的视频看作样本流,其中可以由视频显示器按扫描次序处理该样本。在该样本流中通常出现的一种类型的边界是样本流中的图像之间的边界。许多视频压缩标准识别该边界,并且一般例如通过在每个未编码图像的开始处插入图像报头或其它的元数据,在这些边界处分割编码比特流。在样本流中可能出现的其它边界包括片边界和瓦片边界,其可以出现在未编码图像内,如下所述。视频编码中的预测可以发生在多个等级上。一个等级在后文被称作“熵编码等级”,并且在该等级上的预测被称作“编码预测”。在该等级中,熵编码符号的解码可能需要成功地解码先前的熵编码符号。所有或几乎所有的当前压缩标准都破坏图像和片等级处的编码预测。即,在检测到比特流(或等同物)中的图像或片报头之后,熵编码中使用的与熵编码相关状态被复位为初始化状态。熵编码预测的一个实例是ITU-TRec.H.264中的CABAC状态的复位。此外,可能存在这样一种编码机制,其中该解码机制未落入如上所述的与熵编码相关的预测的普通理解内,但是其仍然涉及与比特流相关联的重构控制信息而不是像素值。作为一个实例,即使一些较旧的标准(例如,ITU-TRec.H.261标准)也允许相对于一个或多个先前编码的运动向量编码运动向量。块组(GOB)、片或图像报头的检测将该预测向量复位为(0,0)。还存在跨越多幅图像的预测机制。例如,运动补偿可以将来自一幅或多幅参考图像的(有可能已被运动补偿的)像素值用于预测。通过宏块类型(或等同物)破坏该类型的预测。例如,帧内宏块通常不使用来自参考图像的预测,然而帧间宏块可能使用来自参考图像的预测。在这个意义上说,帧内片和帧间片仅仅是属于那些不同宏块类型的宏块的累积。还存在这样一种预测等级,其中该预测等级包括基于在正在被编码的图像的重构过程期间已经被重构的像素值的预测。一个实例是帧内预测机制,例如,ITU-TRec.H.263的附件I中描述的那个(类似的机制在其它视频编码标准中也是可用的)。除了预测机制之外,几个视频编码标准指定了用于执行环内滤波的滤波器。一个实例是ITU-TRec.H.263的附件J中指定的环内滤波器。针对一些应用,将正在被编码的图本文档来自技高网...
用于选择性地破坏视频编码中的预测的方法和系统

【技术保护点】
一种用于解码包括多个瓦片的编码视频图像的方法,所述方法包括:对于所述编码视频图像的不具有相关联的瓦片报头的至少一个瓦片,从所述编码视频图像获得将要被应用于所述编码视频图像中的两个瓦片之间的边界的样本自适应偏移操作的至少一个指示;以及响应于所述至少一个指示,控制两个瓦片之间的所述样本自适应偏移操作,其中,所述编码视频图像包含有包括两个没有相关联的瓦片报头的瓦片的至少一个片。

【技术特征摘要】
2010.12.28 US 61/427,569;2011.12.23 US 13/336,4751.一种用于解码包括多个瓦片的编码视频图像的方法,所述方法包括:对于所述编码视频图像的不具有相关联的瓦片报头的至少一个瓦片,从所述编码视频图像获得将要被应用于所述编码视频图像中的两个瓦片之间的边界的样本自适应偏移操作的至少一个指示;以及响应于所述至少一个指示,控制两个瓦片之间的所述样本自适应偏移操作,其中,所述编码视频图像包含有包括两个没有相关联的瓦片报头的瓦片的至少一个片。2.一种用于编码包括多个瓦片的视频图像的方法,所述方法包括:对于所述视频图像的不具有相关联的瓦片报头的至少一个瓦片,获得将要被应用于所述视频图像中的两个瓦片之间的边界的样本自适应偏移操作的至少一个指示;以及响应...

【专利技术属性】
技术研发人员:迈克尔·霍罗威茨
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1