当前位置: 首页 > 专利查询>谷歌公司专利>正文

在可变块尺寸的视频译码中的自适应重叠块预测制造技术

技术编号:16784082 阅读:32 留言:0更新日期:2017-12-13 02:29
本发明专利技术涉及在可变块尺寸的视频译码中的自适应重叠块预测。对已编码的视频流的当前块进行解码包括:基于与当前块相关联的当前预测参数来生成用于当前块的基本预测块,识别用于解码邻近于当前块的先前被解码的邻近块的邻近预测参数,以及确定当前块内和邻近于邻近块的重叠区域。重叠区域具有被确定为第一预测参数和邻近预测参数之间的差的函数的尺寸。对于重叠区域内的每个像素,可以作为基本预测和基于邻近预测参数的预测的函数来生成像素值的重叠预测。

【技术实现步骤摘要】
在可变块尺寸的视频译码中的自适应重叠块预测
本专利技术涉及在可变块尺寸的视频译码中的自适应重叠块预测。
技术介绍
数字视频可以用于例如经由视频会议(conferencing)的远程商务会议、高清晰度视频娱乐、视频广告或用户生成的视频的共享。由于视频数据中涉及的大量数据,因此传输和存储需要高性能压缩。已经提出了各种方法来减少视频流中的数据量,包括压缩和其他编码和解码技术。
技术实现思路
本申请总体上涉及用于传输或存储的视频流数据的编码和解码。本文公开了与可变块尺寸视频译码中的自适应的重叠块预测相关的系统、方法和装置的方面。作为本文的教导的一个方面,是一种用于解码编码的视频流的帧的方法。解码当前帧的当前块可以包括:基于与当前块相关联的当前预测参数来生成用于当前块的基本预测;识别用于解码邻近于当前块的先前解码的邻近块的邻近预测参数;确定当前块内邻近于邻近块的重叠区域,该重叠区域具有被确定作为当前预测参数和邻近预测参数之间的差的函数的尺寸。对于重叠区域内的每个像素,解码可以包括生成作为基本预测和基于邻近预测参数的预测的函数的像素值的重叠预测。本文中的教导的另一方面是一种块基解码压缩的视频流的多个帧的方法。解码可以包括:确定当前块内并且与先前解码的第一邻近块邻近的第一重叠区域;以及生成第一重叠区域中的像素值的预测作为使用当前帧的第一预测参数的第一预测以及使用第一邻近块的第二预测参数的第二预测的函数。第一重叠区域可以具有通过在第一预测参数和第二预测参数之间的差的函数可调适的尺寸。本文中的教导的另一方面是一种块基解码在编码的视频流的多个帧中的当前帧的多个块的当前块的方法。该方法可以包括基于第一预测参数生成当前块的像素值的预测。该方法可以包括定义在当前块内并且邻近于多个先前解码的块中的邻近块的重叠区域。重叠区域可以具有被定义为在第一预测参数与邻近块的第二预测参数之间的差的函数的尺寸。该方法可以包括为重叠区域内的每个像素生成像素值的被更新预测。被更新预测可以是第一预测和第二预测的函数,其中第二预测可以基于第二预测参数。本公开还提供了被布置用于使所述方法实施的相应的装置,被布置用于当被执行在适当的计算机装置上时来实施该方法和装置的计算机程序代码,以及用于运行该计算机代码的计算机可读介质。在下文中将更详细地描述这些和其他方面的变化。附图说明本文的描述参考附图,其中除非另有说明,否则相同的附图标记遍及多个视图中指代相同的部件。图1是根据本公开的实施方式的计算设备的图。图2是根据本公开的实施方式的计算和通信系统的图。图3是根据本公开的实施方式的用于编码和解码的视频流的图。图4是根据本公开的实施方式的编码器的框图。图5是根据本公开的实施方式的解码器的框图。图6是根据本专利技术的实施方案的用于自适应的重叠块预测的示例过程的流程图。图7是根据本专利技术的实施方案的具有可变块尺寸的示例性块基的预测的框图。图8是根据本公开的实施方式的重叠区域的示例性尺寸变化的框图。图9是根据本专利技术的实施方案的用于重叠预测的示例性加权函数的框图。具体实施方式视频压缩方案可以包括将每个图像或帧分成诸如块的较小部分,并且使用用于限制输出中的每个块所包括的信息的技术来生成输出比特流。编码的比特流可以被解码以从有限信息重新创建源图像。可以通过减少空间冗余、减少时间冗余或其组合来限制输出中的每个块包括的信息。例如,可以通过基于编码器和解码器两者可用的信息预测帧,并且包括表示预测帧和编码的视频流中的原始帧之间的差或残余的信息,来减少时间或空间冗余。可以将帧分成可变尺寸的块,使用先前译码的信息来预测每个块的像素值,并且每个块的预测参数和残余数据被编码为输出。解码器接收压缩的比特流中的预测参数和残余数据,并且重构帧,其可以包括基于先前解码的图像数据来预测块。重叠预测可通过使用来自邻近块的预测信息来改进块的预测。邻近块的预测块尺寸可以在邻近块之间变化,并且可以不同于当前块的预测块尺寸。可以对应于各个相邻块来识别当前块内的各个重叠区域,并且可以基于来自相应相邻块的预测参数,针对各个重叠区域确定重叠预测。可通过诸如根据邻近块的预测参数与当前块的预测参数的比较来调适当前块中的每个重叠区域的尺寸来优化重叠预测。图1是根据本公开的实施方式的计算设备100的图。所示的计算设备100包括通信接口110、通信单元120、用户接口(UI)130、处理器140、存储器150、指令160和电源170。如本文所使用的,术语“计算设备”包括能够执行本文所公开的任何方法或其任何一个或多个部分的任何单元或单元的组合。计算设备100可以是固定计算设备,诸如个人计算机(PC)、服务器、工作站、小型计算机或大型计算机;或移动计算设备,诸如移动电话、个人数字助理(PDA)、膝上型计算机或平板PC。尽管被示为单个单元,但是通信设备100的任何一个或多个元件可以被集成到任何数量的单独的物理单元中。例如,UI130和处理器140可以集成在第一物理单元中,并且存储器150可以集成在第二物理单元中。通信接口110是如所示的无线天线。通信接口110可以可选地或另外地是有线通信端口,诸如以太网端口、红外端口、串行端口或能够与有线或无线电子通信介质180对接的任何其它有线或无线单元。通信单元120被配置为经由有线或无线介质180发送或接收信号。例如,如所示,通信单元120可操作地连接到被配置为经由无线信号进行通信的天线。虽然在图1中未明确示出,通信单元120可以被配置为经由诸如射频(RF)、紫外线(UV)、可见光、光纤、有线线路或其组合的任何有线或无线通信介质发送、接收或收发两者。尽管图1示出了单个通信单元120和单个通信接口110,但是可以使用任何数量的通信单元和任何数量的通信接口。UI130包括能够与用户连接的任何单元,例如虚拟或物理键盘、触摸板、显示器、触摸显示器、扬声器、麦克风、摄像机、传感器或其任何组合。UI130可以可操作地耦合到如所示的处理器或者与通信设备100的诸如电源170的任何其他元件。尽管被示为单个单元,UI130可以包括一个或多个物理单元。例如,UI130可以包括用于执行与用户的音频通信的音频接口。UI130可以包括用于执行与用户的基于视觉和触摸的通信的触摸显示器。尽管被示出为单独的单元,但是通信接口110、通信单元120和UI130或其部分可以被配置为组合单元。例如,通信接口110、通信单元120和UI130可以被实现为能够与外部触摸屏设备对接的通信端口。处理器140包括现在存在或将来开发的能够操纵或处理信号或其他信息的任何设备或系统,包括光学处理器、量子处理器、分子处理器或其组合。例如,处理器140可以包括专用处理器、数字信号处理器(DSP)、多个微处理器、与DSP核心相关联的一个或多个微处理器、控制器、微控制器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、可编程逻辑阵列、可编程逻辑控制器、微代码、固件、任何类型的集成电路(IC)、状态机或其任何组合。如本文所使用的,术语“处理器”包括单个处理器或多个处理器。在该示例中,处理器140可操作地耦合到通信接口110、通信单元120、UI130、存储器150、指令160和电源170。存储器150包括任何非暂时性计算机可用或计算机可读介质,诸如可本文档来自技高网...
在可变块尺寸的视频译码中的自适应重叠块预测

【技术保护点】
一种对已编码的视频流的帧进行解码的方法,包括:基于与当前块相关联的当前预测参数,来生成所述当前块的基本预测;识别被用于对邻近于所述当前块的先前被解码的邻近块进行解码的邻近预测参数;确定在所述当前块内的并且邻近于所述邻近块的重叠区域,该重叠区域具有作为在所述当前预测参数与所述邻近预测参数之间的差的函数来被确定的尺寸;以及对于所述重叠区域内的像素,作为所述基本预测和基于所述邻近预测参数的预测的函数,来生成像素值的重叠预测。

【技术特征摘要】
2016.06.06 US 15/173,8811.一种对已编码的视频流的帧进行解码的方法,包括:基于与当前块相关联的当前预测参数,来生成所述当前块的基本预测;识别被用于对邻近于所述当前块的先前被解码的邻近块进行解码的邻近预测参数;确定在所述当前块内的并且邻近于所述邻近块的重叠区域,该重叠区域具有作为在所述当前预测参数与所述邻近预测参数之间的差的函数来被确定的尺寸;以及对于所述重叠区域内的像素,作为所述基本预测和基于所述邻近预测参数的预测的函数,来生成像素值的重叠预测。2.根据权利要求1所述的方法,进一步包括:识别被用于对多个先前被解码的邻近块进行解码的邻近预测参数;对于所述多个先前被解码的邻近块中的每个先前被解码的邻近块,确定在所述当前块内的并且邻近于所述邻近块的重叠区域,该重叠区域具有被定义为在所述当前预测参数与所述邻近预测参数之间的差的函数的尺寸。3.根据权利要求2所述的方法,进一步包括:在所述差小于最小阈值的情况下,省略至少一个重叠区域。4.根据权利要求1所述的方法,其中,所述重叠预测包括:所述基本预测和基于所述邻近参数的所述预测的加权平均。5.根据权利要求4所述的方法,其中,作为在每个相应像素和下述边界之间的距离的函数来确定所述加权平均的权重,其中,所述边界是在所述当前块和所述邻近块之间的边界。6.根据权利要求4所述的方法,其中,作为在每个相应像素与所述当前块的中心之间的距离、和在每个相应像素与所述邻近块的中心之间的距离的函数,来确定所述加权平均的权重。7.根据权利要求1所述的方法,进一步包括:基于所述先前被解码的邻近块的场境信息,来确定用于所述重叠预测的加权函数。8.根据权利要求1所述的方法,其中,所述重叠区域是矩形的,并且所述重叠区域的尺寸被调适为比所述邻近块的尺寸大多个水平像素。9.根据权利要求1所述的方法,其中,所述重叠区域是矩形的,并且所述重叠区域的尺寸被调适为比所述邻近块的尺寸大多个垂直像素。10.根据权利要求1所述的方法,其中,所述当前块的尺寸不同于所述邻近块的尺寸。11.一种用于对在被压缩的视频流的当前帧中的当前块进行解码的方法,包括:确定所述当前块内的并且邻近于先前被解码的第一邻近块的第一重叠区域;以及作为以下方面的函数,来生成所述第一重叠区域中的像素值的预测:使用所述当前帧的第一预测参数的第一预测,使用所述第一邻近块的第二预测参数的第二预测,其中,所述第一重叠区域具有能够通过在所述第一预测参数和所...

【专利技术属性】
技术研发人员:德巴尔加·慕克吉陈悦
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1