【技术实现步骤摘要】
使用先前帧残差的运动矢量预测
技术介绍
数字视频流通常使用帧序列或静止图像来表示视频。每个帧可以包括多个块,该块进而又可以包含描述像素的颜色、亮度或其他属性的值的信息。视频流中的数据量很大,并且视频的传输和存储可以使用大量的计算或通信资源。由于视频数据中涉及大量数据,因此需要高性能压缩以用于传输和存储。这通常涉及使用运动矢量的帧间预测。
技术实现思路
本专利技术总体上涉及利用使用先前帧残差的运动矢量预测来编码和解码视觉数据,诸如视频流数据。根据本公开的一个方面的用于编码或解码视频信号的方法包括:从作为除当前帧之外的至少两个帧的像素值之间的差的残差中生成当前帧内的当前块的掩模,以及通过使用该掩模的帧间预测编码或解码当前块。视频信号包括定义视频序列的帧,这些帧具有由像素组成的块。本文描述的装置的一个方面是用于编码或解码视频信号的装置,该视频信号包括定义视频序列的多个帧,这些帧具有由像素组成的块。该装置包括处理器和非暂时性存储器,非暂时性存储器存储包括使处理器执行方法的指令,所述方法包括:根据残差生成视频序列中的当前帧内的当前块的掩模,残差是除当前帧之外的至少两个帧的像素值之间的差,并且使用掩模通过帧间预测编码或解码当前块。本文中所描述的设备的另一方面是一种用于生成用于编码或解码视频信号的当前块的掩模的装置,该视频信号包括定义视频序列的多个帧,这些帧具有块,且这些块由像素组成。该装置包括处理器和非暂时性存储器,非暂时性存储器存储包括使处理器执行方法的指令,方法包括:通过从第二帧内的像素值减去第一帧内的像素值来计算残差,第一帧和第二帧中的每一个帧均位于视频序列内的当前帧之前 ...
【技术保护点】
一种用于使用计算设备编码或解码视频信号的方法,所述视频信号包括定义视频序列的帧,所述帧具有由像素形成的块,所述方法包括:从作为在所述视频序列中除当前帧之外的至少两个帧的像素值之间的差的残差,生成用于在所述视频序列中的所述当前帧内的当前块的掩模;以及使用所述掩模通过帧间预测编码或解码所述当前块。
【技术特征摘要】
2016.01.29 US 15/010,5941.一种用于使用计算设备编码或解码视频信号的方法,所述视频信号包括定义视频序列的帧,所述帧具有由像素形成的块,所述方法包括:从作为在所述视频序列中除当前帧之外的至少两个帧的像素值之间的差的残差,生成用于在所述视频序列中的所述当前帧内的当前块的掩模;以及使用所述掩模通过帧间预测编码或解码所述当前块。2.根据权利要求1所述的方法,其中,生成所述掩模包括:通过从第二帧内的像素值中减去第一帧内的像素值来计算所述残差,所述第一帧和所述第二帧位于所述视频序列内的所述当前帧之前,并且所述第一帧和所述第二帧由一个或多个帧和定义的时间量间隔开。3.根据权利要求1所述的方法,其中,所述掩模具有像素位置的第一连续部分和像素位置的第二连续部分,所述第一连续部分和所述第二连续部分不重叠,并且所述第一连续部分和所述第二连续部分之间的边界在所述掩模的两个边缘之间延伸,所述方法进一步包括:使用所述掩模对于在所述当前块的像素位置的所述第一连续部分内的像素值在参考帧内执行第一运动搜索;使用所述掩模对于在所述当前块的像素位置的所述第二连续部分内的像素值在所述参考帧内执行第二运动搜索;以及通过使用所述掩模组合所述第一运动搜索的结果与所述第二运动搜索的结果来生成预测块。4.根据权利要求1所述的方法,其中,生成所述掩模包括:将阈值应用于所述残差内的相应像素位置的像素值以生成包括像素的阈值残差,所述阈值残差内的每个像素具有第一值或不同于所述第一值的第二值;以及修改所述阈值残差以生成所述掩模。5.根据权利要求4所述的方法,其中,应用所述阈值包括:将所述残差内的每个像素位置的像素值与所述阈值进行比较;当所述每个像素位置的像素值小于所述阈值时,将所述第一值指配给所述阈值残差内的相同像素位置;以及当所述每个像素位置的像素值大于所述阈值时,将所述第二值指配给所述阈值残差内的相同像素位置。6.根据权利要求4所述的方法,其中,修改所述阈值残差包括:基于与由具有所述第一值的最小数量的连续像素所限定的区域相邻的像素的值,应用生长函数以扩展所述区域。7.根据权利要求6所述的方法,其中,修改所述阈值残差包括:应用收缩函数以移除由具有所述第一值的最大数量的连续像素所限定的区域,所述具有所述第一值的最大数量的连续像素由具有所述第二值的像素包围。8.根据权利要求4所述的方法,其中,所述至少两个帧包括第一帧和第二帧,所述方法进一步包括:通过从所述第一帧内的共位像素的像素值减去所述第二帧内的像素的像素值来计算所述残差,并且其中,在编码或解码所述当前块之前,通过运动矢量移位所述掩模的边界。9.根据权利要求1所述的方法,进一步包括:旋转所述掩模;使用旋转的掩模在参考帧内执行第一运动搜索;使用所述旋转的掩模在所述参考帧内执行第二运动搜索;以及使用所述掩模组合通过所述第一运动搜索找到的块与通过所述第二运动搜索找到的块,以生成用于编码所述当前块的预测块。10.根据权利要求1所述的方法,进一步包括:接收包括第一运动矢量、第二运动矢量和用于编码所述当前块的掩模模式的指示符的编码比特流;以及在生成所述掩模后:将所述掩模应用于从所述第一运动矢量得到的第一参考块以生成第一掩模参考块;将所述掩模应用于从所述第二运动矢量得到的第二参考块以生成第二掩模参考块;以及组合所述第一掩模参考块和所述第二掩模参考块以生成预测块,其中:使用所述掩模通过帧间预测解码所述当前块包括使用所述预测块来解码所述当前块。11.一种用于编码或解码视频信号的装置,所述视频信号包括定义视频序列的帧,所述帧具有块,并且所述块由像素形成,所述装置包括:处理器;以及非暂时性存储器,所述非暂时性存储器存储在执行时使所述处理器执行操作的指令,所述操作包括:从作为在所述视频序列中除当前帧之外的至少两个帧的像素值之间的差的残差,生成用于在所述视频序列中的所述当前帧内的当前块的掩模;以及使用所述掩模通过帧间预测编码或解码所述当前块。12.根据权利要求11所述的装置,其中,所述操作进一步包括通过下述步骤生成所述掩模:计算作为所述视频序列中的第一帧内的像素值与...
【专利技术属性】
技术研发人员:詹姆斯·班科斯基,德巴尔加·慕克吉,许耀武,
申请(专利权)人:谷歌公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。