针对多视点视频压缩的帧间图片运动预测方法技术

技术编号:36820075 阅读:26 留言:0更新日期:2023-03-12 00:52
提供一种用于编码视频数据的方法、计算机程序和计算机系统。视频数据包括(1)包括第一当前视点和第一参考视点的第一帧,以及(2)包括第二当前视点和第二参考视点的第二帧。针对所述第一当前视点中的当前块,识别所述第一参考视点中的同位块。基于所述同位块和所述同位块在所述第二参考视点中的参考图片之间的运动矢量来计算预测的偏移矢量。基于所述预测的偏移矢量对所述视频数据进行编码/解码。偏移矢量对所述视频数据进行编码/解码。偏移矢量对所述视频数据进行编码/解码。

【技术实现步骤摘要】
【国外来华专利技术】针对多视点视频压缩的帧间图片运动预测方法
[0001]援引并入
[0002]本申请要求于2020年9月21日提交的美国专利申请第17/026,922号的优先权权益,该申请的全部内容通过引用并入本文中。


[0003]本公开总体上涉及数据处理领域,更具体地涉及视频编码和解码。

技术介绍

[0004]基于块的运动补偿通常用于现代视频编码系统,例如运动图像专家组

2(Moving Picture Experts Group

2,MPEG

2)、运动图像专家组

4(Moving Picture Experts Group

4,MPEG

4)、高级视频编码(Advanced Video Coding,AVC)、高效视频编码(High Efficiency Video Coding,HEVC)和下一代视频编码(Versatile Video Coding,VVC)。当前编码块的预测器来自先前已编码图片,先前已编码图片称为参考图片。运动矢量用于指向参考图片中的相对于当前图片中的当前块的位置的位置。如果一个以上的参考图片可用于生成预测器,则运动信息可附加地包含参考图片索引,作为来自候选参考图片集合的选择索引。在一些预测方案中,例如在双向预测方法中,可以使用多于一个预测块来生成当前块的最终预测器。
[0005]针对每个帧间预测CU(编码单元(Coding Unit)或编码块(Coding Block)),可能需要由运动矢量、参考图片索引和参考图片列表使用索引组成的运动参数,以及附加信息用于针对帧间预测样本生成的VVC的新编码特征。可以以显式方式或隐式方式通过信号通知运动参数。当用跳过模式或合并模式对CU进行编码时,CU与一组推断的运动信息相关联,并且没有显著的残差系数、没有已编码的运动矢量增量或参考图片索引。指定合并模式,由此从相邻CU推断和获得当前CU的运动参数(包括空间候选和时间候选)。合并模式可以应用于任何帧间预测CU,而不仅仅是跳过模式。合并模式的替代方案是运动参数的显式传输,其中,针对每个CU显式地用信号通知运动矢量(或预测后的运动矢量差)、每个参考图片列表的对应参考图片索引、参考图片列表使用标志以及其他需要的信息。

技术实现思路

[0006]实施例涉及用于编码视频数据的方法、系统和计算机可读介质。根据一个方面,提供了一种用于编码视频数据的方法。该方法可包括接收视频数据,该视频数据包括(1)包括第一当前视点和第一参考视点的第一帧和(2)包括第二当前视点和第二参考视点的第二帧。针对第一当前视点中的当前块,识别第一参考视点中的同位块。基于同位块与同位块在第二参考视点中的参考块之间的运动矢量来计算预测的偏移矢量。基于预测的偏移矢量对视频数据进行编码/解码。
[0007]根据另一方面,提供了一种用于编码视频数据的计算机系统。该计算机系统可以包括一个或多个处理器、一个或多个计算机可读存储器、一个或多个计算机可读有形存储
设备、以及存储在该一个或多个存储设备中的至少一个上的程序指令,由一个或多个处理器中的至少一个经由一个或多个存储器中的至少一个执行该程序指令,由此该计算机系统能够执行一种方法。该方法可包括接收视频数据,该视频数据包括(1)包括第一当前视点和第一参考视点的第一帧和(2)包括第二当前视点和第二参考视点的第二帧。针对第一当前视点中的当前块,识别第一参考视点中的同位块。基于同位块与同位块在第二参考视点中的参考块之间的运动矢量来计算预测的偏移矢量。基于预测的偏移矢量对视频数据进行编码/解码。
[0008]根据又一方面,提供了一种用于编码视频数据的计算机可读介质。该计算机可读介质可包括一个或多个计算机可读存储设备和存储在该一个或多个有形存储设备中的至少一个上的程序指令,该程序指令可由处理器执行。该程序指令可由处理器执行,用于执行一种方法,该方法可相应地包括接收视频数据,该视频数据包括(1)包括第一当前视点和第一参考视点的第一帧和(2)包括第二当前视点和第二参考视点的第二帧。针对第一当前视点中的当前块,识别第一参考视点中的同位块。基于同位块与同位块在第二参考视点中的参考块之间的运动矢量来计算预测的偏移矢量。基于预测的偏移矢量对视频数据进行编码/解码。
附图说明
[0009]从下面结合附图阅读的说明性实施例的详细描述中,这些目的、特征和优点和其他目的、特征和优点将变得显而易见。附图的各种特征不是按比例绘制的,因为附图是为了便于本领域技术人员结合具体实施例进行理解。在附图中:
[0010]图1示出了根据至少一个实施例的联网计算机环境。
[0011]图2是根据至少一个实施例的拼接视频数据的帧(每个帧具有多个视点)的示图。
[0012]图3是根据至少一个实施例的由编码视频数据的程序执行的步骤的操作流程图。
[0013]图4是根据至少一个实施例的图1中描绘的计算机和服务器的内部组件和外部组件的框图。
[0014]图5是根据至少一个实施例的包括图1中描绘的计算机系统的说明性云计算环境的框图。
[0015]图6是根据至少一个实施例的图5的说明性云计算环境的功能层的框图。
具体实施方式
[0016]本文公开了所要求保护的结构和方法的详细实施例。然而,可以理解的是,所公开的实施例仅仅是可以以各种形式实施的所要求保护的结构和方法的说明。然而,这些结构和方法可以以许多不同的形式实施,并且不应被解释为限于这里阐述的示例性实施例。相反,提供这些示例性实施例使得本公开将是彻底且完整的,并且将向本领域技术人员充分地传达本公开的范围。在实施例中,可以省略公知特征和技术的细节,以避免不必要地模糊所呈现的实施例。
[0017]实施例总体上涉及数据处理领域,更具体地涉及视频编码和解码。以下描述的示例性实施例提供了一种系统、方法和计算机程序,以基于视频数据的帧之间的运动矢量预测对视频数据进行编码。因此,一些实施例具有如下能力:通过改进的、基于帧间预测的视
频数据编码来提升计算领域。
[0018]如前所述,对于每个帧间预测CU(编码单元或编码块),可能需要由运动矢量、参考图片索引和参考图片列表使用索引组成的运动参数以及附加信息用于针对帧间预测样本生成的VVC的新编码特征。可以以显式方式或隐式方式通过信号通知运动参数。当用跳过模式或合并模式对CU进行编码时,CU与一组推断的运动信息相关联,并且没有显著的残差系数、没有已编码的运动矢量增量或参考图片索引。指定合并模式,由此从相邻CU推断和获得当前CU的运动参数(包括空间候选和时间候选)。合并模式可以应用于任何帧间预测CU,而不仅仅是跳过模式。合并模式的替代方案是运动参数的显式传输,其中针对,每个CU显式地用信号通知运动矢量(或预测后的运动矢量差)、每个参考图片列表的对应参考图片索引、参考图片列表使用标志以及其他需要的信息。
[0019]在传统方法中,同一场景的多个视点被拼接本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种能够由处理器执行的视频编码方法,所述方法包括:接收视频数据,所述视频数据包括(1)包括第一当前视点和第一参考视点的第一帧,以及(2)包括第二当前视点和第二参考视点的第二帧;针对所述第一当前视点中的当前块,识别所述第一参考视点中的同位块;基于所述同位块在所述同位块的所述第二参考视点(第二帧)中的参考图片中的运动矢量来计算预测的运动矢量;以及基于所述预测的运动矢量对所述当前块的所述视频数据进行编码。2.根据权利要求1所述的方法,其中,基于通过将来自视角变换的视差矢量应用于所述第一当前视点中的所述当前块,预测所述第一参考视点中所述同位块的位置,以对所述视频数据进行编码。3.根据权利要求2所述的方法,其中,编码器基于使用由所述预测的运动矢量指示的所述位置作为可能匹配位置来执行运动估计。4.根据权利要求1所述的方法,其中,将所述预测的运动矢量添加至用于帧间合并模式或帧间跳过模式的候选矢量列表中。5.根据权利要求4所述的方法,其中,当添加一个以上所述预测的运动矢量时,基于所述第一当前视点和对应于所述候选矢量的视点之间的接近度,或者基于参考视点中的质量排序,对所述候选矢量列表排序。6.根据权利要求1所述的方法,其中,将所述预测的运动矢量添加至用于帧间运动矢量编码模式的候选矢量列表中。7.根据权利要求6所述的方法,其中,当添加一个以上所述预测的运动矢量时,基于所述第一当前视点和对应于所述候选矢量的视点之间的接近度,或者基于参考视点中的质量排序,对所述候选矢量列表排序。8.根据权利要求1所述的方法,其中,编码器基于使用所述预测的运动矢量的端点作为搜索中心来执行运动估计。9.根据权利要求1所述的方法,其中,通过应用所述同位块的所述运动矢量的几何变换而推导出所述预测的运动矢量。10.一种用于编码视频数据的计算机系统,所述计算机系统包括:一个或多个计算机可读非暂时性存储介质,配置为存储计算机程序代码;以及一个或多个计算机处理器,配置为访问所述计算机程序代码并按照所述计算机程序代码的指令操作,所述计算机程序代码包括:接收代码,配置为使得所述一个或多个计算机处理器接收视频数据,所述视频数据包括(1)包括第一当前视点和第一参考视点的第一帧,以及(2)包括第二当前视点和第二参考视点的第二帧;识别代码,配置为使得所述一个或多个计算机处理器针对所述第一当前视点中的当前块,识别所述第一参考视点中的同位块;计算代码,配置为使得所...

【专利技术属性】
技术研发人员:田军刘杉许晓中封薇薇
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1