用于解码器侧运动矢量(MV)推导技术的块自适应搜索范围和成本因子制造技术

技术编号:38269213 阅读:9 留言:0更新日期:2023-07-27 10:24
一种解码视频数据的方法可以包括从经编码的比特流解码数据以生成运动矢量以及对运动矢量中的一个或多个执行解码器侧运动矢量细化(DMVR)过程。执行DMVR过程可以包括确定正在被解码的当前视频块的一个或多个特征以及基于当前视频块的所确定的一个或多个特征确定用于针对当前视频块的DMVR过程的搜索区。定用于针对当前视频块的DMVR过程的搜索区。定用于针对当前视频块的DMVR过程的搜索区。

【技术实现步骤摘要】
【国外来华专利技术】用于解码器侧运动矢量(MV)推导技术的块自适应搜索范围和成本因子
[0001]相关申请的交叉引用
[0002]本申请要求于2020年11月23日提交的美国专利申请No.17/101,687的优先权,其全部内容通过引用合并于此。


[0003]本公开涉及视频编码和视频解码。

技术介绍

[0004]数字视频功能可以被集成到各种各样的设备中,包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板计算机、电子书阅读器、数码相机、数字记录设备、数字媒体播放器、视频游戏设备、视频游戏控制台、蜂窝或卫星无线电话、所谓的“智能电话”、视频电话会议设备、视频流设备等等。数字视频设备实施视频编解码(coding)技术,诸如那些在由下述所定义的标准中描述的技术:MPEG

2、MPEG

4、ITU

T H.263、ITU

T H.264/MPEG

4第10部分、高级视频编解码(AVC)、ITU

T H.265/高效视频编解码(HEVC)、以及上述各标准的扩展。通过实施这些视频编解码技术,上述视频设备可以更有效地对数字视频信息进行发送、接收、编码、解码和/或存储。
[0005]视频编解码技术包括空间(图片内)预测和/或时间(图片间)预测,以减少或去除视频序列中固有的冗余。对于基于块的视频编解码,可以将视频切片(slice)(例如,视频图片或视频图片的一部分)划分为视频块,这些视频块也可以被称为编解码树单元(CTU)、编解码单元(CU)和/或编解码节点。图片的帧内编解码的(I)切片中的视频块,使用相对于同一图片中相邻块中参考样点的空间预测进行编码。图片的帧间编解码的(P或B)切片中的视频块可以使用相对于同一图片中相邻块中的参考样点的空间预测或者相对于其他参考图片中的参考样点的时间预测。图片可以被称为帧,并且参考图片可以被称为参考帧。

技术实现思路

[0006]通常,本公开描述对可以改进由视频解码器执行的解码器侧运动矢量细化(DMVR)过程的技术。在一些示例中,以自适应的方式定义与DMVR过程相关联的搜索区,使得不同尺寸或形状的搜索区可以在不同的情况下被使用(例如,用于正在被编解码的不同的视频块)。例如,可以基于与正在被编解码的视频块相关联的一个或多个特征(诸如,基于块尺寸、块维度、分辨率或其他因素)来确定与DMVR过程相关联的搜索区。此外,本公开考虑了信令技术,由此可以基于在比特流中被编码的数据来定义DMVR搜索区的尺寸(例如,一个或多个维度)。信令可以被用于结合块特征的确定或者作为块特征的确定的替代来定义DMVR搜索区。在任何情况下,与DMVR过程相关联的搜索区可以是自适应的,其可以提供视频解码过程中的灵活性,并且可以提高视频质量。
[0007]在一个示例中,一种解码视频数据的方法,该方法可以包括:从经编码的比特流解
码数据以生成运动矢量以及对运动矢量中的一个或多个执行DMVR过程。执行DMVR过程可以包括:确定正在被解码的当前视频块的一个或多个特征以及基于当前视频块的确定的一个或多个特征来确定用于针对当前视频块的DMVR过程的搜索区。
[0008]在另一示例中,设备可以被配置为对视频数据进行解码。该设备包括一个或多个处理器。一个或多个处理器被配置为:从经编码的比特流解码数据以生成运动矢量以及对运动矢量中的一个或多个执行DMVR过程。在执行DMVR过程中,一个或多个处理器可以被配置为:确定正在被解码的当前视频块的一个或多个特征以及基于当前视频块的确定的一个或多个特征来确定用于针对当前视频块的DMVR过程的搜索区。
[0009]在另一示例中,一种用于解码视频数据的设备可以包括:用于从经编码的比特流解码数据以生成运动矢量的部件以及用于对运动矢量中的一个或多个执行DMVR过程的部件。用于执行DMVR过程的部件可以包括:用于确定正在被解码的当前视频块的一个或多个特征的部件以及用于基于当前视频块的确定的一个或多个特征来确定用于针对当前视频块的DMVR过程的搜索区的部件。
[0010]在另一示例中,一种计算机可读存储介质可以存储指令。指令在被执行时使得视频解码设备的一个或多个处理器:从经编码的比特流解码数据以生成运动矢量;以及对运动矢量中的一个或多个执行DMVR过程。在执行DMVR过程中,指令可以使得一个或多个处理器:确定正在被解码的当前视频块的一个或多个特征;以及基于当前视频块的确定的一个或多个特征来确定用于针对当前视频块的DMVR过程的搜索区。
[0011]本文中描述了一些其他特征、方法和示例。在以下附图和描述中阐明了一个或多个示例的细节。根据说明书、附图和权利要求书,其他特征、目的和优势将是显而易见的。
附图说明
[0012]图1是示出可以执行本公开的技术的一种示例视频编码和解码系统的框图。
[0013]图2A和图2B是示出示例四叉树二叉树(QTBT)结构和对应的编解码树单元(CTU)的概念图。
[0014]图3是示出可以执行本公开的技术的一种示例视频编码器的框图。
[0015]图4是示出可以执行本公开的技术的一种示例视频解码器的框图。
[0016]图5A是示出在示例Merge模式中使用的空间相邻运动矢量(MV)候选的概念图。
[0017]图5B是示出在示例高级运动矢量预测(advancedmotion vectorprediction,AMVP)模式中使用的空间相邻MV候选的概念图。
[0018]图6A是示出可以被用于时间运动矢量预测(temporal motion vector prediction,TMVP)的时间运动矢量候选的概念图。
[0019]图6B是示出运动矢量缩放的概念图。
[0020]图7是示出初始运动矢量周围的搜索区(例如,搜索范围)内的模板匹配的概念图。
[0021]图8是示出使用其中MVD0和MVD1基于距正在被编解码的块的时间距离而成比例的双向匹配预测的示例的概念图。
[0022]图9是示出使用其中MVD0和MVD1被镜像而与距正在被编解码的块的时间距离无关的双向匹配预测的示例的概念图。
[0023]图10是示出在由搜索范围[

8,8]定义的示例搜索区中使用的示例3
×
3正方形搜
索样式(pattern)的概念图。
[0024]图11是示出解码器侧运动矢量细化(DMVR)的示例的概念图。
[0025]图12是示出具有不同成本函数(例如,由costFactor(Δhor,Δver)以增量MV(Δhor,Δver)定义的)的示例菱形搜索样式的概念图。
[0026]图13是示出具有不同成本函数(例如,由costFactor(Δhor,Δver)在增量MV(Δhor,Δver)处定义的)的示例正方形搜索样式的概念图。
[0027]图14是示出根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种解码视频数据的方法,所述方法包括:从经编码的比特流解码数据以生成运动矢量;以及对所述运动矢量中的一个或多个执行解码器侧运动矢量细化DMVR过程,其中,执行所述DMVR过程包括:确定正在被解码的当前视频块的一个或多个特征;以及基于所述当前视频块的所确定的一个或多个特征来确定用于针对所述当前视频块的所述DMVR过程的搜索区。2.根据权利要求1所述的方法,还包括:基于所述当前视频块的至少一个维度来确定用于针对所述当前视频块的所述DMVR过程的所述搜索区。3.根据权利要求2所述的方法,还包括:基于所述当前视频块的高度和宽度来确定用于针对所述当前视频块的所述DMVR过程的所述搜索区。4.根据权利要求3所述的方法,还包括:基于所述当前块的高度和宽度以及基于比例因子来确定用于所述DMVR过程的所述搜索区。5.根据权利要求4所述的方法,其中,所述比例因子被存储在所述解码器中,并且不在所述经编码的比特流中信令通知。6.根据权利要求4所述的方法,还包括:基于从所述经编码的比特流解码的一个或多个语法元素来导出所述比例因子。7.根据权利要求1所述的方法,其中,所述当前视频块是第一视频块,并且所述搜索区是第一搜索区,所述方法还包括:确定正在被解码的第二视频块的一个或多个特征;以及基于所述第二视频块的所确定的一个或多个特征来确定用于针对所述第二视频块的DMVR过程的第二搜索区,其中,所述第二搜索区具有至少一个与所述第一搜索区不同的维度。8.根据权利要求1所述的方法,还包括:基于与包括所述当前视频块的视频序列相关联的分辨率来确定用于所述DMVR过程的所述搜索区。9.根据权利要求1所述的方法,其中,所述DMVR过程包括:确定与用于所述DMVR过程的所述搜索区中的候选块相关联的成本因子和失真,其中,所述成本因子将所述搜索区中更接近所述搜索区的中心的一个或多个候选块相对于所述搜索区中更远离所述搜索区的中心的其他候选优先化。10.根据权利要求1所述的方法,其中,所述DMVR过程包括:在考虑所述搜索区中的全部候选块之前,在识别出与满足阈值的成本因子和失真相关联的可接受候选时,终止针对所述当前视频块的DMVR过程。11.根据权利要求1所述的方法,还包括:接收与用于所述DMVR过程的所述搜索区相关联的一个或多个语法元素;对所述一个或多个语法元素进行解码以定义一个或多个值;基于所述一个或多个值来确定所述搜索区的一个或多个维度;以及基于所述搜索区的所述一个或多个维度来确定所述搜索区。12.一种被配置为解码视频数据的设备,所述设备包括一个或多个处理器,所述一个或多个处理器被配置为:
从经编码的比特流解码数据以生成运动矢量;以及对所述运动矢量中的一个或多个执行解码器侧运动矢量细化DMVR过程,其中,在执行所述DMVR过程中,所述一个或多个处理器被配置为:确定正在被解码的当前视频块的一个或多个特征;以及基于所述当前视频块的所确定的一个或多个特征来确定用于针对所述当前视频块的所述DMVR过程的搜索区。13.根据权利要求12所述的设备,其中,所述一个或多个处理器还被配置为基于所述当前视频块的至少一个维度来确定用于针对所述当前视频块的所述DMVR过程的所述搜索区。14.根据权利要求13所述的设备,其中,所述一个或多个处理器还被配置为基于所述当前视频块的高度和宽度来确定...

【专利技术属性】
技术研发人员:张智CC
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1