用于帧间预测中的合并模式候选的全局运动制造技术

技术编号:32353164 阅读:11 留言:0更新日期:2022-02-20 03:00
一种解码器,其包括电路,该电路配置成:接收比特流;对于当前块使用比特流来确定合并模式被启用;构建合并候选列表,包括将全局运动矢量添加至运动矢量候选列表;以及使用运动矢量候选列表重构当前块的像素数据。还描述了相关的设备、系统、技术和制品。技术和制品。技术和制品。

【技术实现步骤摘要】
【国外来华专利技术】用于帧间预测中的合并模式候选的全局运动
[0001]相关申请的交叉引用
[0002]本申请要求于2019年4月25日提交的、题为“GLOBAL MOTION FOR MERGE MODE CANDIDATES IN INTER PREDICTION”的美国临时专利申请第62/838,618号的优先权的权益,该美国临时专利申请在此通过引用整体并入本文。


[0003]本专利技术总体上涉及视频压缩领域。特别地,本专利技术针对帧间预测中的合并模式候选的全局运动。

技术介绍

[0004]视频编码解码器可以包括对数字视频进行压缩或解压的电子电路或软件。视频编码解码器可以将未压缩视频转换为经压缩格式,或者可以将经压缩视频解压为未压缩格式。在视频压缩的情况下,对视频进行压缩(和/或执行其某些功能)的设备通常可以被称为编码器,对视频进行解压(和/或执行其某些功能)的设备可以被称为解码器。
[0005]经压缩数据的格式可以符合标准视频压缩规范。压缩可能是有损的,因为经压缩视频缺失源视频中存在的某些信息。随之而来的后果可能包括:由于没有充足的信息来准确地重构原始视频,因此经解压的视频质量可能低于原始未压缩的视频质量。
[0006]视频质量、用于表示视频的数据量(例如,由比特率决定)、编码算法和解码算法的复杂性、对数据丢失和错误的敏感性、便于编辑、随机访问、端到端延迟(例如,时延)等之间可能存在复杂的关系。
[0007]运动补偿可以包括下述方法:该方法在给定参考帧——比如先前帧和/或未来帧——的基础上通过将相机和/或视频中的对象的运动纳入考量来预测视频帧或视频帧的一部分。可以在对视频数据进行编码和解码以用于视频压缩中采用该方法,例如在使用运动图像专家组(MPEG)

2(也称为高级视频编码(AVC)和H.264)标准的编码和解码中采用。运动补偿可以根据参考图片至当前图片的变换来描述图片。参考图片可以是时间上先于当前图片的图片,也可以是与当前图片相比将来的照片。当可以从先前传输和/或存储的图像中准确地合成图像时,可以提高压缩效率。

技术实现思路

[0008]在一方面中,一种解码器包括电路,该电路配置成:接收比特流;对于当前块使用该比特流来确定合并模式被启用;构建合并候选列表,其中,构建合并候选列表还包括将全局运动矢量添加至运动矢量候选列表;以及使用所述运动矢量候选列表重构当前块的像素数据。
[0009]在另一方面中,一种方法包括:由解码器接收比特流;对于当前块使用该比特流来确定合并模式被启用;构建合并候选列表,其中,构建合并候选列表还包括将全局运动矢量添加至运动矢量候选列表;以及使用所述运动矢量候选列表重构当前块的像素数据。
[0010]在所附附图和以下描述中阐述了本文中描述的主题的一个或更多个变型的细节。从描述和附图以及从权利要求中,本文中描述的主题的其他特征和优点将是明显的。
附图说明
[0011]出于说明本专利技术的目的,附图示出了本专利技术的一个或更多个实施方式的方面。然而,应当理解的是,本专利技术不限于附图中所示的精确布置和手段,其中:
[0012]图1是图示了具有全局和局部运动的示例帧的运动矢量的示图;
[0013]图2图示了可以用于全局运动的三个示例运动模型,包括所述三个示例运动模型的索引值(0、1或2);
[0014]图3是根据当前主题的一些示例实现方式的过程流程图;
[0015]图4是根据当前主题的一些示例实现方式的示例解码器的系统框图;
[0016]图5是根据当前主题的一些示例实现方式的过程流程图;
[0017]图6是根据当前主题的一些示例实现方式的示例编码器的系统框图;以及
[0018]图7是计算系统的框图,该计算系统可以用于实施本文所公开方法的任一或多者及其任何一个或多个部分。
[0019]附图不一定按比例绘制,并且可以通过虚线、图解表示和局部视来图示。在某些情况下,可能已经省略了对于理解实施方式不是必需的或者使其他细节难以察觉的细节。各个图中相同的附图标记表示相同的元件。
具体实施方式
[0020]视频中的全局运动是指在整个帧中发生的运动。全局运动可能是由相机运动引起的;例如,相机摇摄和缩放会在帧中产生通常会影响整个帧的运动。视频的某些部分中存在的运动可以称为局部运动。局部运动可能由移动场景中的对象引起。例如,对象在场景中从左向右移动。视频可能包含局部运动和全局运动的组合。当前主题的一些实现方式可以提供将全局运动传送给解码器以及使用全局运动矢量来提高压缩效率的有效方法。
[0021]图1是图示了具有全局运动和局部运动的示例帧100的运动矢量的图。帧100可以包括被图示为方块的多个像素块以及与多个像素块相关联的被图示为箭头的运动矢量。带有指向左上方的箭头的方块(例如,像素块)表示这些块中的运动被视为全局运动,并且带有指向其他方向的箭头的方块(由104指示)表示这些块中的运动被视为局部运动。在图1的图示示例中,许多块具有相同的全局运动。在诸如图片参数集(PPS)和/或序列参数集(SPS)之类的标头中用信号发送全局运动,并且使用该用信号发送的全局运动可以减少块所需的运动矢量信息并且可以实现改进的预测。尽管出于说明性目的在下面描述的示例涉及的是在块级别确定和/或应用全局运动矢量或局部运动矢量,但可以为帧和/或图片的任何区域确定和/或应用全局运动矢量,所述任何区域包括:由多个块组成的区域;由任何几何形状界定的区域,比如但不限于由几何和/或指数编码定义的区域,其中界定形状的一条或更多条线和/或曲线可以是有角度和/或弯曲的;和/或整个帧和/或图片。尽管在本文中将发信号/用信号发送(signaling)描述为在帧级别和/或帧的标头和/或参数集中执行,但是发信号可以替代地或附加地在子图片级别执行,其中,子图片可以包括如上所述的帧和/或图片的任何区域。
[0022]作为示例,仍然参照图1,可以使用具有两个分量MVx、MVy的运动矢量(MV)来描述简单的平移运动,所述运动矢量描述当前帧中的块和/或像素的移位。可以使用仿射运动矢量来描述诸如旋转、缩放和/或扭曲之类的较复杂运动,其中,本公开中使用的“仿射运动矢量”,该矢量描述了在视频图片和/或图片中的一组像素或点所发生的均匀移位,比如图示的一组像素示出了在运动期间,一对象在视频中的视图上移动但其外观形状未改变。一些视频编码和/或解码方法可以使用四参数仿射模型或六参数仿射模型来进行帧间图片编码中的运动补偿。
[0023]进一步参照图1并且作为示例,六参数仿射运动可以描述为:
[0024]x

=ax+by+c
[0025]y

=dx+ey+f
[0026]四参数仿射运动可以描述为:
[0027]x

=ax+by+c
[0028]y



bx+ay+f
[0029]其中,(x,y)和(x
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种解码器,所述解码器包括电路,所述电路配置成:接收比特流;对于当前块使用所述比特流来确定合并模式被启用;构建合并候选列表,其中,构建所述合并候选列表还包括将全局运动矢量添加至运动矢量候选列表;以及使用所述运动矢量候选列表重构所述当前块的像素数据。2.根据权利要求1所述的解码器,其中,所述全局运动矢量包括预定义的全局运动模型类型。3.根据权利要求1所述的解码器,其中,所述全局运动矢量包括控制点运动矢量。4.根据权利要求3所述的解码器,其中,所述控制点运动矢量是平移运动矢量。5.根据权利要求3所述的解码器,其中,所述控制点运动矢量是四参数仿射运动模型的矢量。6.根据权利要求3所述的解码器,其中,所述控制点运动矢量是六参数仿射运动模型的矢量。7.根据权利要求1所述的解码器,还包括:熵解码器处理器,所述熵解码器处理器配置成接收所述比特流并将所述比特流解码为量化系数;逆量化和逆变换处理器,所述逆量化和逆变换处理器配置成处理所述量化系数,包括执行逆离散余弦;解块过滤器;帧缓冲器;以及帧内预测处理器。8.根据权利要求1所述的解码器,其中,所述当前块形成四叉树加二叉决策树的一部分。9.根据权利要求1所述的解码器,其中,所述当前块是编码树单元。10.根据权利要求1所述的解码器,其中,所述当前块是编码单元。11.根据权利要求1所述的解码器,其中,所述当前块是预测单元。12.根据权利要求1所述的解码器,其中,所述全局运动矢量的全局运动模型包括平移运动。13.根据权利要求1所述的解码器,其中,所述全局运动矢量的全局运动模型包括仿射运动。14.根据权利要求9所述的解码器,其中,所述全局运动模型的特征在于所述比特流的标头,所述标头包括图片参数集。15.根据权利要求9所述的解码器,其中,所述全局运动模型的特征在于所述比特流的标头,所述标头包括序列参数集。16.一种方法,所述...

【专利技术属性】
技术研发人员:H
申请(专利权)人:OP方案有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1