视频编码系统和方法中的编码块位流结构和语法技术方案

技术编号:23194291 阅读:36 留言:0更新日期:2020-01-24 17:26
本文中提供了一种用于对表示视频帧序列中的未编码视频帧的系数阵列编码以生成未编码视频帧的编码位流表示的系统和方法。系数阵列可以具有多个系数行和多个系数列,未编码视频帧的编码位流表示可以至少包括头和视频数据载荷。由此,系数阵列可以被分离成编码块阵列;每个编码块阵列可以被置于编码条中,每个编码条可以被置于编码条组中。然后系数阵列可以被编码使得:编码块的系数使用仅从同一编码条组中的其它系数获得的信息进行编码,并且视频数据载荷中与编码条对应的第一视频数据载荷部分的长度是整数个字节。

Bitstream structure and syntax in video coding systems and methods

【技术实现步骤摘要】
【国外来华专利技术】视频编码系统和方法中的编码块位流结构和语法相关申请的交叉引用本申请是先前于2015年3月31日提交的题为“MotionVectorSelectionandPredictioninVideoCodingSystemsandMethods(视频编码系统和方法中的运动矢量选择和预测)”(代理人案卷号REAL-2015693)的第PCT/CN2015/075599号PCT申请的部分继续申请,该申请的全部公开内容在此并入本文用于所有目的。
本公开涉及视频信号的编码和解码,更具体地,涉及选择用于视频序列帧的预测运动矢量。
技术介绍
诸如数字图像、语音/音频、图形和视频等的数字多媒体的出现大大改善了各种应用并且开放了全新的应用,因为它能相对容易地实现可靠的存储、通信、传输和搜索及访问内容。数字多媒体的应用很多,包括娱乐、信息、医药和安全,并以多种方式使社会受益。多媒体数据在初始由诸如相机和麦克风的传感器捕获时可能是模拟的,随后例如经由常规脉冲编码调制(PCM)过程被数字化。此过程可以创建大量的数字数据。因此,大量数字多媒体内容的高效传送、存储和/或传输需要将数字多媒体从其原始PCM形式压缩成压缩表示。已经开发了许多用于压缩多媒体的技术。多年来,视频压缩技术已经变得非常复杂,它们经常可以实现10到100之间的高压缩因子,同时保持通常类似于未压缩的数字视频的高度的心理视觉质量。虽然迄今为止,视频压缩技术和科学方面取得了巨大的进步(表现为大量标准团体驱动的视频编码标准,诸如MPEG-1、MPEG-2、H.263、MPEG-4第2部分、MPEG-4AVC/H.264、MPEG-4SVC和MVC、以及业界驱动的专有标准,诸如WindowsMediaVideo,RealVideo,On2VP等),但是消费者对更高品质、更高清晰度越来越渴望且现在的3D(立体声)视频(无论何时何地都能“点播”访问)必须通过诸如DVD/BD等的各种手段通过空中广播、线缆/卫星、有线和移动网络传送到一系列客户端装置,例如PC/笔记本电脑、TV、机顶盒、游戏机、便携式媒体播放器/装置、智能手机和可佩带式计算装置,从而更加需要更高级别的视频压缩。许多视频压缩技术利用一般的帧间预测编码框架,其涉及通过补偿视频帧之间的运动来减少时间冗余。基本概念是通过使用块匹配方法去除相邻图片之间的时间依赖性。在编码过程开始时,未编码的视频序列的每一帧被分组成下列三种类型之一:I型帧、P型帧和B型帧。I型帧被帧内编码。也就是说,仅使用来自帧本身的信息来对图片进行编码,并且不使用帧间运动补偿技术(尽管可以应用帧内运动补偿技术)。使用帧间运动补偿技术对其它两种类型即P型和B型的帧进行编码。P图片与B图片之间的差异是用于运动补偿的参考图片的时间方向。P型图片利用来自先前图片的按显示顺序的信息,而B型图片可以利用来自先前和未来图片的按显示顺序的信息。对于P型帧和B型帧,每个帧被划分成由每个像素的亮度和色度分量的系数表示的像素块,并且为每个块获得一个或多个运动矢量(因为B型图片可以利用来自未来和过去编码帧的信息,所以可以为每个块编码2个运动矢量)。运动矢量(MV)表示从当前块的位置到另一先前编码的帧(其可以是按显示顺序的过去帧或未来帧)中的相似块(分别被称为参考块和参考帧)的位置的空间位移。计算参考块与当前块之间的差异以生成残差(也称为“残差信号”)。因此,对于帧间编码帧的每个块,仅需要对残差和运动矢量进行编码,而不是对块的整体内容进行编码。通过去除视频序列的帧之间的这种时间冗余,可以压缩视频序列。为了进一步压缩视频数据,在应用帧间或帧内预测技术之后,经常将残差信号的系数从空间域变换到频域(例如使用离散余弦变换(“DCT”)或离散正弦变换(“DST”))。对于自然发生的图像,例如通常构成人类可感知的视频序列的图像的类型,低频能量总是比高频能量强。因此,频域中的残差信号比在空间域中得到更好的能量压缩。在正向变换之后,系数和运动矢量可以被量化和熵编码。在解码器侧,应用逆向量化和逆向变换来恢复空间残差信号。这些是所有视频压缩标准中的典型变换/量化过程。然后可以执行反向预测过程以生成原始未编码视频序列的重新创建的版本。在某些常规压缩技术中,编码中使用的块通常是16×16像素(在许多视频编码标准中称为宏块)。然而,由于这些标准的发展,帧大小越来越大,并且许多装置已经获得了比“高清”(或“HD”)帧大小更高的显示能力,例如2048×1530像素。因此,可能需要更大的块来高效地编码这些帧大小(例如,64×64像素)的运动矢量。然而,由于分辨率的相应提高,还可能需要能够执行例如4×4像素的较小规模的运动预测和变换。随着运动预测分辨率的提高,对于每个帧以及由此对于整个视频序列,编码和传输运动矢量所需的带宽量都是增大是。附图说明图1示出了根据至少一个实施方式的示例性视频编码/解码系统。图2示出了根据至少一个实施方式的示例性编码装置的若干组件。图3示出了根据至少一个实施方式的示例性解码装置的若干组件。图4示出了根据至少一个实施方式的示例性视频编码器的框图。图5示出了根据至少一个实施方式的示例性并行视频编码器的框图。图6a至图6h是根据至少一个实施方式的由图5的示例性并行编码器编码的视频帧的各个方面的概念图示。图7是根据至少一个实施方式的表示图6a至图6h的视频帧的编码位流的各个方面的概念图示。图8是根据至少一个实施方式的表示编码的视频帧的编码位流的各个方面的概念图示。图9示出了根据至少一个实施方式的示例性视频解码器的框图。图10示出了根据至少一个实施方式的示例性并行视频解码器的框图。图11a至图11e是根据至少一个实施方式的由图10的示例性并行解码器解码的视频帧的各个方面的概念图示。具体实施方式下面的详细描述主要在常规计算机组件的操作的过程和符号表示方面表示,常规计算机组件包括处理器、用于处理器的存储器存储装置、连接的显示装置和输入装置。此外,这些过程和操作可以利用异构分布式计算环境中的常规计算机组件,包括远程文件服务器、计算机服务器和存储器存储装置。这些常规分布式计算组件中的每个可由处理器经由通信网络访问。短语“在一个实施方式中”、“在至少一个实施方式中”、“在各种实施方式中”、“在一些实施方式中”等在本文中可以重复使用。这样的短语不一定指代同一实施方式。术语“包括”、“具有”和“包含”是同义的,除非上下文另有规定。在上文总体上描述的典型“混合”视频编码方法的上下文中描述各种实施方式,因为它使用图片间/图片内预测和变换编码。现在详细参考附图中所示的实施方式的描述。虽然结合附图和相关描述描述了实施方式,但是本领域普通技术人员将理解,在不偏离本公开的范围的情况下,替代和/或等效的实现可以代替所显示和所描述的特定实施方式,包含所有替代、修改和等同,不管是否明确地说明和/或描述。在各种替代的实施方式中,附加装置或所示装置的组合可以被添本文档来自技高网...

【技术保护点】
1.一种用于对视频帧序列中的未编码视频帧编码以生成所述未编码视频帧的编码位流表示的方法,所述编码位流至少包括头部和视频数据载荷部分,所述方法包括:/n将所述未编码视频帧划分成预测块阵列,所述预测块阵列具有多个行和多个列并包括第一预测块,所述第一预测块位于所述多个行中的第一行且位于所述多个列中的第一列;/n获得所述第一预测块的有序的运动矢量候选项列表;/n从所述有序的运动矢量候选项列表中选择用于对所述第一预测块编码的运动矢量;/n使用所述运动矢量对所述第一预测块编码以生成所述编码位流的所述视频数据载荷的一部分;以及/n在所述编码位流的所述头部中提供运动矢量选择标志,其中所述运动矢量选择标志指示所述有序的运动矢量候选项列表中与所述运动矢量对应的位置。/n

【技术特征摘要】
【国外来华专利技术】1.一种用于对视频帧序列中的未编码视频帧编码以生成所述未编码视频帧的编码位流表示的方法,所述编码位流至少包括头部和视频数据载荷部分,所述方法包括:
将所述未编码视频帧划分成预测块阵列,所述预测块阵列具有多个行和多个列并包括第一预测块,所述第一预测块位于所述多个行中的第一行且位于所述多个列中的第一列;
获得所述第一预测块的有序的运动矢量候选项列表;
从所述有序的运动矢量候选项列表中选择用于对所述第一预测块编码的运动矢量;
使用所述运动矢量对所述第一预测块编码以生成所述编码位流的所述视频数据载荷的一部分;以及
在所述编码位流的所述头部中提供运动矢量选择标志,其中所述运动矢量选择标志指示所述有序的运动矢量候选项列表中与所述运动矢量对应的位置。


2.如权利要求1所述的方法,其中所述有序的运动矢量候选项列表按顺序包括:
先前在对所述预测块阵列中的第一参考预测块编码时使用的第一运动矢量;
先前在对所述预测块阵列中的第二参考预测块编码时使用的第二运动矢量;以及
先前在对所述预测块阵列中的第三参考预测块编码时使用的第三运动矢量。


3.如权利要求2所述的方法,其中:
所述第一参考预测块位于所述多个行中的第二行和所述第一列,所述第二行与所述第一行相邻;
所述第二参考预测块位于所述第二行和所述多个列中的第二列,所述第二列与所述第一列相邻;以及
所述第一参考预测块位于所述第一行和所述多个列中的第三列,所述第三列与所述第一列相邻。


4.如权利要求1所述的方法,其中所述有序的运动矢量候选项列表按顺序包括:
先前在对所述预测块阵列中的第一参考预测块编码时使用的第一运动矢量;
先前在对所述预测块阵列中的第二参考预测块编码时使用的第二运动矢量;以及
零值运动矢量。


5.如权利要求4所述的方法,其中:
所述第一参考预测块位于所述多个行的第二行和所述第一列,所述第二行与所述第一行相邻;以及
所述第二参考预测块位于所述第二行和所述多个列的第二列,所述第二列与所述第一列相邻。


6.如权利要求4所述的方法,其中:
所述第一参考预测块位于所述多个行中的第二行和所述第一列,所述第二行与所述第一行相邻;以及
所述第二参考预测块位于所述第一行和所述多个列中的第二列,所述第二列与所述第一列相邻。


7.如权利要求4所述的方法,其中:
所述第一参考预测块位于所述多个行中的第二行和所述多个列中的第二列,所述第二行与所述第一行相邻,所述第二列与所述第一列相邻;以及
所述第二参考预测块位于所述第一行和所述多个列中的第三列,所述第三列与所述第一列相邻。


8.如权利要求1所述的方法,其中所述有序的运动矢量候选项列表按顺序包括:
先前在对所述预测块阵列中的第一参考预测块编码时使用的第一运动矢量;
第一零值运动矢量;以及
第二零值运动矢量。


9.如权利要求8所述的方法,其中所述第一参考预测块位于所述多个行中的第二行和所述第一列,所述第二行与所述第一行相邻。


10.如权利要求8所述的方法,其中所述第一参考预测块位于所述多个行中的第二行和所述多个列中的第二列,所述第二行与所述第一行相邻,所述第二列与所述第一列相邻。


11.如权利要求8所述的方法,其中所述第一参考预测块位于所述第一行和所述多个列中的第二列,所述第二列与所述第一列相邻。


12.如权利要求1所述的方法,其中有序的运动矢量候选项列表按顺序包括:
第一零值运动矢量;
第二零值运动矢量;以及
第三零值运动矢量。


13.如权利要求1所述的方法,其中使用所述运动矢量对所述第一预测块编码包括:
使用所述运动矢量识别所述视频帧序列中的先前编码的帧的第二预测块;
获得所述第一预测块与所述第二预测块之间的残差;以及
对所述残差编码以生成所述编码位流的所述视频数据载荷的所述一部分。


14.如权利要求1所述的方法,其中使用所述运动矢量对所述第一预测块编码包括:
使用所述运动矢量识别所述视频帧序列中的先前编码的帧的第二预测块;以及
对所述第二预测块编码以生成所述编码位流的所述视频数据载...

【专利技术属性】
技术研发人员:况超刘晓波蔡家扬
申请(专利权)人:真实网络公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利