视频编解码的方法及装置制造方法及图纸

技术编号:31564494 阅读:18 留言:0更新日期:2021-12-25 10:51
本公开的各方面提供视频编码/解码的方法和装置。在一些示例中,视频解码的装置包括处理电路。处理电路可以对的系数块的编码信息进行解码,所述系数块来自已编码视频码流。编码信息可以指示系数块的大小。处理电路可以基于系数块的大小,确定要对系数块的变换系数执行主逆变换中的水平逆变换和垂直逆变换的顺序,以获得残差块的残差数据。当系数块的大小满足条件时,在对系数块的变换系数执行水平逆变换之后执行垂直逆变换。处理电路可以基于残差数据来重建残差块中的样本。据来重建残差块中的样本。据来重建残差块中的样本。

【技术实现步骤摘要】
【国外来华专利技术】视频编解码的方法及装置
[0001]交叉引用
[0002]本申请要求于2020年3月6日提交的美国专利申请第16/812,000号,“视频编解码的方法及装置(Method and Apparatus for Video Coding)”的优先权,该申请要求于2019年3月9日提交的美国临时申请第62/816,124号,“自适应变换系数零输出(Adaptive Transform Coefficient Zero

Out)”的优先权。这些在先申请的全部内容通过引用结合到本文中。


[0003]本申请描述总体上涉及视频编解码的实施例。

技术介绍

[0004]本文所提供的背景描述旨在整体呈现本申请的背景。在
技术介绍
部分以及本说明书的各个方面中所描述的目前已署名的专利技术人的工作所进行的程度,并不表明其在本申请提交时作为现有技术,且从未明示或暗示其被承认为本申请的现有技术。
[0005]通过具有运动补偿的帧间图片预测技术,可以进行视频编码和解码。未压缩的数字视频可包括一系列图片,每个图片具有例如1920
×
1080亮度样本及相关色度样本的空间维度。所述系列图片具有固定的或可变的图片速率(也非正式地称为帧率),例如每秒60个图片或60Hz。未压缩的视频具有非常大的比特率要求。例如,每个样本8比特的1080p60 4:2:0的视频(1920x1080亮度样本分辨率,60Hz帧率)要求接近1.5Gbit/s带宽。一小时这样的视频就需要超过600GB的存储空间。
[0006]视频编码和解码的一个目的,是通过压缩减少输入视频信号的冗余信息。视频压缩可以帮助降低对上述带宽或存储空间的要求,在某些情况下可降低两个或更多数量级。无损和有损压缩,以及两者的组合均可采用。无损压缩是指从压缩的原始信号中重建原始信号精确副本的技术。当使用有损压缩时,重建信号可能与原始信号不完全相同,但是原始信号和重建信号之间的失真足够小,使得重建信号可用于预期应用。有损压缩广泛应用于视频。容许的失真量取决于应用。例如,相比于电视应用的用户,某些消费流媒体应用的用户可以容忍更高的失真。可实现的压缩比反映出:较高的允许/容许失真可产生较高的压缩比。
[0007]视频编码器和解码器可利用几大类技术,例如包括:运动补偿、变换、量化和熵编码。
[0008]视频编解码器技术可包括已知的帧内编码技术。在帧内编码中,在不参考先前重建的参考图片的样本或其它数据的情况下表示样本值。在一些视频编解码器中,图片在空间上被细分为样本块。当所有的样本块都以帧内模式编码时,该图片可以为帧内图片。帧内图片及其衍生(例如独立解码器刷新图片)可用于复位解码器状态,并且因此可用作编码视频比特流和视频会话中的第一图片,或用作静止图像。帧内块的样本可用于变换,且可在熵编码之前量化变换系数。帧内预测可以是使预变换域中的样本值最小化的技术。在某些情
形下,变换后的DC值越小,且AC系数越小,则在给定的量化步长尺寸下需要越少的比特来表示熵编码之后的块。
[0009]如同从诸如MPEG

2代编码技术中所获知的,传统帧内编码不使用帧内预测。然而,一些较新的视频压缩技术包括:试图从例如周围样本数据和/或元数据中得到数据块的技术,其中周围样本数据和/或元数据是在空间相邻的编码/解码期间、且在解码顺序之前获得的。这种技术后来被称为"帧内预测"技术。需要注意的是,至少在某些情形下,帧内预测仅使用正在重建的当前图片的参考数据,而不使用参考图片的参考数据。
[0010]可以存在许多不同形式的帧内预测。当在给定的视频编码技术中可以使用超过一种这样的技术时,所使用的技术可以按帧内预测模式进行编码。在某些情形下,模式可具有子模式和/或参数,且这些模式可单独编码或包含在模式码字中。将哪个码字用于给定模式/子模式/参数组合会通过帧内预测影响编码效率增益,因此用于将码字转换成比特流的熵编码技术也会出现这种情况。
[0011]H.264引入了一种帧内预测模式,其在H.265中进行了改进,且在诸如被称为联合探索模型(JEM,joint exploration model)/下一代视频编码(VVC,versatile video coding)/基准集合(BMS,benchmark set)的更新的编码技术中进一步被改进。通过使用属于已经可用的样本的相邻样本值可以形成预测块。在一些示例中,将相邻样本的样本值按照某一方向复制到预测块中。对所使用方向的引用可以被编码在比特流中,或者本身可以被预测。
[0012]参照图1A,右下方描绘了来自H.265的33个可能的预测方向(对应于35种帧内模式的33个角度模式)中已知的九个预测方向的子集合。箭头会聚的点(101)表示正在被预测的样本。箭头表示样本正在被预测的方向。例如,箭头(102)表示根据右上方与水平方向成45度角的一个或多个样本,预测样本(101)。类似地,箭头(103)表示根据左下方与水平方向成22.5度角的一个或多个样本,预测样本(101)。
[0013]仍然参考图1A,在左上方示出了一个包括4
×
4个样本的正方形块(104)(由粗虚线表示)。正方形块(104)包括16个样本,每个样本用“S”、以及其在Y维度上的位置(例如,行索引)和在X纬度上的位置(例如,列索引)来标记。例如,样本S21是Y维度上的第二个样本(从顶部开始)和X维度上的第一个(从左侧开始)样本。类似地,样本S44在X维度和Y维度上都是块(104)中的第四个样本。由于该块为4
×
4大小的样本,因此S44位于右下角。还示出了遵循类似编号方案的参考样本。参考样本用"R"、以及其相对于块(104)的Y位置(例如,行索引)和X位置(例如,列索引)来标记。在H.264与H.265中,预测样本与正在重建的块相邻,因此不需要使用负值。
[0014]通过从信号通知的预测方向所占用的相邻样本来复制参考样本值,可以进行帧内图片预测。例如,假设编码视频比特流包括信令,对于该块,该信令指示与箭头(102)一致的预测方向,即,根据右上方与水平方向成45度角的一个或多个预测样本来预测样本。在这种情况下,根据同一参考样本R05,预测样本S41、S32、S23和S14。根据参考样本R08,预测样本S44。
[0015]在某些情况下,例如通过内插,可以合并多个参考样本的值,以便计算参考样本,尤其是当方向不能被45度整除时。
[0016]随着视频编码技术的发展,可能的方向的数量已经增加了。在H.264(2003年)中,
可以表示九种不同的方向。在H.265(2013年)和JEM/VVC/BMS中增加到了33个,而在此申请时,可以支持多达65个方向。已经进行了实验来识别最可能的方向,并且熵编码中的某些技术被用于使用少量比特来表示那些可能的方向,对于较不可能的方向则接受某些代价。此外,有时可以根据在相邻的、已经解码的块中所使用的相邻方向来预测方向本身。
[0017]图1B示出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种在解码器中进行视频解码的方法,其特征在于,包括:对系数块的编码信息进行解码,所述系数块来自已编码视频码流,所述编码信息指示所述系数块的大小;基于所述系数块的所述大小,确定要对所述系数块的变换系数执行主逆变换中的水平逆变换和垂直逆变换的顺序,以获得残差块的残差数据,其中,当所述系数块的所述大小满足条件时,在对所述系数块的所述变换系数执行所述水平逆变换之后执行所述垂直逆变换;以及基于所述残差数据来重建所述残差块中的样本。2.根据权利要求1所述的方法,其特征在于,所述条件包括所述系数块的所述大小为32
×
64。3.根据权利要求1所述的方法,其特征在于,所述条件包括M
×
N的所述系数块的高度N大于所述系数块的宽度M。4.根据权利要求1所述的方法,其特征在于:所述系数块的所述大小为M
×
N,M和N是正整数;所述残差块中m
×
n区域内的第一残差数据将通过所述主逆变换进行计算,并且所述残差块中所述m
×
n区域外的第二残差数据将不通过所述主逆变换进行计算,m小于或等于M,并且n小于或等于N;并且所述条件包括比率m/M大于或等于比率n/N。5.一种在解码器中进行视频解码的方法,其特征在于,包括:对系数块的编码信息进行解码,所述系数块来自已编码视频码流,所述编码信息指示所述系数块的大小;基于所述系数块的所述大小,确定是否减少主逆变换中的水平逆变换和垂直逆变换其中之一的计算次数,所述垂直逆变换将所述系数块的变换系数变换成中间块的中间数据,所述水平逆变换将所述中间数据变换成残差块中的残差数据;执行所述主逆变换,包括:当确定减少所述垂直逆变换中的所述计算次数时,通过所述垂直逆变换计算所述中间块中的顶部16行的所述中间数据,且所述中间块中的剩余中间数据为零;并且当确定减少所述水平逆变换中的所述计算次数时,通过所述水平逆变换计算所述残差块中的左侧16列的所述残差数据,且所述残差块中的剩余残差数据为零;以及基于所述残差数据来重建所述残差块中的样本。6.根据权利要求5所述的方法,其特征在于:所述系数块的所述大小为32
×
64;所述水平逆变换和垂直逆变换之一是所述垂直逆变换;所述确定包括:当所述系数块的所述大小为32
×
64时,确定减少所述垂直逆变换中的所述计算次数;并且所述执行所述主逆变换包括执行所述主逆变换,通过所述垂直逆变换计算所述中间块中的所述顶部16行的中间数据,并且所述中间块中的所述剩余中间数据为零。7.根据权利要求5所述的方法,其特征在于:所述系数块的所述大小为32
×
64;
所述水平逆变换和垂直逆变换之一是所述水平逆变换;所述确定包括:当所述系数块的所述大小为32
×
64时,确定减少所述水平逆变换中的所述计算次数;并且所述执行所述主逆变换包括执行所述主逆变换,通过所述水平逆变换计算所述残差块中的所述左侧16列残差数据,并且所述残差块中的所述剩余残差数据为零。8.根据权利要求5所述的方法,其特征在于:所述系数块的所述大小为32
×
32;所述水平逆变换和垂直逆变换之一是所述水平逆变换;所述确定包括:当所述系数块的所述大小为32
×
32时,确定减少所述水平逆变换中的所述计算次数;并且所述执行所述主逆变换包括执行所述主逆变换,通过所述水平逆变换计算所述残差块中的所述左侧16列残差数据,所述残差块中的所述剩余残差数据为零,并且通过所述垂直逆变换计算所述中间块中的所述中间数据。9.根据权利要求5所述的方法,其特征在于:所述系数块的所述大小为32
×
32;所述水平逆变换和垂直逆变换之一是所述垂直逆变换;所述确定包括:当所述系数块的所述大小为32
×
32时,确定减少所述垂直逆变换中的所述计算次数;并且所述执行所述主逆变换包括执行所述主逆变换,通过所述垂直逆变换计算所述中间块中的所述顶部16行的中间数据,所述中间块中的所述剩余中间数据为零,并且通过所述水平逆变换计算所述残差块中的所述残差数据。10.一种视频解码的装置,其特征在于,包括处理电...

【专利技术属性】
技术研发人员:赵欣李翔刘杉
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1