基于子层输出层集的推导方法技术

技术编号:32027215 阅读:39 留言:0更新日期:2022-01-22 18:58
一种对已编码视频序列进行解码的方法和系统包括:获得已编码视频序列,以及对该已编码视频序列进行解码。该已编码视频序列中的视频编码层VCL网络抽象层NAL单元的时间子层标识符的值,被限制为小于或等于所述视频编码层VCL网络抽象层NAL单元所参考的视频参数集VPS中的vps_max_sublayers_minus1的值,所述vps_max_sublosons_minus1的值指示时间子层的最大数量,所述时间子层能够存在于参考所述视频参数集VPS的每个已编码视频序列中的层中。参数集VPS的每个已编码视频序列中的层中。

【技术实现步骤摘要】
【国外来华专利技术】基于子层输出层集的推导方法
[0001]交叉引用
[0002]本申请根据35U.S.C.
§
119要求于2020年3月27日向美国专利商标局提交的美国临时申请第63/000,980号以及于2020年11月13日向其提交的美国申请第17/097,636号的优先权,其公开内容通过引用结合在本申请中。


[0003]所公开的主题涉及视频编码和解码,并且更具体地,涉及具有多个层的已编码视频码流中的输出层推导。

技术介绍

[0004]使用具有运动补偿的图片间预测的视频编码和解码已经被熟知了几十年。未压缩数字视频可以由一系列图片组成,每个图片具有例如1920
×
1080个亮度样本和相关联的色度样本的空间维度。系列图片可以具有固定或可变的图片速率(也被非正式地称为帧速率),例如每秒60个图片或60Hz。未压缩视频具有显著的比特率要求。例如,每采样8比特的1080p60 4:2:0视频(60Hz帧速率的1920
×
1080亮度采样分辨率)需要接近1.5Gbit/s带宽。一个小时的这种视频需要超过600千兆字节的存储空间。
[0005]视频编码和解码的一个目的可以是通过压缩来减少输入视频信号中的冗余。压缩可以帮助减少前述带宽或存储空间要求,在一些情况下减少两个数量级或更多。可以采用无损压缩和有损压缩,以及它们的组合。无损压缩是指可以从压缩的原始信号重建原始信号的精确副本的技术。当使用有损压缩时,重建信号可能与原始信号不同,但是原始信号和重建信号之间的失真足够小,使得重建信号可用于预期应用。在视频的情况下,广泛采用有损压缩。容许的失真量取决于应用;例如,某些消费流式应用的用户可以容忍比电视分发应用的用户更高的失真。可实现的压缩比可以反映出:较高的允许/容许失真可以产生较高的压缩比。
[0006]视频编码器和解码器可以利用来自若干广泛类别的技术,包括例如运动补偿、变换、量化及熵编码,下文将介绍其中的一些技术。
[0007]历史上,视频编码器和解码器倾向于对给定图片大小进行操作,在大多数情况下,该给定图片大小是针对已编码视频序列(CVS coded video sequence,)、图片组(GOP,Group of Picture)或类似的多图片时间帧而定义并且保持恒定的。例如,在MPEG

2中,已知系统设计根据例如场景活动的因素来改变水平分辨率(并且因此改变图片大小),但是仅在I图片处改变水平分辨率,因此通常用于GOP。在CVS内使用不同分辨率的参考图片的重采样例如从ITU

T Rec.H.263附录PP已熟知。然而,这里的图片大小没有改变,仅参考图片被重采样,潜在地导致仅部分图片画布被使用(在下采样的情况下),或者仅部分场景被采集(在上采样的情况下)。进一步地,H.263附录Q允许以因子2(在每个维度中)向上或向下重采样单个宏块。同样,图片大小保持相同。宏块的大小在H.263中是固定的,并且因此不需要用信号通知。
[0008]预测图片中图片大小的变化在现代视频编解码中变得更加主流。例如,VP9允许参考图片重采样和整个图像的分辨率的改变。类似地,针对VVC提出了某些建议(包括例如Hendry等人的“关于VVC的自适应分辨率改变(On adaptive resolution change(ARC)for VVC)”联合视频小组文件JVET

M0135

v1,2019年1月9

19日,其全文并入本文中)允许将整个参考图片重采样到不同的更高或更低分辨率。在该文献中,建议将不同的候选分辨率编码在序列参数集中,并且由图片参数集中的每图片语法元素来参考。

技术实现思路

[0009]本公开为用于视频码流中的自适应图片大小的信令。
[0010]一种由至少一个处理器执行的对已编码视频序列进行解码的方法,包括:获得所述已编码视频序列;以及对所述已编码视频序列进行解码,其中,所述已编码视频序列中的视频编码层VCL网络抽象层NAL单元的时间子层标识符的值,被限制为小于或等于所述视频编码层VCL网络抽象层NAL单元所参考的视频参数集VPS中的vps_max_sublayers_minus1的值,所述vps_max_sublosons_minus1的值指示时间子层的最大数量,所述时间子层能够存在于参考所述视频参数集VPS的每个已编码视频序列中的层中。
[0011]在一些实施例中,max_tid_il_ref_pics_plus1[i]的值为零,指示第i层的非帧内随机存取点IRAP图片没有使用层间预测。
[0012]在一些实施例中,max_tid_il_ref_pics_plus1[i]的值大于零指示,为了对所述第i层的图片进行解码,不使用时间子层标识符大于max_tid_il_ref_pics_plus1[i]‑
1的图片作为层间参考图片ILRP。
[0013]在一些实施例中,当不存在时,推断max_tid_il_ref_pics_plus1[i]的值等于vps_max_sublayers_minus1+1。
[0014]在一些实施例中,max_tid_il_ref_pics_plus1[i]被限制为小于或等于vps_max_sublayers_minus1+1。
[0015]在一些实施例中,逐子层输出层集合被限制为不为独立层导出。
[0016]在一些实施例中,第一变量NumSubLayersInLayerInOLS[i][j]指示第i个OLS中的第j层中的子层的数量,其中,第二变量OutputLayerIdInOls[i][j]指示所述第i个OLS中的第j个输出层的nuh_layer_id值,其中,第三变量LayerUsedAsOutputLayerFlag[k]指示第k层是否用作至少一个OLS中的输出层,并且其中,所述第一变量、所述第二变量和所述第三变量是从变量max_tid_il_ref_pics_plus1[i]的值推导出的。
[0017]在一些实施例中,max_tid_il_ref_pics_plus1和layerIncludedInOlsFlag被限制为不为独立层导出。
[0018]一种对已编码视频序列进行解码的示例性设备,包括至少一个存储器,被配置为存储程序代码;以及至少一个处理器,被配置为读取所述程序代码并且如所述程序代码所指示地操作,所述程序代码包括:获得代码,被配置为使所述至少一个处理器获得所述已编码视频序列;以及解码代码,被配置为使所述至少一个处理器对所述已编码视频序列进行解码,其中,所述已编码视频序列中的视频编码层VCL网络抽象层NAL单元的时间子层标识符的值被限制为小于或等于所述视频编码层VCL网络抽象层NAL单元所参考的视频参数集VPS中的vps_max_sublayers_minus1的值,所述vps_max_sublosons_minus1的值指示时间
子层的最大数量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由至少一个处理器执行的对已编码视频序列进行解码的方法,其特征在于,所述方法包括:获得所述已编码视频序列;以及对所述已编码视频序列进行解码,其中,所述已编码视频序列中的视频编码层VCL网络抽象层NAL单元的时间子层标识符的值,被限制为小于或等于所述视频编码层VCL网络抽象层NAL单元所参考的视频参数集VPS中的vps_max_sublayers_minus1的值,所述vps_max_sublosons_minus1的值指示时间子层的最大数量,所述时间子层能够存在于参考所述视频参数集VPS的每个已编码视频序列中的层中。2.根据权利要求1所述的方法,其特征在于,max_tid_il_ref_pics_plus1[i]的值为零,指示第i层的非帧内随机存取点IRAP图片没有使用层间预测。3.根据权利要求1所述的方法,其特征在于,max_tid_il_ref_pics_plus1[i]的值大于零指示,为了对所述第i层的图片进行解码,不使用时间子层标识符大于max_tid_il_ref_pics_plus1[i]

1的图片作为层间参考图片ILRP。4.根据权利要求1所述的方法,其特征在于,当不存在时,推断max_tid_il_ref_pics_plus1[i]的值等于vps_max_sublayers_minus1+1。5.根据权利要求1所述的方法,其特征在于,max_tid_il_ref_pics_plus1[i]被限制为小于或等于vps_max_sublayers_minus1+1。6.根据权利要求1所述的方法,其特征在于,逐子层输出层集合被限制为不为独立层导出。7.根据权利要求6所述的方法,其特征在于,第一变量NumSubLayersInLayerInOLS[i][j]指示第i个OLS中的第j层中的子层的数量,其中,第二变量OutputLayerIdInOls[i][j]指示所述第i个OLS中的第j个输出层的nuh_layer_id值,其中,第三变量LayerUsedAsOutputLayerFlag[k]指示第k层是否用作至少一个OLS中的输出层,并且其中,所述第一变量、所述第二变量和所述第三变量是从变量max_tid_il_ref_pics_plus1[i]的值推导出的。8.根据权利要求6所述的方法,其特征在于,max_tid_il_ref_pics_plus1和layerIncludedInOlsFlag被限制为不为独立层导出。9.一种对已编码视频序列进行解码的设备,其特征在于,所述设备包括:至少一个存储器,被配置为存储程序代码;以及至少一个处理器,被配置为读取所述程序代码并且如所述程序代码所指示地操作,所述程序代码包括:获得代码,被配置为使所述至少一个处理器获得所述已编码视频序列;以及解码代码,被配置为使所述至少一个处理器对所述已编码视频序列进行解码,其中,所述已编码视频序列中的视频编码层VCL网络抽象层NAL单元的时间子层标识符的值,被限制为小于或等于所述视频编码层VCL网络抽象层NAL单元所参考的视频参数集VPS中的vps_max_sublayers_minus1的值,所述vps_max_sublosons_minus1的值指示时间子层的最大数量,所述时间子层能够存在于...

【专利技术属性】
技术研发人员:崔秉斗刘杉史蒂芬
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1