用于多层视频流中的输出层集模式的方法技术

技术编号:33702202 阅读:21 留言:0更新日期:2022-06-06 08:14
一种解码方法可以包括:接收包括压缩视频/图像数据的比特流;根据比特流解析或导出视频参数集(VPS)中的输出层集模式指示符;基于输出层集模式指示符来识别输出层集信令;基于所识别的输出层集信令来识别一个或更多个图片输出层;以及对所识别的一个或更多个图片输出层进行解码。输出层进行解码。

【技术实现步骤摘要】
【国外来华专利技术】用于多层视频流中的输出层集模式的方法
相关申请的交叉引用
[0001]本申请要求于2020年3月27日提交的美国临时申请第63/001,045号以及2020年8月21日提交的美国申请第17/000,018号的优先权,上述申请的全部内容并入本文。

技术介绍


[0002]该公开内容涉及高级视频编解码器中的视频压缩技术以及帧间预测和帧内预测。具体地,本公开内容涉及下一代视频编码技术,其包括除了高效视频编码(High Efficiency Video Coding,HEVC)之外的视频编码/解码技术,诸如通用视频编码(Versatile Video Coding,VVC)。更具体地,本公开内容的一方面针对在具有多个层的已编码视频流中提供一组高级视频编码技术设计的输出层推导的方法、装置和计算机可读介质。相关技术描述
[0003]使用具有运动补偿的帧间图片预测或帧内图片预测的视频编码和解码已知已达数十年。未压缩的数字视频可以包括一系列图片,每个图片的空间维度为例如1920
×
1080个亮度样本以及相关联的色度样本。所述一系列图片可以具有例如每秒60个图片或60Hz的固定的或可变的图片速率(也被非正式地称为帧速率)。未压缩的视频具有显著的比特率要求。例如,每样本8比特的1080p60 4:2:0视频(60Hz帧速率下1920
×
1080亮度样本分辨率)需要接近1.5Gbit/s带宽。一小时的这样的视频可能需要大于600千兆字节(GByte)的存储空间。
[0004]视频编码和解码的一个目的可以是通过压缩来减少输入视频信号的的冗余。压缩可以帮助减少以上提及的带宽或存储空间需求,在一些情况下减少两个数量级或更多。可以采用无损压缩和有损压缩两者以及它们的组合。无损压缩是指可以根据压缩的原始信号重建原始信号的精确副本的技术。当使用有损压缩时,重建的信号可能与原始信号不同,但是原始信号与重建的信号之间的失真足够小,以使重建的信号对于预期应用有用。在视频的情况下,有损压缩被广泛采用。容忍的失真量取决于应用;例如,某些消费者流式传输应用的用户可能比电视内容制作和传送(contribution)应用的用户容忍更高的失真。能够实现的压缩比可以反映出:更高的可允许/可容忍的失真可以产生更高的压缩比。
[0005]视频编码器和视频解码器可以利用来自包括例如运动补偿、变换、量化和熵编码的若干大类的技术,其中的一些技术将在下面介绍。
[0006]历史上,视频编码器和解码器倾向于在给定图片大小上操作,在大多数情况下,该给定图片大小针对已编码视频序列(Coded Video Sequence,CVS)、图片组(Group of Pictures,GOP)或类似的多图片时间帧来进行定义并且保持恒定。例如,在运动图像专家组(Motion Picture Experts Group,MPEG)

2中,已知系统设计依赖于诸如场景活动的因素来改变水平分辨率(并且从而改变图片大小),但是仅在帧内(或i帧或i图片)处改变水平分
辨率,因此通常针对GOP。例如,从ITU

T Rec.H.263附录P已知在CVS内对用于不同分辨率的参考图片进行重采样。然而,在此,图片大小没有改变,仅参考图片被重采样,导致可能仅使用图片画布的部分(在下采样的情况下),或仅捕获场景的部分(在上采样的情况下)。此外,H.263附录Q允许以因子2(在每个维度上)向上或向下对单个宏块进行重采样。同样,图片大小保持不变。宏块的大小在H.263中是固定的,并且因此不需要用信号通知宏块的大小。
[0007]预测图片中的图片大小的改变在现代视频编码中变得更加主流。例如,VP9允许参考图片重采样和整个图片的分辨率的改变。类似地,针对通用视频编码(VVC)作出的某些提议(包括,例如,Hendry等,“On adaptive resolution change(ARC)for VVC”,联合视频工作组文档JVET

M0135

v1,2019年1月9日至1月19日,其全部内容并入本文)允许将整个参考图片重采样到不同的——更高的或更低的——分辨率。在Hendry中,建议将不同的候选分辨率编码在序列参数集中,并且由图片参数集中的每个图片语法元素引用。

技术实现思路

[0008]公开了根据各种实施方式的用于在视频比特流中用信号通知自适应图片大小的技术。
[0009]根据本公开内容的一方面,一种解码方法可以包括:接收包括压缩视频/图像数据的比特流,其中,比特流具有多个层;根据比特流解析或导出视频参数集(VPS)中的输出层集模式指示符;基于输出层集模式指示符来识别输出层集信令;基于所识别的输出层集信令来识别一个或更多个图片输出层;以及对所识别的一个或更多个图片输出层进行解码。
[0010]基于输出层集模式指示符来识别输出层集信令可以包括:在VPS中的输出层集模式指示符为第一值的情况下,将比特流中的最高层识别为一个或更多个图片输出层;在VPS中的输出层集模式指示符为第二值的情况下,将比特流中的所有层识别为一个或更多个图片输出层;以及在VPS中的输出层集模式指示符为第三值的情况下,基于VPS中的显式信令来识别一个或更多个图片输出层。
[0011]第一值可以不同于第二值并且可以不同于第三值,并且第二值可以不同于第三值。
[0012]第一值可以是0,第二值可以是1,并且第三值可以是2。然而,可以使用其他值,并且本公开内容不限于使用如上所述的0、1和2。
[0013]通过VPS中的显式信令来识别一个或更多个图片输出层可以包括:(i)根据VPS解析或导出输出层标志;以及(ii)将具有输出层标志等于1的层设置为一个或更多个图片输出层。
[0014]基于输出层集模式指示符来识别输出层集信令可以包括:在VPS中的输出层集模式指示符为预定值的情况下,输出层集信令包括基于VPS中的显式信令来识别一个或更多个图片输出层。
[0015]通过VPS中的显式信令来识别一个或更多个图片输出层包括:(i)根据VPS解析或导出输出层标志;以及(ii)将具有输出层标志等于1的层设置为一个或更多个图片输出层,其中,多个层的数目大于2。
[0016]输出层集信令可以包括:当输出层集模式指示符等于2,并且多个层的层的数目大于2时,基于VPS中的显式信令来识别一个或更多个图片输出层。
[0017]输出层集信令可以包括:当输出层集模式指示符小于2,并且多个层的数目为2时,通过推断一个或更多个图片输出层将比特流中的最高层或比特流中的所有层识别为一个或更多个图片输出层,并且输出层集模式指示符实际小于2,并且多个层的数目实际为2。
[0018]根据实施方式,VPS中的输出层集minus1指示符的数目指示输出层集的数目。
[0019]根据实施方式,VPS中的VPS最大层minus1指示符指示比特流中的层的数目。
[0020]根据实施方式,VPS中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种解码方法,所述方法包括:接收包括压缩视频/图像数据的比特流,其中,所述比特流具有多个层;根据所述比特流解析或导出视频参数集(VPS)中的输出层集模式指示符;基于所述输出层集模式指示符来识别输出层集信令;基于所识别的输出层集信令来识别一个或更多个图片输出层;以及对所识别的一个或更多个图片输出层进行解码。2.根据权利要求1所述的方法,其中,基于所述输出层集模式指示符来识别所述输出层集信令包括:在所述VPS中的所述输出层集模式指示符为第一值的情况下,将所述比特流中的最高层识别为所述一个或更多个图片输出层;在所述VPS中的所述输出层集模式指示符为第二值的情况下,将所述比特流中的所有层识别为所述一个或更多个图片输出层;以及在所述VPS中的所述输出层集模式指示符为第三值的情况下,基于所述VPS中的显式信令来识别所述一个或更多个图片输出层,其中,所述第一值不同于所述第二值并且不同于所述第三值,并且所述第二值不同于所述第三值。3.根据权利要求2所述的方法,其中,所述第一值是0,所述第二值是1,并且所述第三值是2。4.根据权利要求2所述的方法,其中,通过所述VPS中的所述显式信令来识别所述一个或更多个图片输出层包括:(i)根据所述VPS解析或导出输出层标志;以及(ii)将具有所述输出层标志等于1的层设置为所述一个或更多个图片输出层。5.根据权利要求1所述的方法,其中,基于所述输出层集模式指示符来识别所述输出层集信令包括:在所述VPS中的所述输出层集模式指示符为预定值的情况下,所述输出层集信令包括基于所述VPS中的显式信令来识别所述一个或更多个图片输出层。6.根据权利要求5所述的方法,其中,通过所述VPS中的所述显式信令来识别所述一个或更多个图片输出层包括:(i)根据所述VPS解析或导出输出层标志;以及(ii)将具有所述输出层标志等于1的层设置为所述一个或更多个图片输出层,其中,所述多个层的数目大于2。7.根据权利要求5所述的方法,其中,所述输出层集信令包括:当所述输出层集模式指示符等于2,并且所述多个层的层的数目大于2时,基于所述VPS中的所述显式信令来识别所述一个或更多个图片输出层。8.根据权利要求1所述的方法,其中,所述输出层集信令包括:当所述输出层集模式指示符小于2,并且多个层的数目为2时,通过推断所述一个或更多个图片输出层将所述比特流中的最高层或所述比特流中的所有层识别为所述一个或更多个图片输出层,并且所述输出层集模式指示符实际小于2,并且多个层的数目实际为2。9.根据权利要求8所述的方法,其中,所述VPS中的输出层集minus1指示符的数目指示所述输出层集的数目。
10.根据权利要求9所述的方法,其中,所述VPS中的VPS最大层minus1指示符指示所述比特流中的层的数目。11.根据权利要求10所述的方法,其中,所述VPS中的输出层集标志[i][j]指示第i输出层集的第j层是否为输出层。12.根据权利要求2所述的方法,其中,如果所述比特流中的所述...

【专利技术属性】
技术研发人员:崔秉斗刘杉文格尔史蒂芬
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1