用于译码/解码图片数据的方法和装置制造方法及图纸

技术编号:32441358 阅读:11 留言:0更新日期:2022-02-26 08:03
本公开涉及一种用于对图像数据进行编码的方法,该方法包括:通过使用帧内预测模式来对所述图像数据的第一块进行帧内预测或者通过组合帧间预测和帧内预测来进行预测,其中,所述帧内预测模式使用通过考虑所述第一块大小而获得的第一单个变换。本发明专利技术还涉及一种用于对图像数据进行编码的方法,可变译码长度用于通过所述编码来用信号通知多个预测模式,所述方法包括:

【技术实现步骤摘要】
【国外来华专利技术】用于译码/解码图片数据的方法和装置
1.

[0001]本专利技术的实施方式主要涉及图片数据的编码(encoding)/解码(decoding)。
2.
技术介绍

[0002]本部分旨在向读者介绍可能与下面描述和/或要求保护的本专利技术的实施例中的至少一个的各方面相关的技术的各方面。相信该讨论有助于向读者提供背景信息,以便于更好地理解至少一个实施例的各个方面。因此,应当理解,这些陈述应就此而论地阅读。
[0003]为了实现高压缩效率,视频译码(coding)方案通常采用预测和变换以利用视频内容中的空间和时间冗余。通常,帧内或帧间预测用于利用帧内或帧间相关性。然后,对视频的原始图片和预测图片之间的差异(通常表示为预测误差或预测残差)进行变换、量化和熵译码。为了重构所述图片,通过与所述预测、变换、量化和熵译码对应的逆处理来解码压缩数据。
3.
技术实现思路

[0004]本公开的一些实施例使得能够通过提出一种用于对图像数据进行编码的方法来解决至少一个缺点,该方法包括:帧内预测,或者通过组合帧间预测和帧内预测来进行预测。本公开还涉及对应的解码方法、设备和介质。
4.附图说明
[0005]图1示出了根据至少一个实施例的示例性编码器的简化框图;
[0006]图2示出了根据至少一个实施例的示例性解码器的简化框图;
[0007]图3示出了示例性参考样本生成过程;
[0008]图4示出了用于正方形块的示例性预测方向;
[0009]图5示出了用于针对不同的块形状导出MPM列表的示例性顶部和左侧CU位置。
[0010]图6示出了示例性MPM信令;
[0011]图7示出了示例性MPM导出;
[0012]图8示出了VTM

5.0中当multiRefIdx>0时的示例性MPM信令;
[0013]图9示出了用于4
×
4块的示例仿射线性加权帧内预测过程;
[0014]图10示出了用于8
×
4块的示例仿射线性加权帧内预测过程;
[0015]图11示出了用于16
×
16块的示例仿射线性加权帧内预测过程;
[0016]图12示出了当mipFlag被置于用信号通知第一MPM的比特之前时的示例性MPM信令;
[0017]图13示出了当mipFlag被置于用信号通知第一MPM的比特之前时的示例性MPM信令;
[0018]图14示出了在当SMIP被放入MPM列表中DC之前时的示例性MPM导出;
[0019]图15示出了当SMIP被放入MPM列表中DC之前时的示例性MPM导出;
[0020]图16示出了当将SMIP放入MPM列表中DC之后时的示例性MPM导出;
[0021]图17示出了示例性预测图;
[0022]图18示出了当前块的示例性预测;
[0023]图19示出了4
×
4块的U2,U18,U34和U50的示例值;
[0024]图20示出了和的示例性图示;
[0025]图21示出了和的示例性图示;
[0026]图22示出了和的示例性图示;以及
[0027]图23示出了可以在其中实现各个方面和实施例的系统的示例的框图。
[0028]应注意,图式说明了示例性实施例且本专利技术的实施例不限于所图示的实施例
5.具体实施方式
[0029]本详细描述示出了本专利技术实施例的原理。因此,将理解,本领域技术人员将能够设计出虽然未在本文中明确描述或示出但体现本实施例的原理并且包括在其范围内的各种布置。
[0030]本文所述的所有示例和条件语言旨在用于教示目的,以帮助读者理解本专利技术实施例的原理以及专利技术人为了促进本领域而贡献的概念,并且应被解释为不限于此类具体所述的示例和条件。
[0031]此外,本文中叙述本公开的原理、方面和实施例的所有陈述及其具体示例旨在涵盖其结构和功能等同物这两者。另外,这些等同物旨在包括当前已知的等同物以及将来开发的等同物,即,所开发的执行相同功能的任何元件,而不管结构如何。
[0032]因此,例如,本领域技术人员将理解,这里呈现的框图表示体现本实施例的原理的说明性电路的概念图。类似地,将理解,任何流程图、流图、状态转移图、伪代码等表示可基本上在计算机可读介质中表示并因此由计算机或处理器执行的各种过程,而不管是否明确示出了这样的计算机或处理器。
[0033]以下将参照附图更全面地描述本专利技术,其中示出了所述本专利技术的示例。然而,实施例可以以许多替代形式来体现,并且不应被解释为限于本文阐述的示例。因此,应当理解,不旨在将实施例限于所公开的特定形式。相反,本专利技术的实施例旨在覆盖落入本申请的精神和范围内的所有修改、等同物和替代物。
[0034]当附图被呈现为流程图时,应当理解,它还提供了对应装置的框图。类似地,当附图被呈现为框图时,应当理解,它还提供了对应的方法/过程的流程图。
[0035]可以通过使用专用硬件以及能够与适当软件相关联地执行软件的硬件来提供图中所示的各种元件的功能。当由处理器提供时,所述功能可以由单个专用处理器、单个共享处理器或多个单独的处理器(其中一些可以被共享)提供。此外,术语“处理器”或“控制器”的明确使用不应被解释为排他性地指代能够执行软件的硬件,并且可以隐含地包括但不限于数字信号处理器(DSP)硬件、用于存储软件的只读存储器(ROM)、随机存取存储器(RAM)和非易失性存储装置。也可以包括其它常规和/或定制的硬件。类似地,图中所示的任何开关仅是概念性的。它们的功能可以通过程序逻辑的操作、通过专用逻辑、通过程序控制和专用逻辑的交互、或者甚至手动地来执行,如从上下文中更具体地理解的,特定技术可由实现者
选择。
[0036]图中相似或相同的元素用相同的参考数字表示。一些图表示在视频压缩标准的规范中广泛使用的语法表,用于定义符合所述视频压缩标准的比特流的结构。在这些语法表中,术语
“…”
表示相对于在视频压缩标准的规范中给出的公知定义的语法的未改变部分,并且在图中被去除以便于阅读。语法表中的粗体项指示该项的值是通过解析比特流获得的。语法表的右列指示用于编码语法元素的数据的比特的数目。例如,u(4)指示4比特用于编码数据,u(8)指示8比特,ae(v)指示上下文自适应算术熵译码的语法元素。
[0037]在其权利要求中,被表达为用于执行指定功能的装置的任何元件旨在包含执行该功能的任何方式,这其中包括例如a)执行该功能的电路元件的组合,或者b)任何形式的软件,因此这其中包括固件或微代码等,与用于执行该软件以执行该功能的适当电路相组合。由这些权利要求限定的本实施例在于以下事实:由各种所述装置提供的功能以权利要求所要求的方式被组合和集合。因此,认为可以提供那些功能的任何装置都等效于这里所示的那些装置。
[0038]应当理解,附图和描述已经被简化以示出与清楚理解本实施例相关的元素,同时为了清楚起本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种设备,包括至少一个适于对图像数据进行编码的处理器,所述至少一个处理器适于通过使用利用第一单个变换的帧内预测模式来对所述图像数据的至少一个第一块进行帧内预测,所述第一单个变换是通过考虑所述第一块大小而获得的。2.一种用于对图像数据进行编码的方法,所述方法包括通过使用利用第一单个变换的帧内预测模式来对所述图像数据的至少一个第一块进行帧内预测或者通过组合帧间预测和帧内预测来进行预测,所述第一单个变换是通过考虑所述第一块大小而获得的。3.根据权利要求1所述的设备或根据权利要求2所述的方法,其中所述帧内预测模式使用所述第一单个变换来预测所述图像数据的具有所述第一块大小的块。4.根据权利要求1或3所述的设备或者根据权利要求2或3所述的方法,其中所述帧内预测模式使用第二单个变换以用于帧内预测所述图像数据的具有与所述第一块大小不同的大小的第二块。5.根据权利要求1、3或4所述的设备或根据权利要求2至4中任意项所述的方法,其中所述第一单个变换是从包括单个矩阵和单个偏差向量的集合中获得的。6.根据权利要求5所述的设备或方法,其中当所述块大小为4
×
4像素时,所述单个矩阵具有16
×
4像素的大小和/或所述单个向量具有16个像素的大小。7.根据权利要求5或6所述的设备或方法,其中当所述块大小为4
×
8像素、8
×
4像素或8
×
8像素时,所述单个矩阵具有16
×
8像素的大小和/或所述单个向量具有16像素的大小。8.根据权利要求5到7中的任意项所述的设备或方法,其中,当所述块大小不是4
×
4像素、4
×
8像素、8
×
4像素或8
×
8像素时,所述单个矩阵具有64
×
8像素的大小和/或所述单个向量具有64像素的大小。9.根据权利要求1或3至8中任意项所述的设备,所述处理器适于将用信号通知所述帧内预测模式的使用的信息编码在比特流中,或根据权利要求2至8中任意项所述的方法,该方法包括将用信号通知所述帧内预测模式的使用的信息编码在比特流中。10.根据权利要求9所述的设备或方法,其中,使用可变译码长度来在所述比特流中用信号通知多个预测模式(MPM),所述可变译码长度对所述预测模式进行排序,并且其中,所述信息被编码为所述多个预测模式中的一个预测模式。11.根据权利要求10所述的设备或方法,其中所述多个预测模式包含至少一个常规帧内预测模式。12.根据权利要求11所述的设备或方法,其中,当所述多个预测模式包含用信号通知DC帧内预测模式的至少一个DC元素时,所述信息替代所述DC元素之一、在所述DC元素之一之前和/或之后被译码。13.根据权利要求11所述的设备或方法,其中当所述多个预测模式含有用信号通知平面帧内预测模式的至少一个平面元素时,所述信息替代所述平面元素中的至少一者、在所述平面元素中的所述至少一者之前和/或之后被译码。14.根据权利要求1或3至12中任意项所述的设备,所述处理器适于在比特流中编码所述第一和/或第二单个变换的至少一个参数,或根据权利要求2所述的方法,该方法包括在比特流中编码所述第一和/或第二单个变换的至少一个参数。15.根据权利要求13所述的设备或方法,其中所述至少一个参数通过训练深度神经网络而被获得。
16.根据权利要求13所述的设备或方法,其中,所述第一变换和/或第二变换的所述至少一个参数的所述编码在帧级别被执行。17.一种设备,包括至少一个适于对图像数据进行编码的处理器,可变译码长度被用来通过所述编码来用信号通知多个预测模式,所述至少一个处理器适于:

通过使用帧内预测模式来对所述图像数据的至少一个第一块进行帧内预测,所述帧内预测模式使用至少一个第一变换,所述至少一个第一变换是通过考虑所述第一块大小而获得的,

将用信号通知所述帧内预测模式的使用的信息编码在比特流中,所述信息被编码为所述多个预测模式中的一个。18.一种用于对图像数据进行编码的方法,可变译码长度被用来通过所述编码来用信号通知多个预测模式,所述方法包括:

通过使用帧内预测模式来对所述图像数据的至少一个第一块进行帧内预测,所述帧内预测模式使用至少一个第一变换,所述至少一个第一变换是通过考虑所述第一块大小而获得的,

将用信号通知所述帧内预测模式的使用的信息编码在比特流中,所述信息被编码为所述多个预测模式中的一个。19.一种设备,包括至少一个处理器,所述至少一个处理器适于通过使用用信号通知第一单个变换的使用的帧内预测模式来重构在比特流中编码的图像数据的至少一个第一块,所述第一单个变换考虑所述第一块大小。20.一种方法,包括:...

【专利技术属性】
技术研发人员:T
申请(专利权)人:交互数字VC控股法国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1