解码方法、编码方法和相关装置制造方法及图纸

技术编号:35645847 阅读:23 留言:0更新日期:2022-11-19 16:39
一种利用8位主变换核心矩阵来对压缩视频或图像数据进行解码、或者对未压缩视频或图像数据进行编码的方法。该方法可以包括:确定是使用具有第一大小类型的第一变换核心矩阵,还是使用具有小于第一大小类型的第二大小类型的第二变换核心矩阵。当确定的结果是使用第一变换核心矩阵时,使用具有64点或更大的大小的8位主变换核心矩阵来对目标文件进行编码或解码。否则,则该方法可以包括从第一变换矩阵中提取第二大小类型的第二变换核心矩阵,以及使用所提取的第二变换核心矩阵来对目标文件进行编码或解码。行编码或解码。行编码或解码。

【技术实现步骤摘要】
解码方法、编码方法和相关装置
[0001]本申请要求于2018年6月29日提交的美国临时申请第62/692,658号和2018年12月19日提交的美国申请第16/225,982号的优先权,其全部公开内容通过引用并入本文中。
[0002]本申请对申请号为2019800139886,申请日为2019年06月03日,专利技术名称为“用于解码或编码的方法、装置和介质”的中国专利申请提出分案申请。


[0003]本申请涉及图像处理技术,尤其涉及视频编码/解码技术,其包括高效视频编码(HEVC)之上的视频编码/解码技术,例如通用视频编码(VVC)。

技术介绍

[0004]使用具有运动补偿的帧间图片预测的视频编码和解码已公知数十年。未压缩的数字视频可以由一系列图片组成,每个图片具有例如1920
×
1080亮度样本和相关联的色度样本的空间维度。这一系列图片可以具有固定的或可变的图片速率(非正式地也称为帧速率),例如每秒60幅图片或60赫兹(Hz)。未压缩的视频具有很高的比特率要求。例如,每样本8位的1080p60 4:2:0视频(60Hz帧速率的1920
×
1080亮度样本分辨率)需要接近1.5Gbit/s的带宽。一小时这样的视频需要大于600GB的存储空间。
[0005]视频编码和解码的一个目的可以是通过压缩来减少输入视频信号中的冗余。在一些情况下,压缩可以帮助将上述带宽或存储空间需求减少两个数量级或更多。可以采用无损压缩、有损压缩、以及它们的组合。无损压缩是指可以从压缩的原始信号中重建原始信号的精确副本的技术。当使用有损压缩时,重建的信号可以与原始信号不同,但是原始信号与重建的信号之间的失真足够小,以使重建的信号对预期的应用有用。在视频的情况下,有损压缩被广泛采用。容忍的失真量取决于应用,例如,某些消费者流传送应用程序的用户可以比电视贡献应用程序的用户容忍更高的失真。可达到的压缩率可以反映出:允许/可容忍的失真越高,可得到的压缩率越高。
[0006]本领域普通技术人员通常理解视频压缩/解压缩技术。通常,为了压缩视频或图像数据,执行一系列功能步骤以产生压缩的视频或图像文件。尽管诸如360
°
图像(例如,由360
°
摄像装置捕获的图像)可以适合于压缩,但是为了阅读方便,将对视频文件的压缩进行说明。为了生成压缩的视频文件,在常规标准(例如,H.264、H.265)下,可以对从视频源接收到的未压缩视频样本流执行分割或解析,从而得到两个或更多个参考图片的样本块。
[0007]双向预测可以涉及如下技术:可以从两个或更多个参考图片的两个运动补偿样本块中预测诸如预测的样本块的预测单元(PU)。双向预测首先被引入MPEG

1的视频编码标准中,并且也被引入包括在诸如MPEG

2 Part 2(或H.262)、H.264和H.265之类的其他视频编码技术和标准中。
[0008]当对压缩的视频文件进行解压缩时,在重建双向预测的PU的样本期间,可以将来自每个参考块的运动补偿和内插的输入采样乘以对于每个参考块不同的加权因子,并且可以将两个参考块的这样的加权样本值相加以生成重建中的样本。还可以通过诸如环路滤波
的机制来进一步处理这样的样本。
[0009]在MPEG

1和MPEG

2中,可以基于重建中的PU所属的图片与两个参考图片之间的相对时间距离来确定加权因子。这是可能的,因为在MPEG

1和MPEG

2中,两个参考I或P图片中的一个在重建中的B图片的“过去”,并且另一个在重建中的B图片的“未来”(按照展示顺序),并且因为在MPEG

1和MPEG

2中,对于任何重建中的图片,都相对于其参考图片建立了明确定义的定时关系。
[0010]从H.264开始,放宽了用于双向预测图片的参考图片选择概念,使得参考图片仅需要在解码顺序上更早,而不需要在呈现顺序上更早。此外,时间的概念也放宽了,因为H.264和H.265都不需要时域中的受约束/固定的图片间隔。因此,解码器不能再基于比特流中可用的定时信息来计算加权因子。而是,H.264和H.265包括0.5的“默认值”作为双向预测图片的参考样本的加权因子。可以通过称为pred_weight_table()的切片头部中可用的语法来重写该默认值。默认值0.5或pred_weight_table中的信息可以应用于给定切片中的所有双向预测的PU。
[0011]非专利文献1示出了H.265/HEVC标准。然而,专利技术人已经研究了对具有压缩能力明显超过HEVC标准(包括其扩展)的未来视频编码技术的标准化的需求。
[0012]非专利文献2公开了最近推出的用于HEVC之上的下一代视频编码的标准化格式,其被称为具有版本VTM的通用视频编码(VVC)(VVC测试模型)。VVC通常可以使用10位整数矩阵来提供大(例如,64点或更高)的变换核心。
[0013]相关技术清单
[0014]非专利文献1:“Transform design for HEVC with 16bit intermediate data representation”;由ITU

T SG16 WP3和ISO/IEC JTC1/SC29/WG11视频编码联合协作小组(JCT

VC)出版,第5次会议:瑞士日内瓦,2011年3月16日至23日(文件:JCTVC

E243)。H.265/HEVC(高效视频编码)标准可以包括由ITU

T VCEG(Q6/16)ISO/IEC MPEG(JTC l/SC 29/WG 11)发布的版本1(2013)、版本2(2014)、版本3(2015)和版本4(2016)。
[0015]非专利文献2:“Algorithm description for Versatile Video Coding and Test Model 1(VTM 1)”;由ITU

T SG 16WP 3和ISO/IEC JTC l/SC 29/WG 11联合视频专家组(JVET)出版,第10次会议:美国圣地亚哥,2018年4月10日至20日(文件:JVET

Jl002

v2)。
[0016]要解决的问题
[0017]通常,不能从例如在传统的VVC中为10位的64点DCT

2变换核心中提取8位的2点、4点、8点、16点和32点DCT

2变换核心,因此不可避免地增加了应用主变换的代价,因为单独的64点变换核心将需要额外的存储和逻辑来实现。

技术实现思路

[0018]根据本公开内容的一方面,一种利用8位主变换核心矩阵来对压缩视频或图像数据解码,或对未压缩视频或图像数据编码的方法可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种解码方法,其特征在于,所述方法包括:接收用于解码的目标文件,所述用于解码的目标文件是压缩的视频或图像数据文件;针对所述目标文件进行解码的过程中,若确定使用具有第一大小类型的第一变换核心矩阵,则使用具有64点或更大的大小的8位主变换核心矩阵进行解码;当所述第一变换核心矩阵是64点8位主变换核心矩阵时,所述64点8位主变换核心矩阵的元素包括整数:bf,bg,bh,bi,bj,bk,bl,bm,bn,bo,bp,bq,br,bs,bt,bu,bv,bw,bx,by,bz,ca,cb,cc,cd,ce,cf,cg,ch,ci,cj,ck的取值及各自的符号变化;其中,所述整数{bf,bg,bh,bi,bj,bk,bl,bm,bn,bo,bp,bq,br,bs,bt,bu,bv,bw,bx,by,bz,ca,cb,cc,cd,ce,cf,cg,ch,ci,cj,ck}的取值分别等于{91,90,90,90,88,87,86,84,83,81,79,77,73,71,69,65,62,59,56,52,48,44,41,37,33,28,24,20,15,11,7,2}。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若确定使用具有小于所述第一大小类型的第二大小类型的第二变换核心矩阵,则从所述第一变换核心矩阵中提取所述第二大小类型的第二变换核心矩阵,并且使用所提取的所述第二大小类型的第二变换核心矩阵,对所述用于解码的目标文件进行解码。3.根据权利要求1所述的方法,其特征在于,当所述第一变换核心矩阵是128点8位主变换核心矩阵时,所述128点8位主变换核心矩阵的元素包括整数:cl,cm,cn,co,cp,cq,cr,cs,ct,cu,cv,cw,cx,cy,cz,da,db,dc,dd,de,df,dg,dh,di,dj,dk,dl,dm,dn,do,dp,dq,dr,ds,dt,du,dv,dw,dx,dy,dz,ea,eb,ec,ed,ee,ef,eg,eh,ei,ej,ek,el,em,en,eo,ep,eq,er,es,et,eu,ev和ew的取值加上它们的符号变化;所述整数{cl,cm,cn,co,cp,cq,cr,cs,ct,cu,cv,cw,cx,cy,cz,da,db,dc,dd,de,df,dg,dh,di,dj,dk,dl,dm,dn,do,dp,dq,dr,ds,dt,du,dv,dw,dx,dy,dz,ea,eb,ec,ed,ee,ef,eg,eh,ei,ej,ek,el,em,en,eo,ep,eq,er,es,et,eu,ev,ew}的取值等于{90,90,90,90,90,90,89,89,89,88,88,87,86,86,85,84,83,82,81,80,79,78,77,76,75,73,72,71,69,68,66,65,63,62,60,58,58,55,53,51,49,48,45,44,42,40,38,36,34,32,29,27,25,23,21,19,17,15,12,10,8,6,3,1}。4.根据权利要求1所述的方法,其特征在于,所述第一变换核心矩阵是以下中之一:DCT

2、DCT

5、DCT

8、DST

l和DST

7;所述第二变换核心矩阵是以下中之一:DCT

2、DCT

5、DCT

8、DST

l和DST

7。5.根据权利要求4所述的方法,其特征在于,所述第一变换核心矩阵与所述第二变换核心矩阵均是DCT

2变换矩阵。6.根据权利要求4所述的方法,其特征在于,所述第一变换核心矩阵是8位64点DCT

2变换矩阵,所述第二变换核心矩阵是8位32点、8位16点、8位8点或8位4点DCT

2变换矩阵。7.一种编码方法,其特征在于,所述方法包括:接收与用于编码的目标文件有关的信息,所述用于编码的目标文件是未压缩的视频或图像数据文件;针对所述目标文件进行编码的过程中,若确定使用具有第一大小类型的第一变换核心矩阵,则使用具有64点或更大的大小的8位主变换核心矩阵,对所述用于编码的目标文件进行编码;当所述第一变换核心矩阵是64点8位主变换核心矩阵时,所述64点8位主变换核心矩阵
的元素包括整数:bf,bg,bh,bi,bj,bk,bl,bm,bn,bo,bp,bq,br,bs,bt,bu,bv,bw,bx,by,bz,ca,cb,cc,cd,ce,cf,cg,ch,ci,cj,ck的取值及各自的符号变化;其中,所述整数{bf,bg,bh,bi,bj,bk,bl,bm,bn,bo,bp,bq,br,bs,bt,bu,bv,bw,bx,by,bz,ca,cb,cc,cd,ce,cf,cg,ch,ci,cj,ck}的取值分别等于{91,90,90,90,88,87,86,84,83,81,79,77,73,71,69,65,62,59,56,52,48,44,41,37,33,28,24,20,15,11,7,2}。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:若确定使用具有小于所述第一大小类型的第二大小类型的第二变换核心矩阵,则从所述第一变换核心矩阵中提取所述第二大小类型的第二变换核心矩阵,并且使用所提取的所述第二大小类型的第二变换核心矩阵,对所述用于编码的目标文件进行编码。9.根据权利要求7所述的方法,其特征在于,当所述第一变换核心矩阵是128点8位主变换核心矩阵时,所述128点8位主变换核心矩阵的元素包括整数:cl,cm,cn,co,cp,cq,cr,cs,ct,cu,cv,cw,cx,cy,cz,da,db,dc,dd,de,df,dg,dh,di,dj,dk,dl,dm,dn,do,dp,dq,dr,ds,dt,du,dv,dw,dx,dy,dz,ea,eb,ec,ed,ee,ef,eg,eh,ei,ej,ek,el,em,en,eo,ep,eq,er,es,et,eu,ev和ew的取值加上它们的符号变化;所述整数{cl,cm,cn,co,cp,cq,cr,cs,ct,cu,cv,cw,cx,cy,cz,da,db,dc,dd,de,df,dg,dh,di,dj,dk,dl,dm,dn,do,dp,dq,dr,ds,dt,du,dv,dw,dx,dy,...

【专利技术属性】
技术研发人员:赵欣李翔刘杉
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1