解码或编码的方法和装置、计算机设备和存储介质制造方法及图纸

技术编号:24806138 阅读:33 留言:0更新日期:2020-07-07 22:17
一种解码或编码的方法,包括:接收用于编码或解码的目标数据块的信息;当确定使用第一变换核矩阵对目标数据块进行编码或解码时,基于一组M个唯一数,导出8位DST‑7的第一初级变换核矩阵,以及产生第一信息,该第一信息用于触发采用所导出的第一初级变换核矩阵对目标数据块进行编码或解码,其中,第一变换核矩阵为大于或等于8点并且由8位表示的DST‑7第一初级变换核矩阵;当确定不使用该第一初级变换核矩阵对目标数据块进行编码或解码时,基于同一组M个唯一数,导出第二初级变换核矩阵,以及产生第二信息,该第二信息用于触发采用所导出的第二初级变换核矩阵对目标数据块进行编码或解码,其中该第二初级变换核矩阵是DCT‑8、DST‑1和DCT‑5中的一个。

【技术实现步骤摘要】
解码或编码的方法和装置、计算机设备和存储介质优先权信息本申请要求于2018年6月29日递交美国专利商标局、申请号为62/692,658的美国临时申请的优先权,以及于2018年12月28日递交美国专利商标局、申请号为16/235,995的美国申请的优先权,其全部公开内容通过引用并入本申请中。
本申请涉及视频编解码技术。具体地,本申请涉及解码或编码的方法和装置、计算机设备和存储介质。
技术介绍
相关技术说明几十年以来,使用具有运动补偿的帧间图片预测来进行视频编码和解码已经众所周知。未压缩的数字视频可包括一系列图片,每个图片具有例如1920×1080亮度样本及相关色度样本的空间维度。所述系列图片具有固定的或可变的图片速率(也非正式地称为帧率),例如每秒60个图片或60Hz。未压缩的视频具有非常大的比特率要求。例如,每个样本8比特的1080p604:2:0的视频(1920x1080亮度样本分辨率,60Hz帧率)要求接近1.5Gbit/s带宽。一小时这样的视频就需要超过600GB的存储空间。视频编码和解码的一个目的是通过压缩减少输入视频信号的冗余信息。视频压缩可以帮助降低对上述带宽或存储空间的要求,在某些情况下可降低两个或更多数量级。无损和有损压缩,以及两者的组合均可采用。无损压缩是指从压缩的原始信号中重建原始信号精确副本的技术。当使用有损压缩时,重建信号可能与原始信号不完全相同,但是原始信号和重建信号之间的失真足够小,使得重建信号可用于预期应用。有损压缩广泛应用于视频。容许的失真量取决于应用。例如,相比于电视应用的用户,某些消费流媒体应用的用户可以容忍更高的失真。可实现的压缩比反映出:较高的允许/容许失真可产生较高的压缩比。本领域普通技术人员通常理解视频压缩/解压缩技术。一般来说,为了压缩视频或图像数据,可执行一系列功能步骤以产生压缩的视频或图像文件。尽管图像,例如360°图像(例如,由360°相机采集的),可能适于压缩,但为了易于阅读,将对视频文件的压缩进行解释。为了生成压缩的视频文件,在传统标准(例如,H.264、H.265)下,从视频源接收的未压缩的视频样本流可被分割或解析,这产生了两个或更多个参考图片的样本块。双向预测可涉及如下技术:根据两个或更多个参考图片的两个运动补偿样本块,可对预测单元(PU),例如预测样本块,进行预测。在MPEG-1中首次将双向预测引入视频编码标准,并且双向预测已被包含在其它视频编码技术和标准中,比如MPEG-2的第二部分(或者H.262)、H.264和H.265等等。当对压缩的视频文件进行解压缩时,在对双向预测的PU的样本进行重建的过程中,来自每个参考块的、经运动补偿和内插的输入样本可与加权因子相乘,并且可对两个参考块的、经如此加权后的样本值进行相加以生成正在重建的样本,其中,每个参考块的加权因子不同。可进一步通过比如环路滤波的机制对此样本进行处理。在MPEG-1和MPEG-2中,根据正在重建的PU所属的图片与该两个参考图片之间的相对时间距离,可确定加权因子。因为在MPEG-1和MPEG-2中,两个参考I或P图片中的一个图片处于“过去”,而另一个处于正在重建的B图片的“未来”(就呈现顺序而言),并且因为在MPEG-1和MPEG-2中,为正在重建的、与其参考图片有关的任意图片建立了明确定义的时序关系,因此这样确定加权因子是可行的。从H.264开始,放宽了用于双向预测图片的参考图片选择概念,这使得该参考图片仅需要在解码顺序上更早、但在呈现顺序上无需如此。而且,因为H.264和H.265在时域中都不需要约束的/固定的图片间隔,因此时间的概念也放宽了。因此,解码器无法再基于比特流中可获得的时序信息来计算加权因子。相反,H.264和H.265包括0.5的“默认值”作为双向预测图片的参考样本的加权因子。这一默认值可由切片头(sliceheader)中可获得的、被称为pred_weight_table()的句法(syntax)覆盖。该默认值0.5或者pred_weight_table()中的信息可应用于给定切片(slice)中的所有双向预测PU。非专利文献1:由ITU-TSG16WP3和ISO/IECJTC1/SC29/WG11的视频编码联合协作组(JCT-VC)于2011年3月16日至23日在瑞士日内瓦的第5次会议上发表的“用于具有16位中间数据表示的HEVC的变换设计”(TransformdesignforHEVCwith16bitintermediatedatarepresentation)(文件编号:JCTVC-E243)。H.265/HEVC(高效视频编码)标准可包括由ITU-TVCEG(Q6/16)ISO/IECMPEG(JTC1/SC29/WG11发布的版本1(2013)、版本2(2014)、版本3(2015)和版本4(2016)。非专利文献1示出了H.265/HEVC标准。然而,专利技术人已经研究了对具有压缩能力的未来视频编码技术进行标准化的需求,其压缩能力显著超出HEVC标准(包括其扩展)。非专利文献2:由ITU-TSG16WP3和ISO/IECJTC1/SC29/WG11的视频联合专家组(JVET)于2018年4月10日至20日在美国圣地亚哥的第10次会议上发表的“通用视频编码(VVC)和测试模型1(VTIM1)的算法描述”(AlgorithmdescriptionforVersatileVideoCodingandTestModel1(VTM1))(文件编号:JVET-J1002-v2)。非专利文献2公开了近期推出的、用于超越HEVC的下一代视频编码的标准化格式,其被称为通用视频编码(VVC),具有版本VTM(VVC测试模型)。VVC通常可提供一种使用10位(10-bit)整数矩阵的大型(例如,64点(64-point)或更高的)变换核。然而,对VCC中的8位核(8-bitcore)存在如下需求:降低复杂度、减少用于存储变换核的内存和/或减小乘法/加法/减法操作的输入位宽。通常,在传统VVC中,无法从例如10位的64点DCT-2变换核中提取出8位的2点、4点、8点、16点和32点DCT-2变换核,从而不可避免地增加了应用初级变换的成本,因为单独的64点变换核将需要额外的存储和逻辑才能实现。与10位初级变换核相比,8位初级变换核因为减少了用于存储变换核的内存并且减小了乘法/加法/减法操作的输入位宽,因此降低了复杂度。
技术实现思路
本申请实施例提供了解码或编码的方法和装置、计算机设备和存储介质,旨在解决现有VCC中存储变换核的内存以及乘法/加法/减法操作的输入位宽较高的问题。根据本申请的一方面,提供一种解码或编码的方法,可包括:接收用于编码或解码的目标数据块的信息,所述用于编码或解码的目标数据块是压缩的视频或图像数据块和未压缩的视频或图像数据块中的一个;当确定使用第一变换核矩阵对所述目标数据块进行编码或解码时,基于一组M个唯一数,导出8位DST-7的第一初级变换核矩阵,以及产本文档来自技高网
...

【技术保护点】
1.一种解码或编码的方法,其特征在于,所述方法包括:/n接收用于编码或解码的目标数据块的信息,所述用于编码或解码的目标数据块是压缩的视频或图像数据块和未压缩的视频或图像数据块中的一个;/n当确定使用第一变换核矩阵对所述目标数据块进行编码或解码时,基于一组M个唯一数,导出8位DST-7的第一初级变换核矩阵,以及产生第一信息,所述第一信息用于触发采用所导出的所述第一初级变换核矩阵对所述用于编码或解码的目标数据块进行编码或解码,其中,所述第一变换核矩阵为大于或等于8点并且由8位表示的DST-7第一初级变换核矩阵;以及/n当确定不使用所述第一变换核矩阵对所述目标数据块进行编码或解码时,基于所述同一组M个唯一数,导出第二初级变换核矩阵,以及产生第二信息,所述第二信息用于触发采用所导出的所述第二初级变换核矩阵对所述用于编码或解码的目标数据块进行编码或解码,其中所述第二初级变换核矩阵是DCT-8、DST-1和DCT-5中的一个。/n

【技术特征摘要】
20181228 US 16/235,9951.一种解码或编码的方法,其特征在于,所述方法包括:
接收用于编码或解码的目标数据块的信息,所述用于编码或解码的目标数据块是压缩的视频或图像数据块和未压缩的视频或图像数据块中的一个;
当确定使用第一变换核矩阵对所述目标数据块进行编码或解码时,基于一组M个唯一数,导出8位DST-7的第一初级变换核矩阵,以及产生第一信息,所述第一信息用于触发采用所导出的所述第一初级变换核矩阵对所述用于编码或解码的目标数据块进行编码或解码,其中,所述第一变换核矩阵为大于或等于8点并且由8位表示的DST-7第一初级变换核矩阵;以及
当确定不使用所述第一变换核矩阵对所述目标数据块进行编码或解码时,基于所述同一组M个唯一数,导出第二初级变换核矩阵,以及产生第二信息,所述第二信息用于触发采用所导出的所述第二初级变换核矩阵对所述用于编码或解码的目标数据块进行编码或解码,其中所述第二初级变换核矩阵是DCT-8、DST-1和DCT-5中的一个。


2.根据权利要求1所述的方法,其特征在于,
所述第一初级变换核矩阵是使用8个整数创建的8点8位DST-7初级变换核矩阵,所述8个整数包括a、b、c、d、e、f、g和h及其各自的符号变换,并且
所述8个整数{a,b,c,d,e,f,g,h}等于{17,32,46,60,71,78,85,86}。


3.根据权利要求1所述的方法,其特征在于,
所述第一初级变换核矩阵是使用16个整数创建的16点8位DST-7初级变换核矩阵,所述16个整数包括a、b、c、d、e、f、g、h、i、j、k、l、m、n、o和p及其各自的符号变换,并且
所述16个整数{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p}等于{9,17,25,33,41,49,56,62,66,72,77,81,83,87,89,90}。


4.根据权利要求1所述的方法,其特征在于,
所述第一初级变换核矩阵是使用32个整数创建的32点8位DST-7初级变换核矩阵,所述32个整数包括a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p、q、r、s、t、u、v、w、x、y、z、A、B、C、D、E和F及其各自的符号变换,并且
所述32个整数{a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,A,B,C,D,E,F}等于{4,9,13,17,21,26,30,34,38,42,45,50,53,56,60,63,66,68,72,74,77,78,80,82,84,85,86,88,88,89,90,90}。


5.根据权利要求1所述的方法,其特征在于,
所述第一初级变换核矩阵是使用64个整数创建的64点8位DST-7初级变换核矩阵,所述64个整数包括aa、ab、ac、ad、ae、af、ag、ah、ai、aj、ak、al、am、an、ao、ap、aq、ar、as、at、au、av、aw、ax、ay、az、ba、bb、bc、bd、be、bf、bg、bh、bi、bj、bk、bl、bm、bn、bo、bp、bq、br、bs、bt、bu、bv、bw、bx、by、bz、ca、cb、cc、cd、ce、cf、cg、ch、ci、cj、ck和cl及其各自的符号变换,并且
所述64个整数{aa,ab,ac,ad,ae,af,ag,ah,ai,aj,ak,al,am,an,ao,ap,aq,ar,as,at,au,av,aw,ax,ay,az,ba,bb,bc,bd,be,bf,bg,bh,bi,bj,bk,bl,bm,bn,bo,bp,bq,br,bs,bt,bu,bv,bw,bx,by,bz,ca,cb,cc,cd,ce,cf,cg,ch,ci,cj,ck,cl}等于{2,5,7,8,11,13,15,17,20,22,23,26,29,30,32,34,37,38,41,42,44,46,48,49,52,53,55,58,59,60,62,64,65,66,68,69,72,72,74,73,76,77,78,79,81,80,82,83,85,84,85,86,87,87,88,89,89,90,89,90,90,90,90,90}。


6.根据权利要求1所述的方法,其特征在于,
所述第二初级变换核矩阵是使用8个整数创建的8点8位DCT-8初级变换核矩阵,所述8个整数包括a、b、c、d、e、f、g和h及其各自的符号变换,并且
所述8个整数{a,b,c,d,e,f,g,h}等于{86,85,78,71,60,46,32,17}。


7.根...

【专利技术属性】
技术研发人员:赵欣李翔刘杉
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1