对视频数据进行解码的方法、装置和介质制造方法及图纸

技术编号:35416838 阅读:19 留言:0更新日期:2022-11-03 11:15
一种电子装置执行对视频数据进行解码的方法。所述方法包括:从比特流接收第一控制标志;根据从第一控制标志确定MMVD被启用,从比特流接收视频数据的第二控制标志,第二控制标志与一个或多个编码单元中的相应编码单元相对应,第二控制标志指示MMVD是否应用于相应编码单元;根据从第二控制标志确定MMVD应用于相应编码单元,从视频数据接收第三控制标志;根据从第三控制标志确定针对相应编码单元启用InterPF模式,从视频数据接收第四语法元素;以及通过将MMVD和所标识的InterPF模式应用于与相应编码单元相对应的视频数据来重建相应编码单元。码单元。码单元。

【技术实现步骤摘要】
对视频数据进行解码的方法、装置和介质
[0001]本申请是中国专利申请第202180003819.1号的分案申请,该中国专利申请为2021年3月16日提交的国际专利申请PCT/US2021/022606的中国国家阶段申请,该国际专利申请要求2020年3月16日提交的美国专利申请第62/989,900号的优先权。


[0002]本申请总体上涉及视频编解码和压缩,并且更具体地,涉及提高具有运动矢量差的合并模式(MMVD)(也被称为高级运动矢量表达(UMVE)模式)的编解码效率的方法和装置。

技术介绍

[0003]如数字电视、膝上型计算机或台式计算机、平板计算机、数码相机、数字录音设备、数字媒体播放器、视频游戏机、智能电话、视频电话会议设备、视频流式传输设备等各种电子设备都支持数字视频。电子设备通过实施视频压缩/解压缩标准来传输、接收、编码、解码和/或存储数字视频数据。一些众所周知的视频编解码标准包括通用视频编解码(VVC)、高效视频编解码(HEVC,也被称为H.265或MPEG

H第2部分)和高级视频编解码(AVC,也被称为H.264或MPEG

4第10部分),这些视频编解码标准由ISO/IEC MPEG和ITU

T VECG联合开发。AO媒体视频1(AOMedia Video 1,AV1)由开放媒体联盟(AOM)开发作为其先前标准VP9的后续标准。音视频编解码标准(AVS)(其是指数字音频和数字视频压缩标准)是中国数字音视频编解码技术标准工作组(Audio and Video Coding Standard Workgroup of China)开发的另一个视频压缩系列标准。
[0004]视频压缩典型地包括执行空间(帧内)预测和/或时间(帧间)预测以减少或去除视频数据中固有的冗余。对于基于块的视频编解码,将视频帧划分为一个或多个条带,每个条带具有多个视频块,该视频块也可以被称为编码树单元(CTU)。每个CTU可以包含一个编码单元(CU)或递归地分割成较小的CU,直到达到预定义的最小CU尺寸。每个CU(也称为叶CU)包含一个或多个变换单元(TU),并且每个CU还包含一个或多个预测单元(PU)。可以以帧内、帧间或IBC模式对每个CU进行编解码。相对于同一视频帧内的相邻块中的参考样本,使用空间预测对视频帧的帧内编码(I)条带中的视频块进行编码。视频帧的帧间编码(P或B)条带中的视频块可以相对于同一视频帧内的相邻块中的参考样本使用空间预测或相对于其他先前和/或未来参考视频帧中的参考样本使用时间预测。
[0005]基于先前已编码的参考块(例如,相邻块)的空间或时间预测产生针对待编码的当前视频块的预测块。查找参考块的过程可以通过块匹配算法来完成。表示待编码的当前块与预测块之间的像素差的残差数据被称为残差块或预测误差。根据指向形成预测块的参考帧中的参考块的运动矢量、以及残差块来对帧间编码块进行编码。确定运动矢量的过程典型地被称为运动估计。根据帧内预测模式和残差块对帧内编码块进行编码。为了进一步压缩,将残差块从像素域变换到变换域,例如频域,从而产生残差变换系数,然后可以对该残差变换系数进行量化。可以扫描最初布置为二维阵列的量化的变换系数,以产生变换系数的一维矢量,并且然后将其熵编码为视频比特流,以实现更多的压缩。
[0006]然后,将已编码视频比特流保存在计算机可读存储介质(例如,闪速存储器)中,以被具有数字视频能力的另一个电子设备访问,或者直接以有线或无线方式传输到电子设备。然后,电子设备通过例如解析已编码视频比特流以从比特流获得语法元素并且至少部分地基于从比特流获得的语法元素将数字视频数据从已编码视频比特流重建为其原始格式来执行视频解压缩(其是与上文描述的视频压缩相反的过程),并且在电子设备的显示器上渲染重建数字视频数据。
[0007]随着数字视频质量从高清到4K
×
2K或甚至8K
×
4K,待编码/解码的视频数据量呈指数增长。如何在保持解码视频数据的图像质量的同时更高效地对视频数据进行编码/解码方面一直存在挑战。

技术实现思路

[0008]本申请描述了与视频数据编码和解码有关的实施方式,并且更具体地,与提高具有运动矢量差的合并模式(MMVD)(也被称为高级运动矢量表达(UMVE)模式)的编解码效率的方法和装置有关的实施方式。
[0009]根据本申请的第一方面,一种对视频数据进行解码的方法包括:从比特流接收第一控制标志,其中,第一控制标志指示是否针对视频序列中的一个或多个编码单元启用具有运动矢量差的合并模式MMVD;根据从第一控制标志确定MMVD被启用,从视频数据接收第一语法元素,其中,第一语法元素标识多个运动矢量差MVD偏移量集合中的一个MVD偏移量集合;从比特流接收视频数据的第二控制标志,第二控制标志与一个或多个编码单元中的相应编码单元相对应,第二控制标志指示MMVD是否应用于相应编码单元;根据从第二控制标志确定MMVD应用于相应编码单元,接收相应编码单元的第二语法元素和相应编码单元的第三语法元素,第二语法元素从所标识的MVD偏移量集合中选择MVD偏移量,第三语法元素选择与所选择的MVD偏移量相对应的MVD方向;基于所选择的MVD偏移量和所选择的MVD方向来形成MVD;以及通过应用所形成MVD生成相应编码单元的运动矢量,来重建相应编码单元。
[0010]根据本申请的第二方面,一种对视频数据进行解码的方法包括从比特流接收第一控制标志,其中,第一控制标志指示是否针对一个或多个编码单元启用具有运动矢量差的合并模式MMVD;根据从第一控制标志确定MMVD被启用,从比特流接收视频数据的第二控制标志,第二控制标志与一个或多个编码单元中的相应编码单元相对应,第二控制标志指示MMVD是否应用于相应编码单元;根据从第二控制标志确定MMVD应用于相应编码单元,从视频数据接收第三控制标志,其中,第三控制标志指示是否针对相应编码单元启用帧间预测滤波InterPF模式;根据从第三控制标志确定针对相应编码单元启用InterPF模式,从视频数据接收第四语法元素,其中,第四语法元素标识相应编码单元的多个InterPF模式中的一个InterPF模式;以及通过将MMVD和所标识的InterPF模式应用于与相应编码单元相对应的视频数据来重建相应编码单元。
[0011]根据本申请的第三方面,一种电子装置包括一个或多个处理单元、存储器以及存储在存储器中的多个程序。程序当由一个或多个处理单元执行时使电子装置执行如上文描述的对视频数据进行解码的方法。
[0012]根据本申请的第四方面,一种非暂态计算机可读存储介质存储用于由具有一个或多个处理单元的电子装置执行的多个程序。程序当由一个或多个处理单元执行时使电子装
置执行如上文描述的对视频数据进行解码的方法。
[0013]根据本申请的第五方面,一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现如上文描述的对视频数据进行解码的方法。
附图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对视频数据进行解码的方法,所述方法包括:从比特流接收第一控制标志,其中,所述第一控制标志指示是否针对一个或多个编码单元启用具有运动矢量差的合并模式MMVD;根据从所述第一控制标志确定所述MMVD被启用,从所述比特流接收视频数据的第二控制标志,所述第二控制标志与所述一个或多个编码单元中的相应编码单元相对应,所述第二控制标志指示所述MMVD是否应用于所述相应编码单元;根据从所述第二控制标志确定所述MMVD应用于所述相应编码单元,从所述视频数据接收第三控制标志,其中,所述第三控制标志指示是否针对所述相应编码单元启用帧间预测滤波InterPF模式;根据从所述第三控制标志确定针对所述相应编码单元启用所述InterPF模式,从所述视频数据接收第四语法元素,其中,所述第四语法元素标识所述相应编码单元的多个InterPF模式中的InterPF模式;以及通过将所述MMVD和所标识的InterPF模式应用于与所述相应编码单元相对应的所述视频数据来重建所述相应编码单元。2.根据权利要求1所述的方法,其中,所述多个InterPF模式包括至少两个InterPF模式。3.根据权利要求1或2所述的方法,其中,所述重建所述相应编码单元包括:根据确定所述第四语法元素所标识...

【专利技术属性】
技术研发人员:王祥林修晓宇陈伟陈漪纹马宗全朱弘正于冰
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1