用于视频编码的设备和方法技术

技术编号:20887503 阅读:28 留言:0更新日期:2019-04-17 13:46
本发明专利技术涉及一种用于对编码视频数据进行解码的装置(121),所述编码视频数据包括多个帧,每个帧被划分为多个视频编码块,包括当前视频编码块,其又包括多个子块。所述解码装置(121)包括:解码单元(123),用于对所述编码视频数据进行解码,以提供与所述当前视频编码块相关联的残差视频编码块,并从所述编码视频数据中提取参数调整信息;预测单元(125),用于通过为所述当前视频编码块的每个子块生成预测子块,为所述当前视频编码块生成预测视频编码块,其中,所述预测单元(125)还用于针对所述当前视频编码块的每个子块,根据所述参数调整信息来调整为所述当前视频编码块定义的预测参数,并基于调整后的预测参数生成所述预测子块;以及恢复单元(127),用于根据所述残差视频编码块和所述预测视频编码块恢复所述当前视频编码块。

【技术实现步骤摘要】
【国外来华专利技术】用于视频编码的设备和方法
本专利技术涉及视频编码领域。更具体地说,本专利技术涉及用于编码视频数据的编码装置和解码装置。
技术介绍
数字视频通信和存储应用由各种各样的数字设备来实现,例如数码相机、蜂窝无线电话、笔记本电脑、广播系统、视频会议系统等。这些应用中最重要和最具挑战性的任务之一为视频压缩。视频压缩的任务是复杂的,并受到两个相互矛盾的参数的约束:压缩效率和计算复杂度。ITU-TH.264/AVC或ITU-TH.265/HEVC等视频编码标准提供了良好的参数折衷。由于这个原因,支持视频编码标准几乎是对任意视频压缩应用的强制性要求。现有视频编码标准基于将源图像划分为视频编码块(或短块)。这些块的处理取决于它们的尺寸、空间位置和编码器指定的编码模式。根据预测类型,可将编码模式分为两组:帧内和帧间预测模式。帧内预测模式使用相同图片(也称为帧或图像)的像素来生成参考样本以计算正在重构的块的像素的预测值。帧内预测也可以称为空间预测。帧间预测模式旨在用于时间预测,并使用前一个或后一个图片的参考样本来预测当前图片的块的像素。在预测阶段之后,对原始信号与预测信号之间的差值即预测误差进行变换编码。然后,使用熵编码器(例如,用于AVC/H.264和HEVC/H.265的CABAC)对变换系数和边信息进行编码。最近通过的ITU-TH.265/HEVC标准(ISO/IEC23008-2:2013中2013年11月的《信息技术—异构环境中高效编码和媒体分发第2部分:高效视频编码》)宣布了一套现有技术的视频编码工具,合理地权衡了编码效率和计算复杂度。《IEEE视频技术电路和系统汇刊》2012年12月第22卷第12期中,GaryJ.Sullivan的《高效视频编码(HighEfficiencyVideoCoding,简称HEVC)标准概述》中给出了ITU-TH.265/HEVC标准概述。其全部内容通过引用并入本文。与ITU-TH.264/AVC视频编码标准类似,HEVC/H.265视频编码标准将源图片划分成块,例如编码单元(codingunit,简称CU)。可以进一步地将每个CU分成更小的CU或预测单元(predictingunit,简称PU)。PU可以根据应用于PU的像素的处理类型进行帧内或帧间预测。在帧间预测的情况下,PU表示运动补偿通过为PU指定的运动矢量处理的像素面积。对于帧内预测,相邻块的相邻像素用作参考样本以预测当前块。PU指定一种预测模式,该预测模式从该PU中包含的所有转换单元(transformunit,简称TU)的帧内预测模式集合中选择。TU可以具有不同的大小(例如,4×4、8×8、16×16和32×32像素),并且可以采用不同的方式进行处理。TU中进行变换编码,即利用离散余弦变换或离散正弦变换对预测误差进行变换(在HEVC/H.265标准中,将变换编码应用于帧内编码块)并量化。因此,重构的像素包括量化噪声(量化噪声会变得明显,比如,作为单元之间的块效应、锐边附近的环状伪影等),其是诸如DBF、SAO和ALF等环内滤波器所试图抑制的。使用复杂的预测编码(诸如运动补偿和帧内预测)和分区技术(例如,用于CU和PU的QT以及用于TU的RQT)允许标准化委员会大幅减少PU中的冗余。导致这些视频编码标准成功应用的预测工具可以粗略地区分为帧间和帧内预测工具。帧内预测仅依赖于当前图片中包含的信息,而帧间预测采用不同图片之间的冗余以进一步提高编码效率。因此,通常帧内预测需要比帧间预测更高的比特率,以实现典型视频信号的相同视觉质量。目前,使用不同的机制来发送关于如何选择由帧内或帧间预测工具生成的预测器的信息。最直接的方法就是在编码单元(codingunit,简称CU)或预测单元(predictionunit,简称PU)级别上使用一个或多个比特,其中,该级别处指示帧内预测模式。该方法已经在许多工具(例如,PDPC和MPI)上实现。另一种机制是通过增强型多变换(EnhancedMultipleTransform,简称EMT)实现的,也称为自适应多变换(AdaptiveMultipleTransform,简称AMT)。这种方法背后的基本思想是使用CU级别标志(emtCuFlag)来表示是否需要TU级别索引(emtTuIdx)。然而,EMT不直接与预测编码部分相关。信令的另一个方面是如何编码和解码该信息。传统方法中该信息是熵编码的。例如,可以使用CABAC或其它熵编码器。另一种方法是将残差或预测信息中的边信息隐藏起来。在后一种方法中,将校验函数应用于主信号(即,应用于运动矢量差异投影的残差或量级),以在解码器侧检索隐藏值。因此,有不同方式可以指示已选择的预测模式。但是,这些方式相互独立,无法彼此协调。主要问题是预测工具的非系统化信令机制在诸如HM和JEM的不同混合视频编码框架中会引起大量的开销。如果启用预测相关的语法元素的任何组合,则该问题的另一个结果可能是随着编码器侧计算量的增加,编码器侧的计算复杂度随之增加。因此,需要用于视频编码的设备和方法。
技术实现思路
用于视频编码的设备和方法是本专利技术的一个目的。上述和其它目的通过独立权利要求的主题来实现。根据从属权利要求、说明书以及附图,进一步的实现形式是显而易见的。下文中采用多个术语,在实施例中,这些术语具有以下含义:切片-独立编码/解码的图像的不同空间区域。切片头-用于传输与特定切片相关联的信息的数据结构。视频编码块(或短块)-M×N(M列N行)像素数组或样本(每个像素/样本与至少一个像素/样本值相关联)或M×N变换系数数组。编码树单元(codingtreeunit,简称CTU)网格-用于将像素块分成用于视频编码的宏块的网格结构。编码单元(CodingUnit,简称CU)-亮度样本的编码块,具有三个样本数组的图像的色度样本的两个对应编码块,单色图片的样本编码块或使用三个单独的色彩平面和语法进行编码的图片的样本编码块。图像参数集(PictureParameterSet,简称PPS)-包含适用于零个或多个整体编码图像的语法元素的语法结构,其由在每个切片头中发现的语法元素确定。序列参数集(SequenceParameterSet,简称SPS)-包含适用于零个或多个整体编码视频序列的语法元素的语法结构,其由在PPS中发现的语法元素的内容确定,PPS在每个切片头中发现的语法元素所引用。视频参数集(VideoParameterSet,简称VPS)-包含适用于零个或多个整体编码视频序列的语法元素的语法结构。预测单元(PredictionUnit,简称PU)-亮度样本的预测块,具有三个样本数组的图片的色度样本的两个对应预测块,单色图片的样本预测块或使用三个单独的色彩平面和语法进行预测所述预测块样本的图片的样本预测块。转换单元(TransformUnit,简称TU)-亮度样本的转换块,具有三个样本数组的图片的色度样本的两个对应转换块,单色图片的样本转换块或使用三个单独的色彩平面和语法进行预测所述转换块样本的图片的样本转换块。补充增强信息(Supplementalenhancementinformation,简称SEI)-可插入到视频比特流中来增强视频的使用的额外信息。亮度-指示图像样本的亮度的信息。色度本文档来自技高网
...

【技术保护点】
1.一种用于对编码视频数据进行解码的装置(121),其特征在于,所述编码视频数据包括多个帧,每个帧被划分为多个视频编码块,包括当前视频编码块,其又包括多个子块,其中,所述装置(121)包括:解码单元(123),用于解码所述编码视频数据,以提供与所述当前视频编码块相关联的残差视频编码块,且用于从所述编码视频数据中提取参数调整信息;预测单元(125),用于通过为所述当前视频编码块的每个子块生成预测子块,为所述当前视频编码块生成预测视频编码块,其中,所述预测单元(125)还用于针对所述当前视频编码块的每个子块,根据所述参数调整信息来调整为所述当前视频编码块定义的预测参数,并基于调整后的预测参数生成所述预测子块;恢复单元(127),用于基于所述残差视频编码块和所述预测视频编码块恢复所述当前视频编码块。

【技术特征摘要】
【国外来华专利技术】1.一种用于对编码视频数据进行解码的装置(121),其特征在于,所述编码视频数据包括多个帧,每个帧被划分为多个视频编码块,包括当前视频编码块,其又包括多个子块,其中,所述装置(121)包括:解码单元(123),用于解码所述编码视频数据,以提供与所述当前视频编码块相关联的残差视频编码块,且用于从所述编码视频数据中提取参数调整信息;预测单元(125),用于通过为所述当前视频编码块的每个子块生成预测子块,为所述当前视频编码块生成预测视频编码块,其中,所述预测单元(125)还用于针对所述当前视频编码块的每个子块,根据所述参数调整信息来调整为所述当前视频编码块定义的预测参数,并基于调整后的预测参数生成所述预测子块;恢复单元(127),用于基于所述残差视频编码块和所述预测视频编码块恢复所述当前视频编码块。2.根据权利要求1所述的解码装置(121),其特征在于,所述预测单元(125)用于执行帧内预测和/或帧间预测,以生成所述预测视频编码块。3.根据权利要求1或2所述的解码装置(121),其特征在于,所述编码视频数据为熵编码,其中,所述解码单元(123)用于:通过解码所述编码视频数据从所述编码视频数据中提取所述参数调整信息。4.根据权利要求1或2所述的解码装置(121),其特征在于,所述参数调整信息通过数据隐藏技术隐藏在所述编码视频数据中,并且所述解码单元(123)用于通过将校验函数,尤其是奇偶校验函数,应用于所述编码视频数据,从所述编码视频数据中提取所述参数调整信息。5.根据前述权利要求中任一项所述的解码装置(121),其特征在于,所述预测参数是定义第一状态和第二状态的预测标志,其中,所述预测单元(125)用于根据所述参数调整信息来调整所述预测标志的状态。6.根据权利要求5所述的解码装置(121),其特征在于,所述预测参数定义帧内预测模式。7.一种用于对编码视频数据进行解码的方法(200),其特征在于,所述编码视频数据包括多个帧,每个帧被划分为多个视频编码块,包括当前视频编码块,其又包括多个子块,其中,所述解码方法(200)包括:解码(201)所述编码视频数据,以提供与所述当前视频编码块相关联的残差视频编码块,并从所述编码视频数据中提取参数调整信息;通过为所述当前视频编码块的每个子块生成(203)预测子块,为所述当前视频编码块生成预测视频编码块,包括:针对所述当前视频编码块的每个子块,根据所述参数调整信息来调整为所述当前视频编码块定义的预测参数,并基于调整后的预测参数生成所述预测子块的步骤;基于所述残差视频编码块和所述预测视频编码块恢复(205)所述当前视频编码块。8.一种用于编码视频数...

【专利技术属性】
技术研发人员:阿列克谢·康斯坦丁诺维奇·菲利波夫瓦西里·亚历斯维奇·拉夫特斯基
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1