当前位置: 首页 > 专利查询>诺基亚公司专利>正文

用于视频编码的设备、方法和计算机程序技术

技术编号:8134227 阅读:183 留言:0更新日期:2012-12-27 13:36
公开了用于视频编码的设备、方法和计算机程序。该设备包括选择器,配置用于选择用于预测的像素;投影定义器,配置用于确定所述像素向参考像素集合的投影;以及预测定义器,配置用于基于所述投影,从所述参考像素集合中选择一个或多个参考像素,以及使用所述选择的一个或多个参考像素来获取用于待预测的所述像素的预测值。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于编码和解码的设备、方法和计算机程序。
技术介绍
视频编解码器可以包括编码器和解码器,其中编码器将输入视频转换成适于存储和/或传输的压缩表征,而解码器可以将压缩的视频表征解压缩回可视形式;或者,视频编解码器可以包括编码器和解码器中的任何一个。典型地,编码器丢弃原始视频序列中的某些信息,以便以更紧致的格式(例如,较低的比特率)来表征视频。根据例如国际电信联盟的ITU-T H. 263和H. 264编码标准进行操作的典型视频编解码器按照两个阶段对视频信息进行编码。在第一阶段中,对某些图片区域或“块”中的 像素值进行预测。这些像素值可以例如通过运动补偿机制进行预测,这些机制涉及查找和指示之前编码的视频帧(或之后编码的视频帧)的一个帧中、与正被编码的块最为对应的区域。此外,像素值可以通过空间机制进行预测,这些空间机制涉及查找和指示空间区域关系O使用来自之前(或之后)图像的图像信息的预测方式也可以称为帧间预测方法,而使用同一图像内图像信息的预测方式也可以称为帧内预测方法。第二阶段是对预测的像素块与原始像素块之间的误差进行编码的阶段。这典型地是通过使用指定的变换对像素值的差值进行变换来实现的。此变换典型地是离散余弦变换(DCT)或其变体。在对该差值进行变换之后,经变换的差值被量化和熵编码。通过改变量化过程的保真度,编码器可以控制像素表征的准确度(换言之,图片的质量)与得到的编码视频表征的大小(换言之,文件大小或传输比特率)之间的平衡。解码器通过应用与编码器在形成像素块的预测表征时使用的预测机制类似的预测机制以及预测误差解码来重建输出视频,其中,该预测机制使用由编码器创建的并存储在图像压缩表征中的运动信息或空间信息,并且预测误差解码是用于在空间域中恢复量化预测误差信号的预测误差编码的逆操作。在应用了像素预测过程和误差解码过程之后,解码器将该预测和预测误差信号(像素值)进行组合以形成输出视频帧。解码器(和编码器)还可以应用附加的过滤过程,以便在传递输出的视频以供显示之前和/或将其作为视频序列中将来帧的预测参考进行存储之前,改善该输出视频的质量。在典型的视频编解码器中,运动信息由与每个经运动压缩的图像块相关联的运动矢量所指示。这些运动矢量中的每一个代表(在编码器中)待编码的或(在解码器处)待解码的图片中的图像块相对于之前编码的或解码的图像(或图片)中一个图像(或图片)中的预测源块的位移。为了高效地表示运动矢量,运动矢量典型地针对块特定的预测运动矢量进行差分编码。在典型的视频编解码器中,以预定义方式(例如,通过计算相邻块的编码或解码运动矢量的中值)来创建预测的运动矢量。在典型的视频编解码器中,运动补偿之后的预测残差首先利用变换内核(如DCT)进行变换并继而进行编码。这样做的原因在于,通常,在残差中仍然存在某些关联性,变换在很多情况下有助于减小这种关联性并提供更有效的编码。典型的视频编码器利用拉格朗日成本函数来找寻最优的编码模式,例如,期望的宏块模式和关联的运动矢量。这种类型的成本函数使用加权因子或λ、以将归因于有损编码方法的准确或估计的图像失真与为了表示图像区域中像素值所需的准确或估计的信息量连结在一起。这可以由下述等式表示C = D+λ R (I)其中,C是待最小化的拉格朗日成本,D是目前考虑的模式和运动矢量情 况下的图像失真(例如,原始图像块中的像素值与编码图像块中的像素值之间的均方误差),λ是拉格朗日系数,以及R是表示用于在解码器中重建图像块所需数据所需要的比特数量(包括用于表示候选运动矢量的数据量)。某些混合视频编解码器(诸如,H. 264/AVC)借助于利用图片中已处理区域的像素值的空间手段来预测帧内编码区域。典型的编解码器具有可用预测方法的固定集合,这些方法根据对应的方向提供预测。如果可用预测方向的数量较少,则压缩性能可能受影响,因为可能不存在与图片内容中的所有方向性结构匹配的方法。如果可用预测方向的数量较多,则实现复杂度可能成为负担。某些编解码器使用较少数量的方向性帧内预测方法,例如,从2个至8个不同的方向,这可产生次优性能,但是可能将实现复杂度保持在适度水平。
技术实现思路
本专利技术提供了可以在视频编解码器的帧内预测子系统中支持相对大量预测方向的某些实施方式。根据某些实施方式,预测过程由给定粒度的、无论是水平方向还是竖直方向的参考像素行和一行像素之间的位移测量来定义。在针对块中每个像素推导预测值的时候,所选择的位移用于计算每个像素向参考像素行的投影,以及使用插值操作以便利用投影的像素位置距最近参考像素的距离来计算最终预测值。根据本专利技术的第一方面,提供了一种设备,包括选择器,配置用于选择用于预测的像素;投影定义器,配置用于确定所述像素向参考像素集合的投影;以及预测定义器,配置用于基于所述投影,从所述参考像素集合中选择一个或多个参考像素,以及使用所述选择的一个或多个参考像素来获取用于待预测的所述像素的预测值。根据本专利技术的第二方面,提供了一种方法,包括选择用于预测的像素;确定所述像素向参考像素集合的投影;以及基于所述投影,从所述参考像素集合中选择一个或多个参考像素;以及通过使用所述选择的一个或多个参考像素来获取用于待预测的所述像素的预测值。根据本专利技术的第三方面,提供了一种计算机可读存储介质,其上存储有供设备使用的代码,在由处理器执行时,所述代码引起所述设备选择用于预测的像素;确定所述像素向参考像素集合的投影;以及基于所述投影,从所述参考像素集合中选择一个或多个参考像素;以及通过使用所述选择的一个或多个参考像素来获取用于待预测的所述像素的预测值。根据本专利技术的第四方面,提供了至少一个处理器和至少一个存储器,所述至少一个存储器上存储有代码,在由所述至少一个处理器执行时,所述代码引起设备选择用于预测的像素; 确定所述像素向参考像素集合的投影;以及基于所述投影,从所述参考像素集合中选择一个或多个参考像素;以及通过使用所述选择的一个或多个参考像素来获取用于待预测的所述像素的预测值。根据本专利技术的第五方面,提供了一种设备,包括分析器,配置用于检查关于待解码图像的像素块的方向性的指示;以及重建器,配置用于确定待解码的所述像素块的像素在参考像素集合上的投影;以及基于所述投影,从所述参考像素集合中选择一个或多个参考像素,以及使用所述选择的一个或多个参考像素来获取用于待预测的所述像素的预测值。根据本专利技术的第六方面,提供了一种方法,包括检查关于待解码图像的像素块的方向性的指示;确定待解码的所述像素块的像素在参考像素集合上的投影;以及基于所述投影,从所述参考像素集合中选择一个或多个参考像素,以及使用所述选择的一个或多个参考像素来获取用于待预测的所述像素的预测值。根据本专利技术的第七方面,提供了一种计算机可读存储介质,其上存储有供设备使用的代码,在由处理器执行时,所述代码引起所述设备检查关于待解码图像的像素块的方向性的指示;确定待解码的所述像素块的像素在参考像素集合上的投影;基于所述投影,从所述参考像素集合中选择一个或多个参考像素;以及使用所述选择的一个或多个参考像素来获取用于待预测的所述像素的预测值。根据本专利技术的第八方面,提供了至少一个处理器和至少一个存储器,所述至少一个存储器上存储有代码,在由所述至少一个处理器执行时,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.02.08 US 61/302,3031.一种根据第一实施方式的设备,包括 选择器,配置用于选择用于预测的像素; 投影定义器,配置用于确定所述像素向参考像素集合的投影;以及 预测定义器,配置用于基于所述投影,从所述参考像素集合中选择一个或多个参考像素,以及使用所述选择的一个或多个参考像素来获取用于待预测的所述像素的预测值。2.如权利要求I的设备,进一步包括 成本评估器,用于评估第一投影和用于第二投影的第二成本值,其中所述选择器进一步配置用于基于所述第一成本值和所述第二成本值,选择用于编码的所述投影。3.如权利要求I的设备,其中所述投影定义器进一步配置用于确定针对像素的当前块的方向性值。4.如权利要求I的设备,其中所述投影定义器进一步配置用于检查所述投影是否指向所述像素集合的一个像素,以及如果是,则所述预测定义器进一步配置用于将所述参考像素的值用作所述选择的像素的预测值。5.如权利要求I的设备,其中所述预测定义器配置用于使用至少两个参考像素来获取所述选择的像素的预测值,其中所述预测值是通过对所述至少两个参考像素的值进行插值而确定的。6.如权利要求I的设备,进一步配置用于将指示所述投影和所述选择的编码方法的信息编码到比特流中。7.如权利要求I的设备,其中所述投影可以指示为基于一个参考点和所述当前块的一个像素而确定的位移值。8.如权利要求I的设备,其中所述图像包括位于两个或更多行以及两个或更多列中的至少四个像素块,每个像素块包括至少两行像素以及至少两列像素,所述设备进一步配置用于从左向右以及从上向下逐块对所述图像进行编码,其中所述投影定义器配置用于基于作为控制点的、所述块的右下角处像素来确定所述投影。9.一种方法,包括 选择用于预测的像素; 确定所述像素向参考像素集合的投影;以及 基于所述投影,从所述参考像素集合中选择一个或多个参考像素;以及 通过使用所述选择的一个或多个参考像素来获取用于待预测的所述像素的预测值。10.如权利要求9的方法,进一步包括 确定针对像素的当前块的方向性值。11.如权利要求9的方法,进一步包括 检查所述投影是否指向所述像素集合的一个像素,以及如果是,则将所述参考像素的值用作所述选择的像素的预测值。12.如权利要求9的方法,进一步包括 使用至少两个参考像素来获取所述选择的像素的预测值,以及通过对所述至少两个参考像素的值进行插值来确定所述预测值。13.如权利要求9的方法,进一步包括 将指示所述投影和所述选择的编码...

【专利技术属性】
技术研发人员:J·莱纳玛K·昂格尔
申请(专利权)人:诺基亚公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1