具有非对称分区的帧内块复制预测以及编码器侧搜索图案、搜索范围和用于分区的方法技术

技术编号:13624819 阅读:99 留言:0更新日期:2016-09-01 17:36
在帧内块复制(“BC”)预测中的创新以及在编码器侧搜索图案、和用于分区的方法中的创新。例如,一些创新涉及针对帧内BC预测使用非对称分区。其它创新涉及在块向量估计(用于帧内BC预测)或运动估计期间编码器使用的搜索图案或方法。又一些其它创新涉及使用在BV估计期间使用具有水平或垂直偏置的BV搜索范围。

【技术实现步骤摘要】
【国外来华专利技术】背景工程师使用压缩(也叫做源编码(source coding或source encoding))来降低数字视频的比特率。压缩通过将视频信息转换成较低比特率的形式来降低存储和传送该信息的成本。解压(也被称为解码)从压缩的形式中重构一种版本的原始信息。“编解码器”是编码器/解码器系统。在过去的二十年中,已采用了各种视频编解码器标准,包括ITU-T H.261、H.262(MPEG-2或ISO/IEC 13818-2)、H.263和H.264(MPEG-4AVC或ISO/IEC 14496-10)标准、MPEG-1(ISO/IEC 11172 1 172-2)和MPEG-4视觉(ISO/IEC 14496-2)标准以及SMPTE 421M(VC-1)标准。最近,H.265/HEVC标准(ITU-T H.265或ISO/IEC 23008-2)已被批准。目前,(例如,用于可缩放视频编码/解码、用于在样本比特深度或色度采样率方面具有较高保真度的视频的编码/解码、用于屏幕捕捉内容、或用于多视图编码/解码的)H.265/HEVC标准的扩展处于开发中。视频编解码器标准通常定义针对经编码的视频比特流的句法的选项,从而详述当在编码和解码时使用特定特征时该比特流中的参数。在许多情况下,视频编解码器标准还提供关于解码器应当执行以在解码时取得一致的结果的解码操作的细节。除了编解码器标准外,各种专用编解码器格式定义针对经编码的视频比特流的句法的其他选项以及相应的解码操作。帧内块复制(“BC”)是H.265/HEVC扩展的处于开发中的预测模式。对于帧内BC预测模式,图片的当前块的样本值是使用同一图片中的先前重构的样本值来预测的。块向量(“BV”)指示从当前块到图片的包括用于预测的先前重构的样本值的区域的位移。BV被信号化在比特流中。帧内BC预测是一种形式的图片内预测——针对图片的块的帧内BC预测不使用除了同一图片中的样本值以外的任何样本值。如当前在HEVC标准中规定并在针对HEVC标准的某一参考软件中实现的,帧内BC预测模式具有若干问题。特别是,用于帧内BC预测的块大小的选项在许多场景下过于受限,而且在许多场景下不能使关于块大小以及如何使用帧内BC预测的编码器侧决策高效。概述概言之,本详细描述呈现了在帧内块复制(“BC)预测中的创新以及在编码器侧搜索图案、搜索范围和用于分区的方法中的创新。”例如,一些创新涉及针对帧内BC预测使用非对称分区(有时被称为“AMP)。”其它创新涉及在块向量(“BV”)估计(用于帧内BC预测)或运动估计期间编码器使用的搜索图案或方法。又一些其它创新涉及使用在BV估计期间使用具有水平或垂直偏置的BV搜索范围。根据本文中描述的创新中的第一方面,图像编码器或视频编码器对图像或视频进行编码以产生经编码的数据并将经编码数据作为比特率的一部分输出。作为编码的一部分,编码器执行为了帧内BC预测而被非对称分区的当前块的帧内BC预测。例如,所述当前块是2N x 2N块,且所述当前块被分区为(1)一2N x N/2块和一2N x 3N/2块或(2)一2N x 3N/2块和一2N x N/2块。或者,作为另一示例,所述当前块是2N x 2N块,且其中所述当前块被分区为(1)一N/2 x 2N块和一3N/2 x 2N块或(2)一3N/2 x 2N块和一N/2 x 2N块。更一般而言,对于非对称分区,当前块可被划分为具有不同维度的两个分区。作为编码的一部分,编码器还可执行为了帧内BC预测而被对称分区的另一块的帧内BC预测。例如,另一块是被分区为(1)两个2N x N块,(2)两个N x 2N块,或(3)四个N x N块的2N x 2N块,每个块可被进一步分区为两个N x N/2块、两个N/2 x N块、或四个N/2 x N/2块。更一般而言,对于对称分区,该另一块可被划分为具有等同维度的分区。根据本文中描述的创新中的第二方面,图像解码器或视频解码器接收作为比特率的一部分的经编码数据并将经编码数据进行解码以重构图像或视频。作为解码的一部分,解码器执行为了帧内BC预测而被非对称分区的当前块的帧内BC预测。例如,所述当前块是2N x 2N块,且所述当前块被分区为(1)一2N x N/2块和一2N x 3N/2块或(2)一2N x 3N/2块和一2N x N/2块。或者,作为另一示例,所述当前块是2N x 2N块,且其中所述当前块被分区为(1)一N/2 x 2N块和一3N/2 x 2N块或(2)一3N/2 x 2N块和一N/2 x 2N块。更一般而言,对于非对称分区,当前块可被划分为具有不同维度的两个分区。作为解码的一部分,解码器还可执行为了帧内BC预测而被对称分区的另一块的帧内BC预测。例如,另一块是被分区为(1)两个2N x N块,(2)两个N x 2N块,或(3)四个N x N块的2N x 2N块,每个块可被进一步分区为两个N x N/2块、两个N/2 x N块、或四个N/2 x N/2块。更一般而言,对于对称分区,该另一块可被划分为具有等同维度的分区。根据本文中描述的创新中的第三方面,图像编码器或视频编码器对图像或视频进行编码以产生经编码的数据并将经编码数据作为比特率的一部分输出。作为编码的一部分,编码器计算当前图片的当前块的预测(例如,预测单元的预测块)。预测可针对用于帧内BC预测的运动估计或BV估计。在任何情况下,计算预测使用从下到上的方法来标识当前块的分区。一般而言,当前块的分区包括具有不同维度的两个或更多个分区。例如,当前块是2N x 2N块,且从下到上方法包括:(a)检查该2N x 2N块的每N x N块的模式;(b)选择各个N x N块的最佳模式;(c)高速缓存各个N x N块的向量值;(d)检查该2N x 2N块的具有2N维度的模式,包括使用被高速缓存的向量值;(e)选择该2N x 2N块的具有2N维度的最佳模式;以及(f)在该2N x 2N块的具有2N维度的最佳模式和所选择的该2N x 2N块的各个N x N块的最佳模式之间做出选择。或者,作为另一示例,当前块是2N x 2N块,且从下到上方法包括:(a)检查该2N x 2N块的每N x N块的模式的子集;(b)高速缓存各个N x N块的向量值;(c)检查该2N x 2N块的具有2N维度的模式的子集,包括使用被高速缓存的向量值;(d)选择该2N x 2N块的具有2N维度的最佳模式;以及(e)在该2N x 2N块的具有2N维度的最佳模式和各个N x N块的最佳模式之间做出选择。根据本文中描述的创新中的第四方面,图像编码器或视频编码器对图像或视频进行编码以产生经编码的数据并将经编码数据作为比特率的一部分输出。作为编码的一部分,编码器计算当前图片的当前块的预测。预测可针对用于帧内BC预测的运动估计或BV估计。在任何情况下,计算预测包括(a)通过当前最佳位置周围的小邻域(例如,水平或垂直紧邻当前最佳位置的位置)中的迭代评估来标识该预测的当前最佳位置,以及(b)通过当前最佳位置周围的后继更大大邻域(例如,小邻域外的环中的位置)中的迭代评估来确认该当前最佳位置。例如,如果当前最佳位置比更大邻本文档来自技高网...

【技术保护点】
一种在实现图像或视频编码器的计算设备中的方法,该方法包括:编码图像或视频以产生经编码的数据,包括执行当前块的帧内块复制(“BC”)预测,所述当前块为所述帧内BC预测被非对称分区;以及将所述经编码的数据作为比特流的一部分来输出。

【技术特征摘要】
【国外来华专利技术】2014.01.17 US 61/928,970;2014.03.17 US 61/954,572;1.一种在实现图像或视频编码器的计算设备中的方法,该方法包括:编码图像或视频以产生经编码的数据,包括执行当前块的帧内块复制(“BC”)预测,所述当前块为所述帧内BC预测被非对称分区;以及将所述经编码的数据作为比特流的一部分来输出。2.如权利要求1所述的方法,其特征在于,所述编码进一步包括针对另一块执行帧内BC预测,所述另一块为所述帧内BC预测被对称分区,其中所述另一块是2N x 2N块,且其中所述另一块被分区为(1)两个2N x N块,(2)两个N x 2N块,或(3)四个N x N块,每个N x N块可被进一步分区为两个Nx N/2块、两个N/2x N块、或四个N/2x N/2块。3.一种在实现图像或视频解码器的计算设备中的方法,该方法包括:将经编码的数据作为比特流的一部分来接收;以及解码所述经编码的数据以重构图像或视频,包括执行当前块的帧内块复制(“BC”)预测,所述当前块为所述帧内BC预测被非对称分区。4.如权利要求3所述的方法,其特征在于,所述解码进一步包括针对另一块执行帧内BC预测,所述另一块为所述帧内BC预测被对称分区,其中所述另一块是2N x 2N块,且其中所述另一块被分区为(1)两个2N x N块,(2)两个N x 2N块,或(3)四个N x N块,每个N x N块可被进一步分区为两个Nx N/2块、两个N/2x N块、或四个N/2x N/2块。5.如权利要求1或3所述的方法,其特征在于,所述当前块是2N x 2N块,且其中所述当前块被分区为(1)一2N x N/2块和一N x 3N/2块或(2)一2N x 3N/2块和一2N x N/2块。6.如权利要求1或3所述的方法,其特征在于,所述当前块是2N x 2N块,且其中所述当前块被分区为(1)一N/2x 2N块和一3N/2x 2N块或(2)一3N/2x 2N块和一N/2x 2N块。7.如权利要求1-6中任一项所述的方法,其特征在于,所述当前块是64x64块、32x32块、16x16块或8x8块。8.如权利要求1-7中的任一项所述方法,其特征在于,所述视频是人造视频。9.一个或多个存储计算机可执行指令的计算机可读介质,所述计算机可执行指令使得计算系统由此执行一种方法,所述方法包括:编...

【专利技术属性】
技术研发人员:L·朱Y·吴G·J·沙利文
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1