用于视频编码的低复杂度帧内预测制造技术

技术编号:12436516 阅读:136 留言:0更新日期:2015-12-04 00:35
用于视频编码的低复杂度帧内预测。本发明专利技术提供一种提高视频编码效率的独特帧内预测过程。H.264/AVC使用位于紧接待预测的目标块上方的水平边界中的参考像素和位于紧接该目标块的左侧的竖直边界中的参考像素。在本发明专利技术中,取出水平边界像素阵列和竖直边界像素阵列之一的至少一些像素。然后向其它边界像素添加取出的像素以扩展其阵列。仅基于扩展的边界像素阵列执行帧内预测。

【技术实现步骤摘要】
用于视频编码的低复杂度帧内预测本申请是申请号为201180034682.2、国际申请号为PCT/US2011/044014、申请日为2011年7月14日、专利技术名称为“用于视频编码的低复杂度帧内预测”的专利技术专利申请的分案申请。
本专利技术涉及视频编码,并且具体地涉及使用来自相同视频帧的先前编码并且重建的像素的、其中预测采样块的帧内预测。
技术介绍
数字视频需要大量数据来以未压缩的方式代表数字视频序列(例如系列帧)的每一帧。对于多数应用而言跨越计算机网络发送未压缩的数字视频由于带宽限制而不可行。此外,未压缩的数字视频需要大量存储空间。通常以某一方式对数字视频编码以减少存储要求并且减少带宽要求。一种用于对数字视频编码的技术是帧间预测。帧间预测利用在不同帧之间的时间冗余度。在时间上相邻的视频帧通常包括保持基本上相同的像素块。在编码过程期间,运动矢量将一帧中的像素块的移动与另一帧中的相似像素的块相关联。因而无需系统对像素块编码两次,而是对像素块编码一次并且提供用于预测其它像素块的运动矢量。另一种用于对数字视频编码的技术是帧内预测。帧内预测对帧或者其部分编码而未参考其它帧中的像素。帧内预测利用在帧内的像素块之间的空间冗余度。由于在空间上相邻的像素块一般具有相似属性,所以通过参考在相邻块之间的空间相关性来提高编码过程的效率。通过基于在相邻块中使用的预测模式预测目标块可以利用这一相关性。
技术实现思路
本专利技术提供一种提高视频编码效率的独特帧内预测过程。H.264/AVC使用位于紧接待预测的目标块上方的水平边界中的参考像素和位于紧接该目标块的左侧的竖直边界中的参考像素。在本专利技术中,取出水平边界像素阵列或者竖直边界像素阵列的至少一些像素。然后向其它边界像素添加取出的像素以扩展其阵列。仅基于扩展的边界像素阵列执行帧内预测。在本专利技术的一个实施方式中,取出竖直边界像素中的至少一些像素并且向水平边界像素添加以扩展其阵列。本专利技术消除选择从其取出参考像素的水平边界或者竖直边界的判决过程。本专利技术也消除计算与预测方向相交的竖直边界的位置的重复出现过程,其中重复出现计算过程通常包括除法操作。消除这些过程使帧内预测过程能够实施于单指令多数据(SIMD)架构上,由此提高视频编码的计算效率。在根据本专利技术的一个实施方式中,使用由下式表达的竖直像素标识符来取出竖直边界像素中的至少一些像素:其中size代表待预测的目标块的大小,angle代表预测方向,并且col是从-1至angle递减1的计数器。向在水平像素标识符[col]标识的位置处的水平像素添加取出的像素。在另一实施方式中,在取出竖直边界像素中的至少一些像素时根据下式计算InvAngle:其中N是2的整数幂。然后使用由[col×InvAngle>>log2N]表达的竖直像素标识符来取出竖直边界像素之中的至少一些像素。向在水平像素标识符[col]标识的位置处的水平像素添加取出的像素。在另一实施方式中,从查找表获得InvAngle,查找表相对于angle的值列出了InvAngle的值。在另一实施方式中,使用竖直像素标识符[row]来标识竖直边界像素之中的像素,其中row是从0至size递增1的计数器。向在水平像素标识符[int+1]标识的位置处的水平边界像素添加取出的像素,其中int是与预测方向相交的像素的位置的整数表示。本专利技术也提供一种实施帧内预测操作的编码器和解码器,在该帧内预测操作中,取出水平边界像素阵列或者竖直边界像素阵列的至少一些像素。然后向其它边界像素添加取出的像素以扩展其阵列。仅基于扩展的边界像素阵列执行帧内预测。附图说明图1是示出了本专利技术可以实施于其上的示例硬件架构的框图。图2是示出了本专利技术可以被应用于的视频编码器的总体视图的框图。图3是示出了本专利技术可以被应用于的视频解码器的总体视图的框图。图4是示出了根据本专利技术一个实施方式的编码器的功能模块的框图。图5是示出了本专利技术实施方式的帧内预测模块执行的帧内预测过程的流程图。图6是示出了根据本专利技术一个实施方式的解码器的功能模块的框图。图7是示出了预测方向的图,这些预测方向图示了在H.264/AVC中支持的Intra_4×4预测模式。图8是示出了在第JCT-VCA119号文档中提出的预测方向的图。图9是示出了在JCT-VCA119中提出的沿着图7中所示预测方向之一生成预测的块的过程的流程图。图10是示出了根据本专利技术一个实施方式执行的低复杂度帧内预测过程的流程图。图11A是示出了预测块以及水平和竖直边界像素阵列的示意视图。图11B是示出了用竖直边界像素扩展的水平边界像素阵列的示意图。图12是示出了根据本专利技术一个实施方式执行的扩展水平边界像素阵列的过程的流程图。图13是示出了扩展水平边界像素阵列的另一实施方式的流程图。图14是示出了根据本专利技术另一实施方式执行的低复杂度帧内预测过程的流程图。具体实施方式图1示出了本专利技术可以实施于其上的计算机100的示例硬件架构。请注意图1中所示硬件架构可以在实施本专利技术实施方式的视频编码器和视频解码器中共用。计算机100包括经由本地接口107通信地耦合的处理器101、存储器102、存储设备105和一个或者多个输入和/或输出(I/O)设备106(或者外设)。本地接口105可以例如是但不限于如在本领域中已知的一个或者多个总线或者其它有线或者无线连接。处理器101是用于执行软件、具体为存储于存储器102中的软件的硬件设备。处理器101可以是任何定制或者商用处理器、中央处理单元(CPU)、在与计算机100关联的若干处理器之中的辅助处理器、基于半导体的微处理器(形式为微芯片或者芯片组)或者一般为任何用于执行软件指令的设备。存储器102包括计算机可读介质,该计算机可读介质可以包括易失性存储器元件(例如随机存取存储器(RAM,比如DRAM、SRAM、SDRAM等))和非易失性存储器元件(例如ROM、硬驱动、磁带、CDROM等)中的任何存储器元件或者组合。另外,存储器102可以并入电子、磁、光学和/或其它类型的存储介质。计算机可读介质可以是任何可以存储、传达、传播或者传送用于由指令执行系统、装置或者设备使用或者与指令执行系统、装置或者设备结合使用的程序的装置。请注意存储器102可以具有分布式结构,其中各种部件处于相互远离处、但是可以由处理器101访问。存储器102中的软件103可以包括一个或者多个单独程序,每个程序包含用于实施计算机100的如下文描述的逻辑功能的可执行指令有序列表。在图1的例子中,存储器102中的软件103限定计算机100的根据本专利技术的视频编码或者视频解码功能。此外,虽然非必需,但是存储器102有可能包含操作系统(O/S)104。操作系统104实质上控制计算机程序的执行并且提供调度、输入-输出控制、文件和数据管理、存储器管理以及通信控制和有关服务。计算机100的存储设备105可以是许多不同存储设备类型之一,这些存储设备类型包括静止存储设备或者便携式存储设备。作为例子,存储设备105可以是磁带、磁盘、闪存、易失性存储器或者不同存储设备。此外,存储设备105可以是安全数字记忆卡或者任何其它可拆卸存储设备105。I/O设备106可以包括输入设备、例如但不限于触屏、键盘、鼠标、扫描仪、麦克风或者其它输入设备。另外,I/O本文档来自技高网...

【技术保护点】
一种包括计算机可执行的步骤的视频编码方法,所述计算机可执行的步骤由视频编码器的处理器执行以实施帧内预测操作,所述帧内预测操作用目标块的沿帧内预测角度插值的边界像素推导所述目标块的预测块,其中,所述边界像素包括水平边界像素的水平阵列和竖直边界像素的竖直阵列,所述帧内预测操作包括:从列出分别与多个不同帧内预测角度相关的逆角度参数的值的查找表获得与所述帧内预测角度对应的逆角度参数的值;识别所述竖直边界像素中的、在所述竖直阵列中位于作为获得的逆角度参数的值与水平位置标识符的值之间的乘法的函数的位置的、至少一些竖直边界像素,所述水平位置标识符是表示扩展的水平阵列的扩展中的位置的变量;将识别的所述至少一些竖直边界像素作为水平边界像素添加到扩展的水平阵列的扩展;仅使用扩展的水平阵列中的水平边界像素而不使用竖直边界像素推导所述目标块的预测块,其中,所述水平位置标识符取值‑1...(size×帧内预测角度)/rangelimit,其中,size代表待预测的目标块的大小,rangelimit代表多个帧内预测角度的范围限制,rangelimit固定为常数32,其中,识别所述至少一些竖直边界像素包括算术右移8个二进制数字以撤消与N的乘法,N取值256。...

【技术特征摘要】
2010.07.14 US 61/364,322;2010.09.30 US 61/388,5411.一种包括计算机可执行的步骤的视频编码方法,所述计算机可执行的步骤由视频编码器的处理器执行以实施帧内预测操作,所述帧内预测操作用目标块的沿帧内预测角度插值的边界像素推导所述目标块的预测块,其中,所述边界像素包括水平边界像素的水平阵列和竖直边界像素的竖直阵列,所述帧内预测操作包括:从列出分别与多个不同帧内预测角度相关的逆角度参数的值的查找表获得与所述帧内预测角度对应的逆角度参数的值;识别所述竖直边界像素中的、在所述竖直阵列中位于作为获得的逆角度参数的值与水平位置标识符的值之间的乘法的函数的位置的、至少一些竖直边界像素,所述水平位置标识符是表示扩展的水平阵列的扩展中的位置的变量;将识别的所述至少一些竖直边界像素作为水平边界像素添加到扩展的水平阵列的扩展;仅使用扩展的水平阵列中的水平边界像素而不使用竖直边界像素推导所述目标块的预测块,其中,所述水平位置标识符取值-1...(size×帧内预测角度)/rangelimit,其中,size代表待预测的目标块的大小,rangelimit代表多个帧内预测角度的范围限制,rangelimit固定为常数32,其中,识别所述至少一些竖直边界像素包括算术右移8个二进制数字以撤消与N的乘法,N取值256。2.一种包括计算机可执行的步骤的视频解码方法,所述计算机可执行的步骤由视频解码器的处理器执行以实施帧内预测操作,所述帧内预测操作用目标块的沿帧内预测角度插值的边界像素推导所述目标块的预测块,其中,所述边界像素包括水平边界像素的水平阵列和竖直边界像素的竖直阵列,所述帧内预测操作包括:从列出分别与多个不同帧内预测角度相关的逆角度参数的值的查找表获得与所述帧内预测角度对应的逆角度参数的值;识别所述竖直边界像素中的、在所述竖直阵列中位于作为获得的逆角度参数的值与水平位置标识符的值之间的乘法的函数的位置的、至少一些竖直边界像素,所述水平位置标识符是表示扩展的水平阵列的扩展中的位置的变量;将识别的所述至少一些竖直边界像素作为水平边界像素添加到扩展的水平阵列的扩展;仅使用扩展的水平阵列中的水平边界像素而不使用竖直边界像素推导所述目标块的预测块,其中,所述水平位置标识符取值-1...(size×帧内预测角度)/rangelimit,其中,size代表待预测的目标块的大小,rangelimit代表多个帧内预测角度的范围限制,rangelimit固定为常数32,其中,识别所述至少...

【专利技术属性】
技术研发人员:F·J·宝森陈朝庆
申请(专利权)人:株式会社NTT都科摩
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1