当前位置: 首页 > 专利查询>武汉大学专利>正文

一种分辨率分层技术中的运动矢量预测方法技术

技术编号:3585662 阅读:189 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种在分辨率分层结构中的运动矢量预测方法,利用时域、空域和层间域运动矢量的相关性,获取增强层中宏块的预测运动矢量,实现过程为,时域上由前一帧相同位置宏块的运动矢量获取时域候选运动矢量,空域上由相邻块的运动矢量获取空域候选运动矢量,层间域上由较低空域分辨率层次的相应运动矢量获取层间域候选运动矢量,对时域候选运动矢量、空域候选运动矢量和层间域候选运动矢量进行选择,将其中运动估计代价最小的选为预测运动矢量。本发明专利技术可以获得更准确的预测运动矢量,而且能压缩运动矢量码率,获得性能增益。

【技术实现步骤摘要】

本专利技术属于可伸縮视频编码领域,特别是涉及空域分辨率分层中的运动矢
技术介绍
随着网络基础设施,存储容量和计算能力的快速发展,视频压縮编码技术 也进行着迅速蓬勃地发展。当前,视频编码技术覆盖了多媒体消息,视频电话,视频会议,无线和Internet视频流,标清或高清电视广播和DVD存储等多个应 用领域。在这些应用中,各种各样的视频传输和存储系统可能被部署。由于现 代视频传输系统的异构性和复杂性,以及视频终端需求的多样性,传统的编解 码技术已经表现地捉襟见肘,可伸縮编码技术是满足现代视频传输需求的最佳 方案之一。传统的编解码技术仅仅只注重视频压縮效率和编码效率的平衡,缺 乏了针对应用环境的灵活适应性。而可伸縮编码技术在尽力保证率失真最优的 同时,从帧率、分辨率、图像质量的灵活可调整来满足不同应用需求,增强了 对异构多变的网络传输系统和多样化的终端需求的适用性。因此,可伸縮编码 技术一般被分为时域可伸縮、空域可伸縮和质量可伸縮以及三项伸縮的结合。空域可伸縮的概念分别出现在了 MPEG-2、 H.263和MPEG4等标准中,它的 基本思想是将码流分成一个基本层和多个增强层,增强层依赖基本层或较低增 强层的数据来解码。低分辨率的视频信号被编码在基本层中,较高分辨率的视 频信号被编码在第一增强层中,更高分辨率的视频信号被编码在第二增强层中,依此类推,形成一个分辨率倒金字塔,而这些视频频信号都被包含在一个空域可伸縮的码流中。最新的H. 264扩展标准可伸縮视频编码(SVC)中也沿用了传统的空域可伸縮方法,并且为了提高编码性能,使用了三种层间预测算法层间帧内预测,层间运动信息预测和层间残差预测。设计层间预测算法的目的是尽可能利用基本层的信息来提高增强层的压縮效率和编码效率。svc将层间预测方法分为两类, 一类称为多循环解码方法,这种方法利用基本层的重构帧上采样来预测增强层的帧信息,例如层间帧内预 测。在高运动场景中,同层时域相关性减弱,该算法可获得较大增益。另外一 类称为单循环解码方法,该方法直接利用基本层的编码信息对增强层进行预测, 避免了重构和上采样步骤,减少了解码复杂度和时延。层间运动信息预测和层 间残差预测就是使用单循环解码的概念。简单介绍三种层间预测算法以便理解当前技术(1)层间运动信息预测。SVC在空域增强层增加了一种宏块编码模式BlSkip。当选用这个模式时,宏块数据只传残差而不传运动信息。如果基本层对应块使用帧内编码模式,则增强 层使用层间帧内编码。如果基本层对应块使用帧间编码模式,则增强层使用层 间运动信息预测算法。层间运动信息预测直接利用基本层的运动矢量、预测方 向、块划分模式以及参考索引预测增强层的运动信息,从而节省了传输运动信息的码率;(2)层间帧内预测。如上所述,当增强层宏块使用BlSkip模式而且 基本层对应块为帧内编码,则SVC通过层间帧内预测方法获得增强层宏块预测 信号。该算法上采样基本层对应块的重构信号,并作为增强层原信号的预测。 该算法增益主要来自基本层上采样信号的纹理信息的准确性,减少了残差数据。 (3)层间残差预测。SVC的层间残差预测应用于任何分割模式的宏块,而不管是否使用BlSkip模式。当层间残差预测标志位开启后,基本层相应8*8块的残差 信号通过一个双向滤波器上采样,作为增强层宏块残差信号的预测,从而减小 残差的码率。显然,基本层残差的上采样信号与增强层残差信号越接近,该方 法的增益就越大。由于相邻两层间的运动信息的相关性,增强层运动信息可以通过基本层运 动信息来预测。在层间运动信息预测算法中,编码增强层宏块时,如果该宏块选用BLSkip模式,则使用基本层对应位置块的运动矢量乘以2作为增强层的运 动矢量,同时沿用基本层参考索引和预测方向等运动信息。但是,我们在仿真 实验中发现,基本层获得的运动矢量精确性对编码效率至关重要。如果预测的 运动矢量与全搜索的最优运动矢量比较接近,再经过局部小范围运动搜索,就 有可能得到一个比较好的增益;相反,如果预测的运动矢量与最优运动矢量相 去甚远,则局部小范围运动搜索的结果也可能只是局部最优,得不到好的增益。 此外,如果基本层的运动矢量本身误差较大,则利用它来预测增强层的运动矢 量误差也较大,造成层间运动矢量误差的漂移。
技术实现思路
本专利技术目的在于解决上述层间运动矢量预测的准确性和误差的漂移问 题,提供。本专利技术的技术方案为利用时域、空域和层间域运动矢量的相关性,获取增 强层中宏块的预测运动矢量,实现过程为,时域上由前一帧相同位置宏块的运动矢量获取时域候选运动矢量,空域上 由相邻块的运动矢量获取空域候选运动矢量,层间域上由较低空域分辨率层次 的相应运动矢量获取层间域候选运动矢量,对时域候选运动矢量、空域候选运动矢量和层间域候选运动矢量进行选择,将其中运动估计代价最小的选为预测运动矢量。而且,所述空域候选运动矢量的获取方式为三个相邻块的运动矢量取中值, 三个相邻块分别处于该宏块的上、左、上右或上左。而且,所述层间域候选运动矢量的获取方式为较低空域分辨率层次对应位 置块的运动矢量进行伸縮得到,伸縮比例为两层之间的空域分辨率比率。本专利技术还提供了应用这种运动矢量预测方法的视频编码方法,采集获取高 分辨率的视频信号,将高分辨率视频信号下采样成低分辨率视频信号,将两种 分辨率的视频信号时域分解对齐,形成增强层和基本层,对增强层和基本层的 信息处理后复合成一路码流输出;其中增强层和基本层的纹理信息处理方法为,经过帧内纹理预测后,进行变换 和熵编码,增强层的帧内纹理预测通过基本层的重构上采样实现; 其中增强层和基本层的运动信息处理方法为,基本层使用全搜索运动估计获取 运动矢量并编码,增强层对时域候选运动矢量、空域候选运动矢量和层间域候 选运动矢量进行选择,获取增强层的预测运动矢量并编码。而且,宏块的数据编码组织过程包括如下步骤, 首先,在宏块数据头加一个模式标志位,写宏块码流操作开始后,如果选中了 多域运动矢量预测模式,该模式标志位被写为l,后面跟着写多域选择索引和精 细运动矢量差信息,所述精细运动矢量差信息是对运动矢量修正得到的压縮信 息;如果没有选中多域运动矢量预测模式,则模式标志位被写为0; 接着,写宏块模式和全搜索运动矢量;最后,写预测残差数据。而且,精细运动矢量差信息的获取方法为,以时域候选运动矢量、空域候选运动矢量和层间域候选运动矢量为起点,在窗口内计算SAD值,将最小SAD 值的候选向量的精细运动矢量差作为精细运动矢量差信息。而且,所述窗口为候选运动矢量的x分量和y分量分别在一定范围内调整 构成。而且,x分量和y分量分别在(-1, +1)之间调整。本专利技术还提供了相应解码方法,收到空域可伸縮码流后,首先解码基本层 图像,接着解码同一时刻的增强层图像;在解码增强层图像时,根据模式标志 位判断模式,如果当前宏块选中多域运动矢量预测模式,则根据多域选择索引 选取预测运动矢量,根据精细运动矢量信息修正得到运动矢量。本专利技术提出多域运动矢量预测的方法,就是利用时域前一帧相应位置的运 动矢量、空域相邻块的运动矢量结合较低空域分辨率层次获取的运动矢量进行 选择,进而能够综合利用时域、空域和层间域运动矢量的相关性,获取更准确 的预测运动矢量。本专利技术还本文档来自技高网
...

【技术保护点】
一种分辨率分层技术中的运动矢量预测方法,其特征在于:利用时域、空域和层间域运动矢量的相关性,获取增强层中宏块的预测运动矢量,实现过程为,    时域上由前一帧相同位置宏块的运动矢量获取时域候选运动矢量,空域上由相邻块的运动矢量获取空域候选运动矢量,层间域上由较低空域分辨率层次的相应运动矢量获取层间域候选运动矢量,对时域候选运动矢量、空域候选运动矢量和层间域候选运动矢量进行选择,将其中运动估计代价最小的选为预测运动矢量。

【技术特征摘要】
1.一种分辨率分层技术中的运动矢量预测方法,其特征在于利用时域、空域和层间域运动矢量的相关性,获取增强层中宏块的预测运动矢量,实现过程为,时域上由前一帧相同位置宏块的运动矢量获取时域候选运动矢量,空域上由相邻块的运动矢量获取空域候选运动矢量,层间域上由较低空域分辨率层次的相应运动矢量获取层间域候选运动矢量,对时域候选运动矢量、空域候选运动矢量和层间域候选运动矢量进行选择,将其中运动估计代价最小的选为预测运动矢量。2. 根据权利要求1所述的运动矢量预测方法,其特征在于所述空域候选运动 矢量的获取方式为三个相邻块的运动矢量取中值,三个相邻块分别处于该宏块 的上、左、上右或上左。3. 根据权利要求1所述的运动矢量预测方法,其特征在于所述层间域候选运 动矢量的获取方式为较低空域分辨率层次对应位置块的运动矢量进行伸縮得 到,伸縮比例为两层之间的空域分辨率比率。4. 釆用权利要求1或2或3所述运动矢量预测方法的视频编码方法,其特征在 于采集获取高分辨率的视频信号,将高分辨率视频信号下采样成低分辨率视 频信号,将两种分辨率的视频信号时域分解对齐,形成增强层和基本层,对增 强层和基本层的信息处理后复合成一路码流输出;其中增强层和基本层的纹理信息处理方法为,经过帧内纹理预测后,进行变换和熵编码,增强层的帧内纹理预测通过基本层的重构上采样实现; 其中增强层和基本层的运动信息处理方法为,基本层使用全搜索运动估计获取 运动矢量并编码,增强层对时域候选运动矢量、空域...

【专利技术属性】
技术研发人员:胡瑞敏兰诚栋王啟军
申请(专利权)人:武汉大学
类型:发明
国别省市:83[中国|武汉]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1