视频编码系统的运动估计装置及其方法制造方法及图纸

技术编号:3584405 阅读:153 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种视频编码系统中的运动估计装置及其方法,所述方法包括:产生预测运动向量;使用所述预测运动向量对参考块进行插值得到预测目标块,计算所述预测目标块与目标块之间的绝对误差和(SAD);比较所述绝对误差和(SAD)与设定的阈值,基于比较结果决定是否进行整像素与分像素运动估计;整像素与分像素运动估计,首先用菱形算法搜索最佳整像素块,然后使用分像素搜索得到最佳分像素块。本方法可以减少整像素和分像素搜索的次数。

【技术实现步骤摘要】

本专利技术涉及一种视频编码系统,具体涉及一种运动估计装置及其方法。
技术介绍
二维的数字化图象序列通常用象素点的YUV三分量来表示,由于一幅 图象的像素点数量非常多,需要大量的数据来表示,给图象的存储与传输 带来很大的麻烦,这就需要对图象数据进行压缩,以减少其数据量。事实 上,连续的图象序列在空间和时间上有着非常高的相关性,可以利用这一 特性来消除数据冗余以获得有效的数据压缩。消除空间冗余的方法是帧内预测,为编码一帧图象的某个区域,可以 使用本帧图象内与该区域相邻部分的信息来预测。消除时间冗余信息的关 ^建技术是运动补偿,它的思想是,相邻的两帧图象相似程度非常高,有些 时候甚至是完全相同的,所以在编码后一帧图象的某一区域时,可以用前 一帧图象的相似区域来预测,这样做的好处是,只需要存储或传输两个区 域位置的相对偏移和插值信息即可,由于插值信息包含的信息量非常小, 可以用很少的数据位来表示,所以可以取得很高的压缩效率。在现行的编 解码框架中, 一般采用块编码结构,编码的基本单位是16x16的像素块。 据此,在编码当前帧的某个像素块时,需要在前一帧(又称为参考帧)中 搜索匹配程度最高的象素块,这个过程称为运动估计。运动估计的过程大致可以描述如下,对于当前帧的一个^f寺编码块(在 此称为目标块),需要在参考帧中找到一个最佳匹配块。考虑到图象的运 动特性以及计算的复杂度,不需要对整个参考帧进行搜索,可以事先在参 考帧中确定一个搜索窗口 ,只在搜索窗口中进行搜索。在运动估计过程中, 评价一个参考块与目标块的匹配程度的标准是这两个块的绝对误差和 (SAD: Sum of Absolute Difference )。<formula>formula see original document page 5</formula>其中block为块的边长, 一般为8或16, MB。(x,y)表示目标块中坐标(x, y)的象素值,MBr(x,y)表示参考块中坐标(x, y)的象素值。SAD运算是 一种耗时(time consuming)运算。找到最佳匹配的整像素参考块之后,为提高匹配精度, 一般还需要在 整像素点周围进行分像素搜索,所谓分像素搜索就是对整像素参考块进行 二分之一甚至四分之一差值,以期望更大程度的消除冗余,求得更小的 SAD,插值运算的耗时一般是SAD运算的几倍以上。以搜索窗口为48x48大小,目标块为16x16大小,搜索精确为四分之 一像素为例,最原始的搜索算法是全搜索,也就是对搜索窗口中所有可能 的参考块进行搜索,为求得最佳整像素参考块,需要做32x32=984次SAD 运算。为得到最佳分像素参考块,还需要对整像素点做5x5-1-24次插值 运算和24次SAD运算。为提高搜索效率,人们提出了各种快速搜索算法,这些算法利用图象 的平滑特性,使用较小的SAD次数便可以得到搜索窗口中的局部最优点, 以较小的性能损失换来了计算量的大量节省。常见的快速搜索算法有,二 维对数搜索法,三步法,菱形搜索法,逸些算法能将整像数搜索的SAD次 数减少到平均15-20次,而且搜索精度保持在90°/。以上。有关搜索的起始点的问题,最初的方法是在参考帧中与目标块在当前 帧中有着相同坐标的参考块开始搜索,也就是坐标偏移为(0, 0)的点开 始。考虑到物体运动的连续性,前一帧中某物体运动的方向应当与当前帧 中同一物体的运动方向相同,与此同时,在同一帧内部,位置相邻的两个块中的物体,由于块的大小很小,在大部分时候也有着相似的运动方向。 所以,搜索的起始点可以通过本帧内相邻块的运动向量和上一帧中相同位 置块的运动向量来预测,这也有助于提高搜索的效率。我们知道,在便携式应用中,计算复杂度的大小是方案能否取得成功 的关键,因为便携式处理器考虑到功耗,面积等因素,其处理能力一般都 较弱,而对视频编码这种对计算量要求很高的应用,需要大量算法上和架 构上的优化才能取得成功。普通的快速搜索算法虽然能较大程度的减少搜索次数,但这对便携式应用还显不够。以菱形搜索为例,平均每个16x16的宏块需要10-15次SAD 运算,和至少4次插值运算。每次SAD需要256次减法,256次求绝对值, 255次累加。假设插值采用的是四抽头滤波器,那么每个插值点需要4次 乘法,三次累加和一次移位运算,对两个方向均是分^^素的二维插值,需 要两倍于一维插值的运算量。据统计, 一个16x16宏块的运动估计需要耗 费通用处理器15000至25000个周期,以CIF( 352x288 )分辩率图象为例, 以每秒30帧的速度编码,运动估计模块需要200M MIPS以上的运算量, 再加上内部存储器的读写延迟,需要400-500MMIPS的运算量。这对便携 式处理器来说无论在处理能力上还是在功耗上都是不能接受的。此外,搜索窗口的数据从内部存储器到高速緩存之间的传输需要占用 大量的总线带宽。以士16像素点的偏移极限为例,搜索窗口为(3x16) x (3x16)字节大小,再加上4抽头插值所需的额外3个像素点,共计 52x52=2704字节大小。这样一来,对于CIF ( 352x288 )大小的运动图像, 每编码一帧需要传输2704x396=1. 07兆字节的搜索窗口数据,以30帧每 秒计算,约需要32M字节每秒的总线带宽。专利CN 1440203A中提出的算法需要做一个全搜索,这对降低运算复 杂度没有帮助;专利CN 1177483C中提出了预测运动向量搜索的方法,但 其阈值是固定的,不能做到动态调整,因此也就不能有效减少整^象素和分 像素搜索的次数。
技术实现思路
运动估计是编码器的关键算法,即使采用现有快速搜索算法,仍然需 要耗费200M MIPS以上(CIF 30帧每秒的图l象),这对通用型侵_携式处理 器来说,是无法承受的。此外,搜索窗口的传输需要占用30MByte/s以上 的总线带宽,这也是便携式处理器无法接受的。当前大多数快速搜索算法旨在提高整像素和分像素搜索的速度,减少 每次搜索所需的SAD和插值运算次数。本专利技术提出的一种算法旨在减少整 像素和分像素搜索的次数,本算法对符合要求的目标块,不需要做整像素 和分像素搜索,只需要做一次预测点的插值和SAD计算即可找到较优的分像素匹配块,对其余的块,我们依然采用普通的菱形快速搜索和分像素搜 索的方法。另外,对搜索起始点进行预测能使得大部分搜索在开始的时候 就接近最优点,也因此提高了搜索效率,本专利技术中也釆纳了这一方法。本专利技术的一个目的在于提供一种视频编码系统中的运动估计装置,所述装置包括预测运动向量发生模块,用于产生目标块的预测运动向量;预测目标块估计模块,使用预测运动向量对参考块进行插值得到预测 目标块,并计算所述预测目标块与目标块之间的绝对误差和(SAD);预测运动向.量裁决模块,比较所述绝对误差和(SAD)与设定的阈值, 基于比较结果决定是否进行整像素与分像素运动估计;整像素与分像素运动估计模块,用于进行整像素与分像素运动估计, 在搜索窗口中寻找最佳整像素匹配块。进一步,还包括基于当前帧的设定阈值对下一帧的阈值进^f亍调整的装置。进一 步,基于当前帧的设定阈值对下 一 帧的阈值进行调整的装置使用 以本文档来自技高网
...

【技术保护点】
一种视频编码系统中的运动估计装置,其特征在于,包括:预测运动向量发生模块,用于产生目标块的预测运动向量;预测目标块估计模块,使用预测运动向量对参考块进行插值得到预测目标块,并计算所述预测目标块与目标块之间的绝对误差和(SAD);预测运动向量裁决模块,比较所述绝对误差和(SAD)与设定的阈值,基于比较结果决定是否进行整像素与分像素运动估计;整像素与分像素运动估计模块,用于进行整像素与分像素运动估计,在搜索窗口中寻找最佳整像素匹配块。

【技术特征摘要】
1.一种视频编码系统中的运动估计装置,其特征在于,包括预测运动向量发生模块,用于产生目标块的预测运动向量;预测目标块估计模块,使用预测运动向量对参考块进行插值得到预测目标块,并计算所述预测目标块与目标块之间的绝对误差和(SAD);预测运动向量裁决模块,比较所述绝对误差和(SAD)与设定的阈值,基于比较结果决定是否进行整像素与分像素运动估计;整像素与分像素运动估计模块,用于进行整像素与分像素运动估计,在搜索窗口中寻找最佳整像素匹配块。2. 根据权利要求1所述的装置,其特征在于,还包括基于当前帧的 设定阈值对下一帧的阈值进行调整的装置。3. 根据权利要求2所述的装置,其特征在于,基于当前帧的设定阈 值对下 一 帧的阈值进行调整的装置使用以下公式调整下 一帧的阈值SAD—thresholdn+1 = SAD—threshold,,ASR _OSR,、1 +2xOSR 其中,SADJhreshold^表示第n+1帧图像的绝对误差和阈值, SAD—threshold表示第n帧图像的绝对误差和阈值,ASK表示第n帧图像 的实际搜索比,OSRn表示第n帧图像的最优搜索比。4. 根据权利要求3所述的装置,其特征在于,所述设定的阈值是通 过对预定测试流的绝对误差和阈值与实际搜索比进行函数拟合而确定的。5. 根据权利要求4所述的装置,其特征在于,所述设定的阈值是通 过计算所述拟合的函数的拐点而确定的。6. 根据权利要求1所述的装置,其特征在于,所述比较结果为当 所述绝对误差和(SAD)小于设定的阈值时,直接用预测运动向量作为所 述目标块的运动向量;当所述绝对误差和(SAD)大于设定的阈值时,进 行整像素...

【专利技术属性】
技术研发人员:王立波
申请(专利权)人:炬力集成电路设计有限公司
类型:发明
国别省市:44[中国|广东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1