基于中心预测的整数像素快速混合搜索方法技术

技术编号:3584110 阅读:234 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于中心预测的整数像素快速混合搜索方法,采用运动矢量的空间域预测、时间域预测、UpLayer预测、多参考帧预测和零矢量预测进行搜索窗中心预测,对五种预测模式得到的候选点分别计算块匹配失真度,选取最小块匹配失真度对应的点作为搜索窗中心点;设置搜索方向快速界定门限T1、预测成功判定门限T2和中途截止门限T3;根据预测和设置的门限进行CPFMS搜索,寻找全局最优点。本发明专利技术具有很强的适应性,与FS算法和UMHexagonS算法相比,亮度信号的PSNR损失较小,对视频重建质量的影响基本可以忽略;比特率增加很小,编码效率基本不变;整数像素精度运动估计的耗时下降明显,提高了编码的速度。

【技术实现步骤摘要】

本专利技术属于视频处理方法。
技术介绍
近年来,许多学者在降低块匹配运动估计的计算复杂度方面进行了大量的研究,主要集中在开发快速搜索算法上。这些算法大体可分为4类 第一类算法采用均匀分布的搜索点模式,如三步搜索法(TSS)、二维对数法、十字搜索算法等,大大降低了搜索复杂度,但是也降低了运动估计的准确性和视频质量。例如TSS算法搜索时,整个过程采用了统一的搜索模板,使得第一步的步长过大,容易引起误导,从而对小运动效率较低。 第二类算法利用了运动矢量具有的空间分布不均匀特性——中心偏置分布特性,典型的算法有新三步搜索法(NTSS)、四步搜索法(FSS)、菱形搜索法(DS)、六边形搜索等。运动矢量通常总是高度集中分布在搜索窗的中心位置附近,例如NTSS采用中心倾向的搜索点模式不仅提高了匹配速度,而且减少了陷入局部极小的可能性,而采用中止判别技术则大大降低了搜索复杂度,提高了搜索效率;DS算法的特点在于它分析了视频图像中运动矢量的基本规律,选用了大小两种形状的搜索模板。先用大模板搜索,由于步长大,搜索范围广,可以进行粗定位,使搜索过程不会陷于局部最小;当粗定位结束后,可以认为最优点就在大模板周围8个点所围的菱形区域中,这时再用小模板来准确定位,使搜索不致于有大的起伏,所以它的性能优于其它算法。另外,DS搜索时各步骤之间有很强的相关性,模板移动时只需在几个新的检测点处进行匹配计算,所以也提高了搜索速度。此类算法着眼于提高运动较小情况下的搜索功能,但在估计大运动时预测误差仍然较大。 以上两类算法共同的特点都是以搜索窗的中心作为初始搜索中心,并且假设搜索点在接近全局最优点时对应的匹配误差单调下降,当初始搜索中心与全局最优点距离较大时,容易陷入局部极小。 第三类算法利用运动矢量在时域及空域上的相关性来预测运动矢量以选择较好的初始搜索中心,如预测运动矢量场自适应搜索算法、自适应十字架模式搜索算法及改进的预测区域搜索算法等。此类算法旨在利用运动矢量的时空相关性选择一个反映当前块运动趋势的预测点作为初始搜索点,该预测点比搜索窗的中心更靠近全局最优点,更容易满足匹配误差单调性的假设,提高了预测的准确性。但是,此类算法的性能仍然依赖于初始搜索中心预测的可靠性及搜索模板,且与块的局部运动特征密切相关。 第四类算法是利用预测误差的时空相关性及运动活性动态调整搜索范围或中止搜索的算法,典型的算法有具有匹配预判的自适应不规则模板搜索算法、基于时空相关性的自适应搜索范围调整算法、运动自适应搜索算法以及针对新一代视频压缩标准H.264的非对称十字型多层次六边形格点搜索算法(Unsymmetrical-Cross Muti-Hexagon Search,UMHexagonS)等。其中,UMHexagonS算法(Zhibo Chen,Peng Zhou,Yun He,“Fast Integer Pel and Fractional PelMotion Estimation for JVT”.JVT-F017.doc,JVT of ISO/IEC MPEG&ITU-T VCEG 6th MeetingAwaii Island,2002,5-13)采用搜索中心预测、分级搜索和多种搜索模板等策略,并在搜索的过程中引入了中途跳过策略,有效的避免了候选点陷入局部最优的情况,因而能够达到更高的匹配精度。UMHexagonS算法能够在计算复杂度相对于其他算法增加不多的前提下,将编码效率大大提高,是上述算法中综合性能最佳的算法。但该算法搜索路径复杂,搜索模式多样化(包括了非对称十字形、矩形、对称/非对称六边形、菱形),很难设计对应的统一的并行处理结构,因此不适合硬件设计的要求,另外门限的计算过程也过于复杂,不适合于采用硬 件处理,这些都限制了UMHexagonS算法应用于ASIC设计领域。
技术实现思路
为了克服现有技术UMHexagonS算法复杂、不适合硬件设计的不足,本专利技术提供一种基于中心预测的整数像素快速混合搜索(CPFMS,Centered Prediction based Fast Mixed Search)算法,在利用运动矢量的时空相关性对最优匹配点位置进行预测的基础上,依次进行“十”字形分布的五点搜索和九点均布的矩形搜索,并在搜索过程中引入搜索截止门限,在保证编码性能的前提下,可以有效的降低H.264运动估计过程的复杂度。 本专利技术解决其技术问题所采用的技术方案是 第一步、搜索窗中心预测 借鉴UMHexagonS算法中搜索窗中心预测的思想,搜索窗中心预测除了运动矢量的空间域、时间域预测外,结合H.264的变块尺寸和多参考帧运动预测新特性,引入了UpLayer预测和多参考帧预测,另外根据基于中心偏移的快速搜索原理,将零矢量预测也作为一种重要的预测模式作为候选。 对五种预测模式得到的候选点分别计算块匹配失真度(Block Distortion Measure,BDM),选取最小BDM对应的点作为搜索窗中心点。在上述运动矢量的前五种预测方式中,经过实验证明,空间域的预测更为准确,其中UpLayer预测的性能最优,因为这种方式充分利用了不同预测块模式运动矢量之间的相关性。而中值预测性能随着预测块尺寸的减小而增加,这里因为当前块尺寸越小,相关性越小。 在实际应用中,倘若对这些预测模式都执行一遍,计算量和和所耗费的时钟周期都将是一个庞大的数字。同时,如果5种预测模式都执行的话,需要将一帧中所有宏块的所有子块划分模式下的子块对应所有参考帧的运动矢量都存储下来,这无疑又是一个庞大的存储量需求。因此,要全部执行5种预测模式是不可能的,另一方面也没有这样的必要。因为大多数情况下,多种预测模式下得到的多个候选预测矢量都很相近,同时采用多种模式预测会引起很多的重复计算,实际上采用其中的两种或三种模式即可达到预期目标。而且在实际运动估计算法过程中,对于各种情况下的块,并不是每种预测方式都是有效的。例如,对应的块并没有运动矢量,因此相邻帧对应块的预测无法奏效;对于最近的参考帧,不存在多参考帧预测;对于16×16的块Uplayer预测无效等。 基于上述分析,设计了预测模式选择算法,以适应在不同情况下的运动矢量的预测,选择算法如下(1)对于16×8、8×16、8×8尺寸的块仅采用零矢量预测和UpLayer预测;(2)对于4×8、8×4、4×4尺寸的块采用零矢量预测、UpLayer预测和空间域的中值预测;(3)对于16×16尺寸的块,如果对应参考帧1、2、3、4,仅采用零矢量预测和多参考帧预测;(4)对应参考帧0,预测模式在零矢量预测、中值预测、相邻帧对应块的预测三者中进行选择。 第二步、设置搜索门限 在大多数情况下,预测矢量进行择优后总能很好的落在全局最优点附近SAD单调的区域之内。然而会有极少数情况下,预测值与全局最优点偏差较大。如果对当前块的运动矢量预测值与真实的最佳矢量偏差太大,在局部搜索窗内进行有限的搜索会导致陷入局部最小点或边界极值点,影响运动估计精度。因此必须对运动矢量预测是否成功进行有效的判断。最直接的方法是设置一个门限值,以最佳预测矢量对应的点为中心进行搜索而得到的最小SAD与门限比较,如果小于门限则说明SAD已本文档来自技高网
...

【技术保护点】
基于中心预测的整数像素快速混合搜索方法,其特征在于包括下述步骤:(a)采用运动矢量的空间域预测、时间域预测、UpLayer预测、多参考帧预测和零矢量预测进行搜索窗中心预测,对五种预测模式得到的候选点分别计算块匹配失真度,选取最小块匹 配失真度对应的点作为搜索窗中心点;(b)设置搜索方向快速界定门限T1,T1=SAD↓[thrh_1]=SAD↓[pred](1+β↓[1])、预测成功判定门限T2,T2=SAD↓[thrh_2]=SAD↓[pred](1+β↓[2] )和中途截止门限T3,T3=T↓[i];其中:SAD↓[pred]采用Uplayer预测、空间中值预测、相邻帧对应块预测和相邻多参考帧预测四种预测方式得到的最小预测值,对于16×16、16×8、8×16、8×8、8×4、4×8、4×4尺寸的7种块模式,β1=0.02,0.02,0.02,0.03,0.04,0.04,0.05;β2=0.05,0.10,0.10,0.12,0.125,0.125,0.15;T↓[7]=(2↑[qbits]-f)/QE[q↓[rem]][0][0]<TH↓[7]?(2↑[qbits]-f)/QE[q↓[rem]][0][0]∶TH↓[7];其中qbits=15+QP/6,q↓[rem]=QP%6,f=(1<<qbits)/6,QE指已定义的量化系数表,QP是量化参数;(c) 进行CPFMS搜索,包括以下步骤:(1)根据中值预测、UpLayer预测、相邻帧预测和多帧参考预测预测的当前宏块运动矢量计算最优预测运动矢量对应匹配点的匹配误差SAD’,如果SAD’<T3,则退出搜索,该匹配点为全局最优匹配点;否则 将SAD’和零矢量预测对应的SAD比较,采用误差较小的点作为搜索窗中心点进行步长为2的“十”字形分布的五点搜索,并选择误差较小的点作为第2步的当前最优匹配点;(2)如果X↓[OPT]=0且Y↓[OPT]=0,则:①如果SAD↓[OP T]>T2,以当前最优点为搜索中心重新进行步长为2的“十”字形分布的五点搜索;②如果SAD↓[OPT]<T2,且SAD↓[OPT]<T1,SAD↓[SOPT]>T1,以当前最优点为中心点进行步长为1的九点矩形搜索;③如果SAD↓[OPT]<T2,且SAD↓[OPT]<T1,SAD↓[SOPT]<T1,以搜索窗中心点和次优点之间两点连线中点为中心点进行步长为1的九点...

【技术特征摘要】
1、基于中心预测的整数像素快速混合搜索方法,其特征在于包括下述步骤(a)采用运动矢量的空间域预测、时间域预测、UpLayer预测、多参考帧预测和零矢量预测进行搜索窗中心预测,对五种预测模式得到的候选点分别计算块匹配失真度,选取最小块匹配失真度对应的点作为搜索窗中心点;(b)设置搜索方向快速界定门限T1,T1=SADthrh_1=SADpred(1+β1)、预测成功判定门限T2,T2=SADthrh_2=SADpred(1+β2)和中途截止门限T3,T3=Ti;其中SADpred采用Uplayer预测、空间中值预测、相邻帧对应块预测和相邻多参考帧预测四种预测方式得到的最小预测值,对于16×16、16×8、8×16、8×8、8×4、4×8、4×4尺寸的7种块模式,β1=0.02,0.02,0.02,0.03,0.04,0.04,0.05;β2=0.05,0.10,0.10,0.12,0.125,0.125,0.15;T7=(2qbits-f)/QE[qrem]<TH7?(2qbits-f)/QE[qrem]TH7;其中qbits=15+QP/6,qrem=QP%6,f=(1<<qbits)/6,QE指已定义的量化系数表,QP是量化参数;(c)进行CPFMS搜索,包括以下步骤(1)根据中值预测、UpLayer预测、相邻帧预测和多帧参考预测预测的当前宏块运动矢量计算最优预测运动矢量对应匹配点的匹配误差SAD’,如果SAD’<T3,则退出搜索,该匹配点为全局最优匹配点;否则将SAD’和零矢量预测对应的SAD比较,采用误差较小的点作为搜索窗中心点进行步长为2的“十”字形分布的五点搜索,并选择误差较小的点作为第2步的当前最优匹配点;(2)如果XOPT=0且YOPT=0,则①如果SADOPT>T2,以当前最优点为搜索中心重新进行步长为2的“十”字形分布的五点搜索;②如果SADOPT<T2,且...

【专利技术属性】
技术研发人员:周巍段哲民周欣
申请(专利权)人:西北工业大学
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1