高效视频编码中的运动估计加速方法技术

技术编号:15696099 阅读:327 留言:0更新日期:2017-06-24 11:43
本发明专利技术公开了一种高效视频编码中的运动估计加速方法,主要解决现有高效视频编码技术中编码速度慢的问题。其步骤为:1)主处理器CPU将图像数据传输至协处理器GPU进行存储;2)GPU利用图像数据执行分层高级运动向量预测和整像素运动搜索,得出各层的整像素运动向量,并对图像数据中的参考图像进行分像素插值滤波,得出不同精度的插值图像;3)以各层的整像素运动向量为起点,在不同精度的插值图像上分别执行分像素运动搜索,得出各个块的分像素运动向量;4)GPU将整像素运动向量和分像素运动向量信息传输至CPU,CPU对这两种运动向量进行误差修正,完成运动估计。本发明专利技术显著提高了编码速度和效率,可应用于视频编解码。

【技术实现步骤摘要】
高效视频编码中的运动估计加速方法
本专利技术属于视频压缩编码
,特别涉及一种运动估计加速方法,可用于在CPU+GPU平台下的高效视频编码HEVC。
技术介绍
视频领域应用中有一项关键技术是视频编码,也称视频压缩,其目的是尽可能去除视频数据中的冗余成分,减少表征视频的数据量。从20世纪80年代起,国际组织开始对视频编解码建立国际标准。随着技术的不断改进,新一代视频编解码标准——H.265/HEVC于2013年11月25日发布。与以往的视频编解码标准相比,H.265/HEVC的编码性能有了很大的提升,这是由于新增了许多技术,例如基于四叉树的灵活块分割结构、不同角度的帧内预测模式、帧间预测中自适应的高级运动向量预测技术AMVP、合并技术Merge、可变尺寸的离散余弦变换、性能更好的CABAC,以及新的样点自适应补偿滤波器等。帧间预测主要用于去除图像间的时间相关性,通过将已经编码的图像作为当前帧的参考图像,来获取各个块的运动信息,从而去除时间冗余,提高压缩效率。在H.265/HEVC中引入了新的帧间预测技术,包括Merge、AMVP及基于Merge的Skip模式。Merge技术利用空域相关性和时域相关性来减少相邻块之间的运动参数冗余,具体就是取相邻PU的运动参数作为当前PU的运动参数。AMVP技术的作用与Merge技术类似,AMVP技术得到的运动矢量一方面为运动估计提供搜索起点,另一方面作为预测运动矢量使用。在运动搜索方面,快速搜索使用了TZSearch算法。分像素插值及运动搜索是为了克服由运动的连贯性导致的运动以半像素、1/4像素为单位的情况,对图像信息进行滤波处理,并搜索出亚像素情况下的运动信息。现有标准H.264/AVC以及H.265/HEVC都使用1/4像素精度运动估计。率失真是同时衡量压缩性能和失真情况的一个量度。率失真优化方法是最主要的编码参数选择优化技术。在H.265/HEVC中,率失真函数如下:J=D+λ×Rrate其中D表示失真,Rrate表示编码所消耗的比特数,λ为拉格朗日乘子。在视频编码中常采用平方误差和SSE、绝对误差和SAD、均方误差MSE等客观评价方法作为率失真函数中的失真D。然而,优异的性能是通过高度的算法复杂度换取的,相比于H.264/AVC,H.265/HEVC编码速度大大降低,这导致了H.265/HEVC无法通过软件的方法得到实时编解码传输,所以提高编码速度的是亟待解决的问题。提高编码速度的方法有很多种,目前常见的有改变编码策略、硬件加速和利用并行计算等。其中在并行计算方法中CUDA是一种通用的GPU计算产品,能够非常有效的利用GPU强大的并行计算能力以及充足的存储器带宽。相比一般的CPU而言,CUDA在各个领域取得了显著的成绩,尤其在图像处理方面中获得的加速倍数已经达到一到两个数量级。2015年,王涛在其申请的专利“HEVC并行运动补偿方法及装置”中提出了图像分块并行运动补偿和树形收敛的方法,201510647960.1[P].2016,01,13。该方法运用了小块合并为大块思想,但该方法的并行粒度只达到了tiles级别和CTU级别,没有充分发挥GPU的大规模运算能力。2013年,徐荣飞在其发表的论文“HEVC编解码算法的CUDA优化”中公开了一种基于整帧并行运动搜索和分像素插值的方法,北京邮电大学,2013,该方法利用合并SAD的方式避免了重复计算,同时利用重组参考帧的方式避免了数据的重复传输和重复的插值滤波。但为了易于实现并行化,该方法删除了AMVP模块,导致编码遇到快速运动物体时无法及时捕捉,编码后期图像帧的编码质量下降。2016年,张维龙在其发表的论文“HEVC关键模块并行算法的设计与基于GPU的实现”中公开了一种梯状并行执行运动估计的策略,大连理工大学,2016,该方法在保留了原始数据依赖性的同时保留了AMVP算法,但由于梯形编码的并行程度只能达到多个编码单元CU同时编码,降低了并行效率。
技术实现思路
本专利技术的目的在于针对上述已有技术的不足,提出一种高效视频编码中的运动估计加速方法,以避免编码后期的编码质量下降,实现对整幅图像级的并行计算,提高并行效率。为实现上述目的,本专利技术的技术方案包括如下:(1)利用主处理器CPU将图像数据传输至协处理器GPU进行存储,其中图像数据包括:编码图像、参考图像和参考帧运动向量信息表;(2)GPU利用图像数据执行分层高级运动向量预测和整像素运动搜索,得出各层的整像素运动向量:(2a)对64×64图像块的高级运动向量预测和整像素运动搜索:(2a1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将(0,0)向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第一候选列表;(2a2)利用率失真准则选出第一候选列表中最优项,作为64×64图像块的运动搜索起始点;(2a3)根据(2a2)确定的搜索起始点在参考图像上对大小为64×64图像块执行整像素运动搜索,得出64×64图像块的整像素运动向量;(2b)分别对32×32图像块、32×64图像块和64×32图像块的高级运动向量预测和整像素运动搜索:(2b1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将由步骤(2a3)得出的64×64图像块的整像素运动向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第二候选列表;(2b2)利用率失真准则选出第二候选列表中最优项,作为32×32图像块、32×64图像块和64×32图像块的运动搜索起始点;(2b3)根据(2b2)确定的搜索起始点在参考图像上分别对32×32图像块、32×64图像块和64×32图像块执行运动搜索,分别得出32×32图像块、32×64图像块和64×32图像块的整像素运动向量;(2c)分别对16×16图像块、16×32图像块、32×16图像块的高级运动向量预测和整像素运动搜索:(2c1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将由步骤(2b3)得出的32×32图像块的整像素运动向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第三候选列表;(2c2)利用率失真准则选出第三候选列表中最优项,作为16×16图像块、16×32图像块和32×16图像块的运动搜索起始点;(2c3)根据(2c2)确定的搜索起始点在参考图像上分别对16×16图像块、16×32图像块和32×16图像块执行运动搜索,分别得出16×16图像块、16×32图像块和32×16图像块的整像素运动向量;(2d)分别对8×8图像块、8×16图像块和16×8图像块的高级运动向量预测和整像素运动搜索:(2d1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将由步骤(2c3)得出的16×16图像块的整像素运动向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第四候选列表;(2d2)利用率失真准则选出第四候选列表中最优项,作为8×8图像块、8×16图像块和16×8图像的运动搜索起始点;(2d3)根据(2d2)确定的搜索起始点在参考图像上分别对8×8图像块、8×16图像块和16×8图像块执行运动搜索,分别得出8×8图像块、8×16图像块和16×8图像块整像素运动本文档来自技高网
...
高效视频编码中的运动估计加速方法

【技术保护点】
高效视频编码中的运动估计加速方法,包括如下步骤:(1)利用主处理器CPU将图像数据传输至协处理器GPU进行存储,其中图像数据包括:编码图像、参考图像和参考帧运动向量信息表;(2)GPU利用图像数据执行分层高级运动向量预测和整像素运动搜索,得出各层的整像素运动向量:(2a)对64×64图像块的高级运动向量预测和整像素运动搜索:(2a1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将(0,0)向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第一候选列表;(2a2)利用率失真准则选出第一候选列表中最优项,作为64×64图像块的运动搜索起始点;(2a3)根据(2a2)确定的搜索起始点在参考图像上对大小为64×64图像块执行整像素运动搜索,得出64×64图像块的整像素运动向量;(2b)分别对32×32图像块、32×64图像块和64×32图像块的高级运动向量预测和整像素运动搜索:(2b1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将由步骤(2a3)得出的64×64图像块的整像素运动向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第二候选列表;(2b2)利用率失真准则选出第二候选列表中最优项,作为32×32图像块、32×64图像块和64×32图像块的运动搜索起始点;(2b3)根据(2b2)确定的搜索起始点在参考图像上分别对32×32图像块、32×64图像块和64×32图像块执行整像素运动搜索,分别得出32×32图像块、32×64图像块和64×32图像块的整像素运动向量;(2c)分别对16×16图像块、16×32图像块、32×16图像块的高级运动向量预测和整像素运动搜索:(2c1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将由步骤(2b3)得出的32×32图像块的整像素运动向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第三候选列表;(2c2)利用率失真准则选出第三候选列表中最优项,作为16×16图像块、16×32图像块和32×16图像块的运动搜索起始点;(2c3)根据(2c2)确定的搜索起始点在参考图像上分别对16×16图像块、16×32图像块和32×16图像块执行整像素运动搜索,分别得出16×16图像块、16×32图像块和32×16图像块的整像素运动向量;(2d)分别对8×8图像块、8×16图像块和16×8图像块的高级运动向量预测和整像素运动搜索:(2d1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将由步骤(2c3)得出的16×16图像块的整像素运动向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第四候选列表;(2d2)利用率失真准则选出第四候选列表中最优项,作为8×8图像块、8×16图像块和16×8图像的运动搜索起始点;(2d3)根据(2d2)确定的搜索起始点在参考图像上分别对8×8图像块、8×16图像块和16×8图像块执行整像素运动搜索,分别得出8×8图像块、8×16图像块和16×8图像块整像素运动向量;(3)GPU对参考图像进行分像素插值滤波,得出不同精度的插值图像;(4)以各层的整像素运动向量为起点,在不同精度的插值图像上分别执行分像素运动搜索过程,得出各个块的分像素运动向量;(5)GPU将各个块的整像素运动向量和分像素运动向量传输至CPU,CPU对整像素运动向量和分像素运动向量进行误差修正,消除GPU计算带来的偏移误差,得出准确的运动向量,完成运动估计。...

【技术特征摘要】
1.高效视频编码中的运动估计加速方法,包括如下步骤:(1)利用主处理器CPU将图像数据传输至协处理器GPU进行存储,其中图像数据包括:编码图像、参考图像和参考帧运动向量信息表;(2)GPU利用图像数据执行分层高级运动向量预测和整像素运动搜索,得出各层的整像素运动向量:(2a)对64×64图像块的高级运动向量预测和整像素运动搜索:(2a1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将(0,0)向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第一候选列表;(2a2)利用率失真准则选出第一候选列表中最优项,作为64×64图像块的运动搜索起始点;(2a3)根据(2a2)确定的搜索起始点在参考图像上对大小为64×64图像块执行整像素运动搜索,得出64×64图像块的整像素运动向量;(2b)分别对32×32图像块、32×64图像块和64×32图像块的高级运动向量预测和整像素运动搜索:(2b1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将由步骤(2a3)得出的64×64图像块的整像素运动向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第二候选列表;(2b2)利用率失真准则选出第二候选列表中最优项,作为32×32图像块、32×64图像块和64×32图像块的运动搜索起始点;(2b3)根据(2b2)确定的搜索起始点在参考图像上分别对32×32图像块、32×64图像块和64×32图像块执行整像素运动搜索,分别得出32×32图像块、32×64图像块和64×32图像块的整像素运动向量;(2c)分别对16×16图像块、16×32图像块、32×16图像块的高级运动向量预测和整像素运动搜索:(2c1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将由步骤(2b3)得出的32×32图像块的整像素运动向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第三候选列表;(2c2)利用率失真准则选出第三候选列表中最优项,作为16×16图像块、16×32图像块和32×16图像块的运动搜索起始点;(2c3)根据(2c2)确定的搜索起始点在参考图像上分别对16×16图像块、16×32图像块和32×16图像块执行整像素运动搜索,分别得出16×16图像块、16×32图像块和32×16图像块的整像素运动向量;(2d)分别对8×8图像块、8×16图像块和16×8图像块的高级运动向量预测和整像素运动搜索:(2d1)将参考帧运动向量信息表中对应位置的运动向量作为时域候选,将由步骤(2c3)得出的16×16图像块的整像素运动向量设为空域候选,并对该时域候选和空域候选进行合并,剔除重复项,生成第四候选列表;(2d2)利用率失真准则选出第四候选列表中最优项,作为8×8图像块、8×16图像块和16×8图像的运动搜索起始点;(2d3...

【专利技术属性】
技术研发人员:杜建超陈曦蕾肖嵩李媛媛孙兆凯李卫斌
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1