一种视频数据传输方法技术

技术编号:10584141 阅读:102 留言:0更新日期:2014-10-29 14:04
本发明专利技术提供了一种视频数据传输方法,该方法包括:利用运动向量场进行全局运动估计;对视频中的局部运动进行分割;对ROI图像进行修正;基于修正的ROI图像进行视频编码并传输。本发明专利技术准确完整地检测出视频中的关注区域;降低了编码比特率,同时保持了主观质量。

【技术实现步骤摘要】
一种视频数据传输方法
本专利技术涉及视频编码,特别涉及一种视频数据传输方法。
技术介绍
随着信息技术的发展,生活中人们接触到的视频信息量越来越庞大,如何高效提取视频中显著物体引起了越来越多研究者的关注,ROI(感兴趣区域)在视频信号处理方面有着广泛的应用,比如视频检索、视频压缩、视频监控、视频跟踪等领域。视频传输方面,由于现在视频分辨率越来越高,因此高效的视频传输方法也是研究的热点之一。同时结合人眼视觉模型的视频编码方法是下一代视频编解码的关键技术之一,因此ROI作为人眼视觉模型的一个重要方面也就显得尤为重要。ROI在视频信号处理方面有着广泛的应用,因此对ROI技术的开发有非常重要的意义。目前图像ROI方法主要利用图像的颜色、亮度等特征计算图像的显著性,但是图像的ROI方法没有利用视频的运动特征,因此将图像ROI方法直接应用视频检测时效果不好。然而对视频ROI方法研究较少,并且存在方法复杂度较高的缺点,已有技术并未考虑视频的纹理特征以及人眼视觉所关注区域的整体性,导致压缩率不高或主观质量不佳。因此,针对相关技术中所存在的上述问题,目前尚未提出有效的解决方案。
技术实现思路
为解决上述现有技术所存在的问题,本专利技术提出了一种视频数据传输方法,包括:步骤一,利用视频码流中的运动向量场进行全局运动估计;步骤二,在对运动矢量场进行全局运动估计之后,对视频中的局部运动进行分割;步骤三,对得到的全局运动背景下提取的局部运动的ROI图像进行修正;步骤四,基于修正的ROI图像进行视频编码并传输。优选地,所述步骤一采用参数为8维向量v=[v0,v1,…,v7]的投影模型,该模型的透视变换定义为:xR=(v0xC+v1yC+v2)/(v6xC+v7yC+1);yR=(v3xC+v4yC+v5)/(v6xC+v7yC+1);其中(xC,yC)和(xR,yR)分别为当前帧和参考帧的坐标,对于当前帧中每一个坐标为(xC,yC)的对应运动模型v的块,其运动分量定义为:VX(xC,yC;v)=xR-xC;VY(xC,yC;v)=yR-yC;其中VX和VY分别代表运动向量V的水平和垂直分量,去除向量场中全局运动模型的第一偏差值和第二偏差值;所述第一偏差值为视频编码过程中运动估计的运动向量噪声;所述第二偏差值为不符合背景运动模型的运动向量。优选地,所述步骤二进一步包括:步骤3.1以单个聚类即整帧所有的运动向量开始,计算它的中心Vc=(ΣkVk)/N,然后分别以新的中心Vc±Vc/2生成两个新的聚类;步骤3.2以最近最相似原则划分整帧的运动向量到现有的聚类中,然后更新第i个聚类的中心为其中Ni是第i个聚类Ci中运动向量的个数;步骤3.3计算每个聚类的失真,即分别以为中心,继续把具有最大失真的聚类Cm划分为两个聚类,其中P=((Xmax-Xmin)/2(M-1),(Ymax-Ymin)/2(M-1)),M为划分之前聚类的总数,Xmin,Xmax,Ymin和Ymax分别为中心点向量中最大和最小水平和垂直分量;步骤3.4重复步骤3.2和3.3,直到聚类失真的变化小于预先设定的阈值。优选地,所述步骤四进一步包括:采用自适应频率系数压制的方法,针对每个变换单元,定义:其中Cp为压制后的频率系数矩阵;表示两个矩阵对应元素相乘;W为频率系数压制矩阵,wi(i∈[0,6])取0或者1,并且满足约束wi+1≤wi;针对大小不同的变换单元,设定了5种频率系数压制矩阵:其中i,j分别为块的横坐标和纵坐标,W(k)ij是频率系数压制矩阵;N是块大小,取值分别为4,8,16和32;k是5种候选矩阵的索引;对应于5种候选矩阵,将非ROI区域TU的视觉感知权重WTU归一化为五个等级LTU:LTU=ceil[WTU/(128STU/5)],其中STU分别对应四种块大小取值为1,4,16和64,确定TU的频率系数压制矩阵:WTU=W{min[max(LTU+Winit,0),4]},其中Winit是控制频率系数压制的强度的选择频率系数矩阵的起始索引,取[-4,4]之间的整数值,根据编码QP动态更新,Winit=-(QP-CnonVS)/STEP+OGM,其中CnonVS,STEP和OGM分别表示非ROI区域常量值、步长和全局运动偏移。本专利技术相比现有技术,具有以下优点:在运动识别和编码过程中考虑视频的纹理特征以及人眼视觉所关注区域的整体性,与现有方法相比,本算法能更准确完整地检测出视频中的关注区域;比传统算法降低了编码比特率,从而提高传输效率,同时保持了几乎相同的主观质量。附图说明图1是根据本专利技术实施例的视频数据传输方法的流程图。具体实施方式下文与图示本专利技术原理的附图一起提供对本专利技术一个或者多个实施例的详细描述。结合这样的实施例描述本专利技术,但是本专利技术不限于任何实施例。本专利技术的范围仅由权利要求书限定,并且本专利技术涵盖诸多替代、修改和等同物。在下文描述中阐述诸多具体细节以便提供对本专利技术的透彻理解。出于示例的目的而提供这些细节,并且无这些具体细节中的一些或者所有细节也可以根据权利要求书实现本专利技术。由于编码的目标是为了在同样的视频质量下获取更高的压缩传输效率,因此本研究从人眼视觉感知的角度,在H.265码流压缩域进行显著性分析得到ROI图像。本专利技术的一方面提供了一种视频数据传输方法。图1是根据本专利技术实施例的视频数据传输方法流程图。如图1所示,实施本专利技术的具体步骤如下:1全局运动估计本专利技术采用具有8个参数的透视投影模型。该透视模型参数为一个8维向量v=[v0,v1,…,v7]。设定(xC,yC)和(xR,yR)分别为当前帧和参考帧的坐标,则该透视变换可以定义为:xR=(v0xC+v1yC+v2)/(v6xC+v7yC+1);yR=(v3xC+v4yC+v5)/(v6xC+v7yC+1);公式1设定VX和VY分别代表运动向量V的水平和垂直分量,则对于当前帧中每一个坐标为(xC,yC)对应运动模型v的块,该分量可以定义为:VX(xC,yC;v)=xR-xC;VY(xC,yC;v)=yR-yC公式2由于运动向量的全局运动估计的目的就是从运动向量中推出参数向量v,而H.265码流已经提供了运动向量场,因此运动向量不需要重新估计。然而向量场中存在某些运动向量并不适合全局运动模型,称为偏差值;因此,为了提高全局运动估计的准确性,需要将它们去除。本专利技术中将这些偏差值分为如下两类。类型1运动向量噪声。这些噪声通常是由于视频编码过程中运动估计在某些区域不准确,不能捕捉到真实的运动而产生的,比如具有较少或极少纹理的区域、一个运动物体的边界区域和具有重复纹理特征的区域等。类型2不符合背景运动模型的运动向量。这样的运动向量又可以分为两种:真正相对背景运动物体的运动向量,距离摄像头很近而被混为背景的静止物体的运动向量。这种类型的偏差值特点是它们通常出现在一帧中被上述两种物体覆盖的空间连续区域,且与邻近向量相似。为了准确地估计全局运动,必须尽可能去除这两种类型的运动向量偏差值,具体步骤如下。步骤1去除类型1运动向量偏差值。通常来自一个运动模型的运动向量存在非常强的空间相关性。本专利技术比较当前运动向量与邻近8个运动向量的大小,通过和预先设定阈值比较来去除最不适合的运动向量偏差值。具体判断方式为‖VC-VN‖/‖本文档来自技高网...
一种视频数据传输方法

【技术保护点】
一种视频数据传输方法,其特征在于,包括:步骤一,利用视频码流中的运动向量场进行全局运动估计;步骤二,在对运动矢量场进行全局运动估计之后,对视频中的局部运动进行分割;步骤三,对得到的全局运动背景下提取的局部运动的ROI图像进行修正;步骤四,基于修正的ROI图像进行视频编码并传输。

【技术特征摘要】
1.一种视频数据传输方法,其特征在于,包括:步骤一,利用视频码流中的运动向量场进行全局运动估计;步骤二,在对运动矢量场进行全局运动估计之后,对视频中的局部运动进行分割;步骤三,对得到的全局运动背景下提取的局部运动的ROI图像进行修正;步骤四,基于修正的ROI图像进行视频编码并传输;所述步骤一采用参数为8维向量v=[v0,v1,…,v7]的投影模型,该模型的透视变换定义为:xR=(v0xC+v1yC+v2)/(v6xC+v7yC+1);yR=(v3xC+v4yC+v5)/(v6xC+v7yC+1);其中(xC,yC)和(xR,yR)分别为当前帧和参考帧的坐标,对于当前帧中每一个坐标为(xC,yC)的对应运动模型v的块,其运动分量定义为:VX(xC,yC;v)=xR-xC;VY(xC,yC;v)=yR-yC;其中VX和VY分别代表运动向量V的水平和垂直分量,去除向量场中全局运动模型的第一偏差值和第二偏差值;所述第一偏差值为视频编码过程中运动估计的运动向量噪声;所述第二偏差值为不符合背景运动模型的运动向量。2.根据权利...

【专利技术属性】
技术研发人员:高冬
申请(专利权)人:成都瑞博慧窗信息技术有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1