当前位置: 首页 > 专利查询>山东大学专利>正文

一种基于场景分类和几何标注的单视点视频深度获取方法技术

技术编号:12409317 阅读:54 留言:0更新日期:2015-11-29 17:35
本发明专利技术涉及一种基于场景分类和几何标注的单视点视频深度获取方法,具体步骤包括:(1)判断当前帧图像属于相机静止物体运动场景还是属于相机运动场景;(2)判断是否需要估计当前帧图像的初始深度图;(3)求出当前帧图像的初始深度图;(4)对于相机静止物体运动场景,得到当前帧图像的运动深度图,与初始深度图融合。对于相机运动场景,进行全局运动补偿,利用光流法对全局运动补偿后相邻帧图像进行运动估计,判断是否存在运动物体,确定是否与初始深度图进行融合。本发明专利技术不依赖具体的场景,计算量适中,生成噪声小且更加符合实际的场景分布的深度图,合成效果较好的3D视频。

【技术实现步骤摘要】

本专利技术涉及,属于计算 机图像处理

技术介绍
目前立体图像技术应用范围很广,分布在科研、军事、教育和医疗各个领域。相比 于2D图像,立体图像带给我们更逼真更震撼的视觉享受。目前3D片源的获取主要有几种方 式:深度摄像机、2D转3D技术。但是,深度摄像机非常昂贵,并且只能得到新拍摄视频的3D 内容,在3DTV系统中不实用,解决这个问题的一种有效的途径就是2D转3D技术,因为目前 存在大量的2D视频,2D转3D技术有非常好的发展前景。2D转3D技术是指将普通的2D图 像,通过图像或图像之间的相关信息,获得3D左右眼的深度图像。原图像和深度图像通过 基于深度图的虚拟绘制技术(DIBR)生成左视图图像和右视图图像,因为人眼存在的视差, 当左视图和右视图分别进入到人的左右眼时,便生成了立体图像。 2D视频场景根据场景中目标和相机运动情况不同可分成四种情况:相机运动、物 体静止,相机静止、物体运动,相机静止、物体静止,相机运动、物体运动。对于这些场景可以 采用运动、聚焦、散焦、线性透视、大气透视、纹理信息等深度线索或深度线索的结合得到对 应的深度图,但是,这些方法有的只是适用于某一种场景,当场景变换时,该方法便不再适 用。
技术实现思路
针对现有技术的不足,本专利技术公开了一种基于场景分类和几何标注的单视点视频 深度获取方法; 本专利技术针对相机静止物体运动、相机运动物体静止和相机运动物体运动这三种情 况下的视频都能得到对应的深度图像,将现有的2D视频转换成立体视频。 本专利技术得到能适应多种场景变换,精度较高并且计算量适中的深度图像,从而进 一步生成质量较好的3D视频。 本专利技术的技术方案为: 术语解释 1、光流法,是一种简单实用的图像运动的表达方式,通常定义为一个图像序列中 的图像亮度模式的表观运动,即空间物体表面上的点的运动速度在视觉传感器的成像平面 上的表达; 2、全局运动补偿,为了弥补由于摄像机移动造成的背景全局性的运动对图像中运 动目标检测造成的影响,常采用基于全局运动补偿思想的检测方法。该方法的思路是先对 由摄像机移动引起的背景运动进行运动补偿,使得补偿后的图像序列可以近似认为是静态 背景图像序列,然后再利用静态背景中运动目标的检测方法进行检测。 3、深度图,场景中各点相对于摄像机的距离可以用深度图来表示,即深度图中每 一个像素值表示场景中某一点到摄像机的距离。深度图中像素的值越大,场景中的物体离 摄像机越近,像素值越小,场景中的物体离摄像机越远。 -种基于场景分类和几何标注的单视点视频深度获取方法,具体步骤包括: (1)读取视频序列,采用光流法对视频序列中相邻帧图像进行运动估计,得到光 流运动矢量结果,根据光流运动矢量结果判断当前帧图像属于相机静止物体运动场景还是 属于相机运动场景,所述相机运动场景包括相机运动物体静止场景和相机运动物体运动场 景; (2)判断是否需要估计当前帧图像的初始深度图,如果需要,进入步骤(3),否则, 当前帧图像的初始深度图默认为当前帧图像的前一帧图像的初始深度图,直接进入步骤 ⑷; (3)根据当前帧图像的几何标注结果求出当前帧图像的初始深度图; (4)如果当前帧图像属于相机静止物体运动场景,采用光流法得到当前帧图像的 运动深度图,与当前帧图像的初始深度图融合;如果当前帧图像属于相机运动场景,首先进 行全局运动补偿,然后利用光流法对全局运动补偿后的相邻帧图像进行运动估计,得到运 动估计量级图,根据运动估计量级图中非零像素所占的比例来判断场景中是否存在运动物 体,如果存在运动物体,将全局运动补偿后的运动估计量级图线性变换得到的运动深度图, 运动深度图与初始深度图融合得到最终深度图,如果不存在运动物体,将全局运动补偿前 的运动估计量图线性变换得到的运动深度图作为最终深度图。 根据本专利技术优选的,所述步骤(1)中,读取视频序列,采用光流法对视频序列中相 邻帧图像进行运动估计,得到光流运动矢量结果,根据光流运动矢量结果判断当前帧图像 属于相机静止物体运动场景还是属于相机运动场景;具体步骤包括: a、读取视频序列,获取所有的图像,求相邻帧图像之间的光流运动矢量结果,然后 将当前帧图像的前(N-I)帧图像的光流运动矢量结果聚集,在原像素(x,y)处当前帧图像 的光流运动矢量结果MVS (x,y)的计算公式如式(I )所示:原像素(x,y)在第(1-1)个光 流运动后的坐标(X1^1)的计算公式如式(II )所示; 式(I )中,MV()表示相邻帧图像之间的光流运动矢量结果,N表示连续的帧图 像数,N帧图像共发生(N-I)次光流运动;1 = 1,2, ...,(N-I),分别表示第1,2, ...,(N-I) 个光流运动,(Xby1)表示的是原像素(x,y)在第(1-1)个光流运动后的坐标; 式(II )中,Round {}算子是对光流运动矢量结果的所有元素取整,q = 1,2,. . .,(1-1),分别表示的是第1,2,. . .,(1-1)个光流运动,(xq,yq)表示原像素(X,y)在 第(q-Ι)个光流运动后的坐标; b、根据步骤a求取的当前帧图像的光流运动矢量结果的水平运动分量MVSu和垂 直运动分量MVSJ+算出运动累积量级图M ^jmjliciticin,计算公式如式(III)所示: 设定阈值Thwelght, 2彡Thwelght彡10,统计运动累积量级图中大于阈值Th welght的像素的数目Ν',Ν'在所有像素中所占的百分比作为当前帧图像运动区域的权值Wni,计算公式 如式(IV )所示: 式(IV )中,H和W分别为当前帧图像的高和宽; c、设定相机运动阈值 Theaniera nmtlcin, 0· 6 彡 TheaiierajrotlcinS 0· 85,根据步骤 b 求取的 当前帧图像运动区域的权值Wni与相机运动阈值Th关系判断当前帧图像是局部 运动还是全局运动,如果当前帧图像运动区域的权值Wm小于相机运动阈值Th _____,则 当前帧图像是局部运动,即当前帧图像属于相机静止物体运动场景,否则,当前帧图像是全 局运动,即当前帧图像属于相机运动场景。 根据本专利技术优选的,所述阈值Thirelght= 5。 根据本专利技术优选的,所述相机运动阈值Th_CTaJrotlcin= 0. 8。 根据本专利技术优选的,所述步骤(2)中,判断是否需要估计当前帧图像的初始深度 图,具体步骤包括:如果当前帧图像是局部运动,即当前帧图像属于相机静止物体运动场 景,根据步骤(1)判断当前帧图像的前一帧图像是否为局部运动,如果当前帧图像的前一 帧图像是局部运动,当前帧图像的初始深度图默认为当前帧图像的前一帧图像的初始深度 图,不需要估计当前帧图像的初始深度图;如果当前帧图像的前一帧图像不是局部运动,则 需要求当前帧图像的初始深度图;如果当前帧图像是全局运动,则需要求出当前帧图像的 初始当前第1页1 2 3 4 本文档来自技高网...

【技术保护点】
一种基于场景分类和几何标注的单视点视频深度获取方法,其特征在于,具体步骤包括:(1)读取视频序列,采用光流法对视频序列中相邻帧图像进行运动估计,得到光流运动矢量结果,根据光流运动矢量结果判断当前帧图像属于相机静止物体运动场景还是属于相机运动场景,所述相机运动场景包括相机运动物体静止场景和相机运动物体运动场景;(2)判断是否需要估计当前帧图像的初始深度图,如果需要,进入步骤(3),否则,当前帧图像的初始深度图默认为当前帧图像的前一帧图像的初始深度图,直接进入步骤(4);(3)根据当前帧图像的几何标注结果求出当前帧图像的初始深度图;(4)如果当前帧图像属于相机静止物体运动场景,采用光流法得到当前帧图像的运动深度图,与当前帧图像的初始深度图融合;如果当前帧图像属于相机运动场景,首先进行全局运动补偿,然后利用光流法对全局运动补偿后的相邻帧图像进行运动估计,得到运动估计量级图,根据运动估计量级图中非零像素所占的比例来判断场景中是否存在运动物体,如果存在运动物体,将全局运动补偿后的运动估计量级图线性变换得到的运动深度图,运动深度图与初始深度图融合得到最终深度图,如果不存在运动物体,将全局运动补偿前的运动估计量图线性变换得到的运动深度图作为最终深度图。...

【技术特征摘要】

【专利技术属性】
技术研发人员:江铭炎徐慧慧
申请(专利权)人:山东大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1