基于关注度的目标物三维重建方法技术

技术编号:5359900 阅读:236 留言:0更新日期:2012-04-11 18:40
本发明专利技术基于关注度的目标物的三维重建方法,包括步骤S1:将用于三维重建的视频分割为视频帧,并从静态、位置和动态分析视频帧中的视觉关注度分布,并获得其对应的静态、位置和动态显著度图;融合静态、位置和动态分析的显著度图以得到每个视频帧的基于视频的显著度图,显著度图所描述的显著区域为三维重建中的感兴趣区域;步骤S2:利用概要性全局特征来聚类所有的视频帧,并根据每个视频帧产生的显著度图选出一个候选的关键帧集合,最终通过几何约束和视觉约束分析,提取用于三维重建的视频关键帧;步骤S3:使用视频关键帧和其相对应的显著度图,仅对视频帧中的显著区域进行三维重建,以得到在感兴趣区域上的精确的三维模型并加快重建速度。

【技术实现步骤摘要】

本专利技术属于计算机视觉,图像处理和多媒体分析
,涉及基于关注度的目 标物三维重建方法。
技术介绍
随着数字图像的发展,高质量的视频变得更加丰富。由于基于视频的三维重建通 过使用丰富的视频数据,可以提高集合精度和视觉质量,因此成为一个很流行的研究课题, 在计算机视觉,图像处理和多媒体分析。一般来说,基于视频/图像的三维重建系统可以分为两类基于非标定的系统和 基于自标定的系统。基于非标定的系统需要图像和摄像机参数来进行三维重建,例如基于 块的多视立体方法(PMVS),它通过增强局部光学一致性和全局视觉约束来恢复物体或者场 景的三维结构。基于自标定的系统首先通过摄像机自标定算法估计摄像机参数然后再恢复 三维点云。但是,当前的方法只提供整体场景的三维重建,而我们往往只关注那些吸引我们 注意力的区域。这样的方法浪费了太多的计算量在重建那些非感兴趣区域,而且三维模型 不能突出那些感兴趣区域。人们往往关注与那些视觉显著的区域,而视觉关注度分析可以获得视觉显著区 域。视觉关注度分析已经被学习和广泛的应用于计算机视觉,人工智能和多媒体处理。大 部分先前的工作集中于静态图像的分析,主要使用静态信息。当前,视频关注度分析吸引了 更多的关注。主要方法有结合静态和位置显著度图来获得关键帧中的感兴趣区域。除了静 态和位置关注度,动态关注度同样引起了人们的注意,并且广泛的应用于基于时空信息的 关注区域检测。有很多方法可以用来获得运动向量,例如光流法。但是,在运动摄像机条件 下的运动向量的估计仍然是一个挑战性的问题,而且仅仅从观看者的角度分析动态关注度 是不够的。
技术实现思路
了解决现有技术三维重建的精确度不能令人满意的问题,本专利技术的目的是提出 了一个时空关注度区域检测的方法来增强基于视频的三维重建,为此提供一种基于关注度 的目标物三维重建方法。为达到上述目的,本专利技术提供的的技术方案包 括通过分析视频帧中的感兴趣区域来提高三维重建的效果并加快三维重建的速度,包括 步骤如下步骤Sl 将用于三维重建的视频分割为视频帧,并从静态、位置和动态三个方面 来分析视频帧中的视觉关注度分布,并获得其对应的静态、位置和动态显著度图;融合静 态、位置和动态三方面分析的显著度图以得到每个视频帧的基于视频的显著度图,显著度 图所描述的显著区域为三维重建中的感兴趣区域;步骤S2 利用概要性全局特征来聚类所有的视频帧,并根据每个视频帧产生的显4著度图选出一个候选的关键帧集合,最终通过几何约束和视觉约束分析,提取用于三维重 建的视频关键帧;步骤S3 使用视频关键帧和其相对应的显著度图,仅对视频帧中的显著区域进行 三维重建,以得到在感兴趣区域上的精确的三维模型并加快重建速度。其中,所述分析视频的视觉关注度包括静态关注度分析、位置关注度分析、动态 关注度分析和关注度融合;对于每个视频帧,使用基于对比和基于信息论相结合的方法进行静态关注度分 析,得到静态显著度对于每个视频帧,从水平、垂直和放射三个方面描述摄像机的运动使用完整模板 匹配进行位置关注度分析,得到位置显著度对于相邻视频帧,从视频观众和视频拍摄者两个方面进行动态关注度分析,得到 相邻两帧中前帧的动态显著度对于得到的每个视频帧的静态显著度图、位置显著度图和动态显著度图,使用动 态融合的方式进行关注度融合,根据静态显著度图和动态显著度图的均值之间的关系来计 算融合时各自的权重,并最终得到每个视频帧的融合后的视觉显著度图。其中,所述提取用于三维重建的视频关键帧的步骤包括如下步骤S21 先用概要性全局特征描述符聚类所有的帧到k个聚类类别;步骤S22 对于每一个聚类类别,通过计算这个类别中所有显著度图的均值来获 得这个类别的类显著度步骤S23 计算每个聚类中帧的显著度图和类显著度图之间的距离,并从每个聚 类类别中选出与类显著度图距离最小的10%的图像作为候选关键帧集合;步骤S24 将来自候选关键帧集合中的任意k个帧构成一个帧组合,如果他们来自 不同的类别,根据几何约束和视觉约束排序所有的帧组合并最终决定关键帧组合。其中,所述仅对视频帧中的显著区域进行三维重建的步骤如下步骤S31 用由运动恢复结构的方法自动的恢复关键帧的摄像机参数;然后,在每 个关键帧中用高斯差分和哈里斯检测子来检测角点;对每个关键帧的感兴趣区域由视觉显 著度的值来描述;通过帧显著度图,删除检测出来的分布在感兴趣区域之外的特征;最后, 分布在感兴趣区域内的特征被提供去恢复三维信息;步骤S32 使用两幅图像之间的极限约束对分布在感兴趣区域内的图片特征进行 特征匹配,从而在显著区域中形成稀疏的块分布,得到初始匹配块,步骤S33 重复η次对初始匹配块向周围进行扩散膨胀,并且得到稠密的块分布;步骤S34 根据视觉约束,对稠密的块分布重复η次消除匹配错误的块,实现关注 度增强的三维重建。本专利技术的有益效果本专利技术通过对每个视频帧进行视觉关注度分析,在每个视频 帧中得到了较为精确的感兴趣区域,并通过对视频帧的基于全局特征的聚类以及基于视觉 约束和几何约束的视频关键帧提取,来得到有利于三维重建视频关键帧和视频帧中的感兴 趣区域。对视频关键帧中的感兴趣区域中的特征进行三维重建,得到了精确的三维重建结 果,并提高了三维重建的速度。本专利技术在真实环境中的室内和室外的实验,证明了本专利技术的方法有更高的精确度和更高的计算效率。 附图说明图1本专利技术基于视觉关注度的目标物三维重建框架图图2是描述在室内环境下的视觉关注度分析结果。图3是描述在室外环境下视觉关注度分析的结果。图4是室内环境下视频关键帧提取结果。图5是室外环境下视频关键帧提取结果。图6是室内场景重建的例子。图7是室外场景重建的例子。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照 附图,对本专利技术进一步详细说明。考虑到视觉关注度分析在感兴趣区域检测上的广泛应用,本专利技术提出了一个时空 关注度区域检测的方法来增强基于视频的三维重建。本专利技术的方法适应基于视频的三维重 建的特性未知的摄像机运动和视频中某些物体的突然出现(例如飞鸟,行人,路过的车辆 等)。通过与传统的三维重建方法比较,本专利技术的方法可以获得更准确的三维模型和较低的 运算消耗。本专利技术中所使用计算机均在Windows XP操作系统下,硬件设备条件为处理器: 酷睿双核2. 2G,内存2G。本专利技术的结构图在图1中显示基于视觉关注度的目标物三维重建 框架图,包括三部分1)基于视频的视觉关注度分析,幻视频关键帧提取,幻关注区域增强 的视频三维重建,其中1基于视频的视觉关注度分析基于视频的视觉关注度分析主要包括四部分静态关注度分析、位置关注度分析、 动态关注度分析和关注度融合。其中,静态关注度分析主要是针对视频帧中能够引起人们 视觉关注的静态的物体的分析;位置关注度分析主要是针对视频帧中,由位置引起的视觉 关注的分析,并且视觉关注的位置也随着摄像机的变化而转移;动态关注度分析主要是针 对相邻视频帧中,运动的物体能够引起视觉关注的分析,通过对视频帧中每个像素点的运 动强度分析,获得能够引起视觉关注的动态显著度图;分别从静态、位置和动态三个方面分 析视觉关注之后,本专利技术融合三方面分析的结果,得到最终的视觉关注分析。1. 1静态关注度分析静本文档来自技高网...

【技术保护点】
一种基于关注度的目标物三维重建方法,其特征在于,通过分析视频帧中的感兴趣区域来提高三维重建的效果并加快三维重建的速度,包括步骤如下:步骤S1:将用于三维重建的视频分割为视频帧,并从静态、位置和动态三个方面来分析视频帧中的视觉关注度分布,并获得其对应的静态、位置和动态显著度图;融合静态、位置和动态三方面分析的显著度图以得到每个视频帧的基于视频的显著度图,显著度图所描述的显著区域为三维重建中的感兴趣区域;步骤S2:利用概要性全局特征来聚类所有的视频帧,并根据每个视频帧产生的显著度图选出一个候选的关键帧集合,最终通过几何约束和视觉约束分析,提取用于三维重建的视频关键帧;步骤S3:使用视频关键帧和其相对应的显著度图,仅对视频帧中的显著区域进行三维重建,以得到在感兴趣区域上的精确的三维模型并加快重建速度。

【技术特征摘要】

【专利技术属性】
技术研发人员:徐常胜肖宪
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1