当前位置: 首页 > 专利查询>卡洛斯塔庞专利>正文

模型生成的图形图像到照相机帧的基于帧和象素的匹配制造技术

技术编号:5724470 阅读:244 留言:0更新日期:2012-04-11 18:40
本发明专利技术允许在不进行实际场景分析和特征识别时进行相机位置的三角测量。本发明专利技术利用在视觉领域的世界的先验的、正确的模型。使用最新的图形处理单元在图形表面上绘制3D模型。然后在图形表面上绘制的多个候选中搜索来自照相机的每个帧用于最佳匹配。通过从一个帧到另一个帧计算照相机位置和视角的改变使得绘制的要比较的图像的计数是小的,然后使用这样计算的结果来限制下一个可能的位置和视角以绘制先验的世界模型。本发明专利技术和现有技术相比较的主要优点是将真实世界映射到世界模型。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术使用当前技术发展水平的计算机图形学来推进计算机视觉领域。图形引擎,特别是那些实时使用的图形引擎,例如第一人称射击游戏,已经变得十分真实。本专利技术的基本概念是在图像处理中使用图形引擎将那些由实时图形引擎生成的图像帧和那些来自照相机的图像帧匹配起来。
技术介绍
在视觉或图像处理中有两个不同的任务。 一方面有图像分析和特征识别这样困难的任务,另一方面有计算给定输入图像的照相机的3D世界的位置的不那么困难的任务。在生物视觉中,这两个任务交织在一起使得将它们区分开是困难的。我们通过从我们周围的特征识别和做三角测量来感知我们在世界坐标中的位置。看起来如果我们没有首先识别出我们从中进行三角测量的特征的话,我们不能进行三角测量,并且除非我们可以在我们居住的3D世界的某个位置放置特征,我们不能真正识别。如果不是所有的视觉系统,那么现有技术中绝大多数的视觉系统尝试在相同的系统中实现这两个任务。例如,参考专利号US5801970包括这两个任务;参考专利号US6704621看起来只包括三角测量,但是它实际上要求道路的识别。
技术实现思路
如果三角测量任务可以实际上与分析和特征识别任务分开并独立于分析和特征识别任务来进行,那么我们将需要不执行后者任务的系统中的一半的计算资源。通过利用通信处理中的当前的ii^,本专利技术允许照相机位置的三角测量而不进行通常的景物分析和特征识别。本专利技术利用在视觉领域的世界的先验的、正确的模型。使用最新的图形处理单元在图形表面上绘制3D模型。然后在图形表面上绘制的多个候选中搜索来自照相机的每个帧用于最佳匹配。通过从一个帧到另一个帧计算照相机位置和视角的改变使得绘制的要比较的图像的计数是小的,然后使用这样计算的结果来限制下一个可能的位置和^L角以绘制先验的世界模型。本专利技术和现有技术相比较的主要优点是将真实世界映射到世界模型。本专利技术的一个最适合的应用是机器人编程。以先验的地图引导的机器人以及知道自己在地图中的位置的机器人要远远优于没有被这样引导的机器人。对于导航、引导、寻找路径、避免障碍、瞄准关注点以及其他机器人任务来说是卓越的。附图说明图1是示出在真实世界中照相机的活动是如何在3D模型的世界中被追踪的本专利技术的实施例的图表。图2是分成区域的透视图表面或者照相机帧的示例。图3是下面描述的算法的高层流程图。具体实施例方式图1中示出了本专利技术的优选实施例的图表。使用当前可用的先进的图形处理器101在绘制的图《象102、 103和104上绘制(render) 了世界100的先马全的模型。该模型是真实世界110的正确的但是不必要是完整的模型。本专利技术的目的在于分别追踪在时间t和t + 1产生帧107和108的照相机309的位置和视角。帧107和108用作主要实时输入,输入至设备。使用现有技术水平的方法从帧107和108计算光流矢量。从这些光流矢量根据现有技术以对噪声和异常值具有鲁棒性(robust)的方式可以得出正确的取向和照相机视角。然后在有当前的取向定义的线上的点周围,假设在距当前的位置由当前的速度决定的距离的地方为下一个可能的位置(105)。通过图形处理器或者处理器101在N个候选图像102、 103和104中绘制可能的候选位置N。然后将每个绘制的图像和当前的照相机帧进行比较,并且选出最匹配的图像(106)。从选出的图像,也可以从候选位置中选出照相机的最精确的位置,瞬态速度、视角以及角速度。使用图3所示的流程图中的下面的步骤在本专利技术中实现动态的,帧与帧的三角测量(追踪)。在下面的步骤描述中,对于每个来自照相机的视频帧,具有假设的一批可能的帧,其由图形处理器绘制来进行比较。在本专利技术中,这样的比较最耗费计算能力。视频帧在垂直和水平分辨率上都等于绘制的图像。如图2所示,每个帧和每个绘制的图像被分成多个矩形区域,其可以相互之间重叠多个象素。1. 以来自照相机的一帧开始,当获得该帧时,已知在瞬时时间't,照相机的绝对世界位置P(t)、 -见角V(t)、零速度u(t)-0以及零角速度w(t)-0。计算这一帧的所有区域(Cs)的离散快速傅立叶变换(FFT),并且提取变换的相位分量,在区域V时间't,的PFC(a, t)。2. 取得下一帧。计算所有PFC(a, t+l),在区域a时间t+l中的FFT的相位分量。3. 计算PFC(a, t)和PFC(a, t+l)之间的相位差,并且为了获得相位相关面对于相位差矩阵执行反FFT变换。如果照相机从't,到't+l,既没有摇动也没有移动,那么每个区域的相位相关面将指示在区域'a,的中心的最大值。如果照相机移动或者摇动了,那么最大值将在除了每个区域的中心之外的某处产生。对于每个区域OP(a, t+l)计算光流矢量,其被定义为在相位相关面从中心到最大值点的偏差。(如果在布景的区域中存在移动的物体,每个移动的物体将引起相位相关面上的额外的峰值,但是只要来自随后被比较的帧的两个区域由例如建筑物或者墙壁或者地面的静态物体统治,那么那些其他的峰值将低于对应于照相机位置和/或视角改变的峰值。)4. 从所有这样的OP (a, t + 1 ),并且使用绝对世界位置P(t)、视角V(t)、当前速度u(t)以及当前角速度w(t)来计算在时间t+ 1的所有可能的绝对照相机位置(矢量Pi (t+l))和视角(单位矢量Vi (t+l))的范围。Pi可以被选择位于活动线(瞬态取向)中,如在由The MIT Press 1986年出版的作者为B.K.RHorn的参考书"RobotVison"的17章中详述的那样,Pi可以从OP(a, t+l)中容易地确定。5. 假设可能的照相机位置Pi (t+l)的小的数目(例如N)以及视角Vi(t + 1)使用先验模型来绘制。这将导致N个图像透视图Mi (a, t + 1 )。计算每个Mi ( a, t + 1 )的FFT,并且提取转换的相位分量,PFMi (a, t + 1 )。6. 在t + 1时刻对于照相机帧的最佳匹配是考虑了所有的区域Mi的每个区域的PFMi ( a, t + 1 )和PFC ( a, t + 1 )的相位偏差导致了反FFT变换,其是具有最大最接近的中心的2D图形。从这里也可以选出最佳的可能的位置P (t+1)和视角V (t+1 )。然后将瞬态速度确定为u (t+1) =P(t+l) -P(t),同时瞬态角速度为w (t+1 ) =V(t+l) -V(t)。7.通过将P (t+ 1 )复制到P (t)、 V (t+ 1 )复制到V (t)、 u (t+ 1 )复制到u (t )、 w (t + 1 )复制到w (t)以及PFC ( a, t + 1)复制到PFC ( a,t)来丢弃原来的时间t的计算和帧,并且使得1+ 1成为当前时间。返回步骤2。只要照相机的视角域由静态实体(相当于世界坐标静态,图像的更少的区域由活动实体占据)统治,那么就可能动态三角测量或者追踪。只要照相机帧以及由此区域由静态实体统治,在相位相关面上的峰值对应于照相机运动。这在现有技术中是公知的,如在1987年由British Broadcasting Corporation (BBC)7>布的作者为G.A.Thomas的名称为"Television Motion Meas本文档来自技高网...

【技术保护点】
一种用于实时跟踪校准照相机的位置和视角(自我运动)的方法,包括以下步骤: 创建存在照相机的世界的先验模型; 从照相机中获取每个原始的、未处理的视频帧; 对于每个视频帧,假设获取这些视频帧的一小组可能的位置和视角; 对 于每个视频帧,使用图形处理器和来自先验模型的顶点数据来绘制图像,每个假设的位置和视角绘制一个图像; 对于每个视频帧,通过寻找对该视频帧的最佳匹配图像来选出最佳位置和视角。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:卡洛斯塔庞
申请(专利权)人:卡洛斯塔庞
类型:发明
国别省市:US[美国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1