当前位置: 首页 > 专利查询>诺基亚公司专利>正文

使用模板切换和特征适配提供对象跟踪的方法、装置和计算机程序产品制造方法及图纸

技术编号:8539215 阅读:236 留言:0更新日期:2013-04-05 04:39
提供一种方法、装置和计算机程序产品,可使得设备能够提供改进的对象跟踪,例如结合计算机视觉、多媒体内容分析和检索、增强现实、人机交互和基于区域的图像处理。由此,一种方法包括:调节具有目标对象的输入帧的一部分的参数,以匹配模板大小;然后,在输入帧的一部分和活动模板和至少一个选择的不活动模板之间执行基于特征的图像注册。所述方法还可包括:至少基于在输入帧的一部分和选择的不活动模板之间的匹配分数使得选择的不活动模板能够对于随后帧切换至活动模板;和基于活动模板和选择的不活动模板之一确定目标对象在输入帧中的位置。

【技术实现步骤摘要】
【国外来华专利技术】使用模板切换和特征适配提供对象跟踪的方法、装置和计 算机程序产品
概括地说,本专利技术的实施例涉及计算机视觉,更具体地,涉及使用在线模板切换和 特征适配使得能够进行对象跟踪的装置、方法和计算机程序产品。
技术介绍
在当今世界中,电子设备正逐渐普及。无论是用于商业、娱乐、通信、安全或各种其 他目的,这种设备的性能不断扩展。随着关于处理能力、呈现技术、存储器、功耗和其他方面 做出的演进,各种应用也得到开发,以利用计算设备经过扩展的性能。然而,在寻求进一步 发展并开发新应用时,关于这种设备的性能的扩展也引入了新的系列的挑战。电子计算设备的使用提出新挑战的一个领域涉及计算机视觉。计算机视觉利用机 器来观看。由此,例如,计算机视觉通常采用相机和其他元件来建立可获得来自例如视频序 列的图像数据的信息、来自多个相机的视图或来自扫描设备的多维数据的系统。计算机视 觉可用于许多任务,例如控制处理或设备运动;检测和/或识别事件、对象、模式或人群; 识别信息等。由此,计算机视觉可看作人工视觉系统,其可实现于各种设备和应用的组合 中。在计算机视觉情形下,在视觉帧的系列中对象和/或兴趣区域的跟踪成为了长期 存在的问题。具体地,对于可经历明显改变(例如亮度改变、姿态或方位改变、遮蔽等)的对 象或兴趣区域,难以提供健壮的跟踪能力。在过去提出了基于图像块和基于特征的对象跟 踪方法。一些人将基于图像块的跟踪看作适合于跟踪可经历明显姿态改变的刚性和非刚性 对象。然而,传统的基于图像块的方法倾向于遭受漂流模板问题(例如在模板更新中累积错 误而导致跟踪失败),并且可能对部分遮蔽敏感。一些人将基于特征的方法看作对部分遮蔽 不敏感,但是传统上证明更少用于经历较大姿态改变的跟踪对象。由此,可能期望对象跟踪 领域中的改进。
技术实现思路
因此,提供一种方法、装置和计算机程序产品,使得设备能够提供改进的对象跟 踪。具体地,本专利技术的一些实施例可提供改进的视觉跟踪,例如用于计算机视觉、多媒体内 容分析和检索、增强现实、人机交互和基于区域的图像处理。附图说明已经概括地描述了本专利技术,现在参照附图,附图不必按比例绘制,其中图1是根据本专利技术示例性实施例的计算机视觉系统的示意性框图2是根据本专利技术的示例性实施例的使用模板切换和特征适配提供对象跟踪的 装置的示意性框图;和图3 (包括图3A、3B和3C)示出本专利技术的一个示例性实施例的操作;图4是根据本专利技术的示例性实施例的使用模板切换和特征适配提供对象跟踪的 方法的流程图;和图5示出在其上可以实现本专利技术示例性实施例的芯片集或芯片。具体实施方式现在参考其中示出本专利技术一些而非全部实施例的附图更加完整地描述本专利技术的 示例实施例。当然,本专利技术可以不同形式实施并且不应该理解为限制为此处所述的实施例; 相反,提供这些实施例使得本公开满足适当的法律需求。类似的附图标记通篇表示类似的 元件。这里,术语“数据”,“内容”,“信息”和类似的术语可以可交替地使用以表示能够根据 本专利技术实施例被传输,接收,操作和/或存储的数据。因此,任意这些术语的使用不应认为 是对本专利技术实施例的精神和范围的限制。此处使用的术语“电路”指的是(a)纯硬件电路实现(例如纯模拟和/或数字电路 中的实现);(b)电路和包括软件和/或固件的计算机程序产品(存储于一个或多个计算机 可读存储器上)的组合,他们在一起工作从而使得装置执行这里所述的一个或多个功能;和 (C)需要软件或固件以进行操作的电路,例如微处理器或微处理器的部分,即使这些软件或 固件物理上不存在。“电路”的该定义适用于这个术语在该应用程序中,包括在任意权利要 求中的所有应用。作为另一示例,如此处使用的,术语“电路”也包括实现方式,其包括一个 或多个处理器和/或一个或多个处理器的部分和附随的软件和/或固件。作为另一示例, 此处使用的术语“电路”也包括例如用于移动电话的基带集成电路或应用程序处理器集成 电路,或者服务器、蜂窝网络设备、其它网络设备和/或其它计算设备中的类似集成电路。这里定义的“计算机可读存储介质”(指的是非临时的、物理存储介质(例如易失性 或非易失性存储器设备))可区别于“计算机可读传输介质”(指的是电磁信号)。一些实施例可提供基于健壮性特征的方法,其可延伸至经历明显姿态改变的对象 和非刚性对象。一些实施例中,代表性对象外观可在跟踪期间存储为候选模板,并且可选择 用于匹配随后帧的特定模板(例如最佳模板)。在跟踪处理期间可增加和切换模板,以保持 对象之间的更新关系被跟踪并保持模板用于跟踪。由此,示例性实施例可对于排列不整齐 的模板是有弹性的,并且可缓解漂流问题。示例性实施例可应用于包括固定或移动平台的任意计算机或计算设备的能力。因 此,例如,可使用包括图像捕获设备(例如相机电话)和其他移动设备的移动终端来跟踪人 脸用于人机交互,跟踪对象(例如,用于增强现实情形,其中跟踪对象并在跟踪的对象上叠 加计算机图形),低级图像处理等。然而,可结合网络(例如因特网)提供的服务(例如内容共 享或管理服务)来使用示例性实施例。由此,例如,通过自动分析和跟踪上传视频中感兴趣 的对象,可使得服务能够通过搜索和共享包括感兴趣的对象的内容来提供印象深刻的用户 体验。因此,例如,可提供服务以自动检测、跟踪和通知用户包括用户定义为感兴趣的对象 的其他视频剪辑。如上所述,本专利技术的实施例可在计算机视觉系统的环境下实践。由此,现在将参照 图1说明示例性实施例,图1示出用于采用计算机视觉系统的系统的基本框图。然而,应理 解,本专利技术的实施例可在各种其他环境下实践,并且不限于与计算机视觉系统相关的应用。 此外,尽管与计算机视觉系统相关,但是应认识到,图1仅是这样系统的一个基本实例并且不应看作任何方式的限制。现在参照图1,计算机视觉系统10可包括图像捕获模块20和计算设备30。图像捕 获模块20可包括一个或多个相机或配置为捕获图像数据的其他图像捕获传感器。图像数 据可以是例如来自一个或多个相应的相机或传感器的视频序列或一个或多个图像的形式。 计算设备30可以是计算机(例如个人计算机、膝上型计算机、服务器等)、移动电话、全球定 位系统(GPS)设备、个人数字助理(PDA)、寻呼机、移动电视、游戏设备、相机、音频/视频播 放器、无线电、或上述的任意组合、和可包括用于执行各种硬件和/或软件处理的处理器和 /或存储器的其他类型的电子设备。计算设备30可配置为采用根据以下结合图2的描述更 详细说明的本专利技术实施例的处理。在图像捕获模块20和计算设备30之间的通信可以是经由有线或无线传输机制的 实时或近实时的。一些情况下,图像捕获模块20和计算设备30之间的通信可以是间歇的 或延迟的。此外,一些情况下,图像捕获模块20可存储图像数据,其随后可在稍后的时间传 送至计算设备30 (直接或经由中间设备)。一些实施例中,图像捕获模块20和计算设备30可以是单独设备(例如移动终端或 具有嵌入相机的电话)的一部分。一些情况下,计算设备30可经由网络40与其他设备通 信,尽管不需要网络连接。此外,一些情况下,计算设备30可经由网络40与图像捕获模块 20通信。例如,一些情形下,图像捕获模块20可以是相机、视觉系统或者甚至经由网络40 向服务平台提供图像数据的移本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.06.22 US 61/357,3151.一种方法,包括 调节其中具有目标对象的输入帧的一部分的参数,以匹配模板大小; 在输入巾贞的一部分和活动模板和至少一个选择的不活动模板之间执行基于特征的图像注册; 至少基于在输入帧的一部分和选择的不活动模板之间的匹配分数使得选择的不活动模板能够对于随后帧切换至活动模板;和 基于活动模板和选择的不活动模板之一确定目标对象在输入巾贞中的位置。2.如权利要求1所述的方法,还包括增加输入巾贞的一部分作为候选模板。3.如权利要求1或2中任一项所述的方法,其中确定目标对象的位置包括使用活动模板或选择的不活动模板中提供更能指示与输入帧的一部分匹配的匹配分数的一个模板来确定位置。4.如权利要求1-3中任一项所述的方法,其中调节输入帧的一部分的参数包括对输入帧的一部分进行修剪、旋转和大小调节。5.如权利要求1-4中任一项所述的方法,其中选择的不活动模板包括与最佳最佳匹配点的数目和模板关键点的总数的比相关计分的多个候选模板中的最高排名的不活动模板。6.如权利要求5所述的方法,还包括对每个候选模板累积所述比。7.一种装置,包括至少一个处理器以及存储计算机程序代码的至少一个存储器,其中所述至少一个存储器和存储的计算机程序代码被配置为,利用所述至少一个处理器,使得所述装置至少 调节其中具有目标对象的输入帧的一部分的参数,以匹配模板大小; 在输入巾贞的一部分和活动模板和至少一个选择的不活动模板之间执行基于特征的图像注册; 至少基于在输入帧的一部分和选择的不活动模板之间的匹配分数使得选择的不活动模板能够对于随后帧切换至活动模板;和 基于活动模板和选择的不活动模板之一确定目标对象在输入巾贞中的位置。8.如权利要求7所述的装置,其中所述至少一个存储器和存储的计算机程序代码被进一步配置为,利用所述至少一个处理器,使得所述装置增加输入帧的一部分作为候选模板。9.如权利要求7或8中任一项所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为,利用所述至少一个处理器,使得所述装置通过使用活动模板或选择的不活动模板中提供更能指示与输入帧的一部分匹配的匹配分数的一个模板来确定位置,由此确定目标对象的位置。10.如权利要求7-9中任一项所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为,利用所述至少一个处理器,使得所述装置通过对输入帧的一部分进行修剪、旋转和大小调节,由此调节输入帧的一部分的参数。11.如权利要求7-10中任一项所述的装置,其中选择的不活动模板包括与最佳最佳匹配点的数目和模板关键点的总数的比相关计分的多个候选模板中的最高排名的不活动模板。12.如权利要求11所述的装置,其中所述至少一个存储器和存储的计算机程序代码被进一步配置为,利用所述至少一个处理器,使得所述装置对每个候选模板累积所述比。13.如权利要求...

【专利技术属性】
技术研发人员:范力欣
申请(专利权)人:诺基亚公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1