使用捕捉位置序列信息的图像分类制造技术

技术编号:5077534 阅读:271 留言:0更新日期:2012-04-11 18:40
公开了对一组时间相关图像的分类,其中,根据该组时间相关图像来识别捕捉位置序列。使共同与捕捉位置序列相关联的捕捉位置序列信息与预定捕捉位置序列特征的多个集合中的每个集合进行比较。每个集合与预定分类相关联。至少基于比较步骤的结果来识别与该组时间相关图像相关联的所标识的分类;以及把所识别出的分类存储在处理器可访问存储器系统中。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及人工智能和图像理解,具体而言,涉及时间相关图像集的分类。
技术介绍
消费者照片集是普遍的。从这些集中在语义上发掘有意义的信息已成为机器 学习和计算机视觉团体中积极研究的领域。存在关注于对象识别(诸如,检测某些类 型的对象,如脸、车辆、草、水、天空等)问题的大量工作。大多数此工作依靠使用 图像中可获得的低级视觉特征(诸如,颜色、纹理和线条)。近年来,越来越关注于从 语义上提取更复杂的信息,诸如,场景检测和活动识别。例如,现有系统已尝试通过 场景和对象的视觉分类来识别事件,参见例如L.-J丄i和L.Fei-Fei,"What, where and who classifying events by scene and object recognition” , Proc.IEEE Intl.Conf.on Computer Vision, 2007。该系统报告了在识别许多特殊体育事件(诸如,马球、划船以及博彩 (boche))方面的适度成功,这是由于可以从这些事件的图片中观测到的独特视觉特性。在所有以上提到的现有技术中,只使用基于图像的特征(例如,颜色和边缘 直方图、或者“视觉特征袋”)以及基于各图像来执行传统图像聚类和分类(参见 S.Lazebnikλ C.Schmid 以及 J.Ponce, “Beyond bags of features spatial pyramid matching for recognizing natural scene categories,,,Proc.IEEE Conf.on Computer Vision and Pattern Recognition,2006)。然而,由于属于同一事件的图像之间的时间和空间相关性,所以图像常常并非 是彼此独立的。更具体地,在个人图像集中,除了图像特征之外还存在丰富的上下文信 息,这种上下文信息通常是对图像特征的补充以用于语义理解的目的。因此,需要考虑图像之间关系的改进图像分类技术。
技术实现思路
通过根据本专利技术的各种实施例的用于便于一组时间相关图像分类的方法和系统 在本领域中获得了技术方案并且解决了上述问题。在本专利技术的实施例中,根据该组时间 相关图像来识别捕捉位置序列。使共同与捕捉位置序列相关联的捕捉位置序列信息与预 定捕捉位置序列特性的多个集合中的每个集合进行比较。每个集合与预定分类相关联。 至少基于来自比较步骤的结果来识别与该组时间相关图像相关联的所标识的分类;以及 把所识别出的分类存储在处理器可访问存储器系统中。本专利技术的优点包括使用具有相关联捕捉位置信息的个人图像集来识别事件。除了上述实施例以外,通过参照附图以及通过对以下详细描述的学习应当清楚 更多实施例。附图说明图1和图Ia是用于实施本专利技术实施例的流程图2是示出了在空间范围和移动速度方面不同事件的特性的表;图3和图4分别描绘了与城市观光事件和徒步旅行事件相关的空间和时间轨迹的 示例;图5描绘了用于计算用来组合来自多个提示方式的识别结果的可信度的流程和 示例混淆矩阵,以及根据本专利技术的实施例,图6示出了用于使用照片集和相关联的捕捉位置轨迹进 行事件识别的系统。具体实施例方式共同推断可以是用于对图像进行分类的有用工具。例如,可能难以分辨特定 图片是工作还是空闲,但是看着属于同一事件的其它图片,做出同样的预测会变得更容 易。在本专利技术的实施例中,在具有相关联捕捉位置信息的时间相关图像集的上下文中进 行图像分类。本文中所使用的用语“图像分类”是指把一组时间相关图像分类成行为的 预定集合中的一个行为的过程。进一步地,本文中所使用的用语“事件识别”和“行为 识别”是图像分类的示例。更进一步地,词语“图像”、“图片”以及“照片”在本 文中可互换使用。本专利技术包括本文中描述的实施例的组合。对“特定实施例”等的引用是指在本 专利技术至少一个实施例中出现的特征。对“实施例”或“特定实施例”等的单独引用并 非必定是指同一实施例或同样的实施例;然而,这些实施例并非是相互排他的,除非如 此表明或者对于本领域技术人员而言是显而易见的。在引用“方法”等时使用单数和/ 或复数并非是限制性的。另外,应当注意,除非上下文另行明确注明或需要,在本公开中以非排他性的 方式使用词语“或”。当把GPS (全球定位系统)传感器安装在数字摄像装置中时,可以针对每个捕捉 到的图像收集图像捕捉的时间、经度和纬度。另外,可以使用本领域中已知的技术针对 每个捕捉到的图像捕捉以下信息,低等级图像特征例如,颜色和边缘直方图;语义对 象和场景识别来自图像分类器(室内/室外检测器、海滩检测器等)和对象检测器的 输出(例如,面部);以及其它上下文信息大致在相同时间和相同地点拍摄的图像(例 如,同一事件或同一图像文件夹中的图像)。根据本专利技术的实施例,图6示出了用于事件识别的系统100。系统100包括数据 处理系统110、外围系统120、用户接口系统130以及处理器可访问存储器系统140。处 理器可访问存储器系统140、外围系统120以及用户接口系统130以通信方式连接到数据 处理系统110。数据处理系统110包括实施本专利技术各种实施例的过程(包括图1和图Ia的示例过 程)的一个或更多个数据处理设备。用语“数据处理设备”或“数据处理器”旨在包括 任何数据处理设备,诸如,中央处理单元(“CPU”)、桌上型计算机、膝上型计算机、 大型计算机、个人数字助理、黑莓(Blackberry )、数字摄像装置、手机、或者用于处理 数据、管理数据、或者操控数据的任何其它设备或其组件,无论是否用电、磁、光、生 物组件实施。5处理器可访问存储器系统140包括被配置成存储信息(包括执行本专利技术各种实施 例的过程(包括本文中描述的图1和图Ia的示例过程)所需要的信息)的一个或更多个 处理器可访问存储器。处理器可访问存储器系统140可以是分布式处理器可访问存储器 系统,包括经由多个计算机和/或设备以通信方式连接到数据处理系统110的多个处理器 可访问存储器。另一方面,处理器可访问存储器系统140无需是分布式处理器可访问存 储器系统,因此,可以包括位于单个数据处理器或设备内的一个或更多个处理器可访问 存储器。用语“处理器可访问存储器”旨在包括任何处理器可访问数据存储设备,无论 是易失性的还是非易失性的、电子的、磁的、光的或其它,包括但不限于寄存器、软 盘、硬盘、压缩光盘、DVD、闪存、ROM以及RAM。用语“以通信方式连接”旨在包括可以传送数据的程序、数据处理器、或者设 备之间的任何类型的连接,无论是有线的还是无线的。进一步地,用语“以通信方式连 接”旨在包括单个数据处理器内的程序或设备之间的连接、位于不同数据处理器中的程 序或设备之间的连接、以及根本不位于数据处理器中的设备之间的连接。在此方面,虽 然处理器可访问存储器系统140被示出为与数据处理系统110分开,但本领域技术人员 应当理解,可以把处理器可访问存储器系统140完全地或部分地存储在数据处理系统110 内。在此方面进一步地,虽然外围系统120和用户接口系统130被示出为与数据处理系统 110分开,但本领域技术人员应当理解,可以把这些系统中的一个系统或二者完全地或部 分地存储在数据处理系统110本文档来自技高网
...

【技术保护点】
一种至少部分地由数据处理系统实施的方法,所述方法用于便于一组时间相关图像的分类,所述方法包括以下步骤:  根据该组时间相关图像来识别捕捉位置序列;  使共同与所述捕捉位置序列相关联的捕捉位置序列信息与预定捕捉位置序列特征的多个集合中的每个集合进行比较,每个集合都与预定分类相关联;  至少基于所述比较步骤的结果来识别与该组时间相关图像相关联的所标识的分类;以及把所识别出的分类存储在处理器可访问存储器系统中。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:罗杰波袁俊松
申请(专利权)人:伊斯曼柯达公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1