增量图像聚类制造技术

技术编号:9904275 阅读:97 留言:0更新日期:2014-04-10 19:59
提供了用于增量图像聚类的方法、系统以及具有可执行指令的计算机可读媒体和/或逻辑。一种用于增量图像聚类的示例方法能够包括经由计算设备基于新的图像的特征与被评估LIC节点中的每一个的平均特征之间的相似性从图像聚类树(ICT)上的被评估叶图像聚类(LIC)节点之中标识许多候选节点。所述被评估节点包括沿着从根节点到叶节点或具有超过第一阈值的相似性的节点的每个路径的至少一个节点。能够经由所述计算设备从所述许多候选节点之中确定最相似节点。所述新的图像能够经由所述计算设备被插入到与所确定的最相似节点相关联的节点。

【技术实现步骤摘要】
【国外来华专利技术】增量图像聚类
技术介绍
随着渐增的互联网数据传输速度和WEB2.0的繁荣,互联网上的图像数据的量正日益增长。诸如Flickr、Picasa、You-tube等之类的基于图像的网站越来越流行,使基于在线内容的图像管理变得比以前更重要。因为新的图像数据被一直上传到互联网,所以如何高效地组织、索引并且检索期望的图像数据是持续的挑战。对图像数据进行分类可能是巨大的努力。随着图像数据的合集增加,高效地将新的图像数据与先前分类的图像数据相结合在一起而不引入太多复杂性和计算成本是重要的。避免必须再聚类现有图像数据在计算时间和努力方面可能是有益的。聚类被用来将大量的图像数据划分成许多子集,例如聚类(cluster),其中特定聚类中的图像数据在某些方面彼此相似。一般而言,聚类方法能够被分类成分割方法、层次方法、基于密度的方法、基于网格的方法以及基于模型的方法。例如,K-均值是分割方法,DBSCAN基于数据密度来划分数据,并且凝聚式层次聚类(HAC)构成整个数据集的层次结构,即树形图。能够在批处理模式或静态模式下运行这些方法,这在其中图像数据随着时间的推移在随机时刻被更新的动态环境中不是适当的。附图说明图1图示了根据本公开用于增量图像聚类的方法的流程图。图2图示了根据本公开用于增量聚类树构建的方法的流程图。图3图示了根据本公开的示例增量聚类树的框图。图4图示了根据本公开用来实现增量图像聚类系统的示例计算系统的框图。图5图示了根据本公开与处理资源通信的示例计算机可读介质(CRM)的框图。具体实施方式本公开的示例可以包括方法、系统以及具有可执行指令的计算机可读媒体和/或逻辑。根据本公开的一个或多个示例,新的图像在不用再聚类现有图像的情况下被增量式地聚类。本文中所描述的增量图像聚类方法使用层次匹配模型来以效率方面极少的损失使增量图像聚类变得更高效。所描述的示例针对用于基于图像中的检测到的面部的面部特征对面部进行聚类的方法。然而,本公开的示例不限于涉及仅面部聚类的应用,并且可以被应用于涉及能够在图像数据中被检测和标识的任何主题的聚类,所述任何主题诸如物品、地理、衣服、动物等。增量聚类(例如,在线聚类)针对动态环境被提出,在所述动态环境中新的数据被连续地添加到数据集。增量聚类的挑战是找到向其添加新的图像数据的最适当的聚类。此外,本文中所描述的方法对于图像数据的到达顺序而言可能是不变的。此外,期望本公开的增量图像聚类方法具有周期性地在聚类之中再分配数据以便增加聚类相干性的能力。出于所有这些原因,描述了利用增量图像聚类的层次匹配模型。在先前方法的单遍聚类方法中,整个数据集被扫描一次。当新的数据点到达时,该数据点的匹配分数被顺序地根据特定度量用现有聚类来计算。如果满足预定义条件,则新的数据点被添加到最好的匹配聚类;否则新的聚类被创建。计算匹配分数的一个度量简单地是数据点与聚类之间的相似性,其通过访问该聚类的每个成员或者通过访问该聚类的代表性点或引头(leader)点而被计算。被称作“引头-子引头”的先前方法的两级聚类方法是引头方法的扩展。用于聚类性能的另一度量可以是相似比的增量(delta)改变。聚类使用聚类相似性直方图来表示以便示出每个聚类内的相似性的分布。得自相似性直方图的相似比能够被用来表示聚类相干性。如果新的点在一定程度上增加聚类的相似比或者不减少它,则它被添加到该聚类。另一先前方法的K最近邻聚类(KNN)方法计算具有新的数据点的数据库中的前K个相似数据点,并且将新的点添加到保持大多数K个点的聚类。该方法的时间复杂性与数据集的大小成比例。相对于聚类特征树(ClusterFeatureTree),聚类使用单个特征来表示。聚类特征树是将所有聚类的描述存储在树结构中的孩子节点有限树方法的变体,其被用来通过将新的点与树的仅一部分进行比较来降低相似性计算的成本。本公开的ICTree聚类方法(一种层次匹配模型)在图像特征背景下工作,并且相对于诸如常规聚类特征树之类的先前的图像聚类方法包括一些显著改变。图1图示了根据本公开用于增量图像聚类的方法的流程图100。新的图像能够被接收,如在102处所示。能够对新的图像执行图像分量检测104(例如,面部)。在图像分量的检测之后,能够执行特征提取106并且能够确定原始特征向量108。特征能够被减少(reduced),例如,如在110处所示出的那样以得出减少的特征向量112。基于经减少的特征向量112,增量聚类树构建能够发生,如在图1中在114处所示。能够做出关于更多新的图像是否正悬而未决的确定,如在116处所示。如果新的图像是可用的,则用于增量图像聚类方法的过程流100能够返回以对于新的图像102重复上面描述的过程。如果新的图像不是可用的,则这种空闲时间能够被用来再聚类(一个或多个)单例叶图像聚类节点118,从而将图像再分配给最近叶图像聚类120。图2图示了根据本公开用于增量聚类树构建的方法的流程图。根据本公开的各种示例,图2中所示出的示例方法能够对应于图1中所示出的增量聚类树构建114。用于增量图像聚类的示例方法的增量聚类树构建部分能够包括经由计算设备基于新图像的特征与被评估LIC节点中的每一个的平均特征之间的相似性从图像聚类树(ICT)上的被评估叶图像聚类(LIC)节点之中标识许多候选节点。被评估节点包括沿着从根节点到叶节点或具有超过第一阈值的相似性的节点的每个路径的一个或多个节点。能够经由计算设备从所述许多候选节点之中确定最相似节点。新的图像能够经由计算设备被插入到与所确定的最相似节点相关联的节点。在下面相对于图3提供了上面描述的方法的更具体示例。根据本公开各种图像特征能够被用来捕获图像的视觉特性。能够在基于内容的图像检索中使用通用特征,例如色彩、纹理、形状等。能够在许多应用中利用诸如面部特征之类的其他域特定的特征。如上面所提到的那样,本公开的增量图像聚类方法使用涉及面部特征的示例被举例说明。根据各种示例,面部聚类能够利用,例如,针对面部验证特征的伽伯(Gabor)特征和LBP判别式分析能够被用来描述单面部的特性。一旦从图像中检测到的面部提取了这些特征,则它们就能够被链接以形成一个单特征向量。然后能够应用主分量分析(PCA)以得到维度降低。以这种方式单面部能够被表示为Ii=<IDi,Vi>,其中IDi是面部标识符,并且Vi是该面部的特征向量。不同的度量比较模型能够被用来测量两个特征向量之间的差。例如,在数据聚类中欧几里德(Euclidean)和曼哈顿(Manhattan)距离是两个常用的特征向量相似性量度。根据一个或多个示例,欧几里德量度和归一化相关度量被用来计算两个特征向量之间的相似性。两个面部特征向量之间的最后匹配分数可以是欧几里德距离和归一化相关分数的加权和。还能够使用其他方法。图像聚类(IC)被定义为包含聚类的以下信息的三维元组:(1)在该聚类中包含的图像的数目,(2)该聚类的和特征向量,(3)聚类中图像的标识符的集合。因此,图像聚类的一个定义如下:考虑到图像聚类中的N个图像{I1,I2,…,IN|Ii=<IDi,Vi>},图像聚类IC=<N,VN,IDN>,其中N是图像的数目,VN是各个图像特征向量的和特征,即,,并且IDN是图像标识符的集本文档来自技高网...
增量图像聚类

【技术保护点】
一种用于增量图像聚类的方法,包括:经由计算设备基于新的图像的特征与被评估LIC节点中的每一个的平均特征之间的相似性从图像聚类树(ICT)上的被评估叶图像聚类(LIC)节点之中标识许多候选节点;经由所述计算设备从所述许多候选节点之中确定最相似节点;以及经由所述计算设备将所述新的图像插入到与所确定的最相似节点相关联的节点,其中,所述被评估节点包括沿着从根节点到叶节点或具有超过第一阈值的相似性的节点的每个路径的至少一个节点。

【技术特征摘要】
【国外来华专利技术】1.一种用于增量图像聚类的方法,包括:经由计算设备基于新的图像的特征与被评估LIC节点中的每一个的平均特征之间的相似性从图像聚类树ICT上的被评估叶图像聚类LIC节点之中标识许多候选节点;经由所述计算设备从所述许多候选节点之中确定最相似节点;以及经由所述计算设备将所述新的图像插入到与所确定的最相似节点相关联的节点,其中,所述被评估节点包括沿着从根节点到叶节点或具有超过第一阈值的相似性的节点的每个路径的至少一个节点。2.根据权利要求1所述的方法,进一步包括:当没有候选节点被标识时,启动包含所述新的图像作为所述根节点的同胞的新的叶节点;以及启动具有作为所述根节点和所述新的叶节点的孩子节点的新的叶节点。3.根据权利要求1所述的方法,进一步包括当结果得到的孩子节点超过最大分支阈值时在插入所述新的图像之后拆分所述确定的最相似节点。4.根据权利要求1所述的方法,其中经由所述计算设备将所述新的图像插入到与所述确定的最相似节点相关联的节点包括:当所述最相似节点是叶节点并且所述新的图像的所述特征与所述最相似节点的所述平均特征之间的所述相似性超过第二阈值时,将所述新的图像的特征添加到所述最相似节点;当所述最相似节点是叶节点并且所述新的图像的所述特征与所述最相似节点的所述平均特征之间的所述相似性不超过所述第二阈值时,将所述新的图像的所述特征添加到作为所述最相似节点的同胞节点插入的新的叶节点;以及当所述最相似节点不是叶节点时,将所述新的图像的所述特征添加到作为孩子节点插入到所述最相似节点的新的叶节点。5.根据权利要求1所述的方法,进一步包括沿着从根节点到所述最相似节点的路径来更新所述ICT上的至少一个节点以在所述新的图像被添加之后包括所述新的图像的所述特征和许多孩子节点。6.根据权利要求1所述的方法,进一步包括周...

【专利技术属性】
技术研发人员:K刘X孙T张L王M王
申请(专利权)人:惠普发展公司有限责任合伙企业
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1