描述了基于人脸的图像聚类系统和方法。一方面,在图像(20)中检测人脸区域(58)。至少一个相应的参数值(53)从每个人脸区域(58)中提取。人脸区域(58)中与满足聚类种子判定的参数值(53)关联的那些被归类为聚类种子人脸区域(38)。聚类种子人脸区域(38)被聚类为一个或更多个聚类(44,48)。为每个聚类(44,48)建立各自的人脸模型(24)。人脸模型(24)被存储。另一方面,在图像(20)中检测人脸区域(58)。至少一个相应的参数值(53)从每个人脸区域(58)提取。基于提取的参数值(53)来对人脸区域(58)分级。按分级顺序将各人脸区域(58)聚类为一个或更多个聚类(44,48)。聚类(44,48)的表示在显示器(116)上呈现。
【技术实现步骤摘要】
【国外来华专利技术】基于人脸的图像聚类
技术介绍
随着个人和组织持续快速积累图像内容的大的收藏,他们将日益要 求用于组织和浏览其收藏中的图像内容的系统和方法。许多系统允许用 户通过图像和其它数字内容与特定事件或主题的联系来对其进行手动 分类,并基于这些分类来划分数字内容。但是,手动分类系统通常耗时 且难用,尤其是随着数字内容收藏规模的变大。 一些系统被配置为基于 颜色、形状或紋理特征来自动划分数字内容,如图像。但是,由于与基 于颜色、形状或紋理的分类关联的固有不准确性,这些自动划分系统通 常易于对数字内容进行错误分类。在 一 些基于内容的图像检索方法中,低级的视觉特征被用来将图像 分组为有意义的分类,该分类反过来被用来产生用于包含图像的数据库 的索引。根据这些方法,用诸如颜色、紋理、形状和布局等低级特征来 表现图像。查询图像的特征可用来检索数据库中具有类似特征的图像。 总的来说,当被用来分类和索引图像的特征更精确地捕捉到图像内容的 目标方面时,图像自动分类和索引的结果会改善。最近,在检测和归类人类主题的方面(例如,脸部和眼睛)做出了 努力。例如,在一种方法中,数字图像中的人脸被组织为聚类。根据该 方法, 一人脸图像被用来形成第一个聚类。基于对未分配的人脸图像和 任何现有聚类中的每个脸部图像的比较,人脸识别器产生相似性评分。 如果未分配的人脸图像的相似性评分高于阈值,该未分配的人脸图像被 添加到对应于最高相似性评分的聚类中。如果未分配的人脸图像的相似 性评分低于阈值,该未分配的人脸图像被用于形成一个新的聚类。对于 每个未分配的人脸图像重复该处理。对于每个聚类,包含在聚类中的所 有人脸图像被显示在聚类查看屏幕中。如果人脸图像不属于一个特定的 聚类,用户可以将其从该聚类中删除或重新分配给另外一个聚类。如果 两个聚类的人脸所属相同,用户可以合并这两个聚类。在半自动人脸聚类方法中,人脸检测器用于从相片中自动提取人 脸。人脸识别器被用来通过人脸与选定模型的相似性来排序人脸。在该5过程中,当一个或多个人脸与某个人相关时,建立表示这些人脸的模型, 并显示以与该模型的相似性的顺序排序的未标识的人脸。用户可以用拖 放交互技术来选择一些人脸并将其分配给正确的人。模型被更新以合并 新识别的人脸,且未标识的人脸根据其与新模型的相似性来排序。被排 序的人脸在用户界面中呈现为候选者,该用户界面允许用户标识脸部。使用现有的基于人脸的图像聚类方法构建的人脸模型典型地不准 确地表现它们代表的人的脸部。结果,分级为与特定的人脸模型最接近 的人脸通常不对应于模型所表示的人。特别地,如果一个图像被错误地 包含到 一个聚类中,则与该图像相似的其它图像也会被包括到该聚类 中。这样,每个误报可能会扩散而产生更多的误报。需要基于人脸的图 像聚类系统和方法,其能够建立更准确和更鲁棒的人脸模型。
技术实现思路
在本专利技术的一个方面中,在图像中冲企测人脸区域。从每个人脸区域 提取至少 一 个相应的参数值。人脸区域中与满足聚类种子判定的参数值 关联的那些被归类为聚类种子人脸区域。聚类种子人脸区域被聚类为一 个或更多个聚类。为每个聚类建立各自的人脸模型。人脸模型被存储。在本专利技术的另一个方面中,在图像中检测人脸区域。从每个人脸区 域提取至少 一个相应的参数值。基于提取的参数值来对人脸区域分级。 以分级顺序将人脸区域聚类为一个或更多个聚类。在显示器上呈现聚类本专利技术的其它特征和优势将从包括附图和权利要求书在内的下列 描述而变得明显。附图说明图1是图像处理系统的实施例的框图。图2是图像处理方法的实施例的流程图。图3是示出在执行图2的图像处理方法期间生成的信息的示意图。 图4是示例性输入图像的图解视图,在该图像上叠加了划分人脸区 域的实施例的边界。图5是聚类方法的实施例的流程图。图6是人脸区域特征空间的实施例的示意图,该特征空间被分为由沿接近度度量维度的距离所定义的各区域。图7是从人脸区域提取特征的过程的实施例的图解视图。 图8是图像处理系统的实施例的框图。图9是图像处理方法的实施例的流程图。图10是呈现图形用户界面的实施例的显示器的图解视图,该用户界面用于用户对人脸聚类的查看和修改。图11是呈现图形用户界面的实施例的显示器的图解视图,该用户 界面用于用户对人脸聚类的查看和修改。具体实施例方式在下面的描述中,类似的附图标记被用来表示类似的元件。此外, 附图旨在以图解的方式来说明示例性实施例的主要特征。附图并不旨在 描述实际实施例的每个特征或描述的元件的相对尺寸,并且不是按比率 绘制的。I. 引言这里具体描述的实施例基于在图像中检测到的人脸区域来聚类图 像。这些实施例影响建立聚类的人脸模型的方法,这些方法被期望提供 更准确和更鲁棒的聚类结果。在这些实施例的一些中,聚类以聚类种子 人脸区域来开始,聚类种子人脸区域被选择来为建立人脸聚类提供更准 确和鲁棒的基础。此外, 一些实施例根据一个或更多个参数来对人脸区 域分级,这些参数被期望强调可能包含人脸部的更多准确表示的人脸区 域。在这些实施例中,人脸区域以从最高级别到最低级别的顺序来聚类, 以获得改善的聚类结果。在一些实施例中,用户反馈被用来进一步改善 聚类结果的聚类准确性。II. 第一图像处理系统及其组件的示例性实施例A.图像处理系统的总览图1示出了图像处理系统IO的实施例,包括人脸检测处理组件12、 参数提取处理组件14、聚类处理组件16以及模型处理组件18。在操作中,图像处理系统10处理输入图像20集合以生成聚类规范 22和聚类人脸模型24,在数据库26中与输入图像20关联地存储。每 个输入图像20可以对应于任何类型的图像,包括图像传感器(例如数 字摄像机、数字静态图像照相机或光学扫描仪)捕获的原始图像(例如7视频的关键帧、静态图像或扫描的图像),或这样的原始图像经过处理 (例如,子抽样、裁剪、旋转、滤光、格式重定、增强或其它修改)后的版本。每个聚类规范22对应于在关联的输入图像20中检测到的不同 的相应人脸。在一些实施例中,每个聚类规范22包括对输入图像20中 包含作为构成部分的人脸的相关联的那些的位置的描述(例如,统一资 源定位符(URL)),以及作为构成部分的人脸在这些输入图像的每个 内的位置(例如,包含人脸区域的限定框的坐标)。在一些实施例中, 图像处理系统1 0在链接到输入图像2 0中关联的那些的相应的数据结构(例如表格或列表)中存储聚类规范。在一些实施例中,每个输入图像 20对于在该输入图像20中检测到的每个人脸,关联相应的聚类规范22。 这样,在这些实施例中,包括多个检测到的人脸的输入图像20与多个 聚类规范22关联。图2示出了由图像处理系统10的实施例实现的方法的实施例,并 且图3示出了在执行该方法的说明性实施期间生成的信息。根据该方法,人脸检测处理组件12在输入图像20中检测人脸区域(图2,块28)。每个人脸区域包含人脸部的至少一部分。这样,如图 3所示,图像20被分为包含至少一个人脸的图像的集合30,和不包含 任何检测到的人脸的图像的集合32。参数提取处理组件14从每个人脸 区域中提取至少一个相应的参数值34 (图2,块36)。聚类处理组件 16将人脸区域中与满足聚类种子判定的参数值关联的那些归类为聚类 种子人脸区域38本文档来自技高网...
【技术保护点】
一种方法,包括: 在图像(20)中检测人脸区域(58); 从每个人脸区域(58)提取至少一个相应的参数值(53); 将人脸区域(58)中与满足聚类种子判定的参数值(53)关联的那些归类为聚类种子人脸区域(38); 将 各聚类种子人脸区域(38)聚类为一个或更多个聚类(44,48); 为每个聚类(44,48)建立各自的人脸模型(24);以及 存储人脸模型(24)。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:T张,
申请(专利权)人:惠普开发有限公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。