用于处理图像中包含的面部的方法和设备技术

技术编号:7682586 阅读:178 留言:0更新日期:2012-08-16 05:56
本发明专利技术的实施方式涉及用于处理图像中包含的面部的方法和设备。具体公开了一种用于处理图像中包含的面部的方法,该方法包括:针对社交网络的至少一个相册中的每一个,检测所述相册的图像中所包含的面部;对检测到的面部进行汇聚,以生成至少一个面部数据集;以及从所述至少一个面部数据集中选择面部数据集与所述相册的所有者相关联。该方法还包括:基于与所述至少一个相册的所有者相关联的面部数据集,通过学习来建立用于面部识别的面部分类器。本发明专利技术的实施方式还公开了相应的设备。本发明专利技术的实施方式有效地降低了海量图像面部识别的成本,提高了效率。

【技术实现步骤摘要】

本专利技术的实施方式总体上涉及信息
,更具体地,涉及用于处理图像中包含的面部的方法和设备
技术介绍
随着图像捕获技术和工具的不断发展,每天都有大量的信息以图像的形式产生。在这些图像中,很多图像包含有身份信息和/或社交信息。从这些图像中提取面部信息并确定对应的身份信息是一类重要的应用,它在诸如社交、国家安全、司法、金融以及人机交互等诸多领域具有重要价值。合理的分析和利用图像中对象的身份信息,能够为用户提供更好的服务和体验。 总体上,可以通过人工和自动这两类方式从图像中提取面部信息并确定对应的身份信息。在人工方式中,用户可以交互式地在给定图像中选择面部和/或指示面部所对应的身份信息。例如,在目前比较常见的社交网络站点中,对于用户上传至例如“相册”的图像,系统通常允许用户例如通过鼠标选择图像中的面部,并且输入该面部所对应的身份信息,例如姓名、年龄以及其他有关信息(“社交网络”和“相册”的定义将在下文描述中给出)。可以理解,这种人工方式将会给用户造成明显的交互负担,并且无法有效处理大量甚至是海量的图像信息。与此相对,在自动方式中,使用例如面部检测、识别和分类等生物特征识别技术来处理图像,从而自动地提取图像中包含的面部并确定对应的身份信息。生物特征识别技术目前已经取得了一定的进展和成果,并且在某些领域得到实践应用。但是,为了能够确定图像中包含的面部所对应的身份,需要事先在训练过程中建立称为分类器(classifier)的识别模型。如本领域中已知的,分类器是一种通过训练和学习而获得的模型,其适用于解决这样的问题在已知至少一个样本类别以及每个类别的样本特性的情况下,对待测样本进行分类判别,即识别它属于哪一类。特别地,对于面部识别而言,为了判别特定的面部所对应的身份,需要确定该面部与已知的哪个面部最为接近或匹配。这就必须创建用于面部识别的分类器。为此,对于每个面部,需要提供包含该面部的多个图像作为训练数据,以建立用于学习的训练集。在现有技术中,这种训练数据通常采用人工方式采集的。具体而言,用户需要收集包含特定面部的图像作为训练图像,而后对每个训练图像进行人工标定,以用于分类器的创建(建模)和识别。显然,人工采集训练数据需要耗费大量的时间和人力成本。特别是当需要识别的面部数量众多时,这种人工方式将是耗时的甚至是不可行的。
技术实现思路
为了克服现有技术中的上述缺陷,本专利技术的实施方式提供用于处理图像中包含的面部的方法和设备。在本专利技术的一个方面,提供一种用于处理图像中包含的面部的方法。该方法包括针对社交网络的至少一个相册中的每一个检测所述相册的图像中所包含的面部;对检测到的面部进行汇聚,以生成至少一个面部数据集;从所述至少一个面部数据集中选择面部数据集与所述相册的所有者相关联。该方法进一步包括基于与所述至少一个相册的所有者相关联的面部数据集,通过学习来建立用于面部识别的面部分类器。根据本专利技术的某些可选实施方式,所述检测包括估算面部在所述图像中的位置和大小;基于估算的所述位置和大小来检测所述图像中包含的面部。根据本专利技术的某些可选实施方式,所述检测方法进一步包括对检测到的面部应用过滤以提高检测精度。根据本专利技术的某些可选实施方式,其中所述汇聚包括对检测到的面部进行正则化;提取经过正则化的面部的特征;基于所提取的特征对检测到的面部进行聚类。根据本专利技术的某些可选实施方式,其中所述选择包括选择所对应的面部数目最多的面部数据集与所述相册的所有者相关联。根据本专利技术的某些可选实施方式,其中所述面部分类器基于统计模型。根据本专利技术的某些可选实施方式,该方法进一步包括利用建立的所述面部分类器,识别输入图像中包含的面部。在本专利技术的另一方面,提供一种用于处理图像中包含的面部的设备,包括相册处理装置,配置用于处理社交网络中的至少一个相册中的每一个,所述相册处理装置包括检测装置,配置用于检测所述相册的图像中所包含的面部;汇聚装置,配置用于对检测到的面部进行汇聚,以生成至少一个面部数据集;以及选择装置,配置用于从所述至少一个面部数据集中选择面部数据集与所述相册的所有者相关联。该设备进一步包括分类器建立装置,配置用于基于与所述至少一个相册的所有者相关联的面部数据集,通过学习来建立用于面部识别的面部分类器。根据本专利技术的各种实施方式,社交网络的相册中的图像被用于建立相册所有者的面部训练集。这是因为,对社交网络的统计学分析表明在社交网络的相册中,图像中所包含的面部大部分是该相册的所有者的面部。利用社交网络的这一特性,通过将相册中在数量上或出现频率上占主导地位的面部与该相册的所有者相关联,可以有效地采集该所有者的面部信息。这些面部信息随即可以被用作该用户的训练图像。以此方式,通过处理社交网络的海量相册,可以自动、快速、准确地获取大量面部的训练数据,并由此建立用于海量图像面部识别的分类器。因此,根据本专利技术的实施方式,可以有效地克服现有技术中为了实现海量图像面部识别而需要人工处理训练数据的缺陷,解决海量图像面部识别中获取训练集合的成本和效率问题,从而实现更高的效率和更好的扩展性。利用根据本专利技术实施方式获得的面部分类器,可以有效地识别给定图像中包含的面部,以用于各种目的。附图说明 通过参考附图阅读下文的详细描述,本专利技术实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中图I示出了根据本专利技术示例性实施方式的用于处理图像中包含的面部的方法100的流 程图;图2示出了根据本专利技术示例性实施方式的用于在图像中检测面部的方法200的流程图;图3示出了根据本专利技术示例性实施方式的用于处理图像中包含的面部的设备300的框图;以及图4示出了适合用来实践本专利技术实施方式的计算机系统400的框图。在附图中,相同或对应的标号表不相同或对应的部分。具体实施例方式下面将参考若干示例性实施方式来描述本专利技术的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本专利技术,而并非以任何方式限制本专利技术的范围。如上文所述,统计学分析表明在社交网络的相册中,图像中所包含的面部绝大部分是该相册所有者的面部。换言之,与其他人相比,相册所有者的面部在相册的图像中出现的频率和次数占据主导地位。基于这一事实,根据本专利技术的实施方式,相册中在数量上或者说出现频率上占主导地位的面部被认为是相册所有者的面部并由此与之关联。这样,可以有效地采集该用户的面部训练数据。通过对社交网络中存在的多个相册执行这种处理,可以获得多组训练数据。利用这些训练数据,便可以通过学习来建立用于海量图像面部识别的分类器。注意,在此使用的术语“社交网站”或“社交网络”是指向对特定对象感兴趣或只是一起“闲逛”的人们提供虚拟社区的Web站点。成员通过语音、聊天、即时消息、视频会议和博客等进行通信,并且该服务通常向成员提供了联系其他成员的好友的方法。特别地,很多社交网络都以现实世界的实际生活中的社交为基础。换言之,尽管社交网络成员的关系和数据是虚拟化的,但是这些关系和数据之间的联系往往基于和反映现实生活中确实存在的社交关系。例如,社交网络中的“好友”在很多情况下都是真实世界中的朋友、同事、同学这样的关系。已知的是,此类社交网络通常在注册成员时要求进行实名本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:刘汀邵军辉
申请(专利权)人:北京千橡网景科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1