基于聚类的在线式多人脸图像处理的方法技术

技术编号:12308398 阅读:169 留言:0更新日期:2015-11-11 17:31
本发明专利技术公开了一种基于聚类的在线式多人脸图像处理的方法。在云端人脸识别系统上,需要执行某些策略来提高系统的处理效率,人脸选择就是其中的一种。本发明专利技术提出的算法使用了基于人脸间距离来调整权值以进行人脸聚类的方式,其首先构造了一个不断循环的过程,针对外界传进来的每一个人脸,我们都根据其到当前各聚类中心的距离对其进行归类,然后进行类内调整,重新计算聚类中心。当算法内人脸总数或等待时间到达各自的阈值时把聚类结果进行输出,其聚类中心就是选择出来的人脸。在ORL人脸库上的一个实验证实了本发明专利技术的正确性和实用性。

【技术实现步骤摘要】

本专利技术涉及人脸识别方法,特别涉及一种基于聚类的在线式多人脸图像处理的方 法(G06T5/50的
技术实现思路
与其类似)。
技术介绍
随着信息化程度的加深和社会公共安全意识的提高,传统的人脸识别系统(下简 称传统系统)也在不断地扩大其部署的规模;而具备高并发识别、大人脸库匹配能力的云 端人脸识别系统(下简称云端系统)就是其中的一种发展方向。与传统系统相比,云端环境 对系统的匹配实时性、正确性和运行效率提出了更高的要求,特别是在一些门禁监控场景 中。在当前各类云端系统的研究中,都主要把目光投注到云端服务器匹配效率的提高上: 根据时下流行的分布式处理概念,张俨等人提出了一种云计算环境下的人脸识别 系统。他们把基于PCA的传统人脸识别算法与Hadoop框架相结合,满足了用户对海量人脸 图像识别的计算速率需求;同时还改进了经典的KNN分类算法,提高了识别的精度和稳定 性(张俨.一种云计算环境下人脸识别系统的设计与实现.西安电子科技大学,2013)。 同时,盛会鹏等人也在研究该如何提升人脸数据库的匹配效率。他们对K-均值 算法进行了修改,并在此基础上设计了一个基于聚类的大规模人脸库快速检索系统。他们 借鉴和提高了前人使用聚类来构建人脸层次特征索引结构的方法,在降低一次检索所用时 间的同时,还保证了正确性(盛会鹏.大规模人像数据库快速检索算法的研究.吉林大 学,2006)。 不过,哪怕云端服务器的匹配效率已经得到很好的提高,但这也只是治标不治本, 客户端上传数据量过多仍是一个亟待解决的问题。有一种办法是在客户端上进行图片预处 理,把人脸截取出来上传匹配,这样就降低了网络的负载和减轻了服务器的压力。当前在 类似的研究中,蓝章礼等人成功地把他们的复杂背景下视频序列中的人脸定位算法引入到 了一个人脸门禁系统中(蓝章礼,曹建秋,梁爽.复杂背景下视频序列中的人脸定位算法 ·计算机科学,2008, 06:255-257+279)。 其实客户端产生的人脸是带有很大冗余的,在一段时间内产生的人脸其实可能来 自同一人群。假如对人脸进行选择,进行更进一步地过滤,那么系统的匹配效率还能再次提 升。传统的方法主要有: 1、选择质量高(清晰,姿势标准)的人脸 2、摄像头延时截取 第一种方法可以快速地选择出匹配效果好的人脸,但是也可能因无法区分出不同 人的人脸而产生漏人;而第二种方法则比较硬性,但是同样很容易出现漏人,延时小时达不 到降低人脸上传量的目的,延时大时还会影响到匹配实时性。 其实这个问题可以描述成这样的一个过程:从一个人脸集合中,选择出一个尽可 能小子集,且该子集能够尽可能好地代表原本的人脸集合。 通过研究发现,如果把人脸集合交给K-Means聚类算法进行聚类,再把聚类结果 中聚类中心对应的人脸选择出来的话,那么在理想的情况下,选择出来人脸的集合就是想 要得到的子集。但是在实际使用中,K-Means聚类算法在人脸集合上却又遇到了以下几个 困难:(1)只能且必须把结果分成K个类;(2)极易受到初始点选取和离散点的影响;(3) K-Means算法的计算是离线式的,其聚类的执行要预先一次性给清整个数据样本集合;(4) 计算量随着数据点规模的增大而急速增大。
技术实现思路
本专利技术的目的在于提出一种人脸选择办法,它能够从一个人脸集合中选择出一个 尽可能小的它的子集,并且保证该子集能够尽可能好地代表原本的人脸集合: (1)选取出来的子集与全集的覆盖人数一样。 (2)选取出来的人脸在其所原从属的类上具有最大的代表性。 (3)特殊的人脸会被专门选择出来。 特别地,在不断增加新人脸的人脸集合中,还要保证: (1)处理的方式是在线式的。 (2)处理的效率能达到实时。 其中包含了几个定义: ?人脸的代表性:在一个人脸集合S中,人脸a的代表性等吁 ?人脸集合的覆盖人数:假如某人脸集合的人脸共采集自η个人,那么该人脸集合 的覆盖人数为η。 ?特殊人脸:在一个人脸集合S中,从人的角度上看,特殊人脸与其他人脸 都不相似;从算法的角度上看,特殊人脸X到其他人脸的距离都大于某固定阈值: min {Dist (X,y),y e S} > μ。 实现本专利技术目的的技术解决方案为:一种基于聚类的在线式多人脸图像处理的方 法,其过程如下: 1.设定初始块大小Β,距离阈值μ,时间间隔Τ,初始化类集合S为空,将S中元素 的个数η、当前已有人脸数m都置为零,用Dist (a,b)表示人脸数据样本a和人脸数据样本 b之间的距离;任取一个类s且s e S,令s. size表示类s中的人脸个数,并用51表示类集 合S中的第i个类;任意的已有人脸数据样本都属于且只属于一个类s,用数据样本S 1表示 类s中的第i个数据样本,且同时存在W1表示s i在类s中的权值; 2.等待一个新来人脸数据样本X的传入,若等待时间超过时间间隔T则把S当做 聚类结果输出,然后清空类集合S并令η = 0, m = 0后继续等待; 3.令m+= 1,计算新来人脸数据样本X与现有的S中各个类的聚类中心的距离, 找出距离最小的类S1,然后根据I和Dist (X,(S1). center)对X进行归类; 4、对X所从属的类进行更新:更新权值,并据此更新聚类中心。 5、判断:如果m < B,那么返回第二步继续等待;如果m彡B,那么把S当做聚类结 果输出,之后再重新初始化S为空,置η = 0, m = 0,然后返回第二步继续等待。 本专利技术与现有技术相比,其显著优点为: (1)提供在线式处理过程。 (2)不对分类数进行限制,不需要考虑初始点的选择。 (3)在阈值合理的情况下,离散点不会干扰到最后的结果。 (4)每一次输出中,聚类中心一定是具有最大代表性的人脸。【附图说明】 图1是本专利技术基于聚类的在线式多人脸图像处理方法的流程图。 图2是用于进行实例说明的简单人脸数据样本集展示图 图3是简单人脸数据样本集经过本方法计算后,获取到的输出人脸集合展示图。【具体实施方式】 本专利技术,该方法包含如下步骤: 1、初始化。设定初始块大小B,距离阈值μ,时间间隔T。初始化类集合S和变量。 2、等待一个新来人脸数据样本(下简称人脸)χ的传入。如果等待时间大于T则 把当前的聚类结果输出,然后初始化类集合S,继续等待新来人脸的传入。 3、计算新来人脸与现有的各个类的聚类中心的距离,找出距离最小的类Sp a)最小的距离小于等于μ,那么则把新来的人脸加入到Sp b)最小的距离大于μ,那么则令新来的人脸自成一类S_。 4、新来的人脸加入到某个类中后,我们要更新该类的聚类中心。 a)首先,计算类中各个人脸(包括新来的人脸)到其他人脸的距离和。 b)找到距离和最小的人脸,令其为聚类中心。 5、判断当前算法模块中已有的人脸数。 a)人脸数小于B,那么返回步骤2。 b)人脸数大于或等于B,那么把当前的聚类结果输出,再初始化类集合S,然后返 回步骤2。 本专利技术使用了自建的聚类框架,其中,类集合S中的元素为类,而类中的元素则为 人脸数据样本。每个类中还有一个唯一的聚类中心,它指代类中到其他人脸距离和最小的 人脸。算法的执行是不断循环的,在初始化之后,对外提供添加人脸的接口。在接受到新来 的人脸之后,根据其到类集合中现有的各个聚本文档来自技高网
...

【技术保护点】
一种基于聚类的在线式多人脸图像处理的方法,其特征在于人脸聚类的过程如下:1).设定初始块大小B,距离阈值μ,时间间隔T,初始化类集合S为空,将S中元素的个数n、当前已有人脸数m都置为零,用Dist(a,b)表示人脸数据样本a和人脸数据样本b之间的距离;任取一个类s且s∈S,令s.size表示类s中的人脸个数,并用Si表示类集合S中的第i个类;任意的已有人脸数据样本都属于且只属于一个类s,用数据样本si表示类s中的第i个数据样本,且同时存在wi表示si在类s中的权值;2).等待一个新来人脸数据样本x的传入,若等待时间超过时间间隔T则把S当做聚类结果输出,然后清空类集合S并令n=0,m=0后继续等待;3).令m+=1,计算新来人脸数据样本x与现有的S中各个类的聚类中心的距离,找出距离最小的类SI,然后根据I和Dist(x,(SI).center)对x进行归类;4)、对x所从属的类进行更新:更新权值,并据此更新聚类中心。5)、判断:如果m<B,那么返回第二步继续等待;如果m≥B,那么把S当做聚类结果输出,之后再重新初始化S为空,置n=0,m=0,然后返回第二步继续等待。

【技术特征摘要】

【专利技术属性】
技术研发人员:李千目黄达毅唐振民
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1