基于聚类的在线式多人脸图像处理的方法技术

技术编号:13625171 阅读:73 留言:0更新日期:2016-09-01 18:36
本发明专利技术公开了一种基于聚类的在线式多人脸图像处理的方法,通过设置距离阈值来调整权值进行聚类,首先构造了一个不断循环的过程,针对外界传进来的每一个人脸,根据其到各聚类中心的距离对其进行归类,然后进行类内调整。并在人脸总数到达阈值时把聚类结果进行输出,且其中聚类中心就是我们选择出来的人脸。本发明专利技术的方法可以很好地满足在线式多人脸图像处理的需求,并且通过实验证实,在实时性和正确性等方面达到了要求。

【技术实现步骤摘要】

本专利技术涉及多人脸图像处理的方法,尤其涉及一种基于聚类的在线式多人脸图像处理的方法
技术介绍
随着信息化程度的加深和社会公共安全意识的提高,传统的人脸识别系统(下简称传统系统)也在不断地扩大其部署的规模;而具备高并发识别、大人脸库匹配能力的云端人脸识别系统(下简称云端系统)就是其中的一种发展方向。与传统系统不同,云端环境下系统对网络的负载力、匹配的实时性提出了更高的要求,特别是在一些门禁场景、公众场景中。在这些场景中,客户端摄像头捕捉到的每一帧内都可能包含多个人脸,并且在很长的一段时间内都会维持非常高的人脸产生率。假如一个摄像头一秒截取10帧,每帧包含5个人脸,而其中一个人脸的数据大小是4KB。那么该摄像头一秒内就会产生大小为200KB的人脸数据。如果这些人脸我们都要通过网络上传到云端系统进行匹配,不仅会对网络造成巨大的负担,同时也会大大地消耗云端系统的计算资源。当前的各类云端系统的研究中,都主要把目光投注到数据库匹配效率的提高上。根据时下流行的分布式处理概念,张俨等人提出了一种云计算环境下的人脸识别系统。他们把基于PCA的传统人脸识别算法与Hadoop框架相结合,满足了用户对海量人脸图像识别的计算速率需求;同时还改进了经典的KNN分类算法,提高了识别的精度和稳定性(张俨.一种云计算环境下人脸识别系统的设计与实现[D].西安电子科技大学,2013)。同时,盛会鹏等人也在研究该如何提升人脸数据库的匹配效率。他们对K-均值算法进行了修改,并在此基础上设计了一个基于聚类的大规模人脸库快速检索系统。他们借鉴和提高了前人使用聚类来构建人脸层次特征索引结构的方法,在降低一次检索所用时间的同时,还保证了正确性(盛会鹏.大规模人像数据库快速检索算法的研究[D].吉林大学,2006)。不过,哪怕数据库匹配效率已经得到很好的提高,但这也只是治标不治本,我们仍然需要解决客户端上传人脸过多的问题。其实客户端产生的人脸是带有很大冗余的,在一段时间内产生的人脸其实都来自同一群被采集对象。为了降低一段时间内的上传人脸数,我们可以从产生的所有人脸中只选择出一部分来作为上传人脸,然后抛弃掉其他的部分。比如一开始那个假设的例子,我们如果可以收集人脸,然后一秒钟,甚至三秒种来进行一次选择上传,并令选择的人脸个数为5个,那么我们就可以降低一段时间内的人脸上传量,从而缓解网络负担进而减轻云端的计算压力。所以,解决客户端上传人脸过多的问题其实就是该怎样去选择人脸的问题。传统的方法主要有:1、选择质量高的人脸(清晰,姿势标准)2、摄像头延时截取第一种方法可以快速地选择出匹配效果好的人脸,但是无法应对采集对象突然做表情的问题;同时这种方法也无法区分出不同人的人脸,选择人脸的时候可能会出现漏选人的现象。而第二种方法则比较硬性,但是同样很容易出现漏人,延时小时达不到降低人脸上传量的目的,延时大时还会影响到匹配实时性。更一般地,我们为选择人脸的策略设立了如下几个准则:1.选取出来的子集与全集的覆盖人数一样。其中覆盖人数指的是,若某个人脸集合中,人脸总共来自n个被采集对象,那么该人脸集合的覆盖人数为n;2.选取出来的人脸具有最大的代表性。在这里我们对代表性的定义是,在一个人脸集合中,若某个人脸到其他人脸的距离(0~1,相似度越小则距离越大)之和最小,那么认为该人脸在该集合上具有最大的代表性;3.特殊的人脸会被专门选择出来。所谓的特殊人脸,指的是采集不清晰、侧脸、做大表情等的非标准人脸;4.选择是在线式的。亦即人脸的选择并不需要预先给定一个人脸的集合,等待运算完成之后才能取得结果,而是人脸是不断输入的,而算法会在恰当的时候把结果输出。1967年J.B,Mac Queen提出了K-Means聚类算法,这个经典且使用广泛的基于距离的聚类算法,使用了数据样本间的距离作为相似性度量,能够把比较相近的样本组成一类,并最终得到紧凑而且独立的类集合(J.MACQUEEN.SOME METHODS FOR CLASSIFICATION AND ANALYSIS OF MULTIVARIATE OBSERVATIONS[C].5-th Berkeley Symposium on Mathematical Statistics and Probability.1967:281~297)。我们把覆盖人数为P的人脸集合当做数据样本集合交给K-Means聚类算法,根据其计算方式,如果在算法参数恰好合适的情况下,我们可以得到这样的聚类结果:如果不存在特殊的人脸,且P=K,那么整个人脸集合会被分成K类,每个类中的大多数的人脸样本都来自于同一个人,并且同一个人的大多数人脸样本都属于同一个类。每一个类中的大多人脸都彼此相似,且每一个类中都存在一个人脸最能代表该类。在参数值允许时(K=P+e,e等于特殊人脸的个数),那么原人脸集合中的特殊人脸将会各自被单独分成一类。假如我们把聚类结果中,各个类中的最有代表性的人脸选择出来进行上传,那么可以推
知:结果1保证了准则1的成立;结果2保证了准则2的成立;结果3保证了准则3的成立。当然,这里还有两个准则存在讨论,首先就是准则2中我们怎么选择最有代表性的人脸(K-Means的聚类中心并不是距离和最小的样本)。其次,就是准则4并不能得到保证。事实上,K-Means聚类在人脸集合上实际使用时,我们往往会遇到以下几个困难:1.K-Means只能且必须分成K个类,无法自适应地根据数据样本集中应有类的个数进行动态调整;2.K-Means的聚类极易受到初始点选取的影响;3.K-Means聚类也特别容易受到离散点的影响;4.K-Means算法的计算是离线式的,也就是说其聚类的执行要预先一次性给清整个数据样本集合;5.K-Means的计算量随着数据点规模的增大而急速增大。
技术实现思路
本专利技术所要解决的技术问题是针对
技术介绍
中所涉及到的缺陷,提供一种基于聚类的在线式多人脸图像处理的方法。本专利技术为解决上述技术问题采用以下技术方案:基于聚类的在线式多人脸图像处理的方法,人脸聚类的具体步骤如下:步骤1),设定初始块大小B,距离阈值μ和类集合S;步骤2),等待一个新来人脸数据样本的传入;步骤3),分别计算类集合S中各个类的聚类中心与新来人脸数据样本之间的距离,找出与新来人脸数据样本之间距离最小的类SI;步骤4),将类SI与新来人脸数据样本之间距离与设定的距离阈值μ进行比较,如果类SI与新来人脸数据样本之间距离小于等于距离阈值μ,将新来人脸数据样本加入到SI;如果类SI与新来人脸数据样本之间距离大于距离阈值μ,建立一个新的类,将新来人脸数据样本加入这个新的类,并将该新的类加入到类集合S中;步骤5),更新新来人脸数据样本所在类的聚类中心;步骤6),计算当前类集合S中的人脸数,如果类集合S中的人脸数小于B,执行步骤2);如果类集合S中的人脸数大于或等于B,将当前的聚类结果输出后,清空类集合S,执行步骤2)。作为本专利技术基于聚类的在线式多人脸图像处理的方法进一步的优化方案,步骤5)的详
细步骤如下:步骤5.1),对于新来人脸数据样本所在类中的每个人脸数据样本,计算其和其他人脸数据样本之间的距离和;步骤5.2),将距离和最小的人脸数据样本作为新来人脸数据样本本文档来自技高网
...

【技术保护点】
基于聚类的在线式多人脸图像处理的方法,其特征在于,人脸聚类的具体步骤如下:步骤1),设定初始块大小B,距离阈值μ和类集合S;步骤2),等待一个新来人脸数据样本的传入;步骤3),分别计算类集合S中各个类的聚类中心与新来人脸数据样本之间的距离,找出与新来人脸数据样本之间距离最小的类SI;步骤4),将类SI与新来人脸数据样本之间距离与设定的距离阈值μ进行比较,如果类SI与新来人脸数据样本之间距离小于等于距离阈值μ,将新来人脸数据样本加入到SI;如果类SI与新来人脸数据样本之间距离大于距离阈值μ,建立一个新的类,将新来人脸数据样本加入这个新的类,并将该新的类加入到类集合S中;步骤5),更新新来人脸数据样本所在类的聚类中心;步骤6),计算当前类集合S中的人脸数,如果类集合S中的人脸数小于B,执行步骤2);如果类集合S中的人脸数大于或等于B,将当前的聚类结果输出后,清空类集合S,执行步骤2)。

【技术特征摘要】
1.基于聚类的在线式多人脸图像处理的方法,其特征在于,人脸聚类的具体步骤如下:步骤1),设定初始块大小B,距离阈值μ和类集合S;步骤2),等待一个新来人脸数据样本的传入;步骤3),分别计算类集合S中各个类的聚类中心与新来人脸数据样本之间的距离,找出与新来人脸数据样本之间距离最小的类SI;步骤4),将类SI与新来人脸数据样本之间距离与设定的距离阈值μ进行比较,如果类SI与新来人脸数据样本之间距离小于等于距离阈值μ,将新来人脸数据样本加入到SI;如果类SI与新来人脸数据样本之间距离大于距离阈值μ,建立一个新的类,将新来人脸数据样本加入...

【专利技术属性】
技术研发人员:李千目陆妍蕾李德强李涛徐佳徐小龙
申请(专利权)人:南京邮电大学盐城大数据研究院有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1