海量人脸数据库的快速交叉识别技术制造技术

技术编号:22056529 阅读:24 留言:0更新日期:2019-09-07 15:42
本发明专利技术属于人脸识别的技术领域,尤其涉及一种基于聚类分析的海量人脸数据库的快速交叉识别技术。海量人脸数据库的快速交叉识别技术采用如下的技术手段:通过基站获取的手机IMEI信息,检索到基站覆盖区域范围内的所有机主的身份证信息,通过基站检索获取的身份证信息,比对本地人脸数据库,将目标人脸识别范围缩小到基站内机主的人脸子集,提高人脸识别速度。通过机主的身份证信息,检索国家人口信息系统,通过检索国家人口信息系统,获取系统中机主的人脸信息,和摄像头获取的人脸信息以及本地人脸数据库的信息进行交叉对比识别,提高识别精度。

Fast Cross Recognition Technology for Massive Face Database

【技术实现步骤摘要】
海量人脸数据库的快速交叉识别技术
本专利技术属于人脸识别的
,尤其涉及一种基于聚类分析的海量人脸数据库的快速交叉识别技术
技术介绍
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。聚类分析具有以下要求:可伸缩性许多聚类算法在小于200个数据对象的小数据集合上工作得很好;但是,一个大规模数据库可能包含几百万个对象,在这样的大数据集合样本上进行聚类可能会导致有偏的结果。我们需要具有高度可伸缩性的聚类算法。不同属性许多算法被设计用来聚类数值类型的数据。但是,应用可能要求聚类其他类型的数据,如二元类型(binary),分类/标称类型(categorical/nominal),序数型(ordinal)数据,或者这些数据类型的混合。任意形状许多聚类算法基于欧几里得或者曼哈顿距离度量来决定聚类。基于这样的距离度量的算法趋向于发现具有相近尺度和密度的球状簇。但是,一个簇可能是任意形状的。提出能发现任意形状簇的算法是很重要的。领域最小化许多聚类算法在聚类分析中要求用户输入一定的参数,例如希望产生的簇的数目。聚类结果对于输入参数十分敏感。参数通常很难确定,特别是对于包含高维对象的数据集来说。这样不仅加重了用户的负担,也使得聚类的质量难以控制。处理“噪声”绝大多数现实中的数据库都包含了孤立点,缺失,或者错误的数据。一些聚类算法对于这样的数据敏感,可能导致低质量的聚类结果。记录顺序一些聚类算法对于输入数据的顺序是敏感的。例如,同一个数据集合,当以不同的顺序交给同一个算法时,可能生成差别很大的聚类结果。开发对数据输入顺序不敏感的算法具有重要的意义。高维度(highdimensionality)一个数据库或者数据仓库可能包含若干维或者属性。许多聚类算法擅长处理低维的数据,可能只涉及两到三维。人类的眼睛在最多三维的情况下能够很好地判断聚类的质量。在高维空间中聚类数据对象是非常有挑战性的,特别是考虑到这样的数据可能分布非常稀疏,而且高度偏斜。基于约束现实世界的应用可能需要在各种约束条件下进行聚类。假设你的工作是在一个城市中为给定数目的自动提款机选择安放位置,为了作出决定,你可以对住宅区进行聚类,同时考虑如城市的河流和公路网,每个地区的客户要求等情况。要找到既满足特定的约束,又具有良好聚类特性的数据分组是一项具有挑战性的任务。解释性-可用性用户希望聚类结果是可解释的,可理解的,和可用的。也就是说,聚类可能需要和特定的语义解释和应用相联系。目前还没有切实有效的技术能满足在海量人脸数据库下快速、精确识别人脸的技术要求。
技术实现思路
本专利技术的目的在于通过识别区域范围内人群的手机信息,缩减人脸数据库识别目标范围,提高人脸识别速度以及精度。为达到上述目的,本专利技术海量人脸数据库的快速交叉识别技术采用如下的技术手段:通过基站获取的手机IMEI信息,检索到基站覆盖区域范围内的所有机主的身份证信息,通过基站检索获取的身份证信息,比对本地人脸数据库,将目标人脸识别范围缩小到基站内机主的人脸子集,提高人脸识别速度。通过机主的身份证信息,检索国家人口信息系统,通过检索国家人口信息系统,获取系统中机主的人脸信息,和摄像头获取的人脸信息以及本地人脸数据库的信息进行交叉对比识别,提高识别精度。海量人脸数据库的快速交叉识别技术具体包括以下步骤:第一步:根据手机IMEI信息检索机主身份证信息,形成检索目标人群子集。一部手机IMEI信息对应唯一的机主身份证信息,基站覆盖范围内所有IMEI信息对应的所有机主身份证信息形成目标人群子集S1。第二部:根据机主身份证信息,检索本地数据库,和S1进行与运算形成包含M张人脸图像的集合S。每张图像可以转换成一个N维的向量,然后把这M个向量放到一个集合S里。第三步:在获取到人脸向量集合S后,计算得到平均图像Ψ。把集合S里面的向量遍历一遍进行累加,然后取平均值。第四步:计算每张图像和平均图像的差值Ф,就是用S集合里的每个元素减去步骤二中的平均值。第五步:找到M个正交的单位向量UM,这些单位向量其实是用来描述Ф(步骤三中的差值)分布的。UM里面的第k(k=1,2,3...M)个向量Uk是通过下式计算的,当这个λk取最小的值时,Uk基本就确定了。这M个向量是相互正交而且是单位长度的,Uk为单位正交向量。如果训练图像的数量小于图像的维数比如(M<N2),那么起作用的特征向量只有M-1个而不是N2个(因为其他的特征向量对应的特征值为0),所以求解特征向量我们只需要求解一个NxN的矩阵。第六步:识别人脸。上面几步是为了对人脸进行降维找到表征人脸的合适向量的。首先考虑一张新的人脸,我们可以用特征脸对其进行标示:Ω代表要判别的人脸,Ωk代表训练集内的某个人脸,两者都是通过特征脸的权重来表示的。对两者求欧式距离,当距离小于阈值时说明要判别的脸和训练集内的第k个脸是同一个人的。当遍历所有训练集都大于阈值时,根据距离值的大小又可分为是新的人脸或者不是人脸的两种情况。根据训练集的不同,阈值设定并不是固定的。本专利技术的有益效果在于:本专利技术海量人脸数据库的快速交叉识别技术通过通过获取机主手机IMEI信息,引入身份证信息作为人脸库检索参数,缩小人脸库检索范围,提高人脸识别速度;通过对接国家人口信息系统,引入国家人口信息系统中的人脸数据,与本地人脸数据及摄像头获取的人脸数据进行交叉比对,提高人脸识别准确率。附图说明图1各种性能与类内数据量关系;图2检索时间及准确率与检索节点数的关系。具体实施方式下面结合附图对本专利技术的实施例进行说明。本专利技术海量人脸数据库的快速交叉识别技术通过基站获取的手机IMEI信息,检索到基站覆盖区域范围内的所有机主的身份证信息,通过基站检索获取的身份证信息,比对本地人脸数据库,将目标人脸识别范围缩小到基站内机主的人脸子集,提高人脸识别速度。通过机主的身份证信息,检索国家人口信息系统,通过检索国家人口信息系统,获取系统中机主的人脸信息,和摄像头获取的人脸信息以及本地人脸数据库的信息进行交叉对比识别,提高识别精度。海量人脸数据库的快速交叉识别技术具体包括以下步骤:第一步:根据手机IMEI信息检索机主身份证信息,形成检索目标人群子集。一部手机IMEI信息对应唯一的机主身份证信息,基站覆盖范围内所有IMEI信息对应的所有机主身份证信息形成目标人群子集S1。第二部:根据机主身份证信息,检索本地数据库,和S1进行与运算形成包含M张人脸图像的集合S。每张图像可以转换成一个N维的向量,然后把这M个向量放到一个集合S里。第三步:在获取到人脸向量集合S后,计算得到平均图像Ψ。把集合S里面的向量遍历一遍进行累加,然后取平均值。第四步:计算每张图像和平均图像的差值Ф本文档来自技高网
...

【技术保护点】
1.海量人脸数据库的快速交叉识别技术,其特征在于海量人脸数据库的快速交叉识别技术通过基站获取的手机IMEI信息,检索到基站覆盖区域范围内的所有机主的身份证信息,通过基站检索获取的身份证信息,比对本地人脸数据库,将目标人脸识别范围缩小到基站内机主的人脸子集,提高人脸识别速度;通过机主的身份证信息,检索国家人口信息系统,通过检索国家人口信息系统,获取系统中机主的人脸信息,和摄像头获取的人脸信息以及本地人脸数据库的信息进行交叉对比识别,提高识别精度;海量人脸数据库的快速交叉识别技术具体包括以下步骤:第一步:根据手机IMEI信息检索机主身份证信息,形成检索目标人群子集。一部手机IMEI信息对应唯一的机主身份证信息,基站覆盖范围内所有IMEI信息对应的所有机主身份证信息形成目标人群子集S1。第二部:根据机主身份证信息,检索本地数据库,和S1进行与运算形成包含M张人脸图像的集合S。每张图像可以转换成一个N维的向量,然后把这M个向量放到一个集合S里。第三步:在获取到人脸向量集合S后,计算得到平均图像Ψ。把集合S里面的向量遍历一遍进行累加,然后取平均值。第四步:计算每张图像和平均图像的差值Φ,就是用S集合里的每个元素减去步骤二中的平均值。第五步:找到M个正交的单位向量UM,这些单位向量其实是用来描述Φ(步骤三中的差值)分布的。M个向量是相互正交而且是单位长度的,Uk为单位正交向量。如果训练图像的数量小于图像的维数比如(M<N...

【技术特征摘要】
1.海量人脸数据库的快速交叉识别技术,其特征在于海量人脸数据库的快速交叉识别技术通过基站获取的手机IMEI信息,检索到基站覆盖区域范围内的所有机主的身份证信息,通过基站检索获取的身份证信息,比对本地人脸数据库,将目标人脸识别范围缩小到基站内机主的人脸子集,提高人脸识别速度;通过机主的身份证信息,检索国家人口信息系统,通过检索国家人口信息系统,获取系统中机主的人脸信息,和摄像头获取的人脸信息以及本地人脸数据库的信息进行交叉对比识别,提高识别精度;海量人脸数据库的快速交叉识别技术具体包括以下步骤:第一步:根据手机IMEI信息检索机主身份证信息,形成检索目标人群子集。一部手机IMEI信息对应唯一的机主身份证信息,基站覆盖范围内所有IMEI信息对应的所有机主身份证信息形成目标人群子集S1。第二部:根据机主身份证信息,检索本地数据库,和S1进行与运算形成包含M张人脸图像的集合S。每张图像可以转换成一个N维的向量,然后把这M个向量放到一个集合S里。第三步:在获取到人脸向量集合S后,计算得到...

【专利技术属性】
技术研发人员:王胜
申请(专利权)人:北京京投信安科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1