一种获取人脸识别阈值的方法及系统技术方案

技术编号:24170740 阅读:37 留言:0更新日期:2020-05-16 02:52
本发明专利技术实施例公开了一种获取人脸识别阈值的方法及系统,首先获取识别场景下已知人物与未知人物出现频次的比例作为样本比例,然后建立已知人物的正样本数据集,以及未知人物的负样本数据集,正样本总数量与负样本总数量的比例与样本比例一致。计算每个正样本及每个负样本与已知人物的相似性分数,生成正样本相似性分数的分布,以及,生成负样本相似性分数的分布。最后,判断是否存在同频相似性分数使正样本分布和负样本分布上对应同频相似性分数的频率相同,如果是,将同频相似性分数确定为人脸识别阈值,如果否,在正样本相似性分数中的最低值与负样本相似性分数中的最高值之间,任意选取一个相似性分数确定为人脸识别阈值。

A method and system for obtaining threshold of face recognition

【技术实现步骤摘要】
一种获取人脸识别阈值的方法及系统
本专利技术涉及人脸识别
,特别是涉及一种获取人脸识别阈值的方法及系统。
技术介绍
人脸识别是人工智能领域的研究热点,该技术能够快速有效地检测图像或者视频中的人脸并获得其身份信息,广泛应用于互联网内容审查、安防监控等场景。随着深度学习技术的快速发展,作为深度学习技术应用之一的人脸识别也获得了突破性进展,人脸识别精度逐渐提高,在某些场景下甚至超越了人类的识别极限。人脸识别分为封闭集合人脸识别和开放集合人脸识别两类,分类依据在于是否在有限人脸集合上开展识别工作。封闭集合人脸识别只分析人脸数据库中已知人物的身份信息,即使有未知人物出现也会为其匹配人脸数据库中已知人物的身份信息;而开放集合人脸识别则允许识别人脸数据库外的未知人物,并不会为其匹配已知人物的身份信息。针对封闭集合人脸识别而言,实现人脸识别的流程主要包括以下步骤:首先,采用深度神经网络提取待检测人脸的特征,然后,将待检测人脸的特征与人脸特征库中的特征进行比对,得到特征相似性分数,最后,根据相似性分数为待检测人脸匹配身份信息。而开放式人脸识别除了需要完成上述流程以外,还需要在获得特征相似性分数之后,通过阈值筛选的方式判别待检测人脸对应的人物身份是已知人物还是未知人物,在确认待检测人脸为已知人物之后,再为待检测人脸匹配身份信息。由此可见,阈值是保证开放式人脸识别准确性的重要基础。目前,获取开放式人脸识别阈值主要采用以下方式:采集未知人物的人脸图像作为负样本,以及,采集已知人物的人脸图像作为正样本,将两类样本数据分别与人脸特征库对比,获得每个样本的相似性分数。根据相似性分数按照由高到低的方式为所有样本数据排序,若某一相似性分数能够使高于该分数的负样本数量占正负样本总数的百分比小于1%,则将该相似性分数作为人脸识别的阈值。但是,在真实应用场景中,例如,在办公楼等场所中,固定出入的人员(如公司员工)数量往往比偶尔出入的人员数量多,采用上述方式所确定的阈值,即相似性分数较低,很可能将未知人员误判别为已知人员,影响人脸识别的准确率;而在商场等场所,固定出入的人员(如售货员)通常比偶尔出入的人员数量少,采用上述方式所确定的阈值,即相似性分数较高,很可能将已知人员误判别为未知人员,导致人脸识别的灵敏度下降。
技术实现思路
本专利技术实施例中提供了一种获取人脸识别阈值的方法及系统,以解决现有人脸识别阈值确定方法影响人脸识别准确率和灵敏度的问题。为了解决上述技术问题,本专利技术实施例公开了如下技术方案:一种获取人脸识别阈值的方法,应用于区分识别场景下的已知人物和未知人物,包括:获取识别场景下已知人物与未知人物出现频次的比例并作为样本比例;建立已知人物的正样本数据集,所述正样本数据集中每个正样本均包含一个已知人物的面部数据;建立未知人物的负样本数据集,所述负样本数据集中每个负样本均包含一个未知人物的面部数据;正样本总数量与负样本总数量的比例与样本比例一致;分别计算每个正样本及每个负样本与已知人物的相似性分数;生成正样本相似性分数的分布,以及,生成负样本相似性分数的分布;判断是否存在一个同频相似性分数,使正样本分布和负样本分布上对应所述同频相似性分数的频率相同,如果是,将所述同频相似性分数确定为人脸识别阈值;如果否,在正样本相似性分数中的最低值与负样本相似性分数中的最高值之间,任意选取一个相似性分数确定为人脸识别阈值。可选的,所述分别计算每个正样本及每个负样本与已知人物的相似性分数,包括:建立包含每个已知人物预存面部数据的数据库;利用人脸特征提取模型提取数据库中每个已知人物预存面部数据的特征;利用人脸特征提取模型分别提取每个正样本及每个负样本所含面部数据的特征;根据已知人物预存面部数据特征、正样本面部数据特征以及负样本面部数据特征,采用打分模型分别计算每个正样本及每个负样本与已知人物的相似性分数。可选的,所述根据已知人物预存面部数据特征、正样本面部数据特征以及负样本面部数据特征,采用打分模型分别计算每个正样本及每个负样本与已知人物的相似性分数,包括:采用打分模型分别计算每个正样本面部数据特征与对应已知人物预存面部数据特征的特征分数并作为对应正样本的相似性分数;采用打分模型分别计算每个负样本面部数据特征与所有已知人物预存面部数据特征的特征分数;选取每一个负样本所有特征分数中的最大值作为对应负样本的相似性分数,每个负样本均具有一个相似性分数。可选的,所述获取识别场景下已知人物与未知人物出现频次的比例并作为样本比例,包括:采用人工观测的方式获取识别场景下已知人物与未知人物出现频次的比例。可选的,采用Facenet模型提取面部数据的特征。一种获取人脸识别阈值的系统,应用于区分识别场景下的已知人物和未知人物,包括:样本比例获取模块,用于获取识别场景下已知人物与未知人物出现频次的比例并作为样本比例;正样本建立模块,用于建立已知人物的正样本数据集,所述正样本数据集中每个正样本均包含一个已知人物的面部数据;负样本建立模块,用于建立未知人物的负样本数据集,所述负样本数据集中每个负样本均包含一个未知人物的面部数据;正样本总数量与负样本总数量的比例与样本比例一致;相似性分数计算模块,用于分别计算每个正样本及每个负样本与已知人物的相似性分数;分布生成模块,用于生成正样本相似性分数的分布,以及,生成负样本相似性分数的分布;人脸识别阈值确定模块,用于当存在一个同频相似性分数,使正样本分布和负样本分布上对应所述同频相似性分数的频率相同时,将所述同频相似性分数确定为人脸识别阈值;当不存在一个同频相似性分数,使正样本分布和负样本分布上对应所述同频相似性分数的频率相同时,在正样本相似性分数中的最低值与负样本相似性分数中的最高值之间,任意选取一个相似性分数确定为人脸识别阈值。可选的,所述相似性分数计算模块,包括:数据库建立模块,用于建立包含每个已知人物预存面部数据的数据库;特征提取模块,用于利用人脸特征提取模型提取数据库中每个已知人物预存面部数据的特征;以及,利用人脸特征提取模型分别提取每个正样本及每个负样本所含面部数据的特征;计算模块,用于根据已知人物预存面部数据特征、正样本面部数据特征以及负样本面部数据特征,采用打分模型分别计算每个正样本及每个负样本与已知人物的相似性分数。可选的,所述计算模块,包括:正样本分数确定模块,用于采用打分模型分别计算每个正样本面部数据特征与对应已知人物预存面部数据特征的特征分数并作为对应正样本的相似性分数;负样本分数确定模块,用于采用打分模型分别计算每个负样本面部数据特征与所有已知人物预存面部数据特征的特征分数;选取每一个负样本所有特征分数中的最大值作为对应负样本的相似性分数,每个负样本均具有一个相似性分数。由以上技术方案可见,本专利技术实施例提供的一种获取人脸识本文档来自技高网
...

【技术保护点】
1.一种获取人脸识别阈值的方法,应用于区分识别场景下的已知人物和未知人物,其特征在于,包括:/n获取识别场景下已知人物与未知人物出现频次的比例并作为样本比例;/n建立已知人物的正样本数据集,所述正样本数据集中每个正样本均包含一个已知人物的面部数据;/n建立未知人物的负样本数据集,所述负样本数据集中每个负样本均包含一个未知人物的面部数据;正样本总数量与负样本总数量的比例与样本比例一致;/n分别计算每个正样本及每个负样本与已知人物的相似性分数;/n生成正样本相似性分数的分布,以及,生成负样本相似性分数的分布;/n判断是否存在一个同频相似性分数,使正样本分布和负样本分布上对应所述同频相似性分数的频率相同,/n如果是,将所述同频相似性分数确定为人脸识别阈值;/n如果否,在正样本相似性分数中的最低值与负样本相似性分数中的最高值之间,任意选取一个相似性分数确定为人脸识别阈值。/n

【技术特征摘要】
1.一种获取人脸识别阈值的方法,应用于区分识别场景下的已知人物和未知人物,其特征在于,包括:
获取识别场景下已知人物与未知人物出现频次的比例并作为样本比例;
建立已知人物的正样本数据集,所述正样本数据集中每个正样本均包含一个已知人物的面部数据;
建立未知人物的负样本数据集,所述负样本数据集中每个负样本均包含一个未知人物的面部数据;正样本总数量与负样本总数量的比例与样本比例一致;
分别计算每个正样本及每个负样本与已知人物的相似性分数;
生成正样本相似性分数的分布,以及,生成负样本相似性分数的分布;
判断是否存在一个同频相似性分数,使正样本分布和负样本分布上对应所述同频相似性分数的频率相同,
如果是,将所述同频相似性分数确定为人脸识别阈值;
如果否,在正样本相似性分数中的最低值与负样本相似性分数中的最高值之间,任意选取一个相似性分数确定为人脸识别阈值。


2.根据权利要求1所述的方法,其特征在于,所述分别计算每个正样本及每个负样本与已知人物的相似性分数,包括:
建立包含每个已知人物预存面部数据的数据库;
利用人脸特征提取模型提取数据库中每个已知人物预存面部数据的特征;
利用人脸特征提取模型分别提取每个正样本及每个负样本所含面部数据的特征;
根据已知人物预存面部数据特征、正样本面部数据特征以及负样本面部数据特征,采用打分模型分别计算每个正样本及每个负样本与已知人物的相似性分数。


3.根据权利要求2所述的方法,其特征在于,所述根据已知人物预存面部数据特征、正样本面部数据特征以及负样本面部数据特征,采用打分模型分别计算每个正样本及每个负样本与已知人物的相似性分数,包括:
采用打分模型分别计算每个正样本面部数据特征与对应已知人物预存面部数据特征的特征分数并作为对应正样本的相似性分数;
采用打分模型分别计算每个负样本面部数据特征与所有已知人物预存面部数据特征的特征分数;
选取每一个负样本所有特征分数中的最大值作为对应负样本的相似性分数,每个负样本均具有一个相似性分数。


4.根据权利要求1所述的方法,其特征在于,所述获取识别场景下已知人物与未知人物出现频次的比例并作为样本比例,包括:
采用人工观测的方式获取识别场景下已知人物与未知人物出现频次的比例。

...

【专利技术属性】
技术研发人员:张昆王惠峰刘灵芝白立飞张峰
申请(专利权)人:中国电子科技集团公司信息科学研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1