建立特征数据库的方法和装置制造方法及图纸

技术编号:19635542 阅读:29 留言:0更新日期:2018-12-01 16:11
本申请公开了一种建立特征数据库的方法。该方法包括初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。另外,本申请还提供了一种建立特征数据库的装置。本申请解决了百万量级人脸识别特征库的特征查找效率低的技术问题。

The Method and Device of Establishing Characteristic Database

This application discloses a method for establishing a feature database. The method includes initializing the feature database, in which the feature database includes the first feature set, the catalogue set and the second feature set; adding the feature elements in the original database to the first feature set according to the first preset rule; and adding the feature elements in the first feature set and the catalogue elements in the catalogue set. One-to-one correspondence; each catalog element in the catalog set indicates which or which feature elements in the first feature set are derived from the original database; the feature elements in the first feature set are added to the second feature set according to the second preset rule; and the first feature set. Each feature element corresponds to one feature element in the second feature set. In addition, the application also provides a device for establishing a feature database. This application solves the technical problem of low efficiency in feature search of millions of face recognition feature library.

【技术实现步骤摘要】
建立特征数据库的方法和装置
本申请涉及通信领域,具体而言,涉及一种建立特征数据库的方法。
技术介绍
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸识别技术的核心部分则为人脸图像特征提取以及匹配与识别。一般而言,提取的人脸特征为归一化后的N维向量(N通常为128、512等)。通过对人脸库中的图像逐一提取人脸特征,可以建立一个人脸特征库。在相关技术中,当需要查找可疑人脸时,采用人脸识别算法提取可疑人脸的特征数据,然后与人脸特征库中的每一个特征进行对比,找出最相近的特征作为查找结果。人脸识别主要用于身份识别,近年来已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。随着需求的不断提升,用于比对的人脸库可达百万、千万乃至亿级别,相关技术中的提取人脸特征后的查找过程计算量因此线性放大,使得人脸图像特征提取、匹配与识别的过程效率低下。针对相关技术中在百万级以上人脸特征库中特征提取、匹配与识别效率低的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种建立特征数据库的方法,以解决上述问题。为了实现上述目的,根据本申请的一个方面,提供了一种建立特征数据库的方法,包括:初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。进一步的,如前述的方法,所述将原始数据库中的特征元素按照第一预设规则添加到所述特征数据库中,包括:S21.从所述原始数据库中获取欲添加到所述特征数据库中的特征元素;S22.判断所述第一特征集是否为空;S23.若所述第一特征集为空,则将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;S24.若所述第一特征集不为空,计算所述特征元素与所述第一特征集中各个特征元素的距离,比较各个所述距离,得到与所述特征元素的距离最小的所述第一特征集中的最近特征元素;所述最近特征元素与所述特征元素之间的距离为最近距离;S25.判断所述最近距离是否大于预设阈值;S26.若所述最近距离大于所述预设阈值,则将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;S27.若所述最近距离不大于所述预设阈值,则将所述最近特征元素替换为所述最近特征元素和所述特征元素的均值,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集中的对应目录元素中;S28.重复S21至S27,直至所述原始数据库中所有特征元素的身份信息都添加到所述目录集中。进一步的,如前述的方法,所述特征元素为向量;所述S24中计算所述特征元素与所述第一特征集中各个特征元素的距离,包括计算所述特征元素与所述第一特征集中各个特征元素的点积。进一步的,如前述的方法,所述将所述第一特征集中的特征元素按照第二预设规则添加到所述第二特征集中,包括:S31.通过Sigmoid函数将所述第一特征集中的各个特征元素的各个值都投影为在0和1之间;S32.将所述所有值在0和1之间的各个特征元素按照第三预设规则投影为各个特征元素的各个值为0或1;S33.将所述各个值为0或1的各个特征元素添加到所述第二特征集中。进一步的,如前述的方法,所述S32,包括:S321.获取欲投影的元素的值;S322.判断所述值是否大于0.5;S323.若所述值大于0.5,则将所述值投影为1;S324.若所述值不大于0.5,则将所述值投影为0;S325.重复S321至S324,直至将所述所有值在0和1之间的各个特征元素投影为各个特征元素的每个值为0或1。为了实现上述目的,根据本申请的另一方面,提供了一种建立特征数据库的装置,包括:初始化单元、压缩单元和转换单元;所述初始化单元,用于初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;所述压缩单元,用于将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;所述转换单元,用于将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。进一步的,如前述的装置,所述压缩单元,包括第一获取单元、第一判断单元、第一处理单元和第一计算单元;所述第一获取单元,用于从所述原始数据库中获取欲添加到所述特征数据库中的特征元素;所述第一判断单元,用于判断所述第一特征集是否为空;所述第一处理单元,用于在所述第一特征集为空时,将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;所述第一计算单元,用于在所述第一特征集不为空时,计算所述特征元素与所述第一特征集中各个特征元素的距离,比较各个所述距离,得到与所述特征元素的距离最小的所述第一特征集中的最近特征元素;所述最近特征元素与所述特征元素之间的距离为最近距离;所述第一判断单元,还用于判断所述最近距离是否大于预设阈值;所述第一处理单元,还用于在所述最近距离大于所述预设阈值时,将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;所述第一计算单元,还用于在所述最近距离不大于所述预设阈值时,计算所述最近特征元素和所述特征元素的均值;所述第一处理单元,还用于在所述最近距离不大于所述预设阈值时,将所述最近特征元素替换为所述均值,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集中的对应目录元素中。进一步的,如前述的装置,所述特征元素为向量;所述第一计算单元用于计算所述特征元素与所述第一特征集中各个特征元素的距离,包括用于计算所述特征元素与所述第一特征集中各个特征元素的点积。进一步的,如前述的装置,所述转换单元,包括投影单元和第二处理单元;所述投影单元,用于通过Sigmoid函数将所述第一特征集中的各个特征元素的各个值都投影为在0和1之间;所述投影单元,还用于将所述所有值在0和1之间的各个特征元素按照第三预设规则投影为各个特征元素的各个值为0或1;所述第二处理单元,还用于将所述各个值为0或1的各个特征元素添加到所述第二特征集中。进一步的,如前述的装置,所述投影单元,包括第二获取单元、第二判断单元和第二计算单元;所述第二获取单元,用于获取欲投影的元素的值;所述第二判断单元,用于判断所述值是否大于0.5;所述第二计算单元,用于在所述值大于0.5时,将所述值投影为1;所述第二计算单元,还用于在所述值不大于0.5,则将所述值投影为0。在本申请实施例中,采用将大规模人脸特征库对应为特征库和目录库的本文档来自技高网...

【技术保护点】
1.一种建立特征数据库的方法,其特征在于,包括:初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。

【技术特征摘要】
1.一种建立特征数据库的方法,其特征在于,包括:初始化特征数据库,其中,所述特征数据库包括第一特征集、目录集和第二特征集;将原始数据库中的特征元素按照第一预设规则添加到所述第一特征集中;所述第一特征集中的特征元素与所述目录集中的目录元素一一对应;所述目录集中各个目录元素分别指示第一特征集中对应特征元素来自于所述原始数据库中的哪个或哪些特征元素;将所述第一特征集中的所述特征元素按照第二预设规则添加到所述第二特征集中;所述第一特征集中的每一个特征元素对应所述第二特征集中的一个特征元素。2.根据权利要求1所述的方法,其特征在于,所述将原始数据库中的特征元素按照第一预设规则添加到所述特征数据库中,包括:S21.从所述原始数据库中获取欲添加到所述特征数据库中的特征元素;S22.判断所述第一特征集是否为空;S23.若所述第一特征集为空,则将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;S24.若所述第一特征集不为空,计算所述特征元素与所述第一特征集中各个特征元素的距离,比较各个所述距离,得到与所述特征元素的距离最小的所述第一特征集中的最近特征元素;所述最近特征元素与所述特征元素之间的距离为最近距离;S25.判断所述最近距离是否大于预设阈值;S26.若所述最近距离大于所述预设阈值,则将所述特征元素添加到所述第一特征集中,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集的对应目录元素中;S27.若所述最近距离不大于所述预设阈值,则将所述最近特征元素替换为所述最近特征元素和所述特征元素的均值,并将所述特征元素在所述原始数据库中的身份信息添加到所述目录集中的对应目录元素中;S28.重复S21至S27,直至所述原始数据库中所有特征元素的身份信息都添加到所述目录集中。3.根据权利要求2所述的方法,其特征在于,所述特征元素为向量;所述S24中计算所述特征元素与所述第一特征集中各个特征元素的距离,包括计算所述特征元素与所述第一特征集中各个特征元素的点积。4.根据权利要求1或3所述的方法,其特征在于,所述将所述第一特征集中的特征元素按照第二预设规则添加到所述第二特征集中,包括:S31.通过Sigmoid函数将所述第一特征集中的各个特征元素的各个值都投影为在0和1之间;S32.将所述所有值在0和1之间的各个特征元素按照第三预设规则投影为各个特征元素的各个值为0或1;S33.将所述各个值为0或1的各个特征元素添加到所述第二特征集中。5.根据权利要求4所述的方法,其特征在于,所述S32,包括:S321.获取欲投影的元素的值;S322.判断所述值是否大于0.5;S323.若所述值大于0.5,则将所述值投影为1;S324.若所述值不大于0.5,则将所述值投影为0;S325.重复S321至S324,直至将所述所有值在0和1之间的各个特征元素投影为各个特征元素的每个值为0或1。6.一种建立特征数据库的装置,其特征在于,包括初始化单元、压缩单元和转换单元;所述初...

【专利技术属性】
技术研发人员:孙海涌张默
申请(专利权)人:北京陌上花科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1