一种基于时空和群体信息改进人脸聚类结果的方法技术

技术编号:31495334 阅读:14 留言:0更新日期:2021-12-18 12:35
本发明专利技术公开了一种基于时空和群体信息改进人脸聚类结果的方法,包括以下步骤:步骤S1、输入一个待聚类的人脸特征;步骤S2、预设检索阈值和相似度阈值;步骤S3、计算所述特征群体内任意两个人脸特征的相似度,并生成相似度矩阵,即两两特征的相似度矩阵;步骤S4、获取所述特征群体内两两特征的时间跨度信息和经纬度信息;步骤S5、对不同的时间跨度信息和经纬度信息匹配对应的不同的相似度阈值w;步骤S6、通过计算Jaccard距离来修正两两特征的相似度;步骤S8、预设聚类阈值e,并对聚类阈值e进行设置;步骤S9、根据所述两两特征的相似度矩阵和聚类算法对所述特征群体做聚类运算。聚类算法对所述特征群体做聚类运算。聚类算法对所述特征群体做聚类运算。

【技术实现步骤摘要】
一种基于时空和群体信息改进人脸聚类结果的方法


[0001]本专利技术涉及人脸聚类
,特别是涉及一种基于时空和群体信息改进人脸聚类结果的方法,能够优化聚类算法,降低聚类算法的误聚率。

技术介绍

[0002]随着大数据和人工智能相关技术在安防行业的广泛运用,衍生出了很多有价值的深度应用,比如虚拟和实口人员档案应用、行为分析、跨境追踪(ReID)等。而将结构化出的人脸特征聚类、对象化是这些深度应用的基础和前提条件。传统的聚类算法有K

Means、DBSCAN等,但各种算法都有不足之处,比如K

Means对噪声影响很敏感,对于类别不确定的场景很难使用;DBSCAN的聚类参数选择很难确定等。怎样去优化聚类算法,降低聚类算法的误聚率变得尤为关键,因此,亟需一种技术方案以解决上述问题。

技术实现思路

[0003]为解决现有技术中存在的问题,本专利技术提供了一种基于时空和群体信息改进人脸聚类结果的方法,能够优化聚类算法,降低聚类算法的误聚率。
[0004]本专利技术采用的技术方案是:一种基于时空和群体信息改进人脸聚类结果的方法,包括以下步骤:
[0005]步骤S1、输入一个待聚类的人脸特征;
[0006]步骤S2、预设检索阈值和相似度阈值,在预存的人脸特征库中输入人脸特征并进行检索,判断是否有超过检索阈值的特征群体,如果是,将所述人脸特征加入特征群体中,如果否,返回步骤S1;
[0007]步骤S3、计算所述特征群体内任意两个人脸特征的相似度,并生成相似度矩阵,即两两特征的相似度矩阵;
[0008]步骤S4、获取所述特征群体内两两特征的时间跨度信息和经纬度信息,根据所述对应的时间跨度信息和经纬度信息计算所述两两特征对应的图片之间的时间跨度信息和经纬度信息;
[0009]步骤S5、对不同的时间跨度信息和经纬度信息匹配对应的不同的相似度阈值w,并将所述相似度阈值加权到所述两两特征的相似度上,更新两两特征的相似度矩阵;
[0010]步骤S6、通过计算Jaccard距离来修正两两特征的相似度;
[0011]步骤S7、预设群体相似阈值r,根据群体相似阈值r判断两两特征与特征群体中其他人脸特征的对比情况,获取Jaccard距离中的交集部分,并根据交集部分对群体相似阈值r进行设置;
[0012]步骤S8、预设聚类阈值e,并对聚类阈值e进行设置;
[0013]步骤S9、根据所述两两特征的相似度矩阵和聚类算法对所述特征群体做聚类运算,获取类簇,根据类簇获取离群点,并从类簇中将离群点删除。
[0014]在本技术方案中,本专利技术提出了一种时空和群体信息改进人脸聚类结果的方法。
通过向量检索先获取与待聚类特征相似的特征群体,并计算这个群体内两两特征的相似度,得到一个相似度矩阵;获取这个群体内每个特征对应的人脸图片的抓拍时间和抓拍地点(经纬度)。计算两两特征图片间的空间距离和时间跨度,修正并更新两两特征的相似度矩阵;再计算两两特征与群体相似与否的Jaccard距离,进一步修正两两特征的相似度矩阵;然后简化特征间的相似度矩阵,并采用传统的聚类方法进行聚类,得到若干人脸类簇;最后,利用空间分布对聚好的类簇进行筛查,去除掉离群点。本专利技术主要用以降低传统聚类方法(K

Means、DBSCAN)误聚率。经过时空信息修正后,两两特征的相似度小于阈值w的不用计算Jaccard距离。修正的目的不是要修正到大于阈值为止,修正只是做一个判断,大于阈值则相似度保留,小于阈值相似度设0。
[0015]在另一个技术方案中,步骤S1包括:
[0016]通过向量检索、区域或时间划分的方式获得待聚类群体。
[0017]在本技术方案中,通过向量检索的方式获得待聚类群体,也可以按区域或时间划分的群体,按区域和抓拍时间组合判断两个特征是否一个人的方式,也可以是按任意公式来判断,旨在通过时空信息来排除一个人的可能性。同时,本技术方案在已知的人脸特征库里面检索跟输入特征相似的特征群体,并将待聚类特征加入群体中,计算特征群体内两两特征的相似度,生成相似度矩阵。
[0018]在本技术方案中,获取群体内每个特征对应的人脸图片的抓拍时间和抓拍地点(经纬度),计算两两特征图片间的空间距离(经纬度)和时间跨度(抓拍时间)。对于不同的时间或空间跨度,匹配不同的相似度阈值,并加权到两两特征的相似度上,更新两两特征的相似度矩阵。不同的时空信息,对应的阈值不一样,比如两个特征同属一个区域,且抓拍时间间隔在30秒以内,则相似度的阈值相对低,这两个特征更容易认为是一个人;两个特征距离超过20公里,但抓拍时间间隔在1分钟以内,则可以认为不可能是一个人,修正这对特征的相似度为0(最低)。
[0019]在另一个技术方案中,步骤S6包括:
[0020]通过所述两两特征与群体特征相似与否计算Jaccard距离。
[0021]在本技术方案中,通过Jaccard距离来修正相似度的方式,也可以是其他任意距离或方法,旨在通过与群体是否相似的方式来判断是否为同一个人。
[0022]在本技术方案中,通过计算两两特征与群体相似与否的Jaccard距离来修正特征对的相似度(已经由上步修正,低于聚类阈值e的特征不再计算)。已知群体相似阈值r,判断两两特征与群体内其他特征的相似情况,俩特征与群体内特征逐一比较,若都相似(大于等与阈值r)或都不相似(小与阈值r),则为Jaccard距离中的交集部分。交集占全特征集合的比例与阈值r比较,大于阈值r则保留这对特征的相似度,否则置为0。
[0023]在另一个技术方案中,步骤S6还包括:
[0024]当两两特征的相似度小于或等于相似度阈值w时,将相似度阈值w置为0,当当两两特征的相似度大于相似度阈值w时,则保留两两特征的相似度,并进入步骤S7。
[0025]在本技术方案中,将相似度简化为0、1变量的方式,也可以是其他简化方案,旨在提升运算效率。
[0026]在另一个技术方案中,步骤S7包括:
[0027]将交集部分占全人脸特征集合的比例与群体相似阈值r进行比较,判断是否大于
群体相似阈值r,如果是,则保留所述两两特征的相似度,如果否,则将群体相似阈值r置为0。
[0028]在本技术方案中,将相似度简化为0、1变量的方式,也可以是其他简化方案,旨在提升运算效率。
[0029]在另一个技术方案中,步骤S8包括:
[0030]判断所述两两特征的相似度是否大于矩阵与聚类阈值e,如果是,则将聚类阈值e置为1,如果否,则将聚类阈值e置为0。
[0031]在本技术方案中,两两特征的相似度矩阵与聚类阈值e比较,大于e,则置为1,否则置为0。用以简化聚类过程中的运算。
[0032]在另一个技术方案中,步骤S9包括:
[0033]以类簇为单位计算空间分布的方式获取离群。
[0034]在本技术方案中,基于两两特征的相似度矩阵,可以采用DBSC本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时空和群体信息改进人脸聚类结果的方法,其特征在于,包括以下步骤:步骤S1、输入一个待聚类的人脸特征;步骤S2、预设检索阈值和相似度阈值,在预存的人脸特征库中输入人脸特征并进行检索,判断是否有超过检索阈值的特征群体,如果是,将所述人脸特征加入特征群体中,如果否,返回步骤S1;步骤S3、计算所述特征群体内任意两个人脸特征的相似度,并生成相似度矩阵,即两两特征的相似度矩阵;步骤S4、获取所述特征群体内两两特征的时间跨度信息和经纬度信息,根据所述对应的时间跨度信息和经纬度信息计算所述两两特征对应的图片之间的时间跨度信息和经纬度信息;步骤S5、对不同的时间跨度信息和经纬度信息匹配对应的不同的相似度阈值w,并将所述相似度阈值加权到所述两两特征的相似度上,更新两两特征的相似度矩阵;步骤S6、通过计算Jaccard距离来修正两两特征的相似度;步骤S7、预设群体相似阈值r,根据群体相似阈值r判断两两特征与特征群体中其他人脸特征的对比情况,获取Jaccard距离中的交集部分,并根据交集部分对群体相似阈值r进行设置;步骤S8、预设聚类阈值e,并对聚类阈值e进行设置;步骤S9、根据所述两两特征的相似度矩阵和聚类算法对所述特征群体做聚类运算,获取类簇,根据类簇获取离群点,并从类簇中将离群点删除。2.根据权利要求1所述的一种基于时空和群体信息改进人脸聚类结果的方法,其特征在于,所述步骤S1包括:通过向量检索、区域或时间划分的方式获得待聚类群体。3.根据权利要求1所述的一种基于时空和群体信息改进人脸聚类结果的方法,其特征在于,所述步骤S6包括:通过所述两两特征与群体特征相似与否计...

【专利技术属性】
技术研发人员:张磊
申请(专利权)人:北京臻观数智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1