基于最大连通子图的人脸识别数据清洗方法技术

技术编号:16605851 阅读:84 留言:0更新日期:2017-11-22 15:45
本发明专利技术公开了基于最大连通子图的人脸识别数据清洗方法,包括依次进行的以下步骤:根据标记将收集到的照片分为多组照片组;将每组照片组的每一张照片与该照片组内其它照片一一比对,得到多个组内照片相似度值;根据组内照片相似度值构建每组照片组的组内相似度图;找出每组照片组的最大连通子图;剔除所有照片组中不属于最大连通子图的照片;将每组照片中边数最多的节点对应的照片作为基准照片;将每组照片组的基准照片与其它照片组的基准照片进行一一比对,得到组间照片相似度值,并合并相似照片组。本发明专利技术对收集到的照片数据进行清洗时成本低、工作量小,且能有效剔除照片数据中的错误照片。

Face recognition data cleaning method based on most Dalian subgraph

The invention discloses a face recognition data cleaning method based on the Dalian map, including by the following steps: according to the marker will be collected from the photo is divided into several groups of photographs; other photos of each photo photos group with the photograph group eleven compared to multiple group photos according to the similarity value; construction of each pair of photos within the group in the group photo similarity graph similarity value; find the photos were the most Dalian Dalian most subgraph; connected subgraph of the photo does not belong to the elimination of all photos; the number of edges corresponding to the largest node photos as reference photos photos; reference photo reference photo group and other photos photos each group are compared one by one, get the group photo similarity value, and merge the similar group photo. The invention has the advantages of low cost and small workload when cleaning the collected photograph data, and can effectively eliminate the wrong photos in the photograph data.

【技术实现步骤摘要】
基于最大连通子图的人脸识别数据清洗方法
本专利技术涉及人脸识别技术,具体是基于最大连通子图的人脸识别数据清洗方法。
技术介绍
生物特征识别技术是一种将生物技术与信息技术结合的新型识别技术,它将计算机技术、光学、声学、生物传感器和生物统计学等一些高科技手段紧密结合,利用人体的生理特征或行为特征来进行身份鉴别。目前,利用生物特征识别技术的安全验证方法已成为了安全验证方面不可或缺的一种方式。人体的生物和行为特征作为人与生俱来的特性,用来作为区分不同个体的标志是十分理想的身份验证方式,对安全强度需求高的验证应用也十分适用。在众多的人体生物特征识别技术中,人脸识别应用时对被识别者不需要进行生理上的接触,因此,其应用越来越广泛。人脸识别技术应用时,为了提升识别的精度,常常采用机器学习的方法训练人脸识别模型。训练人脸识别模型时需要大量的已标记的照片数据,照片数据的来源主要是从互联网收集或从自有产品的用户数据中收集等,无论何种方式,所收集的数据都会存在差错。所以,需要对收集到的照片数据进行清洗。目前对照片数据进行清洗主要包括以下两种清洗方式:(1)人工挑选。使用人工的方式,检查每一张照片的质量是否合本文档来自技高网...
基于最大连通子图的人脸识别数据清洗方法

【技术保护点】
基于最大连通子图的人脸识别数据清洗方法,其特征在于,包括以下步骤:S1、根据标记将收集到的照片分为多组照片组,其中,标记相同的照片为一组;S2、将每组照片组的每一张照片与该照片组内其它照片一一比对,得到多个组内照片相似度值;S3、根据组内照片相似度值构建每组照片组的组内相似度图,其中,照片组中每一张照片均为一个节点;S4、找出每组照片组的最大连通子图;S5、剔除所有照片组中不属于最大连通子图的照片;S6、将每组照片中边数最多的节点对应的照片作为基准照片;S7、将每组照片组的基准照片与其它照片组的基准照片进行一一比对,得到组间照片相似度值,并合并相似照片组。

【技术特征摘要】
1.基于最大连通子图的人脸识别数据清洗方法,其特征在于,包括以下步骤:S1、根据标记将收集到的照片分为多组照片组,其中,标记相同的照片为一组;S2、将每组照片组的每一张照片与该照片组内其它照片一一比对,得到多个组内照片相似度值;S3、根据组内照片相似度值构建每组照片组的组内相似度图,其中,照片组中每一张照片均为一个节点;S4、找出每组照片组的最大连通子图;S5、剔除所有照片组中不属于最大连通子图的照片;S6、将每组照片中边数最多的节点对应的照片作为基准照片;S7、将每组照片组的基准照片与其它照片组的基准照片进行一一比对,得到组间照片相似度值,并合并相似照片组。2.根据权利要求1所述的基于最大连通子图的人脸识别数据清洗方法,其特征在于,所述标记为某一个人的标识。3.根据权利要求2所述的基于最大连通子图的人脸识别数据清洗方法,其特征在于,所述标记为人的名字或预先设定的人的编号。4.根据权利要求1所述的基于最大连通子图的人脸识别数据清洗方法,其特征在于,所述步骤S1还包括在收集的照片没有标记时对收集到的照片进行标记的步骤。5.根据权利要求1所述的基于最大连通子图的人脸识别数据清洗方法,其特征在于,所述步骤S2和步骤S7得到照片相似度值均采用人脸识别系统实现...

【专利技术属性】
技术研发人员:朱葛
申请(专利权)人:成都恒高科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1