【技术实现步骤摘要】
一种人脸图像的迭代式双向连接聚类算法
本专利技术涉及图像处理领域,具体涉及一种人脸图像识别的迭代式双向连接聚类算法。
技术介绍
人脸识别是图像识别领域的研究方向之一,具有非常广阔的应用前景。人脸识别技术主要包括人脸检测、人脸特征提取和人脸识别三个过程。但是随着人脸数据库“量”的增长以及识别“速”的要求提高,以及人脸图像数据点非均匀分布的特征,传统的检索策略便十分耗时,不利于高效率识别人脸图像特征。聚类分析是数据分析的一种重要方法,其本质是将数据按照其特征进行分组,使得组内数据的相似度尽可能小。目前聚类分析在数据挖掘、机器学习及模式识别等领域得到了广泛的应用,常用于对不同群体的细分,尤其是在人脸图像识别领域的应用。但目前应用于人脸图像识别领域的聚类算法存在以下问题:(1)密度估计函数的设计较复杂,且人脸图像集数据点分布不均匀时,无法进行有效处理;(2)人脸图像集合呈现细长分布时,聚类效果很差。本专利技术将聚类分析算法与人脸识别技术结合。首先计算人脸图像间的欧几里得距离,进而计算人脸图像数据的密度值,并通过脱落策略找出人脸图像数据中的核心区域,完成核心数据的聚类,最后使用双向连接策略完成脱落数据的分配。
技术实现思路
为克服上述现有聚类算法在处理人脸图像集中遇到的几个问题,本专利技术提出了一种人脸图像识别的迭代式双向连接聚类算法,包括以下步骤:步骤1:计算人脸图像距离矩阵提取人脸特征,从人脸图像数据集X里提取任意两个图像xi和xj,根据公式(1)计算两个图像之间的欧几里 ...
【技术保护点】
1.一种人脸图像的迭代式双向连接聚类算法,其特征在于,包括如下步骤:/n步骤1:计算人脸图像距离矩阵/n提取人脸特征,从人脸图像数据集X里提取任意两个图像x
【技术特征摘要】
1.一种人脸图像的迭代式双向连接聚类算法,其特征在于,包括如下步骤:
步骤1:计算人脸图像距离矩阵
提取人脸特征,从人脸图像数据集X里提取任意两个图像xi和xj,根据公式(1)计算两个图像之间的欧几里得距离;
d(xi,xj)=||xi-xj||2(1)
其中,1≤i≤n,1≤j≤n;
步骤2:计算图像间的共享近邻相似度
根据公式(2)得到任意两个图像xi和xj间的共享近邻关系SNN,
SNNk(xi,xj)={xl|xl∈Nk(xi)Ixl∈Nk(xj)}(2)
其中k表示近邻个数,Nk(xi)表示图像xi的k近邻集合,Nk(xj)表示图像xj的k近邻集合;
根据共享近邻相似度公式(3)计算图像xi和xj间共享近邻相似度,
其中,|SNNk(xi,xj)|表示图像xi和xj间共享近邻的数目;
步骤3:迭代执行数据脱落操作,发现核心数据;
步骤4:实现核心数据的聚类;
步骤5:使用向内的连接策略完成脱落数据的分配;
步骤6:使用基于共享近邻相似度向外连接策略完成类簇的合并。
2.根据权利要求1所述的一种人脸图像的迭代式双向连接聚类算法,其特征在于,所述步骤3包括:
步骤3.1:对数据脱落进行初始化操作,令t=1,该次迭代所处理的图像数据集合为X(t)=X;
其中t为当前迭代次数;
步骤3.2:根据公式(4)计算第t次迭代中数据X(t)的密度值
其中,表示两个图像间的欧几里得距离的平方;Σ为求和公式;表示第t次迭代图像xi反k近邻集合,其数学定义为其中表示第t次迭代图像xi的k近邻集合;
步骤3.3:执行第t次图像数据的脱落操作
按照密度脱落掉当前图像数据中10%的数据,b(t)是当前图像数据X(t)按密度从小到大排列,第10百分位上的密度值。将密度比b(t)小的数据进行脱落,根据公式(5)得到第t次的脱落集合
步骤3.4:更新迭代状态,令下一次所处理的数据集合X(t+1)为当前数据集合X(t)与脱落集合的差集;
其中,
步骤3.5:判断迭代是否结束,当满足公式(6)时,迭代终止;
λ(t)>2·λ(t-1)(6)
其中λ(t)表示第t次中脱落集合中密度最大值,λ(t-1)表示第t-1次中脱落集合中密度最大值,即前者比后者大两倍,则终止迭代,令核心数据集Ω=X(t+1),最大迭代次数T为t,如果未满足公式(6),则令t=t+1,跳转步骤3.2。
3.根据权利要求1所述的一种人脸图像的迭代式双向连接聚类算法,其特征在于,所述步骤4包括:
步骤4.1:初始化类簇数目初始化数据划分核心数据的未访问集合Γ,其初始为Γ=Ω,根据公式(7)定义距离阈值ε;
ε=mean...
【专利技术属性】
技术研发人员:杜明晶,国艺璇,瞿欢添,王茹,朱俊,盛锦超,
申请(专利权)人:江苏师范大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。