一种人脸图像的迭代式双向连接聚类算法制造技术

技术编号:28376129 阅读:35 留言:0更新日期:2021-05-08 00:03
一种人脸图像识别的迭代式双向连接聚类算法,针对人脸图像数据重叠较高的特点,在基于密度聚类的基础上,采用数据脱落策略,找出图像数据集中的核心数据,完成核心数据的聚类工作,最后采用双向连接方式实现脱落数据的分配操作。其特征在于,包含以下步骤:根据公式计算人脸图像的距离矩阵;计算图像间的共享近邻相似度;进行数据的迭代脱落过程,发现核心数据;完成核心数据聚类;通过双向连接准则完成剩余数据的分配。本发明专利技术的一种人脸图像识别的迭代式双向连接聚类算法中,每一类簇都被用独特的颜色表示,离群值用灰色表示,对离群值的判断更优,相比于现有的算法可产生更正确且更多的最优簇结构。

【技术实现步骤摘要】
一种人脸图像的迭代式双向连接聚类算法
本专利技术涉及图像处理领域,具体涉及一种人脸图像识别的迭代式双向连接聚类算法。
技术介绍
人脸识别是图像识别领域的研究方向之一,具有非常广阔的应用前景。人脸识别技术主要包括人脸检测、人脸特征提取和人脸识别三个过程。但是随着人脸数据库“量”的增长以及识别“速”的要求提高,以及人脸图像数据点非均匀分布的特征,传统的检索策略便十分耗时,不利于高效率识别人脸图像特征。聚类分析是数据分析的一种重要方法,其本质是将数据按照其特征进行分组,使得组内数据的相似度尽可能小。目前聚类分析在数据挖掘、机器学习及模式识别等领域得到了广泛的应用,常用于对不同群体的细分,尤其是在人脸图像识别领域的应用。但目前应用于人脸图像识别领域的聚类算法存在以下问题:(1)密度估计函数的设计较复杂,且人脸图像集数据点分布不均匀时,无法进行有效处理;(2)人脸图像集合呈现细长分布时,聚类效果很差。本专利技术将聚类分析算法与人脸识别技术结合。首先计算人脸图像间的欧几里得距离,进而计算人脸图像数据的密度值,并通过脱落策略找出人脸图像数据中的核心区域,完成核心数据的聚类,最后使用双向连接策略完成脱落数据的分配。
技术实现思路
为克服上述现有聚类算法在处理人脸图像集中遇到的几个问题,本专利技术提出了一种人脸图像识别的迭代式双向连接聚类算法,包括以下步骤:步骤1:计算人脸图像距离矩阵提取人脸特征,从人脸图像数据集X里提取任意两个图像xi和xj,根据公式(1)计算两个图像之间的欧几里得距离;d(xi,xj)=||xi-xj||2(1)其中,1≤i≤n,1≤j≤n;步骤2:计算图像间的共享近邻相似度;根据公式(2)得到任意两个图像xi和xj间的共享近邻关系(SharedNearestNeighbour,简称SNN),SNNk(xi,xj)={xl|xl∈Nk(xi)∩xl∈Nk(xj)}(2)其中k表示近邻个数,Nk(xi)表示图像xi的k近邻集合,Nk(xj)表示图像xj的k近邻集合;根据共享近邻相似度公式(3)计算图像xi和xj间共享近邻相似度,其中,|SNNk(xi,xj)|表示图像xi和xj间共享近邻的数目;步骤3:迭代执行数据脱落操作,发现核心数据步骤3.1:对数据脱落进行初始化操作,令t=1,该次迭代所处理的图像数据集合为X(t)=X;其中t为当前迭代次数;步骤3.2:根据公式(4)计算第t次迭代中数据X(t)的密度值其中,表示两个图像间的欧几里得距离的平方;Σ为求和公式;表示第t次迭代图像xi反k近邻集合,其数学定义为其中表示第t次迭代图像xi的k近邻集合。步骤3.3:执行第t次图像数据的脱落操作按照密度脱落掉当前图像数据中10%的数据,b(t)是当前图像数据X(t)按密度从小到大排列,第10百分位上的密度值。将密度比b(t)小的数据进行脱落,根据公式(5)得到第t次的脱落集合步骤3.4:更新迭代状态,令下一次所处理的数据集合X(t+1)为当前数据集合X(t)与脱落集合的差集;其中,步骤3.5:判断迭代是否结束,当满足公式(6)时,迭代终止;λ(t)>2·λ(t-1)(6)其中λ(t)表示第t次中脱落集合中密度最大值,λ(t-1)表示第t-1次中脱落集合中密度最大值,即前者比后者大两倍,则终止迭代,令核心数据集Ω=X(t+1),最大迭代次数T为t,如果未满足公式(6),则令t=t+1,跳转步骤3.2;步骤4:实现核心数据的聚类步骤4.1:初始化类簇数目初始化数据划分核心数据的未访问集合Γ,其初始为Γ=Ω,根据公式(7)定义距离阈值ε;ε=mean(Dk)+std(Dk)(7)其中Dk表示核心数据集合Ω中各个数据点到其k近邻点的距离的集合,mean表示该集合的平均值,std表示该集合的标准差;定义可达,对于任意的两个核心数据xi和xj,有过存在一个核心数据序列p1,p2,...,pS(其中S为该序列的长度),满足p1为xi,ps为xj,且满足对于任意的1≤s≤S,有d(ps,ps+1)≤ε,即ps和ps+1之间的欧几里得距离小于等于距离阈值ε,则称由xi到xj可达。步骤4.2:初始化新的类簇,令随机选择数据集Γ中的一个图像x构成当前类簇,即将当前新生成的类簇设置为并将核心数据的未访问集合Γ设置为Γ与{x}的差集,即剔除核心数据的未访问集合Γ中的数据x;步骤4.3:扩展新的类簇,逐个遍历的未访问集合Γ中的数据,找出所有可以与x存在可达关系的数据点x′,将其并入到当前类簇中,即同时将核心数据的未访问集合Γ设置为Γ与{x′}的差集,即剔除核心数据的未访问集合Γ中的数据x′。无法从未访问集合Γ找出符合可达条件的图像数据,则终止遍历,更新数据划分如果未访问集合Γ是空集合,则完成核心数据聚类,继续往下执行,否则跳转到步骤4.2;步骤5:使用向内的连接策略完成脱落数据的分配步骤5.1:从最内的脱落集合向最外的脱落集合进行逐步聚类工作,完成脱落数据聚类的初始化工作;令当前层数t为最大脱落迭代次数T;当前数据划分初始化为核心数据划分即已聚类数据集合Φ初始化为已完成聚类的核心数据集Ω,即Φ=Ω。当前层脱落数据Δ初始化为最后一层的脱落数据其中T为最大脱落迭代次数;步骤5.2:使用向内的连接策略聚类当前层的脱落数据逐个选择当前层脱落数据Δ中的图像数据x,从已聚类数据集合Φ中找出与x最近的图像数据x′,假设该已聚类数据x′属于类簇(其中为当前划分的类簇个数),则将x分配至该类簇更新且更新已聚类数据集合Φ=Φ∪x,更新当前层脱落数据Δ为Δ与数据x的差集。当前层脱落数据Δ为空集合时,终止该层的数据分配工作;步骤5.3:判断向内连接是否结束,更新当前层数t=t-1,如果t为0,则脱落数据的向内连接结束;否则,令当前层脱落数据Δ为第t层脱落数据跳转至步骤5.2;步骤6:使用基于共享近邻相似度向外连接策略完成类簇的合并遍历图像数据集X中各个成对数据,如果存在两个图像数据x和x′分属于两个不同的类簇和(其中为当前划分的类簇个数),且两个图像数据的共享近邻相似度大于0.5,合并类簇和形成一个新的类簇,即如果simSNN(x,x′)≥0.5则完成遍历工作,得到新的其中下标c是完成合并工作后最终的类簇数目。与现有技术相比,本专利技术的有益技术效果:本专利技术的一种人脸图像识别的迭代式双向连接聚类算法中,每一类簇都被用独特的颜色表示,离群值用灰色表示,对离群值的判断更优,相比于现有的算法可产生更正确且更多的最优簇结构。附图说明图1是基于Olivetti人脸数据集的可视化结果,其中a是本文提出的“一种人脸图像识别的迭代式双向连接聚类算法”,b是DB算法,c是DBSCAN算法,d是HDBSCAN算法。具体实施方式本文档来自技高网...

【技术保护点】
1.一种人脸图像的迭代式双向连接聚类算法,其特征在于,包括如下步骤:/n步骤1:计算人脸图像距离矩阵/n提取人脸特征,从人脸图像数据集X里提取任意两个图像x

【技术特征摘要】
1.一种人脸图像的迭代式双向连接聚类算法,其特征在于,包括如下步骤:
步骤1:计算人脸图像距离矩阵
提取人脸特征,从人脸图像数据集X里提取任意两个图像xi和xj,根据公式(1)计算两个图像之间的欧几里得距离;
d(xi,xj)=||xi-xj||2(1)
其中,1≤i≤n,1≤j≤n;
步骤2:计算图像间的共享近邻相似度
根据公式(2)得到任意两个图像xi和xj间的共享近邻关系SNN,
SNNk(xi,xj)={xl|xl∈Nk(xi)Ixl∈Nk(xj)}(2)
其中k表示近邻个数,Nk(xi)表示图像xi的k近邻集合,Nk(xj)表示图像xj的k近邻集合;
根据共享近邻相似度公式(3)计算图像xi和xj间共享近邻相似度,



其中,|SNNk(xi,xj)|表示图像xi和xj间共享近邻的数目;
步骤3:迭代执行数据脱落操作,发现核心数据;
步骤4:实现核心数据的聚类;
步骤5:使用向内的连接策略完成脱落数据的分配;
步骤6:使用基于共享近邻相似度向外连接策略完成类簇的合并。


2.根据权利要求1所述的一种人脸图像的迭代式双向连接聚类算法,其特征在于,所述步骤3包括:
步骤3.1:对数据脱落进行初始化操作,令t=1,该次迭代所处理的图像数据集合为X(t)=X;
其中t为当前迭代次数;
步骤3.2:根据公式(4)计算第t次迭代中数据X(t)的密度值



其中,表示两个图像间的欧几里得距离的平方;Σ为求和公式;表示第t次迭代图像xi反k近邻集合,其数学定义为其中表示第t次迭代图像xi的k近邻集合;
步骤3.3:执行第t次图像数据的脱落操作
按照密度脱落掉当前图像数据中10%的数据,b(t)是当前图像数据X(t)按密度从小到大排列,第10百分位上的密度值。将密度比b(t)小的数据进行脱落,根据公式(5)得到第t次的脱落集合



步骤3.4:更新迭代状态,令下一次所处理的数据集合X(t+1)为当前数据集合X(t)与脱落集合的差集;
其中,
步骤3.5:判断迭代是否结束,当满足公式(6)时,迭代终止;
λ(t)>2·λ(t-1)(6)
其中λ(t)表示第t次中脱落集合中密度最大值,λ(t-1)表示第t-1次中脱落集合中密度最大值,即前者比后者大两倍,则终止迭代,令核心数据集Ω=X(t+1),最大迭代次数T为t,如果未满足公式(6),则令t=t+1,跳转步骤3.2。


3.根据权利要求1所述的一种人脸图像的迭代式双向连接聚类算法,其特征在于,所述步骤4包括:
步骤4.1:初始化类簇数目初始化数据划分核心数据的未访问集合Γ,其初始为Γ=Ω,根据公式(7)定义距离阈值ε;
ε=mean...

【专利技术属性】
技术研发人员:杜明晶国艺璇瞿欢添王茹朱俊盛锦超
申请(专利权)人:江苏师范大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1