基于优化的近邻保持嵌入降维算法在图像检索和人脸识别中的应用制造技术

技术编号:39002065 阅读:16 留言:0更新日期:2023-10-07 10:33
本发明专利技术公开了基于优化的近邻保持嵌入降维算法在图像检索和人脸识别中的应用,涉及图像识别技术领域,包括以下步骤:S1:采集图片,建立数据库;S2:S1中数据库的初始数据集为X={x1,x2Lx

【技术实现步骤摘要】
基于优化的近邻保持嵌入降维算法在图像检索和人脸识别中的应用


[0001]本专利技术涉及图像识别
,尤其是涉及基于优化的近邻保持嵌入降维算法在图像检索和人脸识别中的应用。

技术介绍

[0002]大数据环境下的高维数据在人脸识别、图像检索等领域有着广泛的应用前景,是数据挖掘和模式识别领域的研究热点。但是高维数据具有冗余度大,空间维数高等特点,难以发现其内在的特征规律。降维是消除高维数据维度上冗余的一种技术手段,目的是克服维数灾难,获取数据本质特征,以实现数据可视化。
[0003]降维分为线性降维和非线性降维。线性降维算法主要有主成分分析(principal component analysis,简称PCA)、多维尺度变换(Multidimensional Scaling,简称MDS)、线性判别分析(Linear Discriminant Analysis,简称LDA)等。这类方法的优势在于处理线性结构的数据集时具有很好的降维效果。但现实生活中大多都是高维非线性数据,例如人脸数据,因此非线性降维方法应运而生。基于特征值的非线性降维方法是其中一个重要研究方向。这类方法是保持高维数据与低维数据的某个“不变特征量”以找到低维特征表示。主要的基于特征值的非线性降维算法有等规度映射(isometric feature mapping,简称ISOMAP)、局部切空间算法(Local tangent space alignment,简称LTSA)、局部线性嵌入(locally linear embedding,简称LLE)、拉普拉斯特征映射(Laplacian Eigenmaps,简称LE)、近邻保持嵌入(Neighborhood preserving embedding,简称NPE)等。ISOMAP算法保持的不变特征量是测地距离;LTSA算法保持的不变特征量是利用局部PCA投影后的局部线性化;LLE算法和NPE算法类似,保持的不变特征量都是局部重构系数;LE算法保持的不变特征量则是数据邻域关系。
[0004]目前,学者们已经在人脸识别、语音识别等众多领域对NPE算法展开了广泛的应用研究。例如王志强对非控环境下获取的高维人脸图像进行降维研究,期望寻找一种映射或者投影,得到高维复杂数据中低维本质结构;Zhen Ye等人提出了基于稀疏或协同表示的降维方法,将稀疏或协同系数作为图像的权值,有效地减少重建误差。但是它们在进行线性重构时没有考虑到类间的权值信息以及类内的密度信息,因此在数据降维上仍有局限性。梁春燕等人通过构建邻接图以获得数据的局部邻域结构,同时通过有监督训练对数据进行类别标注。尽管考虑到了数据类间之间的信息情况,进一步提高数据的识别性能,但对数据类内信息欠学习,算法的性能需进一步提高。Sumet Meh ta等人提出了一种加权邻域保持嵌入算法(WNPEE),构造了一个相邻图的集合,使得最近邻的数目k的选择是变化的,这种方法对邻域大小参数的敏感性相比NPE要低得多,尽管敏感度有所下降,但没有有效考虑到数据的类别信息,算法的优越性也会有所下降。
[0005]上述降维算法都有较强的计算优势,但是在处理局部邻域信息量不足、存在短路以及流形曲率大等稀疏数据时,原始数据的几何拓扑结构损坏严重。

技术实现思路

[0006]本专利技术的目的在于提供基于优化的近邻保持嵌入降维算法在图像检索中的应用,以解决上述
技术介绍
中目前的NPE算法在处理局部邻域信息量不足、存在短路以及流形曲率大的稀疏数据时,原始数据的几何拓扑结构损坏严重的问题。
[0007]为实现上述目的,本专利技术提供基于优化的近邻保持嵌入降维算法在图像检索中的应用,包括以下步骤:
[0008]S1:采集图片,建立图像数据库;
[0009]S2:S1中数据库的初始数据集为X={x1,x2L x
N
}∈R
D
×
N
,将初始数据集进行中心化处理,使得初始数据集变为
[0010]X表示高维空间中的图像数据集;x表示高维空间中的每个图像像素值数据;R
D
×
N
表示一共N个x,在高维(即D维)空间中;I是单位矩阵,N是高维空间图像数据集X中x的个数,T是数学中转置的符号;
[0011]S3:根据类标签信息,计算S2中变化后的初始数据集中每一类图片样本的类间权重矩阵W
t
和类内密度信息
[0012]S4:根据S3中类间权重矩阵W
t
和类内密度信息计算高维图像数据的最大特征的特征矩阵并将其进行特征分解,得到特征值λ0>λ1>

λ
D
及其所对应的特征向量矩阵U=[a0,a1,

a
D
];
[0013]B1表示高维空间图像数据集的类内离散度矩阵,B2表示高维空间图像数据集的类间离散度矩阵;
[0014]S5:取S4中U的前d个最大特征值所对应的特征向量M=(a0,a1,

,a
d
‑1),得到
[0015]M表示与目标图像最相似的d个图像的特征矩阵;
[0016]S6:利用S5中得到的对S1中Coil

20数据库中的14类图像分别进行图像检索,得到基于形状的特征空间,并计算出各个图像的查准率和查全率;
[0017]S7:通过S6中图像检索的结果,得到与样本图像相关的相关图像Y的排序序号P
i
,计算相关图像的平均排序;
[0018]S8:根据S7中检索出来的图像的显示排序,越排在前面的图像越与目标图像相似。
[0019]进一步的,S3中的类间权重矩阵W
t
的公式包括:
[0020][0021]其中,和分别是第t类的第i个和第j个嵌入向量;n
t
是第t类的嵌入向量总数;
为和之间的权值;u
t
和u
g
分别是第t类和第g类的嵌入向量平均值,且分别是第t类和第g类的嵌入向量平均值,且是和之间的权值;Z
tg
是第t类和第g类之间的权值。
[0022]进一步的,S3中的类内密度信息α
it
的公式包括:
[0023][0024][0025]和表示高维图像中第t类图像中的两个图像像素值数据,α
i*
表示利用欧式距离计算两个图像像素值数据之间的最大距离,表示要计算出与目标图像数据相邻的k个数据的距离之和。
[0026]基于优化的近邻保持嵌入降维算法在人脸识别中的应用。
[0027]进一步的,所述应用包括以下步骤:
[0028]S1:采集人脸信息,建立数据库;
[0029]S2:S1中数据库的初始数据集为X={x1,x2L x
N
}∈R
D
×
N
,将初始数据集进行中心化处理,使得初始数据集变为
[0030]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于优化的近邻保持嵌入降维算法在图像检索中的应用。2.根据权利要求1所述的基于优化的近邻保持嵌入降维算法在图像检索中的应用,其特征是:所述应用包括以下步骤:S1:采集图片,建立图像数据库;S2:S1中图像数据库的初始数据集为X={x1,x2L x
N
}∈R
D
×
N
,将初始数据集进行中心化处理,使得初始数据集变为X表示高维空间中的图像数据集;x表示高维空间中的每个图像像素值数据;R
D
×
N
表示一共N个x,在高维(即D维)空间中;I是单位矩阵,N是高维空间图像数据集X中x的个数,T是数学中转置的符号;S3:根据类标签信息,计算S2中变化后的初始数据集中每一类图片样本的类间权重矩阵W
t
和类内密度信息S4:根据S3中类间权重矩阵W
t
和类内密度信息计算高维图像数据的最大特征的特征矩阵并将其进行特征分解,得到特征值λ0>λ1>

λ
D
及其所对应的特征向量矩阵U=[a0,a1,

a
D
];B1表示高维空间图像数据集的类内离散度矩阵,B2表示高维空间图像数据集的类间离散度矩阵;S5:取S4中U的前d个最大特征值所对应的特征向量M=(a0,a1,

,a
d
‑1),得到低维空间坐标M表示与目标图像最相似的d个图像的特征矩阵;S6:利用S5中得到的对S1图像数据库中的图像分别进行图像检索,得到基于形状的特征空间,并计算出各个图像的查准率和查全率;S7:通过S6中图像检索的结果,得到与样本图像相关的相关图像Y的排序序号P
i
,计算相关图像的平均排序;S8:根据S7中得到的相关图像的显示排序,越排在前面的图像越与目标图像相似。3.根据权利要求2所述的基于优化的近邻保持嵌入降维算法在图像检索中的应用,其特征是:S3中的类间权重矩阵W
t
的公式包括:其中,和分别是第t类图像的第i个和第j个嵌入向量;n
t
是第t类图像的嵌入向量总数;为和之间的权值;u
t
和u
g
分别是第t类图像和第g类图像的嵌入向量平均值,且
是和之间的权值;Z
tg
是第t类图像和第g类图像之间的权值。4.根据权利要求3所述的基于优化的近邻保持嵌入降维算法在图像检索中的应用,其特征是:S3中的类内密度信息的公式包括:的公式包括:的公式包括:和表示高维图像中第t类图像中的两个图像像素值数据,α
i*
表示利用欧式距离计算两个图像像素值数据之间的最大距离,表...

【专利技术属性】
技术研发人员:李燕燕王学光王喜明
申请(专利权)人:河北建筑工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1