一种半监督自适应图正则化判别非负矩阵分解方法技术

技术编号:22186282 阅读:28 留言:0更新日期:2019-09-25 03:41
一种半监督自适应图正则化判别非负矩阵分解方法,包括如下步骤:S1、获取样本数据矩阵,样本数据矩阵中每列元素代表一个样本,每个样本中包括若干个数据点;S2、根据数据点之间的相似度构建相似矩阵,并且对相似矩阵进行约束,得到第一约束条件;S3、为样本设定标签,并且根据数据点的标签构建标签矩阵,得到第二约束条件;S4、将第一约束条件和第二约束条件代入到传统非负矩阵分解目标函数中,得到新目标函数;S5、对新目标函数进行迭代更新得到系数矩阵;S6、对系数矩阵进行聚类。本发明专利技术提供一种半监督自适应图正则化判别非负矩阵分解方法,能够很好地利用局部结构信息和标签信息来获得更好的数据表示。

A Semi-supervised Adaptive Graph Regularization Discriminant Nonnegative Matrix Decomposition Method

【技术实现步骤摘要】
一种半监督自适应图正则化判别非负矩阵分解方法
本专利技术涉及数据表示
,具体的说是一种半监督自适应图正则化判别非负矩阵分解方法。
技术介绍
数据表示在图像处理中起着重要的作用。合适的数据表示有助于很好地揭示数据的潜在信息结构,便于后续处理。近年来,矩阵分解技术作为一种流行的数据表示技术受到越来越多的关注。矩阵分解技术是寻找两个或多个低维矩阵,这些矩阵的乘积足以近似原始数据矩阵。目前常用的矩阵分解技术有矢量量化(VQ)、奇异值分解(SVD)、主成分分析和非负矩阵分解(NMF)。与VQ和SVD不同的是,NMF分解得到的两个矩阵都是非负的。NMF在矩阵分解中加入了非负约束。也就是说,矩阵分解后的所有元素都大于等于零。由于非负性只允许原始数据的加法组合,而不允许减法组合,因此它们导致了基于部分的NMF表示。这一属性符合以人脑各部分表征为基础的生理和心理要素。作为一种理想的算法,NMF在图像聚类、人脸识别、模式识别、文本聚类等方面中具有优势。近年来,一些研究人员通过在NMF中加入额外的约束条件,提出了一些新的算法。Babaee和Tsoukalas利用标签信息和非负系数矩阵构造正则化约束,提出了判别NMF(DNMF)。Li等人通过在分解后的基矩阵中加入稀疏约束,提出了局部非负矩阵分解(localnon-negativematrixfactorization,LNMF)。Liuetal.利用标签信息提出了约束NMF(CNMF),将具有相同标签的数据点投影到新的低维空间中的相同表示中。近年来,一些研究表明,更多的数据信息可能来自嵌入高维空间的低维流形结构。为了找到潜在的流形结构,提出了许多流形学习算法,如局部线性嵌入(LLE),等距映射(ISOMAP),拉普拉斯特征映射(LE)。这些算法都利用了局部不变性,并且已经证明这些算法的学习性能显著提高。结合局部几何结构,Cai等人提出的图正则化非负矩阵分解(GNMF)。在GNMF算法中,数据结构由最近邻图编码得到。传统的流形学习方法大多是通过邻居图来保存局部流形结构信息,这有两个缺点。首先,存在一个参数k或ε图学习方法的性能在很大程度上依赖于参数值。其次,图的构造和后续的操作是完全分离的。
技术实现思路
为了解决现有技术中的不足,本专利技术提供一种半监督自适应图正则化判别非负矩阵分解方法,能够很好地利用局部结构信息和标签信息来获得更好的数据表示。为了实现上述目的,本专利技术采用的具体方案为:一种半监督自适应图正则化判别非负矩阵分解方法,包括如下步骤:S1、获取样本数据矩阵,样本数据矩阵中每列元素代表一个样本,每个样本中包括若干个数据点;S2、根据数据点之间的相似度构建相似矩阵,并且对相似矩阵进行约束,得到第一约束条件;S3、为样本设定标签,并且根据数据点的标签构建标签矩阵,得到第二约束条件;S4、将第一约束条件和第二约束条件代入到传统非负矩阵分解目标函数中,得到新目标函数;S5、对新目标函数进行迭代更新得到系数矩阵;S6、对系数矩阵进行聚类。作为一种优选方案,S1中,样本数据矩阵表示为X=[x1,x2,...,xn]∈Rm×n,X中的每列元素代表一个样本,每个样本的维数都是M维;作为一种优选方案,S2的具体方法为:S2.1、获取任意两个数据点vi和vj之间的相似度sij;S2.2、构建相似矩阵S其中,si为相似矩阵S中的第i列向量;S2.3、基于相似矩阵构建拉普拉斯矩阵拉普拉斯矩阵的第i对角元素是D是度矩阵;S2.4、设定F=[f1,...,f2]∈Rn×k,对拉普拉斯矩阵进行处理得到其中f是一个k维的初始化随机向量,λ是正则化参数,Tr表示这个矩阵的主对角线上各个元素的总和,并且称为迹;S2.5、基于S2.4的结果对相似矩阵进行约束,得到第一约束条件作为一种优选方案,S3中,标签矩阵为Q∈Rc×n,其中c是标签序号,标签矩阵中的元素为作为一种优选方案,S4中,传统非负矩阵分解目标函数为其中Vl=[v1,v2,…,vnl,0,0,…,0]T∈Rn×k,A∈Rc×k为辅助矩阵,用于对向量VL进行线性表示;将第一约束条件和第二约束条件代入后,新目标函数为其中,U、V、S、F和A为变量,其中V为系数矩阵。作为一种优选方案,S5的具体方法为:S5.1、固定U、V、A和F,对S进行更新,得到S5.2、固定U,V,A和S,对F进行更新,得到S5.3、固定V、A、S和F,对U进行更新,得到S5.4、固定U、A、S和F,对V进行更新,得到S5.5、固定U、V、S和F,对A进行更新,得到有益效果:本专利技术能够很好地利用局部结构信息和标签信息来获得更好的数据表示。附图说明图1是本专利技术的流程图;图2是本专利技术仿真实验的采用YALE聚类算法时在四个数据集上的聚类结果对比图;图3是本专利技术仿真实验的采用ORL聚类算法时在四个数据集上的聚类结果对比图;图4是本专利技术仿真实验的采用COIL20聚类算法时在四个数据集上的聚类结果对比图;图5是本专利技术仿真实验的采用HD聚类算法时在四个数据集上的聚类结果对比图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,一种半监督自适应图正则化判别非负矩阵分解方法,包括S1至S6。S1、获取样本数据矩阵,样本数据矩阵中每列元素代表一个样本,每个样本中包括若干个数据点。样本数据矩阵表示为X=[x1,x2,...,xn]∈Rm×n,X中的每列元素代表一个样本,每个样本的维数都是M维。传统的非负矩阵分解NMF的目的在于找到将原矩阵分解为两个矩阵U和V能及可能的表示原数据集。U中的每一个列向量都可以看做是新表示空间中的一个基向量,因此U矩阵被称为基矩阵。而矩阵V中的每一行都包含了U中所有列向量线性组合的系数,称为系数矩阵。事实上,矩阵V的第j个行向量就是原始高维数据矩阵中第j个样本点的低维表示。使用欧氏距离的平方作为目标函数来度量其相似性,并最小化这个目标函数。其中||·||F是一个弗罗贝尼乌斯矩。S2、根据数据点之间的相似度构建相似矩阵,并且对相似矩阵进行约束,得到第一约束条件。S2的具体方法为S2.1至S2.5。S2.1、获取任意两个数据点vi和vj之间的相似度sij。S2.2、构建相似矩阵S其中,si为相似矩阵S中的第i列向量。S2.3、基于相似矩阵构建拉普拉斯矩阵拉普拉斯矩阵的第i对角元素是D是度矩阵。S2.4、设定F=[f1,...,f2]∈Rn×k,对拉普拉斯矩阵进行处理得到其中f是一个k维的初始化随机向量,λ是正则化参数,Tr表示这个矩阵的主对角线上各个元素的总和,并且称为迹。(3)理想状态下的邻图要求相似矩阵包含k个连通分量。实际上,式(2)中得到的相似矩阵S通常只包含一个连通分量,不利于后续处理。因此,引入定理一“在拉普拉斯矩阵中,特征值中0的个数等于图中连通区域的个数”。根据定理一,将式(2)改写为然后定义Ls的第i个最小特征值为σi(Ls)。同时,rank(Ls)=n-k可以表示为再根据KyFan定理,得到S2.5、基于S2.4的本文档来自技高网
...

【技术保护点】
1.一种半监督自适应图正则化判别非负矩阵分解方法,其特征在于:包括如下步骤:S1、获取样本数据矩阵,样本数据矩阵中每列元素代表一个样本,每个样本中包括若干个数据点;S2、根据数据点之间的相似度构建相似矩阵,并且对相似矩阵进行约束,得到第一约束条件;S3、为样本设定标签,并且根据数据点的标签构建标签矩阵,得到第二约束条件;S4、将第一约束条件和第二约束条件代入到传统非负矩阵分解目标函数中,得到新目标函数;S5、对新目标函数进行迭代更新得到系数矩阵;S6、对系数矩阵进行聚类。

【技术特征摘要】
1.一种半监督自适应图正则化判别非负矩阵分解方法,其特征在于:包括如下步骤:S1、获取样本数据矩阵,样本数据矩阵中每列元素代表一个样本,每个样本中包括若干个数据点;S2、根据数据点之间的相似度构建相似矩阵,并且对相似矩阵进行约束,得到第一约束条件;S3、为样本设定标签,并且根据数据点的标签构建标签矩阵,得到第二约束条件;S4、将第一约束条件和第二约束条件代入到传统非负矩阵分解目标函数中,得到新目标函数;S5、对新目标函数进行迭代更新得到系数矩阵;S6、对系数矩阵进行聚类。2.如权利要求1所述的一种半监督自适应图正则化判别非负矩阵分解方法,其特征在于:S1中,样本数据矩阵表示为X=[x1,x2,...,xn]∈Rm×n,X中的每列元素代表一个样本,每个样本的维数都是M维;S2的具体方法为:S2.1、获取任意两个数据点vi和vj之间的相似度sij;S2.2、构建相似矩阵S其中,si为相似矩阵S中的第i列向量;S2.3、基于相似矩阵构建拉普拉斯矩阵拉普拉斯矩阵的第i对角元素是D是度矩阵;S2.4、设定F=[f1,...,f2]∈Rn×k,对拉普拉斯矩阵进行处理得到其中f...

【专利技术属性】
技术研发人员:刘中华宋斌王琳张琳王京京
申请(专利权)人:河南科技大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1