一种多约束自适应图学习的鲁棒非负矩阵分解方法及系统技术方案

技术编号:36268621 阅读:26 留言:0更新日期:2023-01-07 10:09
本发明专利技术涉及一种多约束自适应图学习的鲁棒非负矩阵分解方法及系统。该方法包括:获取数据集;根据所述数据集,构建基于L

【技术实现步骤摘要】
一种多约束自适应图学习的鲁棒非负矩阵分解方法及系统


[0001]本专利技术涉及非负矩阵分解领域,特别是涉及一种多约束自适应图学习的鲁棒非负矩阵分解方法及系统。

技术介绍

[0002]在数据采集技术和互联网技术飞速发展的信息时代,人们很容易在实际生活中捕获海量且高维的数据。然而,这些高维大数据可能包含大量冗余特征以及噪声信息,给当前大数据挖掘以及数据分析带来巨大的挑战。维数简约是一种有效解决上述问题的方法之一,其旨在通过线性或非线性变换将高维数据映射或者转换为低维数据,从而获得有效的数据信息。在过去的几十年中,许多研究者已经提出了大量维数简约方法,这些方法被用于分类、聚类、异常目标检测、自然语言处理、医学图像处理等领域。由于矩阵分解具有雄厚的数学理论基础和较强的可解释,成为一类主流的维数约简方法。经典的矩阵分解方法包括主成分分析(PCA)、独立成分分析(ICA)、向量量化(VQ)、奇异值分解(SVD)、非负矩阵分解(NMF)、概念分解(CF)等。
[0003]非负矩阵分解(NMF)是一种著名的维数约简方法,也被称为基于成分的特征表示。它将非负矩阵X近似分为两矩阵的乘积X≈AS,其中,A为基矩阵,S为系数矩阵用于表示低维特征。以人脸图像数据为例,NMF可以学习人脸图像的重要部分,如眉毛、眼睛、鼻子和嘴唇。因此,NMF已经成功应用于多个领域,如:模式识别、图像质量评估、社区检测、信息检索和疾病关联预测、图像分析和文本聚类分析等。为了扩大应用范围和提高方法性能,研究人员提出了许多NMF的变种方法。Wang等人将其分为四类:1)基本NMF(BNMF)。BNMF是原始NMF算法,该方法仅仅考虑非负约束。2)约束NMF(CNMF)。CNMF主要是在NMF的基础上引入额外的正则化约束。如:稀疏NMF(SNMF)、流形上的NMF(MNMF)。3)结构化NMF(SNMF)。SNMF是将数据矩阵分解成三个矩阵的乘积,如非负矩阵三因素化(NMTF)。4)广义的NMF(GNMF),这类方法主要在广义上突破了约束或者分解模式,如Semi

NMF、KernelNMF。
[0004]NMF及其改进方法在许多领域获得较好的性能,同时具有很多优势,如1)占用存储空间少;2)分解结果具有可解释性3)实现简便。但是上述方法仍存在不足。首先,NMF和大多数改进方法通常采用欧式距离作为目标度量函数。然而,欧式距离对数据中噪声和异常值非常敏感,从而导致目标函数不稳定和所学到的低维特征不具有鲁棒性。尽管NMF可以学习基于部件的表示,但是在矩阵分解过程中没有考虑样本的空间几何结构,从而导致学习到的低维特征不能准确地捕捉到足够的判别信息。
[0005]为了克服上述缺陷,人们提出许多NMF的改进方案。Kong等人引入基于L21

范数的度量函数,提出一种鲁棒的非负矩阵分解方法。相比基于L2

范数的度量函数,基于L21

范数的度量函数在一定程度上压制了异常和噪声数据在分解过程中产生的误差,同时也可以保证分解误差的稀疏性。接着,Wei等人提出一种熵加权的NMF(EWNMF),该方法通过每个样本的成本函数引入一种加权方法来消除噪声和异常值的影响。Cai等人利用流形学习的核心思想设计一个图正则化约束,并建立一个图正则化NMF(GNMF)方法来利用数据的几何结
构。在GNMF中,引入三种图形构造方法,包括0

1加权、热核加权和点积加权。Gu等人提出一种局部学习正则化的NMF(LLNMF),该方法假定聚类标签可以通过其相邻区域的点来预测。LLNMF利用数据的流形结构来提高低维特征的判别能力。尽管GNMF和LLNMF的性能优于传统的NMF,但它们的性能容易受到邻域大小和正则化参数的影响。于是,Ahmed等人提出一种邻域结构协助的NMF(NS

NMF)方法,该方法使用最小生成树(MST)来构造稀疏的相似性矩阵。Wang等人提出一种用于癌症数据分析的稀疏图正则化NMF(SGNMF)方法。在SGNMF中,首先引入Huber损失函数以减少噪声和冗余信息的影响。然后,引入两个正则化项,包括稀疏惩罚和图正则化项,分别约束矩阵的稀疏性和数据的几何信息。
[0006]在上述方法中,图的权重矩阵是预先定义的,即图一旦被构造,在更新迭代过程中将保持不变。因此,这些方法的性能很容易受所构图的质量影响。为了解决这个问题,人们提出许多带有自适应图学习的方法。例如,Huang等人将相似性学习、图正则化和NMF整合为一个统一的框架,命名为自适应局部结构学方法(NMFAN)。在NMFAN中,提出自适应局部结构学习(ALSL),该方法可以自适应从原始数据中学习到数据的局部邻域结构。同样,Pei等人将ALSL引入概念分解(CF),提出具有自适应邻域的概念分解(CFAN)。此外,He等人提出一种鲁棒的自适应图正则化NMF(RAGNMF),该方法将自适应图学习和图正则化整合到具有L21

范数的加权NMF中。虽然这些方法都能自适应地学习图结构并取得较好的性能,但图构造过程仍然存在一些缺陷。例如:基于原始高维特征的图构建会导致较高的计算复杂性以及忽略图结构的稀疏性和局部性约束,这将影响所学图结构的判别性。

技术实现思路

[0007]本专利技术的目的是提供一种多约束自适应图学习的鲁棒非负矩阵分解方法及系统,能够从高维数据中提取有用的信息降低计算的复杂性以及能够提高图结构的判别性。
[0008]为实现上述目的,本专利技术提供如下方案:
[0009]一种多约束自适应图学习的鲁棒非负矩阵分解方法包括:
[0010]获取数据集;
[0011]根据所述数据集,构建基于L
21

范数度量函数的非负矩阵分解模型;
[0012]根据所述数据集,构建基于低维特征的多约束自适应图学习模型,所述多约束包括稀疏约束和局部约束;
[0013]基于自适应图结构,构建拉普拉斯图正则化项;
[0014]根据所述非负矩阵分解模型、多约束自适应图学习模型和拉普拉斯图正则化项,构建多约束自适应图学习的鲁棒非负矩阵分解模型的目标函数;
[0015]采用迭代优化的方法求解所述目标函数,当迭代次数到达阈值时,输出目标函数的解。
[0016]可选地,所述数据集包括但不限于人脸数据图像、饮品属性数据、动物属性数据和疾病数据。
[0017]可选地,所述根据所述数据集,构建基于L
21

范数度量函数的非负矩阵分解模型,具体包括:
[0018]根据所述数据集,构建基于L
21

范数度量函数的鲁棒性非负矩阵分解模型的目标函数:
[0019]minφ(A,S)=||X

AS||
2,1
[0020]s.t.A≥0,S≥0
[0021]其中,X=[x1,x2,...,x
n
]∈R
m
×本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多约束自适应图学习的鲁棒非负矩阵分解方法,其特征在于,包括:获取数据集;根据所述数据集,构建基于L
21

范数度量函数的非负矩阵分解模型;根据所述数据集,构建基于低维特征的多约束自适应图学习模型,所述多约束包括稀疏约束和局部约束;基于自适应图结构,构建拉普拉斯图正则化项;根据所述非负矩阵分解模型、多约束自适应图学习模型和拉普拉斯图正则化项,构建多约束自适应图学习的鲁棒非负矩阵分解模型的目标函数;采用迭代优化的方法求解所述目标函数,当迭代次数到达阈值时,输出目标函数的解。2.根据权利要求1所述的多约束自适应图学习的鲁棒非负矩阵分解方法,其特征在于,所述数据集包括但不限于人脸数据图像、饮品属性数据、动物属性数据和疾病数据。3.根据权利要求1所述的多约束自适应图学习的鲁棒非负矩阵分解方法,其特征在于,所述根据所述数据集,构建基于L
21

范数度量函数的非负矩阵分解模型,具体包括:根据所述数据集,构建基于L
21

范数度量函数的非负矩阵分解模型的目标函数:minφ(A,S)=||X

AS||
2,1
s.t.A≥0,S≥0其中,X=[x1,x2,...,x
n
]∈R
m
×
n
表示非负数据矩阵,A=[a1,a2,...,a
k
]∈R
m
×
r
和S=[s1,s2,...,s
n
]∈R
r
×
n
分别表示为基矩阵和系数矩阵,||
·
||
2,1
表示矩阵的L
21

范数;对于任意矩阵Y∈R
m
×
n
,L
21

范数定义为其中Y
i
表示矩阵Y的行向量,根据矩阵属性||Y||
2,1
=tr(Y
T
UY),U∈R
m
×
m
表示对角矩阵,其对角元素为tr(
·
)表示矩阵的迹操作。4.根据权利要求3所述的多约束自适应图学习的鲁棒非负矩阵分解方法,其特征在于,所述根据所述数据集,构建基于低维特征的多约束自适应图学习模型,具体包括:根据所述数据集,构建基于低维特征的自适应图学习模型的目标函数:s.t.W≥0其中,W=[w1,w2,...,w
n
]∈R
n
×
n
为重构系数矩阵,w
i
=[w
i1
,w
i2
,...,w
in
]∈R
n
×1表示第i列向量,其元素w
ij
用于表示低维数据S
i
与S
j
之间连接边的权值,其值越大表示S
i
与S
j
之间的关系越紧密,相似性越大;获取稀疏约束的目标函数:其中,||<...

【专利技术属性】
技术研发人员:易玉根王建中王文乐曹远龙陈智毅
申请(专利权)人:江西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1