自表示学习监督的非负矩阵分解方法技术

技术编号:32526672 阅读:19 留言:0更新日期:2022-03-05 11:19
本发明专利技术公开了自表示学习监督的非负矩阵分解方法,首先通过自表示学习得到一个反映数据局部或全局结构的相似性矩阵。然后,对相似性矩阵进一步分解,可得到具有聚类结构信息的矩阵。最后,将具有聚类结构信息的矩阵指导系数矩阵的学习,使其具有一致性结构,提高系数矩阵的判别能力。该方法的提出主要是解决在无监督聚类方面,非负矩阵分解得到的系数矩阵判别能力弱的问题。所提出的自表示学习监督的非负矩阵分解方法充分考虑了传统非负矩阵分解判别能力弱的问题,利用自表示方法,再进一步得到具有聚类结构信息的矩阵指导低维表示的学习,能够有效提高低维表示的判别能力,提高聚类性能。聚类性能。聚类性能。

【技术实现步骤摘要】
自表示学习监督的非负矩阵分解方法


[0001]本专利技术涉及自表示学习监督的非负矩阵分解方法,适用于机器学习领域的降维聚类技术。

技术介绍

[0002]随着信息收集技术的不断发展,收集到的数据集的规模越来越大,这带来了巨大的挑战,如维数灾难、算法的性能可能会呈指数级下降等,导致无法及时提取有用的信息。因此,从这些高维数据中提取最重要的低维表示,不仅有助于避免“维数灾难”的问题,而且还降低了输入数据空间的复杂度。此外,将高维空间嵌入到一个低维空间中,同时还要保留了大部分所期望的有效信息是十分必要的。研究表明,一些降维方法已经取得了巨大的成功,如主成分分析、线性判别分析和局部投影法等。然而,虽然这些方法对高维数据的降维十分有效,但是它们在物理意义方面的解释较弱。而非负矩阵分解(NMF)由于对分解结果的直接可解释性,逐渐成为最流行的降维工具。
[0003]与主成分分析和SVD等方法不同,NMF将原始数据分解为两个矩阵的乘法,这两个矩阵受到非负性约束。一个矩阵由揭示潜在语义结构的基向量组成,另一个矩阵可以看作是每个样本点由其他基向量线性组合的系本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.自表示学习监督的非负矩阵分解方法,其特征在于:该方法输入原始数据,首先对其进行归一化处理,归一化后的图像具有相同的标准;再利用所提出的模型对数据进行低维表示;最后利用聚类方法和评价指标对降维方法进行评估;其具体步骤如下:步骤一:构建样本点本发明首先使用四个经典的数据库来构建输入样本点,数据集的部分图像依次为OIL20,ORL,Yale和PIE;任选一个数据库其中f
i
是一个样本点,对样本进行归一化处理得到步骤二:降维处理由于相同的子空间数据往往有非常强的相关性,而来自不同的子空间数据则没有相关性或弱相关性,首先对于归一化后的非负数据矩阵X进行自表示学习;用以下公式构建相似性矩阵:X=XZs.t.Z≥0,Z1=1.
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,约束条件保证所有关于Z的解都是有意义的,由于Z是由原始数据建立的相似性矩阵,而矩阵Z中每一个元素表示x
i
与其他相似点x
j
之间的相似性权重,每一点与其他点的相似性权重之和为1;在自表示的基础上,对相似性矩阵做进一步分解体现聚类结构信息:经过上述过程,得到了具有聚类结构信息的矩阵G;对归一化的数据D为特征数,n为样本个数,利用NMF寻找两个非负矩阵和具体表...

【专利技术属性】
技术研发人员:孙艳丰王杰郭继鹏胡永利尹宝才
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1