【技术实现步骤摘要】
自表示学习监督的非负矩阵分解方法
[0001]本专利技术涉及自表示学习监督的非负矩阵分解方法,适用于机器学习领域的降维聚类技术。
技术介绍
[0002]随着信息收集技术的不断发展,收集到的数据集的规模越来越大,这带来了巨大的挑战,如维数灾难、算法的性能可能会呈指数级下降等,导致无法及时提取有用的信息。因此,从这些高维数据中提取最重要的低维表示,不仅有助于避免“维数灾难”的问题,而且还降低了输入数据空间的复杂度。此外,将高维空间嵌入到一个低维空间中,同时还要保留了大部分所期望的有效信息是十分必要的。研究表明,一些降维方法已经取得了巨大的成功,如主成分分析、线性判别分析和局部投影法等。然而,虽然这些方法对高维数据的降维十分有效,但是它们在物理意义方面的解释较弱。而非负矩阵分解(NMF)由于对分解结果的直接可解释性,逐渐成为最流行的降维工具。
[0003]与主成分分析和SVD等方法不同,NMF将原始数据分解为两个矩阵的乘法,这两个矩阵受到非负性约束。一个矩阵由揭示潜在语义结构的基向量组成,另一个矩阵可以看作是每个样本点由其 ...
【技术保护点】
【技术特征摘要】
1.自表示学习监督的非负矩阵分解方法,其特征在于:该方法输入原始数据,首先对其进行归一化处理,归一化后的图像具有相同的标准;再利用所提出的模型对数据进行低维表示;最后利用聚类方法和评价指标对降维方法进行评估;其具体步骤如下:步骤一:构建样本点本发明首先使用四个经典的数据库来构建输入样本点,数据集的部分图像依次为OIL20,ORL,Yale和PIE;任选一个数据库其中f
i
是一个样本点,对样本进行归一化处理得到步骤二:降维处理由于相同的子空间数据往往有非常强的相关性,而来自不同的子空间数据则没有相关性或弱相关性,首先对于归一化后的非负数据矩阵X进行自表示学习;用以下公式构建相似性矩阵:X=XZs.t.Z≥0,Z1=1.
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,约束条件保证所有关于Z的解都是有意义的,由于Z是由原始数据建立的相似性矩阵,而矩阵Z中每一个元素表示x
i
与其他相似点x
j
之间的相似性权重,每一点与其他点的相似性权重之和为1;在自表示的基础上,对相似性矩阵做进一步分解体现聚类结构信息:经过上述过程,得到了具有聚类结构信息的矩阵G;对归一化的数据D为特征数,n为样本个数,利用NMF寻找两个非负矩阵和具体表...
【专利技术属性】
技术研发人员:孙艳丰,王杰,郭继鹏,胡永利,尹宝才,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。