基于低秩恢复的非负矩阵分解方法技术

技术编号：13685169 阅读：64 留言：0更新日期：2016-09-08 21:36

本发明专利技术属于信息处理技术领域，具体涉及一种基于低秩恢复的非负矩阵分解方法，包括以下步骤：1】将原始数据库中的每个图像样本均转换为向量，构成m×n的原始数据矩阵X；m为图像样本的维数，n为图像样本的个数；2】对原始数据矩阵X进行低秩稀疏分解；2.1】设置低秩矩阵的秩为r，设置稀疏矩阵的稀疏度为k；2.2】采用双边随机投影算法求解原始数据矩阵X的秩为r的低秩矩阵L和稀疏度为k的稀疏矩阵S；3】对步骤2】中求解得到的低秩矩阵L进行非负矩阵分解，得到基矩阵W和编码矩阵H。本发明专利技术通过低秩稀疏分解得到数据低秩成分和稀疏成分，并对去除稀疏噪声部分的低秩成分进行非负分解，从而使得非负分解结果免受噪声的干扰。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于信息处理
，具体涉及一种基于低秩恢复的非负矩阵分解方法。
技术介绍
随着信息化和互联网的发展，高维数据在社会各领域不断涌现。总体来讲，这些数据或者是半结构的或者是无结构的，这使得构建这些数据的特征向量高达上万维甚至更高。数据维数的增加对大规模数据处理带来了困难。非负矩阵分解时基于非监督模式识别的一个研究领域，旨在得到数据稀疏的、基于部分的低维数据表示。非负矩阵分解被广泛应用于数学、最优化、神经计算、模式识别与机器学习、数据挖掘、图像工程与计算机视觉等领域，因此研究非负矩阵分解技术具有非常重要的意义与应用价值。非负矩阵分解技术建立在对因子矩阵的非负约束的基础上，通过非监督的方法学习到原数据的低维表示以及其相应的基矩阵，从而有利于后续相关应用中的处理。目前，非负矩阵分解方法主要分为三类：一是基于稀疏约束或正交约束的方法，这种方法致力于通过对因子矩阵(即基矩阵和编码矩阵)施加稀疏或者正交约束来学习到更稀疏和局部化的数据表示。P.Hoyer在文献“Non-Negative Matrix Factorization with Sparseness Constraints,J.Machine Learning Research,vol.5,no.9,pp.1457-1469,2004”提出对编码矩阵施加L1范数约束的非负矩阵分解方法，通过L1范数的稀疏约束来取得更稀疏的数据表示。S.Li等人在文献“Learning spatially localized,parts-based representation,in Proc.IEEE Intern...

【技术保护点】
一种基于低秩恢复的非负矩阵分解方法，其特征在于：包括以下步骤：1】将原始数据库中的每个图像样本均转换为向量，构成m×n的原始数据矩阵X；m为图像样本的维数，n为图像样本的个数；2】对原始数据矩阵X进行低秩稀疏分解；2.1】设置低秩矩阵的秩为r，设置稀疏矩阵的稀疏度为k；2.2】采用双边随机投影算法求解原始数据矩阵X的秩为r的低秩矩阵L和稀疏度为k的稀疏矩阵S；3】对步骤2】中求解得到的低秩矩阵L进行非负矩阵分解，得到基矩阵W和编码矩阵H。

【技术特征摘要】
1.一种基于低秩恢复的非负矩阵分解方法，其特征在于：包括以下步骤：1】将原始数据库中的每个图像样本均转换为向量，构成m×n的原始数据矩阵X；m为图像样本的维数，n为图像样本的个数；2】对原始数据矩阵X进行低秩稀疏分解；2.1】设置低秩矩阵的秩为r，设置稀疏矩阵的稀疏度为k；2.2】采用双边随机投影算法求解原始数据矩阵X的秩为r的低秩矩阵L和稀疏度为k的稀疏矩阵S；3】对步骤2】中求解得到的低秩矩阵L进行非负矩阵分解，得到基矩阵W和编码矩阵H。2.根据权利要求1所述的基于低秩恢复的非负矩阵分解方法，其特征在于：所述步骤2.2】包括以下步骤：2.2.1】初始化低秩矩阵为L0＝X，初始化稀疏矩阵为S0＝0，初始化迭代次数为t＝0；设置重构相对误差阈值ε；2.2.2】计算其中，q为0或者正整数；2.2.3】计算的r双边随机投影和其中，A1是n×r的随机矩阵，A2是m×r的随机矩阵；2.2.4】进行迭代更新：t＝t+1，A2＝Y1，2.2.5】计算Y1和Y2的QR分解：Y2＝Q2R2，Y1＝Q1R1；2.2.6】更新低秩矩阵和稀疏矩阵：St＝PΩ(X-Lt)；其中，PΩ表示将一个矩阵投影到元素集合Ω；2.2.7】计算重构误差判断重构误差是否小于重构相对误差阈值ε，若重构误差小于ε则执行步骤2.2.8】，若重构误差大于或者等于ε则执行步骤2.2.4】；2.2.8】得到低秩矩阵L＝Lt和稀疏矩阵S＝St。3.根据权利要求2所述的基于低秩恢复的非负矩阵分解方法，其特征在于：所述步骤3】包括以下步骤：3.1】将步骤2】中求得的低秩矩阵L中的非负元素赋值为0；3.2】初始化基矩阵W0为m×l的随机矩阵，初始化编码矩阵H0为l×n的随机矩阵，初始化迭代次数为t＝0；其中，l为样本类个数；设定迭代误差限ε′；3.3】利用K近邻算法构建近邻图，计算图拉普拉斯矩阵Lap＝Dap-Sap；其中，Sap是对称的权重矩阵，Dap是对角矩阵，对角元素是Sap的列和；3.4】迭代求解基矩阵W和编码矩阵H；3.4.1】计算其中α是图正则参数；3.4.2】计算t'＝t'+1；其中，β是Tiknohov正则参数；3.4.3】计算非负矩阵分解重构误差；若非负矩阵分解重构误差大于或者等于迭代误差限ε′则执行步骤3.4.1】；若非负矩阵分解重构误差小于迭代误差限ε则执行步骤3.4.4】；3.4.4】得到基矩阵W＝Wt′+1和编码矩阵H＝Ht′+1。4.根据权利要求1-3中任一所述的基于低秩恢复的非负矩阵分解方法，其特征在于：还包括以下步骤：4】用k-means聚类算法对编码矩阵H进行聚类；5】计算聚类结果评判指标聚类精度AC和归一化互信息NMI： A C = Σ i = 1 n δ ( gnd i , m a p ( z i ) ) n ]]> M I ( C ...

【专利技术属性】
技术研发人员：李学龙，董永生，崔国盛，
申请(专利权)人：中国科学院西安光学精密机械研究所，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人