【技术实现步骤摘要】
本专利技术属于信息处理
,具体涉及一种基于低秩恢复的非负矩阵分解方法。
技术介绍
随着信息化和互联网的发展,高维数据在社会各领域不断涌现。总体来讲,这些数据或者是半结构的或者是无结构的,这使得构建这些数据的特征向量高达上万维甚至更高。数据维数的增加对大规模数据处理带来了困难。非负矩阵分解时基于非监督模式识别的一个研究领域,旨在得到数据稀疏的、基于部分的低维数据表示。非负矩阵分解被广泛应用于数学、最优化、神经计算、模式识别与机器学习、数据挖掘、图像工程与计算机视觉等领域,因此研究非负矩阵分解技术具有非常重要的意义与应用价值。非负矩阵分解技术建立在对因子矩阵的非负约束的基础上,通过非监督的方法学习到原数据的低维表示以及其相应的基矩阵,从而有利于后续相关应用中的处理。目前,非负矩阵分解方法主要分为三类:一是基于稀疏约束或正交约束的方法,这种方法致力于通过对因子矩阵(即基矩阵和编码矩阵)施加稀疏或者正交约束来学习到更稀疏和局部化的数据表示。P.Hoyer在文献“Non-Negative Matrix Factorization with Sparseness Constraints,J.Machine Learning Research,vol.5,no.9,pp.1457-1469,2004”提出对编码矩阵施加L1范数约束的非负矩阵分解方法,通过L1范数的稀疏约束来取得更稀疏的数据表示。S.Li等人在文献“Learning spatially localized,parts-based representation,in Proc.IEEE Intern ...
【技术保护点】
一种基于低秩恢复的非负矩阵分解方法,其特征在于:包括以下步骤:1】将原始数据库中的每个图像样本均转换为向量,构成m×n的原始数据矩阵X;m为图像样本的维数,n为图像样本的个数;2】对原始数据矩阵X进行低秩稀疏分解;2.1】设置低秩矩阵的秩为r,设置稀疏矩阵的稀疏度为k;2.2】采用双边随机投影算法求解原始数据矩阵X的秩为r的低秩矩阵L和稀疏度为k的稀疏矩阵S;3】对步骤2】中求解得到的低秩矩阵L进行非负矩阵分解,得到基矩阵W和编码矩阵H。
【技术特征摘要】
1.一种基于低秩恢复的非负矩阵分解方法,其特征在于:包括以下步骤:1】将原始数据库中的每个图像样本均转换为向量,构成m×n的原始数据矩阵X;m为图像样本的维数,n为图像样本的个数;2】对原始数据矩阵X进行低秩稀疏分解;2.1】设置低秩矩阵的秩为r,设置稀疏矩阵的稀疏度为k;2.2】采用双边随机投影算法求解原始数据矩阵X的秩为r的低秩矩阵L和稀疏度为k的稀疏矩阵S;3】对步骤2】中求解得到的低秩矩阵L进行非负矩阵分解,得到基矩阵W和编码矩阵H。2.根据权利要求1所述的基于低秩恢复的非负矩阵分解方法,其特征在于:所述步骤2.2】包括以下步骤:2.2.1】初始化低秩矩阵为L0=X,初始化稀疏矩阵为S0=0,初始化迭代次数为t=0;设置重构相对误差阈值ε;2.2.2】计算其中,q为0或者正整数;2.2.3】计算的r双边随机投影和其中,A1是n×r的随机矩阵,A2是m×r的随机矩阵;2.2.4】进行迭代更新:t=t+1,A2=Y1,2.2.5】计算Y1和Y2的QR分解:Y2=Q2R2,Y1=Q1R1;2.2.6】更新低秩矩阵和稀疏矩阵:St=PΩ(X-Lt);其中,PΩ表示将一个矩阵投影到元素集合Ω;2.2.7】计算重构误差判断重构误差是否小于重构相对误差阈值ε,若重构误差小于ε则执行步骤2.2.8】,若重构误差大于或者等于ε则执行步骤2.2.4】;2.2.8】得到低秩矩阵L=Lt和稀疏矩阵S=St。3.根据权利要求2所述的基于低秩恢复的非负矩阵分解方法,其特征在于:所述步骤3】包括以下步骤:3.1】将步骤2】中求得的低秩矩阵L中的非负元素赋值为0;3.2】初始化基矩阵W0为m×l的随机矩阵,初始化编码矩阵H0为l×n的随机矩阵,初始化迭代次数为t=0;其中,l为样本类个数;设定迭代误差限ε′;3.3】利用K近邻算法构建近邻图,计算图拉普拉斯矩阵Lap=Dap-Sap;其中,Sap是对称的权重矩阵,Dap是对角矩阵,对角元素是Sap的列和;3.4】迭代求解基矩阵W和编码矩阵H;3.4.1】计算其中α是图正则参数;3.4.2】计算t'=t'+1;其中,β是Tiknohov正则参数;3.4.3】计算非负矩阵分解重构误差;若非负矩阵分解重构误差大于或者等于迭代误差限ε′则执行步骤3.4.1】;若非负矩阵分解重构误差小于迭代误差限ε则执行步骤3.4.4】;3.4.4】得到基矩阵W=Wt′+1和编码矩阵H=Ht′+1。4.根据权利要求1-3中任一所述的基于低秩恢复的非负矩阵分解方法,其特征在于:还包括以下步骤:4】用k-means聚类算法对编码矩阵H进行聚类;5】计算聚类结果评判指标聚类精度AC和归一化互信息NMI: A C = Σ i = 1 n δ ( gnd i , m a p ( z i ) ) n ]]> M I ( C ...
【专利技术属性】
技术研发人员:李学龙,董永生,崔国盛,
申请(专利权)人:中国科学院西安光学精密机械研究所,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。