基于增量式凸局部非负矩阵分解的数据处理方法技术

技术编号:12990051 阅读:58 留言:0更新日期:2016-03-10 01:04
本发明专利技术公开了一种基于增量式凸局部非负矩阵分解的数据处理方法,主要解决基本非负矩阵分解无法对含负值数据进行处理及在处理增量数据时,计算消耗过大和占用存储空间较多的问题。其实现步骤是:1.将初始数据表达为初始矩阵;2.利用凸局部非负矩阵分解方法对初始矩阵分解,得到初始基矩阵和初始系数矩阵;3.接收新数据,并构造新数据矩阵;4.结合初始基矩阵和初始系数矩阵,利用增量式凸局部非负矩阵分解方法,对新数据矩阵进行分解,实现对增量数据的处理。本发明专利技术可以处理含负值的数据,拓展了基本非负矩阵分解的应用领域,分解结果物理意义明确,具有良好的正交性、稀疏性和高效性,可用于图像、视频和网络访问记录的增量数据处理。

【技术实现步骤摘要】

本专利技术属于数据处理
,涉及增量数据的处理方法,可用于图像、视频和网络访问记录的数据处理。
技术介绍
随着物联网、传感器和计算机等相关技术的飞速发展,数据以爆炸式的速度动态增长,如监控视频、网络访问等,且数据维数越来越高,人们不得不面临分析和处理各种大规模海量高维数据的任务。如何从浩如烟海的数据海洋里迅速且准确地获取有用或最需要的信息,成为迫在眉睫的问题。数据降维是解决“维数灾难”的一种有效方法。传统的降维方法包括:主成分分析、独立成分分析、Fisher判别分析等,该类方法允许结果为负,但负值元素在处理图像、视频等高维数据时,缺乏直观的物理意义,而非负矩阵分解(Non-negativeMatrixFactorization,NMF)成功解决了这个难题。LeeDD,SeungHS.等人于1999年在著名的Nature上提出了一种非负矩阵分解NMF方法[Learningthepartsofobjectswithnonnegativematrixfactorization.Nature,401(6755):788-791],该方法能够大大降低数据特征的维数,挖掘数据潜在的内部结构特征,大幅度节省存储空间和计算资源,具有明确的物理意义,同时具备局部感知全局的智能特性。而基本非负矩阵分解NMF方法在处理增量数据时,需要对历史数据和新增数据全部分解处理,消耗了大量的计算资源和存储资源,大大降低了方法的效率,同时,输<br>入矩阵的严格非负性要求,极大地限制了该类方法的应用领域。
技术实现思路
本专利技术针对上述已有技术的不足,提出了基于增量式凸局部非负矩阵分解的数据处理方法,以解决基本非负矩阵分解方法不能处理负值数据的缺陷,同时解决常规方法在处理增量式数据时效率不高、严重消耗计算资源和存储资源的问题。本专利技术的技术关键是:首先,对基本非负矩阵分解NMF方法进行了核拓展,构成凸非负矩阵分解CNMF方法的目标函数;其次,对此目标函数引入正交约束和稀疏约束,构成凸局部非负矩阵分解CLNMF方法的目标函数;最后,对该方法进行增量处理,构成本专利技术的增量式凸局部非负矩阵分解ICLNMF方法,其实现方案包括如下:(1)获取固定大小p×n的数据,作为初始数据,并表示成初始矩阵V0,其中,p表示单个样本的维数,n表示样本个数;(2)对基本非负矩阵分解NMF目标函数进行核拓展,构成凸非负矩阵分解CNMF的目标函数:FCNMF(V0||V0W0H0)=||V0-V0W0H0||F2]]>其中,W0和H0分别是对初始矩阵V0进行分解期望得到的基矩阵和系数矩阵,表示矩阵的F范数的平方;(3)对步骤(2)中目标函数的基矩阵W0施加正交约束,系数矩阵H0施加稀疏约束,构成凸局部非负矩阵分解CLNMF的目标函数FCLNMF(V0||V0W0H0):FCLNMF(V0||V0W0H0)=||V0-V0W0H0||F2+δ||W0TW0||L1-φTr(H0H0T)]]>其中,||·||L1表示矩阵的L1范数,Tr()表示求矩阵的迹,T表示矩阵的转置,δ是正交调节参数,用于控制正交约束项对目标函数影响的大小,以调节正交约束项与准确重构之间的平衡,φ是稀疏调节参数,用于控制稀疏约束项对目标函数影响的大小,以调节稀疏约束项与准确重构之间的平衡;(4)对凸局部非负矩阵分解CLNMF的目标函数FCLNMF(V0||V0W0H0)优化求解,得到基矩阵W0和系数矩阵H0;(5)继续获取固定大小p×n的数据,作为第1次待处理的增量数据,并表示成相应的新数据矩阵v;(6)将新数据矩阵v代入凸局部非负矩阵分解CLNMF的目标函数中,得到对应于新数据矩阵v的新目标函数fCLNMF(v||vWmh):fCLNMF(v||vWmh)=||v-vWmh||F2+δ||WmTWm||L1-φTr(hhT),]]>其中,Wm和h分别对新数据矩阵v进行分解期望得到的基矩阵和系数矩阵;(7)将初始矩阵V0赋值给数据矩阵Vm,将步骤(3)目标函数中的W0替换为Wm,H0替换为Hm,V0替换为Vm,此时m=1;并与步骤(6)中的目标函数进行加权结合,得到增量式凸局部非负矩阵分解ICLNMF的目标函数F:F=αFCLNMF(Vm||VmWmHm)+βfCLNMF(v||vWmh)=α||Vm-VmWmHm||F2+β||v-vWmh||F2+δ||WmTWm||L1-αφTr(HmHmT)-βφTr(hhT)]]>其中,Hm表示用于联系前后两次数据分解的过渡系数矩阵,存储前一次分解得到的系数矩阵,α为控制目标函数FCLNMF(Vm||VmWmHm)在增量式凸局部非负矩阵分解中作用大小的权值,β为控制目标函数fCLNMF(v||vWmh)在增量式凸局部非负矩阵分解中作用大小的权值,且0<α<1,0<β<1,α+β=1;(8)对增量式凸局部非负矩阵分解的目标函数F优化求解,实现对新数据矩阵v的分解,得到对应的系数矩阵h和基矩阵Wm;(9)初始化一个空的存储矩阵H,将过渡系数矩阵Hm中的数据保存到存储矩阵H中,之后将过渡系数矩阵Hm清空,再将此时的系数矩阵h的值赋值给过渡系数矩阵Hm,之后将系数矩阵h清空用于存储下次处理结果;(10)将数据矩阵Vm清空,把新数据矩阵v赋值给数据矩阵Vm,赋值结束后,将新数据矩阵v清空,存储第m+1次获得的大小为p×n的数据,作为待处理的新数据矩阵,m=1,2,...,M;(11)当接收数据的次数达到设置的M时,增量数据处理完毕,结束处理过程;否则,将通过赋值得到的过渡系数矩阵Hm、数据矩阵Vm以及第m+1次获得的新数据矩阵v代入到步骤(7)的目标函数中,得到与之对应的目标函数,重复步骤(8)到步骤(11)的操作。本专利技术相比于现有技术具有如下优点:1)本专利技术在基本非负矩阵分解方法的基础上进行核拓展,能够直接对含有负值的数据进行处理,扩展了应用领域的范围;2)本专利技术通过对基矩阵施加正交约束、对系数矩阵施加稀疏约束,使得分解结果具有良好的正交性和稀疏性;3)本专利技术对于增量数据,采用增量式处理方法,大大节省了处理时间,提高了方法的效率。附图说明图1是本专利技术的实现流程图;图2是本专利技术与基本NMF方法随样本增加次数变化的运行迭代时间对比结果图。具体实施方式一、基础理论介绍信息时代使得人类不得不面临分析或处理各种大规模数据信息的本文档来自技高网
...

【技术保护点】
一种基于增量式凸局部非负矩阵分解的数据处理方法,包括:(1)获取固定大小p×n的数据,作为初始数据,并表示成初始矩阵V0,其中,p表示单个样本的维数,n表示样本个数;(2)对基本非负矩阵分解NMF的目标函数进行核拓展,构成凸非负矩阵分解CNMF的目标函数:FCNMF(V0||V0W0H0)=||V0-V0W0H0||F2]]>其中,W0和H0分别是对初始矩阵V0进行分解期望得到的基矩阵和系数矩阵,表示矩阵的F范数的平方;(3)对步骤(2)中目标函数的基矩阵W0施加正交约束,对系数矩阵H0施加稀疏约束,构成凸局部非负矩阵分解CLNMF的目标函数FCLNMF(V0||V0W0H0):FCLNMF(V0||V0W0H0)=||V0-V0W0H0||F2+δ||W0TW0||L1-φTr(H0H0T)]]>其中,||·||L1表示矩阵的L1范数,Tr()表示求矩阵的迹,T表示矩阵的转置,δ是正交调节参数,用于控制正交约束项对目标函数影响的大小,以调节正交约束项与准确重构之间的平衡,φ是稀疏调节参数,用于控制稀疏约束项对目标函数影响的大小,以调节稀疏约束项与准确重构之间的平衡;(4)对凸局部非负矩阵分解CLNMF的目标函数FCLNMF(V0||V0W0H0)优化求解,得到基矩阵W0和系数矩阵H0;(5)继续获取固定大小p×n的数据,作为第1次获得的增量数据,并表示成相应的新数据矩阵v;(6)将新数据矩阵v代入凸局部非负矩阵分解CLNMF的目标函数中,得到对应于新数据矩阵v的新目标函数fCLNMF(v||vWmh):fCLNMF(v||vWmh)=||v-vWmh||F2+δ||WmTWm||L1-φTr(hhT),]]>其中,Wm和h分别对新数据矩阵v进行分解期望得到的基矩阵和系数矩阵;(7)将初始矩阵V0赋值给数据矩阵Vm,并将步骤(3)目标函数中的W0替换为Wm,H0替换为Hm,V0替换为Vm,此时m=1,与步骤(6)中的目标函数进行加权结合,得到增量式凸局部非负矩阵分解ICLNMF的目标函数F:F=αfCLNMF(Vm||VmWmHm)+βfCLNMF(v||vWmh)=α||Vm-VmWmHm||F2+β||v-vWmh||F2+δ||WmTWm||L1-αφTr(HmHmT)-βφTr(hhT)]]>其中,Hm表示用于联系前后两次数据分解的过渡系数矩阵,存储前一次分解得到的系数矩阵,α为控制目标函数FCLNMF(Vm||VmWmHm)在增量式凸局部非负矩阵分解中作用大小的权值,β为控制目标函数fCLNMF(v||vWmh)在增量式凸局部非负矩阵分解中作用大小的权值,且0<α<1,0<β<1,α+β=1;(8)对增量式凸局部非负矩阵分解的目标函数F优化求解,实现对新数据矩阵v的分解,得到对应的系数矩阵h和基矩阵Wm;(9)初始化一个空的存储矩阵H,将过渡系数矩阵Hm保存到存储矩阵H中,之后将过渡系数矩阵Hm清空,再将此时的系数矩阵h赋值给过渡系数矩阵Hm,之后将系数矩阵h清空用于存储下次处理结果;(10)将数据矩阵Vm清空,把新数据矩阵v赋值给数据矩阵Vm,赋值结束后,将新数据矩阵v清空,存储第m+1次获得的大小为p×n的数据,作为待处理的新数据,m=1,2,...,M;(11)当接收数据的次数达到设置的M时,增量数据处理完毕,结束处理过程;否则,将通过赋值得到的过渡系数矩阵Hm、数据矩阵Vm以及第m+1次获得的新数据矩阵v代入到步骤(7)的目标函数中,得到与之对应的目标函数,重复步骤(8)到步骤(11)的操作。...

【技术特征摘要】
1.一种基于增量式凸局部非负矩阵分解的数据处理方法,包括:
(1)获取固定大小p×n的数据,作为初始数据,并表示成初始矩阵V0,其
中,p表示单个样本的维数,n表示样本个数;
(2)对基本非负矩阵分解NMF的目标函数进行核拓展,构成凸非负矩阵分
解CNMF的目标函数:
FCNMF(V0||V0W0H0)=||V0-V0W0H0||F2]]>其中,W0和H0分别是对初始矩阵V0进行分解期望得到的基矩阵和系数矩阵,表示矩阵的F范数的平方;
(3)对步骤(2)中目标函数的基矩阵W0施加正交约束,对系数矩阵H0施
加稀疏约束,构成凸局部非负矩阵分解CLNMF的目标函数FCLNMF(V0||V0W0H0):
FCLNMF(V0||V0W0H0)=||V0-V0W0H0||F2+δ||W0TW0||L1-φTr(H0H0T)]]>其中,||·||L1表示矩阵的L1范数,Tr()表示求矩阵的迹,T表示矩阵的转置,δ是
正交调节参数,用于控制正交约束项对目标函数影响的大小,以调节正交约束项与
准确重构之间的平衡,φ是稀疏调节参数,用于控制稀疏约束项对目标函数影响的
大小,以调节稀疏约束项与准确重构之间的平衡;
(4)对凸局部非负矩阵分解CLNMF的目标函数FCLNMF(V0||V0W0H0)优化求解,
得到基矩阵W0和系数矩阵H0;
(5)继续获取固定大小p×n的数据,作为第1次获得的增量数据,并表示成
相应的新数据矩阵v;
(6)将新数据矩阵v代入凸局部非负矩阵分解CLNMF的目标函数中,得到
对应于新数据矩阵v的新目标函数fCLNMF(v||vWmh):
fCLNMF(v||vWmh)=||v-vWmh||F2+δ||WmTWm||L1-φTr(hhT),]]>其中,Wm和h分别对新数据矩阵v进行分解期望得到的基矩阵和系数矩阵;
(7)将初始矩阵V0赋值给数据矩阵Vm,并将步骤(3)目标函数中的W0替换
为Wm,H0替换为Hm,V0替换为Vm,此时m=1,与步骤(6)中的目标函数进行
加权结合,得到增量式凸局部非负矩阵分解ICLNMF的目标函数F:
F=αfCLNMF(Vm||VmWmHm)+βfCLNMF(v||vWmh)=α||Vm-VmWmHm||F2+β||v-vWmh||F2+δ||WmTWm||L1-αφTr(HmHmT)-βφTr(hhT)]]>其中,Hm表示用于联系前后两次数据分解的过渡系数矩阵,存储前一次分解得到
的系数矩阵,α为控制目标函数FCLNMF(Vm||VmWmHm)在增量式凸局部非负矩阵分解
中作用大小的权值,β为控制目标函数fCLNMF(v||vWmh)在增量式凸局部非负矩阵分
解中作用大小的权值,且0<α<1,0<β<1,α+β=1;
(8)对增量式凸局部非负矩阵分解的目标函数F优化求解,实现对新数据矩阵
v的分解,得到对应的系数矩阵h和基矩阵Wm;
(9)初始化一个空的存储矩阵H,将过渡系数矩阵Hm保存到存储矩阵H中,
之后将过渡系数矩阵Hm清空,再将此时的系数矩阵h赋值给过渡系数矩阵Hm,之
后将系数矩阵h清空用于存储下次处理结果;
(10)将数据矩阵Vm清空,把新数据矩阵v赋值给数据矩阵Vm,赋值结束后,
将新数据矩阵v清空,存储第m+1次获得的大小为p×n的数据,作为待处理的新
数据,m=1,2,...,M;
(11)当接收数据的次数达到设置的M时,增量数据处理完毕,结束处理过程;
否则,将通过赋值得到的过渡系数矩阵Hm、数据矩阵Vm以及第m+1次获得的新数
据矩阵v代入到步骤(7)的目标函数中,得到与之对应的目标函数,重复步骤(8)
到步骤(11)的操作。
2.根据权利要求1所述的方法,其中步骤(4)中对目标函数FCLNMF(V0||V0W0H0)
的优化求解,步骤如下:
(4a)根据初始矩阵V0和预设的分解维数r,确定基矩阵W0和系数矩阵H0的
大小,初始矩阵V0的大小为p×n,则基矩阵W0的大小为n×r,系数矩阵H0的大
小为r×n;
(4b)对基矩阵W0和系数矩阵H0进行初始化,使得基矩阵W0中的任意元素
W0(x,y)∈[0,1],x=1,2,...,n,y=1,2,...,r,其中,W0(x,y)表示基矩阵W0中第x行
第y列的元素,系数矩阵H0的任意元素H0(i,j)∈[0,1],i=1,2,...,r,...

【专利技术属性】
技术研发人员:同鸣李海龙席圣男陶士昌
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1