当前位置: 首页 > 专利查询>江苏大学专利>正文

一种基于低秩拉普拉斯图学习的鲁棒数据降维方法技术

技术编号:31908714 阅读:20 留言:0更新日期:2022-01-15 12:48
本发明专利技术公开了一种基于低秩拉普拉斯图学习的数据降维方法,该方法针对原始数据存在噪声或遮挡的情况下,学习数据的内在几何结构即鲁棒的低秩拉普拉斯图,并利用该低秩拉普拉斯图得到高维数据的低维映射以达到数据降维作用。提出的方法能够同时进行数据的低秩拉普拉斯图以及投影矩阵的学习,两者在产生的过程中相互促进。本方法利用了低维映射数据的低秩成分以获取数据的全局结构,数据的全局结构能抵抗数据中噪声的干扰同时低维数据也能在一定程度上减少噪声对投影矩阵的影响。程度上减少噪声对投影矩阵的影响。程度上减少噪声对投影矩阵的影响。

【技术实现步骤摘要】
一种基于低秩拉普拉斯图学习的鲁棒数据降维方法


[0001]本专利技术涉及图像处理以及数据降维
,具体是一种兼顾图学习和子空间学习的图像特征提取与数据降维方法。

技术介绍

[0002]随着时代的发展,越来越多的图像和视频数据需要被分析和处理。而图像作为高维数据的代表,其具有数据量大而价值低的特点。如何通过合理的手段对其进行维度缩减以减少后续处理的计算成本和内存占用已经成为学者们关注的热点。很多经典而有效的数据降维方法被相继提出,例如主成分分析(PCA),线性判别分析(LDA),局部线性保留投影(LPP)等。
[0003]虽然已有的经典数据降维方法已经取得了很好的效果,但是它们都忽略了实际应用中的数据往往存在噪声以及图像数据中时常存在遮挡的情况。当输入数据存在噪声和遮挡时,这些方法的效果都会大打折扣。为此,需要一种针对噪声数据的数据降维方法更好的处理噪声以及图像数据中时常存在遮挡的情况。

技术实现思路

[0004]为了解决现有技术中存在的不足,本专利技术提出了一种基于低秩拉普拉斯图学习的鲁棒数据降维方法,通过构造了关于数据的低秩拉普拉斯图,该低秩拉普拉斯图可以很好的揭示排除噪声后样本之间的真实关系,通过该低秩拉普拉斯图可以获得投影矩阵进而可以将高维数据映射到合理的低维空间中。
[0005]本专利技术所采用的技术方案如下:
[0006]一种基于低秩拉普拉斯图学习的鲁棒数据降维方法,包括如下步骤:
[0007]步骤一:获取待处理的高维图像数据,将高维图像数据转换为数据向量X
i
∈R
m
,即图像的像素和为m;由此,高维图像数据的图像数据集合表示为矩阵X={X1,X2,

,X
n
}∈R
m
×
n
,即假定为n张待处理的图像数据;基于转换后的图像数据集合X构造如下目标函数:
[0008][0009]s.t.P
T
P=I,diag(S)=0,S≥0,S
T
1=1
[0010]其中,P∈R
m
×
k
为待求解的投影矩阵,k为自定义的图连通分量数;用于将高维数据映射到低维空间;S矩阵为低维空间中数据的低秩表示,即低秩拉普拉斯图;X
j
为第j个数据样本所表示的数据向量,S
ij
表示矩阵S中第i行第j列的元素;λ1和λ2为平衡因子;diag(S)=0指S矩阵的对角线元素均为0,S
T
1=1中的1指的是所有元素为1的列向量;
[0011]步骤二:将投影矩阵P初始化设置为正交矩阵,基于下式目标函数对低秩拉普拉斯图S进行初始化:
[0012][0013]步骤三:为便于求解,对步骤一种所构造的目标函数进行优化,具体地,将步骤一中构造的目标函数增加若干中间变量Z,U,E以松弛,改进后的目标函数表示为:
[0014][0015]s.t.Z=S,Z=U,E=P
T
X

P
T
XZ,PTP=I,diag(S)=0,S≥0,S
T
1=1
[0016]其中,Z,U,E分别为辅助矩阵变量,||U||
*
表示求U所有特征值之和,||E||
2,1
表示求E的L
2,1
范数。
[0017]进一步,将优化后的目标函数转换为对应的增广拉格朗日函数以便于求解,其对应的形式:
[0018][0019]其中,Y1,Y2,Y3为拉格朗日乘子;μ为惩罚系数;是代表矩阵的F范数;任意〈A,B〉表示矩阵A和B的内积,即〈A,B>=Tr(A
T
B)。
[0020]采用交替方向乘子(ADMM)更新的方法,对此增广拉格朗日函数进行求解
[0021]步骤四:循环迭代步骤三的求解过程,直到满足迭代结束条件。若符合以上迭代结束条件,则跳出循环;否则继续执行循环。当循环退出,则代表已经找出最优投影矩阵P;基于所获得的最优投影矩阵P,得到原始数据(即高维图像数据)的低维映射为P
T
X。
[0022]进一步,采用交替方向乘子(ADMM)更新的方法,对此增广拉格朗日函数进行求解的过程如下:
[0023]Step 1:
[0024]固定其他变量(P,S,U,E),只考虑Z变量,我们对关于Z的函数求导并令其为0,计算可得:
[0025][0026]Step 2:
[0027]固定其他变量(P,S,Z,E),只考虑U变量,U可以通过SVT求解获得
[0028][0029]其中,Θ表示软阈值操作;
[0030]Step 3:
[0031]固定其他变量(P,S,Z,U),只考虑E变量,E可以通过求解如下表达式获得
[0032][0033]Step 4:
[0034]固定其他变量(P,Z,U,E),只考虑S变量,S可以通过如下方式获得
[0035]S
ij
=(N
ij

G
ij
/μ)
+
[0036]其中,N
ij
为矩阵N中第i行第j列的元素,G
ij
为矩阵G中第i行第j列的元素,表示为
[0037]Step 5:
[0038]固定其他变量(S,Z,U,E),只考虑P变量,P可以通过求解如下特征方程获得
[0039](XL
S
X
T
+λ2X(I

Z)D(I

Z)
T
X
T
)P=λP
[0040]其中,L
S
=D

(S+S
T
)/2而D为对角矩阵,其对角线上对应的元素为D
ii
=∑
j
(S
ij
+S
ij
)/2;I为单位矩阵;λ为特征值。
[0041]进一步,S
ij
表示为:
[0042][0043]其中,e为引入的辅助矩阵,e
ij
为辅助矩阵e中第i行第j列的元素,而自适应参数k为自定义的图连通分量数。
[0044]进一步,基于降维后的图像数据能用于进一步的聚类或分类。
[0045]进一步,针对降维后的图像数据进行K

means聚类以挖掘数据中的隐含信息。
[0046]进一步,迭代结束条件为目标函数值小于某个阈值或者迭代次数大于设置的最大迭代次数。
[0047]本专利技术的有益效果:
[0048]本方法将子空间学习与拉普拉斯图学习放入统一框架,通过数据的低秩表示嵌入拉普拉斯图学习的过程中使得所学习的图矩阵S具有鲁棒性和判别性,在数据中存在大量噪声的情况下依然能获得良好的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于低秩拉普拉斯图学习的鲁棒数据降维方法,其特征在于,包括如下步骤:步骤一:获取待处理的高维图像数据,将高维图像数据转换为数据向量X
i
;由此高维图像数集合表示为矩阵S={X1,S2,

,S
n
}∈R
m
×
n
,m为图像的像素和,n为待处理的图像数据张数;基于转换后的图像数据集合X构造目标函数:s.t.P
T
P=I,diag(S)=0,S≥0,S
T
1=1其中,P为待求解的投影矩阵,矩阵S为低维空间中数据的低秩表示,即低秩拉普拉斯图;X
j
为第j个数据样本所表示的数据向量;S
ij
表示矩阵S中第i行第j列的元素;λ1和λ2为平衡因子;步骤二:将投影矩阵P初始化设置为正交矩阵,基于下式目标函数对低秩拉普拉斯图S进行初始化:步骤三:对步骤一种所构造的目标函数进行优化;向目标函数中增加中间变量Z,U,E以松弛该目标函数,优化后的目标函数表示为:s.t.Z=S,Z=U,E=P
T
X

P
T
XZ,P
T
P=I,diag(S)=0,S≥0,S
T
1=1其中,Z,U,E分别为辅助矩阵变量,||U||
*
表示求U所有特征值之和,||E||
2,1
表示求E的L
2,1
范数;将优化后的目标函数转换为对应的增广拉格朗日函数;并且采用交替方向乘子更新的方法,对增广拉格朗日函数进行求解;步骤四:循环迭代步骤三的求解过程,直到满足迭代结束条件,输出最优投影矩阵P,基于最优投影矩阵P,得到原始高维图像数据的低维映射为P
T
X。2.根据权利要求1所述的一种基于低秩拉普拉斯图学习的鲁棒数据降维方法,其特征在于,目标函数对应的增广拉格朗日函数的表达式为:其中,Y1,Y2,Y3为拉格朗日乘子;μ为惩罚系数;是代表矩阵的F范数;任意<A,B>表示矩阵A和B的内积,即<A,B>=Tr(A
T
B)。3.根据权利要求2所述的一种基于低秩拉普拉斯图学习的鲁棒数据降维方法,其特征在...

【专利技术属性】
技术研发人员:沈项军蔡明建刘志锋
申请(专利权)人:江苏大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利