【技术实现步骤摘要】
一种基于图学习的快速谱嵌入聚类方法
本专利技术涉及数据挖掘和模式识别
,尤其涉及一种基于图学习的快速谱嵌入聚类方法。
技术介绍
目前,有学者提出自适应近邻谱嵌入聚类方法,该方法主要有两步,第一步为对数据进行谱嵌入,第二步为自适应近邻聚类,该方法的详细过程如下:1)对数据进行谱嵌入聚类结果可以看做是原始数据的映射,映射函数为:Y=XTW+1bT(1)谱聚类的目标函数为:s.t.FTF=I.(2)其中,或者L=I-D-1W加上线性嵌入正则项,可得s.t.FTF=I.(3)将公式(1)带入公式(3),使其中W和b的导数为0,将得到的结果代回公式(3),则有s.t.FTF=I(4)2)自适应近邻聚类本专利技术目标是从数据点和锚点中得到相似度矩阵,根据现有资料,有以下目标方程:为了方便对公式(5)求解,对公式(5)施加先验信息和秩约束为:由于秩约束较为难解 ...
【技术保护点】
1.一种基于图学习的快速谱嵌入聚类方法,其特征在于,所述方法包括如下步骤:/nS10、输入数据:/n输入待聚类的数据集X=[x
【技术特征摘要】
1.一种基于图学习的快速谱嵌入聚类方法,其特征在于,所述方法包括如下步骤:
S10、输入数据:
输入待聚类的数据集X=[x1,…,xn]T∈Rn×d、设定类簇数c;利用K-means方法选取m个锚点U=[u1,…,um]T∈Rm×d;
S20、构建组合二部图矩阵,通过组合二部图得到数据点的低维表示F和G:
计算数据点X和锚点U之间的二部图矩阵:Z1∈Rn×m;
计算数据点X和锚点U之间的分配矩阵:Z2∈Rm×m;
得到组合的二部图矩阵:
求出矩阵Z的相似矩阵A,对相似矩阵A进行谱分析,其目标函数为:
其中,Λ∈Rm×m为对角矩阵;其中,
F∈Rn×c和G∈Rm×c分别对应于数据点和锚点的低维表示;
此处对进行奇异值分解,得到H的松弛连续解,从而得到低维的谱嵌入数据;
S30、构建数据点和锚点的低维表示的目标函数:
其中,P为数据点和锚点的相似度矩阵,Q为最大的c个奇异值对应的左右奇异向量的相似度矩阵,fi为对应F∈Rn×c的向量表示形式,gj为对应G∈Rm×c的向量表示形式;λ为约束系数;
S40、判定步骤S30中目标函数是否收敛;若目标函数收敛,则转至步骤S60;若目标函数不收敛,则转至步骤S50;
S50、通过交替迭代优化方式更新目标函数,并返回步骤S20;
S60、输出图结构信息完整的相似度矩阵P,结束。
2.根据权利要求1所述的基于图学习的快速谱嵌入聚类方法,其特征在于,所述步骤S50中:通过交替迭代优化方式更新目标函数,包含步骤如下:<...
【专利技术属性】
技术研发人员:林郭权,杨晓君,郭春炳,阳琴,蔡湧达,许裕雄,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。