一种基于图学习的快速谱嵌入聚类方法技术

技术编号：26846484 阅读：23 留言：0更新日期：2020-12-25 13:09

本发明专利技术公开了一种基于图学习的快速谱嵌入聚类方法，本发明专利技术的有益效果是，通过近邻方法构造二部图，二部图包含了原始数据点与锚点、锚点与锚点之间的联系，并通过对二部图快速谱嵌入得到数据的低维表示，然后更新自适应近邻图结构，并用其来修正原来的二部图结构，学习到更好的数据点与锚点的二部图结构；通过迭代更新，最终得到具有c个连通域的自适应近邻图结构。得到最优的图结构的同时，也得到了聚类的结果。本发明专利技术提出的算法在多个基准数据集上获得了较好的聚类精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图学习的快速谱嵌入聚类方法
本专利技术涉及数据挖掘和模式识别
，尤其涉及一种基于图学习的快速谱嵌入聚类方法。
技术介绍
目前，有学者提出自适应近邻谱嵌入聚类方法，该方法主要有两步，第一步为对数据进行谱嵌入，第二步为自适应近邻聚类，该方法的详细过程如下：1)对数据进行谱嵌入聚类结果可以看做是原始数据的映射，映射函数为：Y＝XTW+1bT(1)谱聚类的目标函数为：s.t.FTF＝I.(2)其中，或者L＝I-D-1W加上线性嵌入正则项，可得s.t.FTF＝I.(3)将公式(1)带入公式(3)，使其中W和b的导数为0，将得到的结果代回公式(3)，则有s.t.FTF＝I(4)2)自适应近邻聚类本专利技术目标是从数据点和锚点中得到相似度矩阵，根据现有资料，有以下目标方程：为了方便对公式(5)求解，对公式(5)施加先验信息和秩约束为：由于秩约束较为难解，所以通过特征值分解的方法来近似求解秩约束将公式(7)写成向量表示形式，则相似度矩阵的元素为其中，αi和ηi是拉格朗日乘数。现有技术中采用自适应近邻谱嵌入聚类方法，通过原始数据点与锚点之间的关系构建二部图对标签矩阵进行嵌入，没有考虑锚点之间的联系，图结构反映的信息不够完整。在追求高准确度的同时没有很好地考虑计算复杂度，因此在维度高或者...

【技术保护点】
1.一种基于图学习的快速谱嵌入聚类方法，其特征在于，所述方法包括如下步骤：/nS10、输入数据：/n输入待聚类的数据集X＝[x

【技术特征摘要】
1.一种基于图学习的快速谱嵌入聚类方法，其特征在于，所述方法包括如下步骤：
S10、输入数据：
输入待聚类的数据集X＝[x1,…,xn]T∈Rn×d、设定类簇数c；利用K-means方法选取m个锚点U＝[u1,…,um]T∈Rm×d；
S20、构建组合二部图矩阵，通过组合二部图得到数据点的低维表示F和G：
计算数据点X和锚点U之间的二部图矩阵：Z1∈Rn×m；
计算数据点X和锚点U之间的分配矩阵：Z2∈Rm×m；
得到组合的二部图矩阵：
求出矩阵Z的相似矩阵A，对相似矩阵A进行谱分析，其目标函数为：

其中，Λ∈Rm×m为对角矩阵；其中，

F∈Rn×c和G∈Rm×c分别对应于数据点和锚点的低维表示；
此处对进行奇异值分解，得到H的松弛连续解，从而得到低维的谱嵌入数据；
S30、构建数据点和锚点的低维表示的目标函数：

其中，P为数据点和锚点的相似度矩阵，Q为最大的c个奇异值对应的左右奇异向量的相似度矩阵，fi为对应F∈Rn×c的向量表示形式，gj为对应G∈Rm×c的向量表示形式；λ为约束系数；
S40、判定步骤S30中目标函数是否收敛；若目标函数收敛，则转至步骤S60；若目标函数不收敛，则转至步骤S50；
S50、通过交替迭代优化方式更新目标函数，并返回步骤S20；
S60、输出图结构信息完整的相似度矩阵P，结束。

2.根据权利要求1所述的基于图学习的快速谱嵌入聚类方法，其特征在于，所述步骤S50中：通过交替迭代优化方式更新目标函数，包含步骤如下：<...

【专利技术属性】
技术研发人员：林郭权，杨晓君，郭春炳，阳琴，蔡湧达，许裕雄，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人