【技术实现步骤摘要】
本专利技术涉及一种谱聚类方法,特别是涉及一种。
技术介绍
聚类分析是统计数据分析和处理领域最流行的技术之一。目前已广泛地应用于图像分析、模式识别、机器学习和信息检索等。聚类分析的目标是有效地区分数据集中不同的数据类别(称为“簇”),使得相同簇内数据的相似度大,而不同簇数据之间数据的相似度小。 近年来,谱聚类方法已快速发展成为一类有效的聚类技术。谱聚类方法建立在谱图理论的基础上,主要利用数据集的相似度矩阵的特征向量进行有效聚类。与传统的聚类方法(如 k_均值聚类等)相比,谱聚类方法有很多优点,其不仅实现简单,与维数无关,而且能够在任意形状的数据分布上聚类并收敛于全局的最优解,因此得到了广泛的应用。谱聚类方法把聚类看成是一个图分割问题。一般情况下,谱聚类方法首先建立一个基于所有数据点的图模型(相似度矩阵),图中的边用来表征不同数据点之间的距离。然后在特定的误差度量下对相似度矩阵进行归一化,最后对归一化矩阵的特征值分解得到的低维数据利用简单的聚类方法(如k均值聚类)进行有效聚类。谱聚类方法中相似度矩阵的建立和归一化是影响最终谱聚类性能的关键因素。给定一个相似度矩阵,最 ...
【技术保护点】
基于拉格朗日对偶的半正定谱聚类方法,其特征在于包括以下步骤:1)对给定样本数据集采用主成分分析进行降维;2)基于全向连接图的方法构造样本数据集的相似度矩阵,并采用基于高斯核函数和多项式核函数的加权和方法来计算样本数据对之间的相似度;3)基于拉格朗日对偶性质对相似度矩阵进行半正定归一化求解;4)对归一化矩阵进行奇异值分解,得到前k个最大特征值对应的特征向量组成的矩阵;5)利用传统的k均值聚类或者其他聚类方法对特征向量矩阵进行聚类分析得到最终的聚类结果。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。