【技术实现步骤摘要】
一种基于自适应的密度峰值聚类方法
[0001]本专利技术涉及计算机技术应用领域,具体是一种基于自适应的密度峰值聚类方法。
技术介绍
[0002]聚类是研究分类问题的一种统计分析方法,其所要求划分的类是未知的。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其它的簇中的对象相异。聚类被广泛应用于多个领域,如机器学习、模式识别、图像处理、信息检索等。针对不同的应用和数据特性已出现了千余种不同的聚类算法,但不同的聚类算法都有其特定的适用范围和不足。
[0003]传统的聚类算法大致可以分为划分聚类方法、层次聚类方法、密度聚类方法、网格聚类方法、模型聚类方法等。基于划分的聚类算法中最著名的两个算法分别是k
‑
means算法和FCM(Fuzzy C
‑
Means)算法,基于层次的聚类算法中三个有名的算法分别是CURE(Clustering Using Representative)算法和CHAMELEON算法,基于密度的聚类算法中最为著名的是DBSCAN算法,基于网 ...
【技术保护点】
【技术特征摘要】
1.一种基于自适应的密度峰值聚类方法,主要包括以下步骤:步骤一:首先通过DPC聚类算法计算数据点的局部密度。步骤二:其次通过DPC聚类算法计算数据点与其他密度更高的点之间的最小距离。步骤三:再通过局部密度和最小距离确定初始聚类中心。步骤四:然后使用迪杰斯特拉算法自适应选取簇的数目。步骤五:最后使用模糊C
‑
均值聚类算法自适应确定最终的隶属度矩阵以及聚类中心点集。2.根据权利要求1所述的一种基于自适应簇数目的模糊密度峰值聚类算法,对于任意的数据点i,其局部密度ρ
i
为:3.根据权利要求2所述的局部密度,其中d
ij
是数据点i和j的欧式距离,χ是指示函数,当x<0时,χ(x)=1,否则χ(x)=0;d
c
是截断距离,通常将所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。