一种基于自适应的密度峰值聚类方法技术

技术编号:33777514 阅读:24 留言:0更新日期:2022-06-12 14:31
本发明专利技术涉及一种基于自适应的密度峰值聚类方法,属于密度聚类的基本算法之一,本发明专利技术旨在解决传统的DPC聚类算法中存在的问题,传统的DPC算法对数据进行处理,计算局部密度和最小距离,通过局部密度和最小距离构造决策图,人工选取局部密度和最小距离都较大的点作为聚类中心点,导致聚类的准确度不高,因此针对密度峰值聚类算法不能自适应选取簇的数目,人工选取聚类中心等问题,引入了迪杰特斯拉算法和模糊C

【技术实现步骤摘要】
一种基于自适应的密度峰值聚类方法


[0001]本专利技术涉及计算机技术应用领域,具体是一种基于自适应的密度峰值聚类方法。

技术介绍

[0002]聚类是研究分类问题的一种统计分析方法,其所要求划分的类是未知的。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其它的簇中的对象相异。聚类被广泛应用于多个领域,如机器学习、模式识别、图像处理、信息检索等。针对不同的应用和数据特性已出现了千余种不同的聚类算法,但不同的聚类算法都有其特定的适用范围和不足。
[0003]传统的聚类算法大致可以分为划分聚类方法、层次聚类方法、密度聚类方法、网格聚类方法、模型聚类方法等。基于划分的聚类算法中最著名的两个算法分别是k

means算法和FCM(Fuzzy C

Means)算法,基于层次的聚类算法中三个有名的算法分别是CURE(Clustering Using Representative)算法和CHAMELEON算法,基于密度的聚类算法中最为著名的是DBSCAN算法,基于网格的聚类算法的典型代本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于自适应的密度峰值聚类方法,主要包括以下步骤:步骤一:首先通过DPC聚类算法计算数据点的局部密度。步骤二:其次通过DPC聚类算法计算数据点与其他密度更高的点之间的最小距离。步骤三:再通过局部密度和最小距离确定初始聚类中心。步骤四:然后使用迪杰斯特拉算法自适应选取簇的数目。步骤五:最后使用模糊C

均值聚类算法自适应确定最终的隶属度矩阵以及聚类中心点集。2.根据权利要求1所述的一种基于自适应簇数目的模糊密度峰值聚类算法,对于任意的数据点i,其局部密度ρ
i
为:3.根据权利要求2所述的局部密度,其中d
ij
是数据点i和j的欧式距离,χ是指示函数,当x<0时,χ(x)=1,否则χ(x)=0;d
c
是截断距离,通常将所...

【专利技术属性】
技术研发人员:田新雨何云斌杨晓秋
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1