一种基于自适应的密度峰值聚类方法技术

技术编号：33777514 阅读：24 留言：0更新日期：2022-06-12 14:31

本发明专利技术涉及一种基于自适应的密度峰值聚类方法，属于密度聚类的基本算法之一，本发明专利技术旨在解决传统的DPC聚类算法中存在的问题，传统的DPC算法对数据进行处理，计算局部密度和最小距离，通过局部密度和最小距离构造决策图，人工选取局部密度和最小距离都较大的点作为聚类中心点，导致聚类的准确度不高，因此针对密度峰值聚类算法不能自适应选取簇的数目，人工选取聚类中心等问题，引入了迪杰特斯拉算法和模糊C

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自适应的密度峰值聚类方法

[0001]本专利技术涉及计算机技术应用领域，具体是一种基于自适应的密度峰值聚类方法。

技术介绍

[0002]聚类是研究分类问题的一种统计分析方法，其所要求划分的类是未知的。由聚类所生成的簇是一组数据对象的集合，这些对象与同一个簇中的对象彼此相似，与其它的簇中的对象相异。聚类被广泛应用于多个领域，如机器学习、模式识别、图像处理、信息检索等。针对不同的应用和数据特性已出现了千余种不同的聚类算法，但不同的聚类算法都有其特定的适用范围和不足。
[0003]传统的聚类算法大致可以分为划分聚类方法、层次聚类方法、密度聚类方法、网格聚类方法、模型聚类方法等。基于划分的聚类算法中最著名的两个算法分别是k
‑
means算法和FCM(Fuzzy C
‑
Means)算法，基于层次的聚类算法中三个有名的算法分别是CURE(Clustering Using Representative)算法和CHAMELEON算法，基于密度的聚类算法中最为著名的是DBSCAN算法，基于网...

【技术保护点】

【技术特征摘要】
1.一种基于自适应的密度峰值聚类方法，主要包括以下步骤：步骤一：首先通过DPC聚类算法计算数据点的局部密度。步骤二：其次通过DPC聚类算法计算数据点与其他密度更高的点之间的最小距离。步骤三：再通过局部密度和最小距离确定初始聚类中心。步骤四：然后使用迪杰斯特拉算法自适应选取簇的数目。步骤五：最后使用模糊C
‑
均值聚类算法自适应确定最终的隶属度矩阵以及聚类中心点集。2.根据权利要求1所述的一种基于自适应簇数目的模糊密度峰值聚类算法，对于任意的数据点i，其局部密度ρ
i
为：3.根据权利要求2所述的局部密度，其中d
ij
是数据点i和j的欧式距离，χ是指示函数，当x<0时，χ(x)＝1，否则χ(x)＝0；d
c
是截断距离，通常将所...

【专利技术属性】
技术研发人员：田新雨，何云斌，杨晓秋，
申请(专利权)人：哈尔滨理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人