一种自适应尺度网格和扩散强度的密度峰值聚类方法技术

技术编号：39577006 阅读：15 留言：0更新日期：2023-12-03 19:28

本发明专利技术涉及数据集聚类技术领域，具体涉及一种自适应尺度网格和扩散强度的密度峰值聚类方法；将原数据点按照自适应尺度网格划分映射到网格空间中，并根据网格密度阈值划分将网格划分为稠密网格和稀疏网格，并将数据点映射到网格空间

全部详细技术资料下载

【技术实现步骤摘要】
一种自适应尺度网格和扩散强度的密度峰值聚类方法

[0001]本专利技术涉及数据集聚类
，尤其涉及一种自适应尺度网格和扩散强度的密度峰值聚类方法
。

技术介绍

[0002]聚类分析是一种无监督的学习方法，其目的是按照特定的标准，将数据划分到不同的簇中，探索数据的隐含信息，作为一种数据分析方法，聚类分析被广泛的应用于数据分析，图像处理，生物信息学，模式识别，机器学习等领域；目前在数据集聚类过程中，采用密度峰值聚类算法，即
DPC
算法，但采用密度峰值聚类算法进行数据集聚类时，无法处理更高维度的数据聚类
。

技术实现思路

[0003]本专利技术的目的在于提供一种自适应尺度网格和扩散强度的密度峰值聚类方法，能够获得处理更高维度的数据聚类的效果
。
[0004]为实现上述目的，本专利技术采用的一种自适应尺度网格和扩散强度的密度峰值聚类方法，包括如下步骤：
[0005]步骤1，将原数据点按照自适应尺度网格划分映射到网格空间中，并根据网格密度阈值划分将网格划分为稠密网格和稀疏网格，并将数据点映射到网格空间
T
g
，计算每个网格密度，将网格单元视为后续聚类步骤中的聚类对象；
[0006]步骤2，根据密度波动划分网格并计算连通度；
[0007]步骤3，计算相对距离和扩散强度，筛选假定中心并划分初始簇；
[0008]步骤4，查找簇间边缘网格的密度峰值；
[0009]步骤5，多簇合并；
[0010...

【技术保护点】

【技术特征摘要】
1.
一种自适应尺度网格和扩散强度的密度峰值聚类方法，其特征在于，包括如下步骤：步骤1，将原数据点按照自适应尺度网格划分映射到网格空间中，并根据网格密度阈值划分将网格划分为稠密网格和稀疏网格，并将数据点映射到网格空间
T
g
，计算每个网格密度，将网格单元视为后续聚类步骤中的聚类对象；步骤2，根据密度波动划分网格并计算连通度；步骤3，计算相对距离和扩散强度，筛选假定中心并划分初始簇；步骤4，查找簇间边缘网格的密度峰值；步骤5，多簇合并；步骤6，将网格聚类结果映射到原数据集
。2.
如权利要求1所述的自适应尺度网格和扩散强度的密度峰值聚类方法，其特征在于，在步骤2，根据密度波动划分网格并计算连通度的步骤中：将
ρ
g
＜
θ
记为稀疏网络，反之则记为稠密网格，计算每个稠密网格的连通度
h
g
和全局连通分支数
ω
。3.
如权利要求1所述的自适应尺度网格和扩散强度的密度峰值聚类方法，其特征在于，在步骤3，计算相对距离和扩散强度，筛选假定中心并划分初始簇的步骤中：采用
d
维空间中的切比雪夫距离来计算网格
ob
i
的相对距离
δ
i
，其中
ob
ip
是该网格的
p
维坐标：坐标：计算每个网格的中心度后将其降序排列并开始遍历查找，若在网格
i
周围
δ
i
的半径范围内，
γ
i
＞
γ
j
(j≠i)
，该网格即为假定中心；非中心网格再根据最近邻且
γ
值最高...

【专利技术属性】
技术研发人员：王玥洋，佘堃，刘书舟，于钥，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人