一种参数自适应的密度峰值聚类方法技术

技术编号：19058919 阅读：60 留言：0更新日期：2018-09-29 12:34

本发明专利技术涉及一种参数自适应的密度峰值聚类方法，其特征在于，包括以下步骤：S1：基于数据密度属性自动获得数据角色；S2：以簇头节点为核心实现自动聚类；S3、评价聚类结果与自适应调整聚类参数，迭代优化聚类结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种参数自适应的密度峰值聚类方法
本专利技术属于网络数据通信
，涉及一种通信领域用聚类方法，尤其是一种参数自适应的密度峰值聚类方法。
技术介绍
随着硬件技术，网络通信技术，各种传感设备和各种信息技术的飞速发展，在社会网络，传感器网络，电子商务，网络监控，气象环境监测，金融零售企业等多个应用领域，产生了大量的动态数据，如何在这些数据中获取有效的知识成为大数据应用研究的热点。聚类分析是无监督的机器学习方法，不需要设置样本数据集进行训练就可以对数据进行有效的划分，因此在大数据分析领域具有很好的应用前景。目前聚类算法已经在金融分析、环境监测、工业控制等领域有着广泛的用途，是机器学习领域重要的分支之一。现有的聚类算法需要设置初始参数，实现聚类，而初始参数对计算结果影响较大，需要准确的先验知识设置参数值，导致聚类效率低的缺陷。此为现有技术的不足之处。因此，针对现有技术中的上述缺陷，提供设计一种参数自适应的密度峰值聚类方法；以解决现有技术中的上述缺陷，是非常有必要的。
技术实现思路
本专利技术的目的在于，针对上述现有技术存在的缺陷，提供设计一种参数自适应的密度峰值聚类方法，以解决上述技术问题。为实现上述目的，本专利技术给出以下技术方案：一种参数自适应的密度峰值聚类方法，包括以下步骤：S1：基于数据密度属性自动获得数据角色；S2：以簇头节点为核心实现自动聚类；S3、评价聚类结果与自适应调整聚类参数，迭代优化聚类结果。所述步骤S1包括以下步骤：S11：计算数据点的节点局部密度，用ρ表示节点局部密度，计算公式如下：其中dc是以节点i为中心的邻域Ar的半径，所有在此区域内的点...

【技术保护点】
1.一种参数自适应的密度峰值聚类方法，其特征在于，包括以下步骤：S1：基于数据密度属性自动获得数据角色；S2：以簇头节点为核心实现自动聚类；S3、评价聚类结果与自适应调整聚类参数，迭代优化聚类结果。

【技术特征摘要】
1.一种参数自适应的密度峰值聚类方法，其特征在于，包括以下步骤：S1：基于数据密度属性自动获得数据角色；S2：以簇头节点为核心实现自动聚类；S3、评价聚类结果与自适应调整聚类参数，迭代优化聚类结果。2.根据权利要求1所述的一种参数自适应的密度峰值聚类方法，其特征在于，所述步骤S1包括以下步骤：S11：计算数据点的节点局部密度，用ρ表示节点局部密度，计算公式如下：其中dc是以节点i为中心的邻域Ar的半径，所有在此区域内的点视为i的邻居节点，dij是节点i到节点j的欧氏距离；得到节点的所有密度值之后对其进行从大到小排序得到序列{ρq1，ρq2，...，ρqn}；S12：计算数据点的最近高密度点距离，用δ表示最近高密度点距离；用以下公式计算节点i最近且比i密度高的节点的距离δ；3.根据权利要求2所述的一种参数自适应的密度峰值聚类方法，其特征在于，所述步骤S2包括以下步...

【专利技术属性】
技术研发人员：杜韬，许婧文，曲守宁，王玉栋，武奎，庞战，牟国栋，李国昌，张瑞，刘闯，
申请(专利权)人：济南大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人