【技术实现步骤摘要】
一种基于边界点匹配的聚类方法
本专利技术属于数据挖掘领域,具体是一种基于边界点匹配的聚类方法。
技术介绍
聚类分析是一种无监督的机器学习方法,可以用来分析数据集的结构特征。聚类有效性指标可以对聚类结果进行评价,是聚类分析的重要组成部分。现有的聚类有效性指标主要用来确定最优聚类数,比如Davies-Bouldin指标、TibshiraniGapstatistics指标、Xie-Beni指标等。然而,这些指标具有以下缺点:1)固定的聚类算法。现有的聚类有效性指标大多数基于C-means和FCM算法的聚类结果,而对于其他聚类算法(例DBSCAN)则没有与其对应的聚类有效性指标。2)固定的参数。现有的聚类有效性指标只能对最佳聚类数进行评价,而不能评价聚类过程中的其他参数,比如DBSCAN算法中的邻域半径。
技术实现思路
本专利技术的目的在于克服现有技术的上述不足,提出一种基于边界点匹配的聚类方法。首先按照一定的规则将整个数据集划分为边界与内点,再在某一聚类算法下将数据集划分成若干个聚类,并计算每个 ...
【技术保护点】
1.一种基于边界点匹配的聚类方法,包括下列步骤:/n1)定义边界点/n设X={x
【技术特征摘要】
1.一种基于边界点匹配的聚类方法,包括下列步骤:
1)定义边界点
设X={x1,x2,...,xn}是d维空间中的数据集;记数据集中任意两点xi,xj之间的距离为dist(xi,xj),任意一点xk的p近邻即为距离xk最近的第p个点;定义xk的p近邻密度为前p个近邻距离之和的倒数,如公式(1)所示;
通常,取p=[2dπ];如果一个点的[2dπ]近邻中,有多于一半的点的密度均大于该点,则定义该点为边界点;反之,为内点;
2)计算边界点匹配指标值
...
【专利技术属性】
技术研发人员:李奇,岳士弘,丁明亮,高晓峰,
申请(专利权)人:天津大学,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。