【技术实现步骤摘要】
本专利技术涉及聚类分析
,尤其涉及一种可能模糊K调和均值聚类方法及系 统。
技术介绍
聚类是一种无监督学习方法,它寻找数据之间的相互联系,按照相似性原则进行 分类,就是“物以类聚”。聚类广泛应用于模式分类,文本信息提取,图像分割和数据挖掘等 领域。K-均值聚类是著名的聚类方法之一,给定一个数据集和聚类数目k,K-均值聚类能 简洁有效地划分数据集。但是,K-均值聚类的聚类结果依赖于初始聚类中心的选择,不同 的初始聚类中心会导致不同的聚类结果,所以,K-均值聚类对初始聚类中心敏感而导致聚 类结果不稳定。另外,K-均值聚类容易陷入局部极小点。1999年Zhang等人提出K调和均值聚类,是一种基于中心的迭代聚类方法。K调 和均值聚类将所有数据点到每个聚类中心的调和平均值的和作为聚类的目标函数。实验表 明,由于提升函数的作用使K调和均值聚类对初始聚类中心不敏感。但是,K调和均值聚类 也容易陷入局部极小点。因此,许多学者针对此问题展开研究。Yang等人将粒子群优化和 K调和均值聚类相结合,提出一种粒子群优化的K调和均值聚类方法(PSOKHM),PSOKHM能避 免局部极小点,并且解决了粒子群优化收敛速度慢问题。由于蚁群聚类方法能解决局部极 小点问题,Jiang等人提出一种基于蚁群聚类的K调和均值聚类方法。在给定初始温度值后 模拟退火用来搜寻一些空间分子的平衡状态,它是一种求解组合优化问题的方法。和Ctaler在模拟退火和K调和均值聚类基础上提出一种新的聚类算法以求得K调和均值聚 类的全局最优解。禁忌搜索是一种全局逐步寻优算法,Gitagfir和利用禁忌搜索方法 ...
【技术保护点】
一种可能模糊K调和均值聚类方法,其特征在于,所述方法包括以下步骤:S1、确定聚类的初始类中心;S2、设置聚类算法的参数值;S3、计算样本数据的协方差;S4、计算可能模糊K调和均值聚类的模糊隶属度值;S5、计算可能模糊K调和均值聚类的典型值;S6、计算可能模糊K调和均值聚类的聚类中心值;S7、判断是否满足迭代终止条件,若满足则迭代终止,若不满足则返回步骤S3~S6继续进行迭代计算;S8、利用模糊隶属度值和典型值最终实现数据集的划分。
【技术特征摘要】
1.一种可能模糊K调和均值聚类方法,其特征在于,所述方法包括以下步骤 51、确定聚类的初始类中心; 52、设置聚类算法的参数值; 53、计算样本数据的协方差; 54、计算可能模糊K调和均值聚类的模糊隶属度值; 55、计算可能模糊K调和均值聚类的典型值; 56、计算可能模糊K调和均值聚类的聚类中心值; 57、判断是否满足迭代终止条件,若满足则迭代终止,若不满足则返回步骤S3 S6继续进行迭代计算; 58、利用模糊隶属度值和典型值最终实现数据集的划分。2.根据权利要I所述的可能模糊K调和均值聚类方法,其特征在于,所述步骤S2具体为确定类别数k,数据的个数n和权重指数m和q的值,且满足n>k彡2, + >m, q>l ;设置迭代次数初始值r=l和最大迭代次数为设置迭代最大误差参数e ;设置常数a和b的值。3.根据权利要I所述的可能模糊K调和均值聚类方法,其特征在于,所述步骤S3中样本数据的协方差计算公式为 ,IjrZ-^If,其中J = 士,xj为第j个样本数据,F为样本均值,。2为样本数据的协方差。4.根据权利要I所述的可能模糊K调和均值聚类方法,其特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。