【技术实现步骤摘要】
一种基于改进的引力场算法的聚类方法
本专利技术涉及数据算法领域,特别涉及一种基于改进的引力场算法的聚类方法。
技术介绍
聚类分析是常见的数据挖掘技术。聚类分析是一个将未标记的数据集划分为若干簇的过程。聚类是将相异的数据尽可能地分开,而将相似的数据聚成一个类别(簇),使得同一类别的数据具有尽可能高的同质性(homogeneity),类别之间有尽可能高的异质性(heterogeneity),从而方便从数据中发现隐含的有用信息。聚类分析技术已被应用在许多领域中,例如网络挖掘,文本挖掘,图像处理,股票预测,信号处理,生物学以及其他科学和工程领域。传统的聚类算法分为两大类:基于分层的聚类算法和基于划分的聚类算法。分层聚类具体可分为“自底向上”和“自顶向下”两种方案。在“自底向上”方案中,初始时每个数据点组成一个单独的组,在接下来的迭代中,按一定的距离度量将相互邻近的组合并成一个组,直至所有的记录组成一个分组或者满足某个条件为止。在划分模式下,所有对象从一开始就被视为一个群集,然后将每个群集分为两个群集,直到满足终止条件为止。代 ...
【技术保护点】
1.一种基于改进的引力场算法的聚类方法,其特征在于,具体流程如下:/n(1)随机初始化灰尘群体,计算灰尘的质量;/n(2)对灰尘进行随机分组,计算每组的中心灰尘和当前质量最大的灰尘;/n(3)进入收缩-膨胀阶段,执行收缩、膨胀等操作对灰尘群里进行精英化,当满足终止条件时,进入下一阶段(4),否则继续执行(3);/n(4)进入移动、自转阶段,执行移动、自转操作,若执行爆炸策略的条件满足,则进入(5),否则继续执行(4);/n(5)执行爆炸策略,若满足算法结束条件,则执行(6);/n(6)返回最优解,算法结束。/n
【技术特征摘要】
1.一种基于改进的引力场算法的聚类方法,其特征在于,具体流程如下:
(1)随机初始化灰尘群体,计算灰尘的质量;
(2)对灰尘进行随机分组,计算每组的中心灰尘和当前质量最大的灰尘;
(3)进入收缩-膨胀阶段,执行收缩、膨胀等操作对灰尘群里进行精英化,当满足终止条件时,进入下一阶段(4),否则继续执行(3);
(4)进入移动、自转阶段,执行移动、自转操作,若执行爆炸策略的条件满足,则进入(5),否则继续执行(4);
(5)执行爆炸策略,若满足算法结束条件,则执行(6);
(6)返回最优解,算法结束。
2.根据权利要求1所述的一种基于改进的引力场算法的聚类方法,其特征在于,在引力场算法中,每个粒子对应优化问题的一个解,可用四元组Di(Xi,Mi,Gi,Fi)表示,其中Xi表示粒子的位置,Mi为灰尘的质量,Gi为粒子所在的组号,Fi是一个0/1的二值变量,值为1时表示该粒子为中心灰尘,为0时表示该灰尘粒子为环境灰尘,聚类数据集规模是n×d的(n个数据,d个特征),k是聚类中心的个数,那么每一个灰尘的位置可以被表示为一个k×d的矩阵,其中,每一行是一个聚类中心,每个聚类中心有d个特征,有k个聚类中心,即有k行。
3.根据权利要求1所述的一种基于改进的引力场算法的聚类方法,其特征在于,在灰尘初始化之后,引力场算法中,...
【专利技术属性】
技术研发人员:黄岚,胡雪梅,王岩,杨森,
申请(专利权)人:吉林大学,
类型:发明
国别省市:吉林;22
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。