一种优化的人工蜂群聚类方法技术

技术编号:11738434 阅读:137 留言:0更新日期:2015-07-15 20:30
一种优化的人工蜂群聚类方法。为了解决传统K-means算法过于依赖初始聚类中心及易陷入局部最优的问题,提出一种优化的人工蜂群聚类方法。首先对初始聚类中心的选取进行改进得到优化蜜源;然后借鉴轮盘赌的思想,采用自动调整搜索步长的动态局部寻优策略改善人工蜂群的局部寻优能力;最后选取UCI的四个数据集进行仿真实验,实验结果表明该方法相比K-means算法、K-means++算法及人工蜂群算法能获得更好的聚类效果,对决策者有一定的参考价值。

【技术实现步骤摘要】

本专利技术涉及一种聚类方法,尤其涉及。
技术介绍
聚类分析是一种重要的无监督学习方法,在数据的内在结构识别方面起到了不可 替代的作用。目前聚类分析广泛应用于模式识别、图像分割、数据压缩及检索、数据挖掘等 领域,并发挥着重要作用。K-means算法是最经典的聚类算法之一,得到了广泛应用及研宄。 它简单、高效,具有良好的局部搜索能力,但存在过于依赖初始聚类中心、易陷入局部最优 等缺陷。 为解决上述问题,许多学者在选择初始聚类中心时对距离进行了度量,与已有聚 类中心距离较远的数据对象有更大概率被选择为新的聚类中心,保证聚类中心之间尽可能 地相互分离,进而提高初始聚类中心质量。诸如此类方法通过选择较优的初始聚类中心对 K-means算法进行优化,在一定程度上改善了聚类效果,但仍可能不同程度地陷入局部最 优。 近年,群智能算法以其良好的全局寻优能力得到越来越多的关注,并被应用到聚 类分析中。人工蜂群(Artificial Bee Colony,简称ABC)算法最初用于函数优化问题,具 有参数少、原理简单、容易实现等优点,且相对于遗传算法、差分进化算法、粒子群算法等具 有更好的调节全局与局部寻优的能力,获得了较好的聚类效果。但ABC算法存在收敛速度 慢,局部寻优能力差等问题,综上所述,迫切需要研宄一种新的聚类方法。
技术实现思路
针对ABC算法存在收敛速度慢,局部寻优能力差等问题,本专利技术研制一种优化的 人工蜂群聚类方法。 本专利技术其特征在于,包括以下步骤: (1)蜜源初始化,使用策略对蜜源进行初始化。 (2)发送雇佣蜂。雇佣蜂采动态局部寻优策略进行局部搜索,并采用贪婪算法选择 较优蜜源。 (3)发送观察蜂。观察蜂首先通过轮盘赌方式选择较优蜜源,然后采用动态局部寻 优策略及贪婪算法对蜜源进行更新。若某蜜源经过limit次后其质量仍得不到提高,则该 蜜源被放弃且所对应的蜜蜂变为侦察蜂。 (4)发送侦察蜂。侦察蜂采用优化策略选择新的蜜源进行下一轮更新。 (5)返回到(2)循环迭代,直到运行次数达到MCL次,并输出结果,即最优聚类中 心。 所述(1)中策略是采用一种基于距离与轮盘赌的选择方法对初始蜜源进行筛选, 保证初始蜜源内部的聚类中心尽可能地相互远离; 所述(2)中动态局部寻优策略是借鉴轮盘赌的思想,基于优化的初始蜜源,提出 一种基于迭代次数的动态搜索策略,以满足方法在优化过程中对全局与局部搜索能力的要 求,改善原始ABC算法收敛速度过慢、局部搜索能力差等问题。【附图说明】 图1是实施流程图。 图2是实验数据图。 图3是方法在不同数据集上的聚类结果比较图。 图4是K-means算法在Iris数据集上的聚类效果图。 图5是方法在Iris数据集上的聚类效果图。 图6是基于ABC的算法效率对比图。【具体实施方式】 为更好地理解本专利技术,下面结合附图和【具体实施方式】对本专利技术进行更为详细描 述。在以下的描述中,当已有的现有技术的详细描述也许会淡化本专利技术的主题内容时,这些 描述在这儿将被忽略。 图1是本专利技术的【具体实施方式】流程图。在本实施例 中,本专利技术的包括以下步骤: 本专利技术采用UCI机器学习数据库中的经典数据集Iris、Wine、GlaSS和Seeds作为 实验数据,如图2所示。 本专利技术采用错误率作为衡量聚类结果的标准。错误率指被错误分类的样本数量与 总样本数量的比值,其公式如下: Error =Jx 100% 通过本专利技术方法过程(1)蜜源初始化,使用策略对蜜源进行初始化。(2)发送雇佣 蜂。雇佣蜂采用动态局部寻优策略进行局部搜索,并采用贪婪算法选择较优蜜源。(3)发送 观察蜂。观察蜂首先通过轮盘赌方式选择较优蜜源,然后采用动态局部寻优策略及贪婪算 法对蜜源进行更新。若某蜜源经过limit次后其质量仍得不到提高,则该蜜源被放弃且所 对应的蜜蜂变为侦察蜂。(4)发送侦察蜂。侦察蜂采用优化策略选择新的蜜源进行下一轮 更新。(5)返回到⑵循环迭代,直到运行次数达到MCL次,并输出结果,即最优聚类中心。 将本专利技术方法与K-means算法、K-means++算法及ABC算法进行对比实验。由于部分算法在 选择初始聚类中心时有一定的随机性,因此每个算法运行20次并取平均值作为实验结果。 蜂群聚类算法的初始参数设置为:蜜源个数SN = 20,放弃阈值limit = SN*D,最大迭代次 数MCL = 20,其中D指各数据集属性数目。为了更清晰地展示本专利技术方法的优劣,将其分两 步进行实验:首先进行基于优化蜜源的蜂群聚类算法(IABC-I)的实验;然后在此基础上加 入动态局部寻优策略(IABC-2),再次进行实验。实验错误率对比结果如图3所示。 从实验结果可以看出,在这四个数据集上,K-means++算法的准确率整体略优于 K-means算法,蜂群算法的表现时好时坏;而本专利技术方法充分利用了上述几种算法的优势, 有效降低了其他算法随机性所导致的较高的聚类错误率,在聚类准确率及稳定性上有了一 定程度的提升。 为了更加直观地表现本专利技术方法的聚类效果,采用多维缩放技术对K-means算法 与本专利技术方法在Iris数据集上的聚类结果进行二维形式的展现,如图4、图5所示。由聚类 效果图可以看出,本专利技术方法对样本集的划分较为合理,取得了较好的聚类结果。 此外,我们对算法的运行时间也进行了对比,如图6所示。我们注意到,本专利技术方 法的效率高于原始ABC算法;IABC-I的效率高于IABC-2但精确性方面稍差。 尽管上面对本专利技术说明性的【具体实施方式】进行了描述,但应当清楚,本专利技术不限 于【具体实施方式】的范围,对本
的普通技术人员来讲,只要各种变化在所附的权利 要求限定和确定的本专利技术的精神和范围内,这些变化是显而易见的,一切利用本专利技术构思 的专利技术创造均在保护之列。【主权项】1. ,其特征在于,包括以下步骤:(1)蜜源初始化,使用 策略对蜜源进行初始化。(2)发送雇佣蜂。雇佣蜂采用动态局部寻优策略进行局部搜索, 并采用贪婪算法选择较优蜜源。(3)发送观察蜂。观察蜂首先通过轮盘赌方式选择较优蜜 源,然后采用动态局部寻优策略及贪婪算法对蜜源进行更新。若某蜜源经过limit次后其 质量仍得不到提高,则该蜜源被放弃且所对应的蜜蜂变为侦察蜂。(4)发送侦察蜂。侦察蜂 采用策略选择新的蜜源进行下一轮更新。(5)返回到(2)循环迭代,直到运行次数达到MCL 次,并输出结果,即最优聚类中心。2. 根据权利要求1所述的其特征在于:权利要求1中 (1)所述策略是采用一种基于距离与轮盘赌的选择方法对初始蜜源进行筛选,保证初始蜜 源内部的聚类中心尽可能地相互远离; 权利要求1中(2)所述动态局部寻优策略是借鉴轮盘赌的思想,基于优化的初始蜜源, 提出一种基于迭代次数的动态搜索策略,以满足方法在优化过程中对全局与局部搜索能力 的要求,改善原始ABC算法收敛速度过慢、局部搜索能力差等问题。【专利摘要】。为了解决传统K-means算法过于依赖初始聚类中心及易陷入局部最优的问题,提出。首先对初始聚类中心的选取进行改进得到优化蜜源;然后借鉴轮盘赌的思想,采用自动调整搜索步长的动态局部寻优策略改善人工蜂群的局部寻优能力;最后选取UCI的四个数据集进行仿真实验,实验结果表明该本文档来自技高网
...

【技术保护点】
一种优化的人工蜂群聚类方法,其特征在于,包括以下步骤:(1)蜜源初始化,使用策略对蜜源进行初始化。(2)发送雇佣蜂。雇佣蜂采用动态局部寻优策略进行局部搜索,并采用贪婪算法选择较优蜜源。(3)发送观察蜂。观察蜂首先通过轮盘赌方式选择较优蜜源,然后采用动态局部寻优策略及贪婪算法对蜜源进行更新。若某蜜源经过limit次后其质量仍得不到提高,则该蜜源被放弃且所对应的蜜蜂变为侦察蜂。(4)发送侦察蜂。侦察蜂采用策略选择新的蜜源进行下一轮更新。(5)返回到(2)循环迭代,直到运行次数达到MCL次,并输出结果,即最优聚类中心。

【技术特征摘要】

【专利技术属性】
技术研发人员:龚安高云马兴敏唐永红刘亚囡
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1