一种基于带有多样化半径技术的小生境遗传算法的聚类方法技术

技术编号：10815086 阅读：103 留言：0更新日期：2014-12-24 19:22

一种基于带有多样化半径技术的小生境遗传算法的聚类方法，所述聚类方法包括以下步骤：1)染色体编码和种群初始化；2)计算个体适应度；3)采用动态识别方法识别群体中的小生境位置、内容和数目；4)执行多样化半径机制调整各个小生境的半径信息；5)应用适应度共享函数重新计算个体的新适应度；6)执行选择、交叉和变异操作；7)执行精英策略替换群体中最差的个体；8)若满足终止条件，则终止运行；否则，跳转至步骤5)。本发明专利技术提供一种具有很好的聚类效果、稳定性良好的基于带有多样化半径技术的小生境遗传算法的聚类方法。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】，所述聚类方法包括以下步骤：1)染色体编码和种群初始化；2)计算个体适应度；3)采用动态识别方法识别群体中的小生境位置、内容和数目；4)执行多样化半径机制调整各个小生境的半径信息；5)应用适应度共享函数重新计算个体的新适应度；6)执行选择、交叉和变异操作；7)执行精英策略替换群体中最差的个体；8)若满足终止条件，则终止运行；否则，跳转至步骤5)。本专利技术提供一种具有很好的聚类效果、稳定性良好的基于带有多样化半径技术的小生境遗传算法的聚类方法。【专利说明】一种基于带有多样化半径技术的小生境遗传算法的聚类方法
本专利技术涉及数据挖掘技术，尤其是一种聚类方法。
技术介绍
数据挖掘是从海量的、模糊的、有噪声的、随机的、不完全的数据中，发掘隐含的、尚未发现的、却又是可能有用的信息和知识的过程。聚类分析是数据挖掘的一个重要内容和基本形式之一，数据聚类是指根据数据的内在特征，通过某种度量方式将数据分成若干聚合类，使每一个聚合类内的数据具有相似的特性，不同聚合类之间的数据的特性具有尽可能大的差异性。对于实际要解决的数据集，在进行聚类分析时，具体应该选择哪种或哪类聚类算法，主要考虑数据的类型特征、算法的特点以及聚类的目标几个因素。有时，也需要同时采用多种聚类方法，以从不同的角度分析数据的特征，从而找出真正想要的结果。总体上，主要的聚类算法可以分为如下几类： 1)基于划分方法对于含有η个数据的数据集，基于划分的方法需要用户预先给定最终划分的数目 k，然后根据目标函数的最小化组合，将数据划分为k组。此时，...

【技术保护点】
一种基于带有多样化半径技术的小生境遗传算法的聚类方法，其特征在于：所述聚类方法包括以下步骤：1)染色体编码和种群初始化一个染色体被编码成一个聚类中心，每个染色体由v个实数组成，染色体表示为c＝[c1,c2,…,cv]，这里v代表特征空间的维数；随机选取N个数据点，N为群体规模，每个数据点是由v维实数组成，每个数据点表示一个染色体且没有重复的数据点；2)计算个体适应度令X＝{x1,x2,…,xn}是N维向量空间的一个子集，K是聚类数目，S(xj,ci)表示数据点Xj和第i个聚类中心ci的相似性度量函数，聚类目标是找出ci使总相似度J(c)最大，J(c)表示为：J(c)=Σi=1KΣj=1n(exp(-||xj-ci||2β))γ---(1)]]>c＝(c1,c2,…,ck),β定义为：β=Σj=1n||xj-x‾||2n---(2)]]>其中，x‾=Σj=1nxjn,;]]>令Js(xk)表示数据点xk到其他所有点的总相似度，且Js(xk)的计算方式如下：Js(xk)=&Sig...

【技术特征摘要】

【专利技术属性】
技术研发人员：盛伟国，范东成，汪晓妍，李军伟，何俊丽，陈胜勇，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人