一种数据聚类处理方法技术

技术编号:25891269 阅读:29 留言:0更新日期:2020-10-09 23:33
本发明专利技术涉及一种数据聚类处理方法,属于人工鱼群算法领域,本发明专利技术包括对标准人工鱼群算法(AFSA)的改进与人工鱼群算法(AFSA)和K‑means算法混合进行数据聚类处理;针对K‑MEANS算法存在初始聚类中心点难以确定的缺陷,引入人工鱼群算法;针对人工鱼群算法中鱼群在觅食行为中随机性过大、聚群行为中围绕最优解以及追尾行为的盲目性问题分别进行改进,减少了个体鱼随机搜索的迂回现象和追尾行为中的盲目性,并允许聚群行为中忽略拥挤度因子,达到快速收敛到全局最优解。

【技术实现步骤摘要】
一种数据聚类处理方法
本专利技术涉及人工鱼群算法
,具体为一种数据聚类处理方法。
技术介绍
聚类是一种常用的数据挖掘方法,在进行数据挖掘前,数据库本身大量的数据杂乱无章,数据的性质、类型、表达方式千差万别,为了将这些复杂的数据简约化、明晰化,需要使用聚类来梳理数据,以便根据需求快速地筛选出所需数据,只对有需求的数据进行储存和管理,并且在实际应用中还可根据需求对数据处理对象进行快速响应和改变,为使用者的各种经营活动提供重要的参考信息,满足客户实际需求;聚类的数学描述如下:令S={x1,x2,x3,...,xn}表示为数量为n个对象的集合,xi表示集合中第i个对象,Dk表示第k个簇(k={1,2,3,...,m}),用R(xi,xj)表示两个对象问的相似性,则每一个簇需要满足下列条件:但是目前广泛使用的K-MEANS算法存在初始聚类中心点难以确定的缺陷,影响力实际工作效率,因此针对此缺陷引入人工鱼群算法,而鱼群存在有觅食行为中随机性过大、聚群行为出现的迂回问题以及追尾行为的盲目性问题,需针对性进行改进。
技术实现思路
针对K-MEANS算法存在初始聚类中心点难以确定的缺陷问题,本专利技术公开了一种数据聚类处理方法。本专利技术技术方案是:一种数据聚类处理方法,包括如下步骤:(1)设定种群数量n,视野visual,步长step,尝试次数try,拥挤度因子,迭代次数T,目标函数f(x),交叉概率C;(2)初始化人工鱼群;(3)按个体鱼当前状态的适应度值进行排序分为优秀组G和懈怠组W,并以公式计算步长step、视野visual,根据分组不同计算尝试次数try;(4)进行追尾和聚群行为;(5)比对追尾行为和聚群行为产生的适用度值,择优选择,跳转至步骤(6);若未找到,则进入觅食行为向周遭尝试,若有较优状态则向其移动,若达到尝试次数try,则令flagi为个体鱼i的历史移动标志位,并记录该个体探查到的历史最优状态,通过历史标志位和历史较优状态的记录,对在局部较优状态处迂回的个体鱼进行标记,不再向该方向移动,而随机选择其他方向,直到找到优于记录的历史较优状态;(6)将个体鱼执行行为所得到的结果与公告板上的历史最大适应度值相比,若大于公告板所记录则进行替换,否则保持;(7)判断是否得到目标解,若得到则转向步骤(9),若没有则继续迭代;(8)判断迭代是否达到上限,若是转步骤(9),若未迭代完成则转步骤(3);(9)将当前最优解作为K-means算法的初始聚类中心进行数据处理;(10)算法终止。所述方法的具体步骤如下:计算所有个体鱼当前的状态Xi的适应度值f(Xi),并以该适应度值从小到大进行排列分为两组,优秀组G与懈怠组W,令迭代次数为T,迭代次数的上限为Tmax,优秀组G的步长step及视野visual由下列公式计算:以的概率;懈怠组W的步长step及视野visual由下列公式计算:以的概率;根据优秀组G与懈怠组W的不同分别选择不同的尝试次数,当时,try=β×try.β∈(1,1.5),当对,try=β×try.β∈(0,0.5);计算个体鱼当前的适应度值与适应度值总和的比值,适用度值越大的个体鱼获得全局最优的几率越大,计算个体鱼与其视野范围内聚群中心的距离并另,以的概率执行原聚群行为;追尾行为以交叉概率C使当前个体鱼与目标鱼的位置互换,而视野visual、补偿、尝试次数try不做变换;设初始flagi=0,个体尝试次数到达上限后随机移动一步,记录移动前的最优状态,并另flagi=1;迭代后个体鱼继续追尾和聚群行为,若两者无较优状态则尝试周围环境状态,当尝试到的环境状态与历史较优状态相同时,说明个体鱼重新探查到了上一次移动的起点,令flagi=-1,并移动回起点等待下次重新探查;当flagi=-1时说明个体鱼已经进行过一次迂回移动,在后续移动中如果再次探查到历史较优状态,则不再向该方向移动,而随机选择其他方向,直到找到优于记录的历史较优状态,替换记录并令flagi=1。本专利技术的有益效果是:在对业务流程进行改造和信息集成化管理中,针对K-MEANS算法存在初始聚类中心点难以确定的缺陷,引入人工鱼群算法,消除算法前期聚类中心的不确定性,提高算法的效率,对客户所需数据能过更快更准确的进行收集并便于后期的提取;针对人工鱼群算法中鱼群在觅食行为中随机性过大、聚群行为中围绕最优解以及追尾行为的盲目性问题分别进行改进,减少了个体鱼随机搜索的迂回现象和追尾行为中的盲目性,并允许聚群行为中忽略拥挤度因子,达到快速收敛到全局最优解,提高前期准备所需聚类中心的计算效率;将前期数据挖掘与后期数据聚类处理一体化,准确快速的为使用者的各种经营活动提供重要的参考数据。附图说明图1为本算法流程图;图2为函数(1)在两种算法上运行次数与目标函数值的关系曲线图;图3为函数(2)在两种算法上运行次数与目标函数值的关系曲线图;图4为函数(3)在两种算法上运行次数与目标函数值的关系曲线图;图5为函数(4)在两种算法上运行次数与目标函数值的关系曲线图。具体实施方式下面通过具体实验仿真来详细说明本专利技术;实施例1:如图2-5所示,一种数据聚类处理方法,包括如下步骤:(1)设定种群数量n,视野visual,步长step,尝试次数try,拥挤度因子,迭代次数T,目标函数f(x),交叉概率C;(2)初始化人工鱼群;(3)按个体鱼当前状态的适应度值进行排序分为优秀组G和懈怠组W,并以公式计算步长step、视野visual,根据分组不同计算尝试次数try;(4)进行追尾和聚群行为;(5)比对追尾行为和聚群行为产生的适用度值,择优选择,跳转至步骤(6);若未找到,则进入觅食行为向周遭尝试,若有较优状态则向其移动,若达到尝试次数try,则令flagi为个体鱼i的历史移动标志位,并记录该个体探查到的历史最优状态,通过历史标志位和历史较优状态的记录,对在局部较优状态处迂回的个体鱼进行标记,不再向该方向移动,而随机选择其他方向,直到找到优于记录的历史较优状态;(6)将个体鱼执行行为所得到的结果与公告板上的历史最大适应度值相比,若大于公告板所记录则进行替换,否则保持;(7)判断是否得到目标解,若得到则转向步骤(9),若没有则继续迭代;(8)判断迭代是否达到上限,若是转步骤(9),若未迭代完成则转步骤(3);(9)将当前最优解作为K-means算法的初始聚类中心进行数据处理;(10)算法终止。具体仿真实验如下:如图2-5所示,A采用四种函数分别使用改进的人工鱼群算法进行运算并与标准人工鱼群进行对比;B函数一:i=1:20,-512≤xi≤512;C函数二:D函数三:E函数四:本文档来自技高网...

【技术保护点】
1.一种数据聚类处理方法,其特征在于:包括如下步骤:/n(1)设定种群数量n,视野visual,步长step,尝试次数try,拥挤度因子,迭代次数T,目标函数f(x),交叉概率C;/n(2)初始化人工鱼群;/n(3)按个体鱼当前状态的适应度值进行排序分为优秀组G和懈怠组W,并以公式计算步长step、视野visual,根据分组不同计算尝试次数try;/n(4)进行追尾和聚群行为;/n(5)比对追尾行为和聚群行为产生的适用度值,择优选择,跳转至步骤(6);若未找到,则进入觅食行为向周遭尝试,若有较优状态则向其移动,若达到尝试次数try,则令flag

【技术特征摘要】
1.一种数据聚类处理方法,其特征在于:包括如下步骤:
(1)设定种群数量n,视野visual,步长step,尝试次数try,拥挤度因子,迭代次数T,目标函数f(x),交叉概率C;
(2)初始化人工鱼群;
(3)按个体鱼当前状态的适应度值进行排序分为优秀组G和懈怠组W,并以公式计算步长step、视野visual,根据分组不同计算尝试次数try;
(4)进行追尾和聚群行为;
(5)比对追尾行为和聚群行为产生的适用度值,择优选择,跳转至步骤(6);若未找到,则进入觅食行为向周遭尝试,若有较优状态则向其移动,若达到尝试次数try,则令flagi为个体鱼i的历史移动标志位,并记录该个体探查到的历史最优状态,通过历史标志位和历史较优状态的记录,对在局部较优状态处迂回的个体鱼进行标记,不再向该方向移动,而随机选择其他方向,直到找到优于记录的历史较优状态;
(6)将个体鱼执行行为所得到的结果与公告板上的历史最大适应度值相比,若大于公告板所记录则进行替换,否则保持;
(7)判断是否得到目标解,若得到则转向步骤(9),若没有则继续迭代;
(8)判断迭代是否达到上限,若是转步骤(9),若未迭代完成则转步骤(3);
(9)将当前最优解作为K-means算法的初始聚类中心进行数据处理;
(10)算法终止。


2.根据权利要求1所述的一种数据聚类处理方法,其特征在于:计算所有个体鱼当前的状态Xi的适应度值f(Xi),并以该适应度值从小到大进行排列分为两组,优秀组G与懈怠组W,令迭代次数为T,迭代次数的上限为Tma...

【专利技术属性】
技术研发人员:谢金柱邹国斌耿蓉
申请(专利权)人:知舟信息科技镇江有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1