一种数据聚类处理方法技术

技术编号：25891269 阅读：29 留言：0更新日期：2020-10-09 23:33

本发明专利技术涉及一种数据聚类处理方法，属于人工鱼群算法领域，本发明专利技术包括对标准人工鱼群算法(AFSA)的改进与人工鱼群算法(AFSA)和K‑means算法混合进行数据聚类处理；针对K‑MEANS算法存在初始聚类中心点难以确定的缺陷，引入人工鱼群算法；针对人工鱼群算法中鱼群在觅食行为中随机性过大、聚群行为中围绕最优解以及追尾行为的盲目性问题分别进行改进，减少了个体鱼随机搜索的迂回现象和追尾行为中的盲目性，并允许聚群行为中忽略拥挤度因子，达到快速收敛到全局最优解。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据聚类处理方法
本专利技术涉及人工鱼群算法
，具体为一种数据聚类处理方法。
技术介绍
聚类是一种常用的数据挖掘方法，在进行数据挖掘前，数据库本身大量的数据杂乱无章，数据的性质、类型、表达方式千差万别，为了将这些复杂的数据简约化、明晰化，需要使用聚类来梳理数据，以便根据需求快速地筛选出所需数据，只对有需求的数据进行储存和管理，并且在实际应用中还可根据需求对数据处理对象进行快速响应和改变，为使用者的各种经营活动提供重要的参考信息，满足客户实际需求；聚类的数学描述如下：令S＝{x1，x2，x3，...，xn}表示为数量为n个对象的集合，xi表示集合中第i个对象，Dk表示第k个簇(k＝{1，2，3，...，m})，用R(xi，xj)表示两个对象问的相似性，则每一个簇需要满足下列条件：但是目前广泛使用的K-MEANS算法存在初始聚类中心点难以确定的缺陷，影响力实际工作效率，因此针对此缺陷引入人工鱼群算法，而鱼群存在有觅食行为中随机性过大、聚群行为出现的迂回问题以及追尾行为的盲目性问题，需针对性进行改进。
技术实现思路
针对K-MEANS算法存在初始聚类中心点难以确定的缺陷问题，本专利技术公开了一种数据聚类处理方法。本专利技术技术方案是：一种数据聚类处理方法，包括如下步骤：(1)设定种群数量n，视野visual，步长step，尝试次数try，拥挤度因子，迭代次数T，目标函数f(x)，交叉概率C；(2)初始化人工鱼群；(3)按个...

【技术保护点】
1.一种数据聚类处理方法，其特征在于：包括如下步骤：/n(1)设定种群数量n，视野visual，步长step，尝试次数try，拥挤度因子，迭代次数T，目标函数f(x)，交叉概率C；/n(2)初始化人工鱼群；/n(3)按个体鱼当前状态的适应度值进行排序分为优秀组G和懈怠组W，并以公式计算步长step、视野visual，根据分组不同计算尝试次数try；/n(4)进行追尾和聚群行为；/n(5)比对追尾行为和聚群行为产生的适用度值，择优选择，跳转至步骤(6)；若未找到，则进入觅食行为向周遭尝试，若有较优状态则向其移动，若达到尝试次数try，则令flag

【技术特征摘要】
1.一种数据聚类处理方法，其特征在于：包括如下步骤：
(1)设定种群数量n，视野visual，步长step，尝试次数try，拥挤度因子，迭代次数T，目标函数f(x)，交叉概率C；
(2)初始化人工鱼群；
(3)按个体鱼当前状态的适应度值进行排序分为优秀组G和懈怠组W，并以公式计算步长step、视野visual，根据分组不同计算尝试次数try；
(4)进行追尾和聚群行为；
(5)比对追尾行为和聚群行为产生的适用度值，择优选择，跳转至步骤(6)；若未找到，则进入觅食行为向周遭尝试，若有较优状态则向其移动，若达到尝试次数try，则令flagi为个体鱼i的历史移动标志位，并记录该个体探查到的历史最优状态，通过历史标志位和历史较优状态的记录，对在局部较优状态处迂回的个体鱼进行标记，不再向该方向移动，而随机选择其他方向，直到找到优于记录的历史较优状态；
(6)将个体鱼执行行为所得到的结果与公告板上的历史最大适应度值相比，若大于公告板所记录则进行替换，否则保持；
(7)判断是否得到目标解，若得到则转向步骤(9)，若没有则继续迭代；
(8)判断迭代是否达到上限，若是转步骤(9)，若未迭代完成则转步骤(3)；
(9)将当前最优解作为K-means算法的初始聚类中心进行数据处理；
(10)算法终止。

2.根据权利要求1所述的一种数据聚类处理方法，其特征在于：计算所有个体鱼当前的状态Xi的适应度值f(Xi)，并以该适应度值从小到大进行排列分为两组，优秀组G与懈怠组W，令迭代次数为T，迭代次数的上限为Tma...

【专利技术属性】
技术研发人员：谢金柱，邹国斌，耿蓉，
申请(专利权)人：知舟信息科技镇江有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人