一种基于杂交水稻算法优化的模糊C均值聚类方法及系统技术方案

技术编号:20161137 阅读:21 留言:0更新日期:2019-01-19 00:13
本发明专利技术公开了一种基于杂交水稻算法优化的模糊C均值聚类方法及系统,方法包括:初始化该优化算法参数,预处理待聚类的数据集;构建目标函数,即对可行解的评价函数;对目标函数进行最优值求解,得到最优值并确定对应的最优初始聚类中心;根据最优初始聚类中心进行模糊C均值聚类,最终得到聚类结果。系统包括初始化模块、编码模块、适用度值计算模块、最优值计算模块、最优初始聚类中心计算模块、模糊C均值聚类模块、输出模块;采用本发明专利技术对模糊C均值聚类进行基于杂交水稻算法的初始聚类中心优化,解决了模糊聚类效果极易受随机初始聚类中心的影响。

【技术实现步骤摘要】
一种基于杂交水稻算法优化的模糊C均值聚类方法及系统
本专利技术属于无监督学习
,涉及一种模糊C均值聚类方法及系统,具体涉及一种基于杂交水稻算法优化的模糊C均值聚类方法及系统。
技术介绍
模糊C均值(FCM)是一种基于无监督学习机制的常用聚类方法,该聚类函数利用聚类中心(距离)计算函数和FCM目标函数。FCM的主要步骤是迭代过程,它更新隶属函数值和中心位置及其值。在FCM中,高隶属度值表示更靠近该类中心,低隶属度值表示距该类中心较远。FCM对初始聚类中心极其敏感,聚类数目、数据集特征和模糊指数m等因素都对聚类效果影响很大,不同的初始聚类中心即可能导致不同的聚类结构,该聚类算法易受初始聚类中心影响而陷入局部最优,初始聚类中心的选取是问题所在。解决聚类算法中初始聚类中心选取的问题的方法主要有传统的数学逻辑方法和智能计算算法两大类,传统的方法由于自身逻辑复杂或者难以保证有效形成更优的初始聚类中心,导致其在面对聚类算法初始类中心选取这类非线性优化问题时求解难度较高。传统的粒子群算法在面对高维度、大规模、多约束的初始聚类中心选取问题容易陷入局部最优解而不能保证全局收敛。
技术实现思路
本专利技术的目的是提供一种基于杂交水稻算法优化的模糊C均值聚类方法及系统,对模糊C均值聚类进行基于杂交水稻算法的初始聚类中心优化,解决了模糊聚类结果极易受初始聚类中心的选取的影响而陷入局部最优的问题。本专利技术的方法所采用的技术方案是:一种基于杂交水稻算法优化的模糊C均值聚类方法,其特征在于,包括以下步骤:步骤1:初始化杂交水稻算法参数,预处理待聚类的若干数据集,即标签编码以及数据归一化;根据数据集描述设置各待聚类数据集的聚类数目;所述参数包括水稻种群数N、最大育种次数maxIteration、最大自交次数maxTime;每个水稻个体为最优初始聚类中心的候选解;步骤2:根据杂交水稻优化算法对初始聚类中心进行编码,并使用对其评价作为目标函数;步骤3:根据目标函数计算水稻种群各个体适用度值;步骤4:根据杂交水稻算法结合模糊聚类初始聚类中心对所述目标函数进行最优值求解,得到最优值;步骤5:根据所述最优值确定对应的最优初始聚类中心;步骤6:最优初始聚类中心作为模糊C均值聚类的初始化聚类中心,进行模糊C均值聚类;步骤7:输出优化后的模糊聚类结果。本专利技术的系统所采用的技术方案是:一种基于杂交水稻算法优化的模糊C均值聚类系统,其特征在于:包括初始化模块、编码模块、适用度值计算模块、最优值计算模块、最优初始聚类中心计算模块、模糊C均值聚类模块、输出模块;所述初始化模块,用于初始化杂交水稻算法参数,预处理待聚类的若干数据集,即标签编码以及数据归一化;根据数据集描述设置各待聚类数据集的聚类数目;所述编码模块,用于根据杂交水稻优化算法对初始聚类中心进行编码,并使用对它评价函数作为优化求解的目标函数;所述适用度值计算模块,用于根据目标函数计算水稻种群各个体适用度值;所述最优值计算模块,用于根据杂交水稻算法结合模糊聚类初始聚类中心对所述目标函数进行最优值求解,得到最优值;所述最优初始聚类中心计算模块,用于根据所述最优值确定对应的最优初始聚类中心;所述模糊C均值聚类模块,用于最优初始聚类中心作为模糊C均值聚类的初始化聚类中心,进行模糊C均值聚类;所述输出模块,用于输出优化后的模糊聚类结果。本专利技术中通过运用杂交水稻优化算法迭代更新产生较优的初始聚类中心,进而实现了对模糊C均值聚类极易受随机初始类中心影响而陷入局部最优的问题的解决。采用杂交水稻算法进行初始聚类中心选取能够进行全局搜索,不易陷入局部最优。但又未舍弃局部寻优,局部和全局两者兼顾,参数少,原理简单,易于实现,通用性强。寻优能力强,计算复杂度低,计算速度快,使得模糊聚类的初始类中心选取不再随机。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例的方法流程图;图2为本专利技术实施例优化算法与其它优化算法的效果对比图,(a)为杂交水稻算法与灰狼算法和遗传算法在iris数据集上优化目标函数的收敛曲线的对比图;(b)为杂交水稻算法与灰狼算法和遗传算法在liver-disorder数据集上优化目标函数的收敛曲线的对比图;HRO为本专利技术所用的杂交水稻的缩写,GWO为灰狼算法的缩写,GA为遗传算法的缩写。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请见图1,本专利技术提供的一种基于杂交水稻算法优化的模糊C均值聚类方法,包括以下步骤:步骤1:初始化杂交水稻算法参数,预处理待聚类的若干数据集,即标签编码以及数据归一化;根据数据集描述设置各待聚类数据集的聚类数目;本实施中,参数包括水稻种群数N、最大育种次数maxIteration、最大自交次数maxTime;每个水稻个体为最优初始聚类中心的候选解;步骤2:根据杂交水稻优化算法对初始聚类中心进行编码,并使用对它评价函数作为优化求解的目标函数;本实施例中,根据杂交水稻优化算法对初始聚类中心进行编码的方式为:根据待聚类数据集的已知聚类数目C和待聚类数据集的属性数目,也即是数据维度dim,确定聚类中心在优化算法中编码为C×dim维的向量,编码方式为Cluster=c1,1,c1,2,...c1,d,c2,1,c2,2...ci,j...cc,d,其中ci,j,i∈(1,2,...C),j∈(1,2,...dim)代表第i类中心的第j维的数据值。本实施例的目标函数为:其中,ui,j是xj属于类别ci的隶属度,ci是类i的聚类中心,||||norm表示归一化数据的欧氏距离,c表示聚类数目,n表示待聚类数据集的样本个数,m表示模糊指数,一般取值为1-3,本专利技术中默认其为2,xj表示待聚类数据集的第j个样本;目标函数遵循的约束条件为:根据保证每一待聚类目标对应所有类别的隶属度之和为1;初始聚类中心根据公式计算其对应的隶属度矩阵,隶属度矩阵根据公式计算出新的聚类中心,即跳转到上一步计算隶属度矩阵的过程,循环往复,直到达到循环终止条件max其中0<ε<1是迭代终止参数,k代表迭代代数。步骤3:根据目标函数计算水稻种群各个体适用度值;步骤4:根据杂交水稻算法结合模糊聚类初始聚类中心对目标函数进行最优值求解,得到最优值;具体实现包括以下子步骤:步骤4.1:初始化杂交水稻种群大小、最大育种次数、最大自交次数;杂交水稻种群由多个杂交水稻个体组成,杂交水稻个体表示目标函数的取值,选取初始聚类中心作为杂交水稻个体;步骤4.2:计算杂交水稻种群中杂交水稻个体的适应度值;适应度值表示杂交水稻种群中杂交水稻的优劣;步骤4.3:根据适应度值将杂交水稻个体进行排序得到个体适应度序列;步骤4.4:将个体适应度序列区分为保持系、不育系、恢复系;步骤4.5:将保持系与不育系进行杂交产生本文档来自技高网...

【技术保护点】
1.一种基于杂交水稻算法优化的模糊C均值聚类方法,其特征在于,包括以下步骤:步骤1:初始化杂交水稻算法参数,预处理待聚类的若干数据集,即标签编码以及数据归一化;根据数据集描述设置各待聚类数据集的聚类数目;所述参数包括水稻种群数N、最大育种次数maxIteration、最大自交次数maxTime;每个水稻个体为最优初始聚类中心的候选解;步骤2:根据杂交水稻优化算法对初始聚类中心进行编码,并使用对它评价函数作为优化求解的目标函数;步骤3:根据目标函数计算水稻种群各个体适用度值;步骤4:根据杂交水稻算法结合模糊聚类初始聚类中心对所述目标函数进行最优值求解,得到最优值;步骤5:根据所述最优值确定对应的最优初始聚类中心;步骤6:最优初始聚类中心作为模糊C均值聚类的初始化聚类中心,进行模糊C均值聚类;步骤7:输出优化后的模糊聚类结果。

【技术特征摘要】
1.一种基于杂交水稻算法优化的模糊C均值聚类方法,其特征在于,包括以下步骤:步骤1:初始化杂交水稻算法参数,预处理待聚类的若干数据集,即标签编码以及数据归一化;根据数据集描述设置各待聚类数据集的聚类数目;所述参数包括水稻种群数N、最大育种次数maxIteration、最大自交次数maxTime;每个水稻个体为最优初始聚类中心的候选解;步骤2:根据杂交水稻优化算法对初始聚类中心进行编码,并使用对它评价函数作为优化求解的目标函数;步骤3:根据目标函数计算水稻种群各个体适用度值;步骤4:根据杂交水稻算法结合模糊聚类初始聚类中心对所述目标函数进行最优值求解,得到最优值;步骤5:根据所述最优值确定对应的最优初始聚类中心;步骤6:最优初始聚类中心作为模糊C均值聚类的初始化聚类中心,进行模糊C均值聚类;步骤7:输出优化后的模糊聚类结果。2.根据权利要求1所述的基于杂交水稻算法优化的模糊C均值聚类方法,其特征在于,步骤2中根据杂交水稻优化算法对初始聚类中心进行编码的方式为:根据待聚类数据集的已知聚类数目C和待聚类数据集的属性数目,也即是数据维度dim,确定所述聚类中心在优化算法中编码为C×dim维的向量,编码方式为Cluster=c1,1,c1,2,...c1,d,c2,1,c2,2...ci,j...cc,d,其中ci,j,i∈(1,2,...C),j∈(1,2,...dim)代表第i类中心的第j维的数据值。3.根据权利要求1所述的基于杂交水稻算法优化的模糊C均值聚类方法,其特征在于,步骤2中的目标函数为:其中,ui,j是xj属于类别ci的隶属度,ci是类i的聚类中心,||||norm表示归一化数据的欧氏距离,c表示聚类数目,n表示待聚类数据集的样本个数,m表示模糊指数,xj表示待聚类数据集的第j个样本;目标函数遵循的约束条件为:根据保证每一待聚类目标对应所有类别的隶属度之和为1;初始聚类中心根据公式计算其对应的隶属度矩阵,隶属度矩阵根据公式计算出新的...

【专利技术属性】
技术研发人员:叶志伟金灿王春枝苏军孙一恒郑逍杨娟孙爽陈凤张旭
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1