一种基于杂交水稻算法优化的模糊C均值聚类方法及系统技术方案

技术编号：20161137 阅读：21 留言：0更新日期：2019-01-19 00:13

本发明专利技术公开了一种基于杂交水稻算法优化的模糊C均值聚类方法及系统，方法包括：初始化该优化算法参数，预处理待聚类的数据集；构建目标函数，即对可行解的评价函数；对目标函数进行最优值求解，得到最优值并确定对应的最优初始聚类中心；根据最优初始聚类中心进行模糊C均值聚类，最终得到聚类结果。系统包括初始化模块、编码模块、适用度值计算模块、最优值计算模块、最优初始聚类中心计算模块、模糊C均值聚类模块、输出模块；采用本发明专利技术对模糊C均值聚类进行基于杂交水稻算法的初始聚类中心优化，解决了模糊聚类效果极易受随机初始聚类中心的影响。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于杂交水稻算法优化的模糊C均值聚类方法及系统
本专利技术属于无监督学习
，涉及一种模糊C均值聚类方法及系统，具体涉及一种基于杂交水稻算法优化的模糊C均值聚类方法及系统。
技术介绍
模糊C均值(FCM)是一种基于无监督学习机制的常用聚类方法，该聚类函数利用聚类中心(距离)计算函数和FCM目标函数。FCM的主要步骤是迭代过程，它更新隶属函数值和中心位置及其值。在FCM中，高隶属度值表示更靠近该类中心，低隶属度值表示距该类中心较远。FCM对初始聚类中心极其敏感，聚类数目、数据集特征和模糊指数m等因素都对聚类效果影响很大，不同的初始聚类中心即可能导致不同的聚类结构，该聚类算法易受初始聚类中心影响而陷入局部最优，初始聚类中心的选取是问题所在。解决聚类算法中初始聚类中心选取的问题的方法主要有传统的数学逻辑方法和智能计算算法两大类，传统的方法由于自身逻辑复杂或者难以保证有效形成更优的初始聚类中心，导致其在面对聚类算法初始类中心选取这类非线性优化问题时求解难度较高。传统的粒子群算法在面对高维度、大规模、多约束的初始聚类中心选取问题容易陷入局部最优解而不能保证全局收敛。
技术实现思路
本专利技术的目的是提供一种基于杂交水稻算法优化的模糊C均值聚类方法及系统，对模糊C均值聚类进行基于杂交水稻算法的初始聚类中心优化，解决了模糊聚类结果极易受初始聚类中心的选取的影响而陷入局部最优的问题。本专利技术的方法所采用的技术方案是：一种基于杂交水稻算法优化的模糊C均值聚类方法，其特征在于，包括以下步骤：步骤1：初始化杂交水稻算法参数，预处理待聚类的若干数据集，即标签编码以及数据归一...

【技术保护点】
1.一种基于杂交水稻算法优化的模糊C均值聚类方法，其特征在于，包括以下步骤：步骤1：初始化杂交水稻算法参数，预处理待聚类的若干数据集，即标签编码以及数据归一化；根据数据集描述设置各待聚类数据集的聚类数目；所述参数包括水稻种群数N、最大育种次数maxIteration、最大自交次数maxTime；每个水稻个体为最优初始聚类中心的候选解；步骤2：根据杂交水稻优化算法对初始聚类中心进行编码，并使用对它评价函数作为优化求解的目标函数；步骤3：根据目标函数计算水稻种群各个体适用度值；步骤4：根据杂交水稻算法结合模糊聚类初始聚类中心对所述目标函数进行最优值求解，得到最优值；步骤5：根据所述最优值确定对应的最优初始聚类中心；步骤6：最优初始聚类中心作为模糊C均值聚类的初始化聚类中心，进行模糊C均值聚类；步骤7：输出优化后的模糊聚类结果。

【技术特征摘要】
1.一种基于杂交水稻算法优化的模糊C均值聚类方法，其特征在于，包括以下步骤：步骤1：初始化杂交水稻算法参数，预处理待聚类的若干数据集，即标签编码以及数据归一化；根据数据集描述设置各待聚类数据集的聚类数目；所述参数包括水稻种群数N、最大育种次数maxIteration、最大自交次数maxTime；每个水稻个体为最优初始聚类中心的候选解；步骤2：根据杂交水稻优化算法对初始聚类中心进行编码，并使用对它评价函数作为优化求解的目标函数；步骤3：根据目标函数计算水稻种群各个体适用度值；步骤4：根据杂交水稻算法结合模糊聚类初始聚类中心对所述目标函数进行最优值求解，得到最优值；步骤5：根据所述最优值确定对应的最优初始聚类中心；步骤6：最优初始聚类中心作为模糊C均值聚类的初始化聚类中心，进行模糊C均值聚类；步骤7：输出优化后的模糊聚类结果。2.根据权利要求1所述的基于杂交水稻算法优化的模糊C均值聚类方法，其特征在于，步骤2中根据杂交水稻优化算法对初始聚类中心进行编码的方式为：根据待聚类数据集的已知聚类数目C和待聚类数据集的属性数目，也即是数据维度dim，确定所述聚类中心在优化算法中编码为C×dim维的向量，编码方式为Cluster＝c1,1,c1,2,...c1,d,c2,1,c2,2...ci,j...cc,d，其中ci,j,i∈(1,2,...C),j∈(1,2,...dim)代表第i类中心的第j维的数据值。3.根据权利要求1所述的基于杂交水稻算法优化的模糊C均值聚类方法，其特征在于，步骤2中的目标函数为：其中，ui,j是xj属于类别ci的隶属度，ci是类i的聚类中心，||||norm表示归一化数据的欧氏距离，c表示聚类数目，n表示待聚类数据集的样本个数，m表示模糊指数，xj表示待聚类数据集的第j个样本；目标函数遵循的约束条件为：根据保证每一待聚类目标对应所有类别的隶属度之和为1；初始聚类中心根据公式计算其对应的隶属度矩阵，隶属度矩阵根据公式计算出新的...

【专利技术属性】
技术研发人员：叶志伟，金灿，王春枝，苏军，孙一恒，郑逍，杨娟，孙爽，陈凤，张旭，
申请(专利权)人：湖北工业大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人