A feature selection method based on mixed-wash frog leap is proposed, in which a data with M initial feature set dimension is input, each feature contains several samples, the frog population is initialized to determine the maximum number of iterations, the position of the individual frog is calculated by fitness function, and the fitness value of the individual frog is calculated according to the fitness value. The whole frog population was sorted in descending order, and the frog population was grouped according to meme grouping method to determine the best frog in each group, the worst frog in each group and the global optimal frog in the whole frog population. The fitness value of the poor frog is better than that of the worst frog before updating, and it satisfies the optimization constraints, then completes an updating process; the updated frog population is updated again until the maximum number of iterations, and the best feature subset is obtained. The invention improves the efficiency of data mining and pattern recognition.
【技术实现步骤摘要】
一种基于混洗蛙跳的特征选择方法
本专利技术涉及一种特征选择方法。特别是涉及一种针对高维度特征描述的复杂问题的基于混洗蛙跳的特征选择方法。
技术介绍
1、混洗蛙跳算法简介混洗蛙跳算法(ShuffledFrogLeapingAlgorithm,SFLA)是Eusuff等人在2003年提出一种新型的群体智能优化算法,它模拟了青蛙种群的觅食和迁移过程。整个过程可以描述成如下方式:多只青蛙共同组成了一个大种群,其中又分成了若干个初始子种群,每个子种群包含数只青蛙。每只青蛙的对环境的适应能力都不同。这里用与食物的距离来表示青蛙的适应能力。为了获取食物,每只青蛙都会靠近子种群中距离食物最近的那只青蛙,也就是每只青蛙都会向距离食物最近的青蛙跳跃,从而缩短自己与食物的距离,提高自己的适应能力。当整个青蛙种群完成一次跳跃后,不同的青蛙之间会进行信息交换与共享,目的是提高整个青蛙种群的适应能力。在子种群中,为了避免青蛙积聚在同一位置,每次交换信息之后,要重新形成新的子种群。每只青蛙都携带着各自的信息加入新的子种群。子种群中适应能力最高的青蛙是子种群内部的青蛙的跳跃方向,每次重新生成子种群保证了子种群之间的信息交互。通过交替进行子种群内部每只青蛙向最优青蛙的跳跃(局部搜索)和所有青蛙子种群之间的重新混洗(全局搜索),可以保证整个青蛙种群是向着最优的方向前进。算法的数学描述如下:首先生成由N只青蛙个体组成的初始种群P={X1,X2,…,Xn},在生成初始种群之后,首先按照每只青蛙的适应能力进行降序排列,将排在第一位的青蛙记为Xg,它是整个种群中适应能力最佳的一只。然后将整个种群分成 ...
【技术保护点】
1.一种基于混洗蛙跳的特征选择方法,其特征在于,包括如下步骤:1)输入一个初始特征集维度为M的数据,每个特征包含有若干个样本;2)对青蛙种群进行初始化,并确定算法最大迭代次数;3)将青蛙个体的位置利用适应度函数进行适应度计算,适应度函数表达式为:
【技术特征摘要】
1.一种基于混洗蛙跳的特征选择方法,其特征在于,包括如下步骤:1)输入一个初始特征集维度为M的数据,每个特征包含有若干个样本;2)对青蛙种群进行初始化,并确定算法最大迭代次数;3)将青蛙个体的位置利用适应度函数进行适应度计算,适应度函数表达式为:这里S是特征子集,si和sj分别表示特征子集S中的第i和第j个特征,L表示样本数据对应的目标类标签,I(si;L)表示特征子集S中第i个特征与目标类标签的平均互信息量,I(si;sj)表示特征子集S中第i个特征与第j个特征的平均互信息量。4)按照青蛙个体的适应度值对整个青蛙种群进行降序排序,并按照模因分组法对青蛙种群进行分组,将青蛙种群分为p组,每组有q只青蛙,其中p和q满足青蛙的数量N=p*q的关系,确定每组中的组内最优青蛙、组内最差青蛙以及整个青蛙种群中的全局最优青蛙;5)每组中首先利用组内最优青蛙更新组内最差青蛙,若发现更新后的组内最差青蛙的适应度值优于更新前的最差青蛙的适应度值,且满足优化的约束条件,则完成一次更新过程;否则,采用全局最优青蛙更新,若更新后的组内最差青蛙的适应度值优于更新前的最差青蛙的适应度值,且满足特征子集内特征不重复的约束条件,则完成更新过程;若依然无法更新成功,则采用随机更新的方式更新组内最优青蛙,迭代次数自加1,得到更新后的青蛙种群;6)对更新后的青蛙种群重复步骤4)到步骤5),直到迭代次数达到最大迭代次数,此时得到的青蛙种群中全局最优青蛙的位置即为最佳的特征子集。2.根据权利要求1所述的一种基于混洗蛙跳的特征选择方法,其特征在于,步骤...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。