【技术实现步骤摘要】
本专利技术涉及一种特征选择方法,特别涉及一种基于部落进化竞争的特征选择方法。
技术介绍
文献“Research of multi-population agent genetic algorithm for feature selection,Expert Systems with Applications,2009,Vol36(9),p11570-11581”提出了一种基于多种群遗传进化的特征选择算法。原始特征数目为N,该方法通过构造多边形闭环种群,将特征空间划分成多个联接正多边形,通过竞争机制选出特征数目为M(M<N)的个体,使得分类效果最好。种群之间通过共用的两个个体进行交流,这两个个体被称为种群代理,代理和种群内部的其他成员之间根据适应度排序,适应度高的保留下来,适应度低的被替换。通过对每个多边形内部的寻优,得到局部最优,再通过比较所有多边形的代理,得到全局最优。文献所述方法在构造多种群的时候,没有考虑到特征选择数目在排列组合中的偏置问题,选择出来的特征子集的维数很可能在N/2附近,这是因为由M个特征组成的可能的特征子集的个数是在N较大的情况下,种群内个体所选特征数目有非常大的概率落在N/2附近,使得最终结果很有可能不是全局最优。
技术实现思路
为了克服现有特征选择方法中高维特征分类时特征选择数目在排列组合中偏置的不足,本专利技术提供一种基于部落进化竞争的特征选择方法。该方法根据特征的维度将特征划分成多个部落,每个部落对应一定的特征子空间,初始时分配给各个部落相同数目的个体,部落内部所选择的特征个数在统计上服从高斯分布;采取改进的遗传算法,在保 ...
【技术保护点】
一种基于部落进化竞争的特征选择方法,其特征在于包括以下步骤:步骤一、将整个种群划分成K个部落,每个部落初始化时含有P个个体,表示第i个部落中所选特征维度为j的个数,表示选择j个特征的所有可能的个体的集合;其中在第i个部落中服从高斯分布,使第i个部落中的个体初始时选择的特征个数以95.45%的概率落在区间;初始化完成后,形成所选特征个数呈高斯分布的K个部落;步骤二、部落内部进化;每个部落内部的进化是基于一个改进的遗传算法进行的,分为以下四个步骤迭代的执行;1)适应度计算;对于部落中的每个个体,首先将其解码为所表示的所选特征集合,然后采用支持向量机对该所选特征集进行分类,并使用10折交叉验证,得到分类正确率,作为该个体的适应度;依此方法,计算每个个体的适应度,并将适应度最高的精英个体直接保存入下一代;2)选择;轮盘赌选择是从部落中选择一批成员,被选中的概率和它们的适应度分数成比例,个体的适应度愈高,被选中的概率也越高;选择过程中,个体适应度高的个体有很大的几率会被重复选择,而适应度低的个体则有可能从未被选择;3)交叉;在交叉过程中,个体用集合表示,集合中的元素是个体二进制编码中1的下标位置 ...
【技术特征摘要】
1.一种基于部落进化竞争的特征选择方法,其特征在于包括以下步骤:步骤一、将整个种群划分成K个部落,每个部落初始化时含有P个个体,表示第i个部落中所选特征维度为j的个数,表示选择j个特征的所有可能的个体的集合;其中在第i个部落中服从高斯分布,使第i个部落中的个体初始时选择的特征个数以95.45%的概率落在区间;初始化完成后,形成所选特征个数呈高斯分布的K个部落;步骤二、部落内部进化;每个部落内部的进化是基于一个改进的遗传算法进行的,分为以下四个步骤迭代的执行;1)适应度计算;对于部落中的每个个体,首先将其解码为所表示的所选特征集合,然后采用支持向量...
【专利技术属性】
技术研发人员:夏勇,马本腾,张艳宁,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。