【技术实现步骤摘要】
一种基于特征组进化的特征选择方法
本专利技术涉及一种特征选择方法,尤其涉及一种基于特征组进化的特征选择方法。
技术介绍
特征选择方法是机器学习算法中的关键技术之一,其作用是确定紧凑的重要特征集,从而减小算法识别模型建模的开销,并提高模型的识别性能。当前的特征选择方法主要采用单一特征选择方式,即:分别对原始特征集中的单个特征进行评估,逐一地对单个特征进行选择或排除,从而确定最终的重要特征集。现有特征选择方法的主要问题是选择出的特征集鲁棒性较差,一旦某一个特征在实际预测时受到干扰而导致其识别性能下降,会导致整个特征集的识别性能大大降低。
技术实现思路
本专利技术的目的是提供一种基于特征组进化的特征选择方法,能够逐渐进化得出由若干低维互补特征组层层嵌套构成且满足特征数目要求的重要特征集,具有稳定性好的优点。本专利技术采用下述技术方案:一种基于特征组进化的特征选择方法,依次包括以下具体步骤:A:设原始特征集F中含有P个原始特征,原始特征集F={fi},i=1,2,3,……,P,P为正整数;
【技术保护点】
1.一种基于特征组进化的特征选择方法,其特征在于,依次包括以下具体步骤:/nA:设原始特征集F中含有P个原始特征,原始特征集F={f
【技术特征摘要】
1.一种基于特征组进化的特征选择方法,其特征在于,依次包括以下具体步骤:
A:设原始特征集F中含有P个原始特征,原始特征集F={fi},i=1,2,3,……,P,P为正整数;然后进入步骤B;
设进化过程中的适应度函数R为特征相关性:
其中,为计算相关性的函数,f为要考察的一个特征组合;
B:根据步骤A中的适应度函数R,分别对步骤A中的P个原始特征的相关性进行计算,然后根据计算得出的每一个原始特征的相关性大小进行降序排列,得到含有P个1元特征组的特征组序列f(1)到f(P),记为特征组序列a;然后进入步骤C;
C:将步骤B中得到的特征组序列a中的第一个1元特征组作为选择组CG,位次位于第一个1元特征组以下的其他1元特征组都作为候选组AG;安排选择组CG从候选组AG中挑选出一个特征组作为被选组SG,使得选择组CG与被选组SG组合的相关性最大,从而得到第一个2元组Group1;
随后将第一个2元组Group1中包含的两个1元特征组从特征组序列a中剔除从而得到新的特征组序列b,并从特征组序列b中选取第一个1元特征组作为选择组CG,并将在特征组序列b中位次位于选择组CG以下的其他1元特征组都作为候选组AG,安排选择组CG从候选组AG中挑选出一个特征组作为被选组SG,使得选择组CG与被选组SG组合的相关性最大,从而得到第2个2元组Group2;
以此类推,若P为偶数,则依次得到含有个2元特征组的特征组序列Group1到Group记为特征组序列A;若P为奇数,则依次得到含有个2元特征组的特征组序列Group1到Group记为特征组序列A,并舍弃剩余的一个1元特征组;然后进入步骤D;
D:根据步骤A中的适应度函数R,分别对每一个2元特征组的相关性进行计算,然后根据计算得出的每一个2元特征组的相关性大小进行降序排列,若P为偶数,则依次得到含有个2元特征组的特征组序列Group1到Group记为特征组序列B;若P为奇数,则依次得到含有个2元特征组的特征组序列Group1到Group记为特征组序列B;然后进入步骤E;
E:从特征组序列B中的第一个2元特征组开始检查,判断该2元特征组在特征组序列B中的位次是否高于在特征组序列A中的位次,若高于,则将该2元特征组作为检查组,并在特征组序列B中位次位于该检查组之下的其他2元特征组中,选择出所有在特征组序列A中位次高于该检查组的2元特征组作为被检查组;然后对得到的检查组,依次与所有被检查组进行交叉选择和变异选择;
然后进入步骤F;
F:当步骤E中得到的检查组,完成与所有被检查组进行交叉选择和变异选择这两种检查后,判断是否出现了相关性更好的新的二元特征组:
若进行交叉选择后得到了相关性更好的新的二元特征组,则将检查组中的被选组SG与被检查组...
【专利技术属性】
技术研发人员:孙彤,王治国,江楠,任洁,钱慎一,
申请(专利权)人:郑州轻工业大学,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。