基于遗传算法的特征选择方法及相关装置制造方法及图纸

技术编号:34854924 阅读:77 留言:0更新日期:2022-09-08 07:56
本发明专利技术公开了一种基于遗传算法的特征选择方法及相关装置,可以通过基于目标特征集,生成目标种群,其中,所述目标种群包括多个个体,每个所述个体均涉及所述目标特征集;使用所述目标种群对SVM分类器进行训练和测试;当所述SVM分类器的分类正确率大于预设正确率阈值后,分别计算各所述个体的适应度;根据各所述个体的适应度,确定是否需要对各所述个体进行交叉和/或变异;若确定不需要对各所述个体进行交叉和/或变异,则输出所述目标特征集。本发明专利技术可以自动选择出最优的目标特征集,对于特征的筛选效率较高。征的筛选效率较高。征的筛选效率较高。

【技术实现步骤摘要】
基于遗传算法的特征选择方法及相关装置


[0001]本专利技术涉及人工智能领域,特别涉及一种基于遗传算法的特征选择方法及相关装置。

技术介绍

[0002]在金融风险控制领域,需要对海量的金融数据进行分析建模,这些交易数据由各种数据表连接而成,拥有几百上千维的原始特征,再通过特征衍生后,特征空间将会快速膨胀,导致经常出现维度灾难问题,如何从这些海量特征中筛选出一些最有效特征,剔除无效特征,以降低数据集维度,提高学习算法性能,是算法工程师必须常考虑的问题。
[0003]在使用机器学习建模的过程中,如何选择重要的特征参与建模,是一件非常耗费精力的工作,目前需要算法工程师投入大量的经历对特征进行选择,效率较低。

技术实现思路

[0004]鉴于上述问题,本专利技术提供一种克服上述问题或者至少部分地解决上述问题的一种基于遗传算法的特征选择方法及相关装置。
[0005]第一方面,一种基于遗传算法的特征选择方法,包括:
[0006]基于目标特征集,生成目标种群,其中,所述目标种群包括多个个体,每个所述个体均涉及所述目标特征本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于遗传算法的特征选择方法,其特征在于,包括:基于目标特征集,生成目标种群,其中,所述目标种群包括多个个体,每个所述个体均涉及所述目标特征集;使用所述目标种群对SVM分类器进行训练和测试;当所述SVM分类器的分类正确率大于预设正确率阈值后,分别计算各所述个体的适应度;根据各所述个体的适应度,确定是否需要对各所述个体进行交叉和/或变异;若确定不需要对各所述个体进行交叉和/或变异,则输出所述目标特征集。2.根据权利要求1所述的方法,其特征在于,在所述根据各所述个体的适应度,确定是否需要对各所述个体进行交叉和/或变异之后,所述方法还包括:若确定需要对各所述个体进行交叉和/或变异,则根据各所述个体进行交叉和/或变异,从而得到新的个体和相应新的目标种群;使用所述新的目标种群对SVM分类器进行训练和测试,直到输出相应的目标特征集为止,其中,所述新的个体涉及新的目标特征集。3.根据权利要求1所述的方法,其特征在于,所述基于目标特征集,生成目标种群,包括:获得初始数据集,其中,所述初始数据集包括多条数据,每条所述数据包括多个数据项;根据所述目标特征集,对各所述数据进行二进制编码,其中,各所述个体的长度一致;对遗传算法中的惩罚参数和核参数分别进行二进制编码,从而获得相应的惩罚参数编码和核参数编码;对于任一经过二进制编码的所述数据,均将所述数据、所述惩罚参数编码和所述核参数编码进行拼接,得到相应的所述个体,从而生成所述目标种群。4.根据权利要求1所述的方法,其特征在于,所述使用所述目标种群对SVM分类器进行训练和测试,包括:将所述目标种群中的各所述个体划分为训练集和测试集;使用所述训练集对所述SVM分类器进行训练;使用所述测试集对所述SVM分类器进行测试。5.根据权利要求1所述的方法,其特征在于,所述当所述SVM分类器的分类正确率大于预设正确率阈值后,分别计算各所述个体的适应度,包括:当所述SVM分类器的分类正确率大于所述预设正确率阈值后,根据所述分类正确率分别计算得到各所述个体的适应度。6.根据权利要求1所述的方法,其特征在于,所述根据各所述个体的...

【专利技术属性】
技术研发人员:丁锐
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1