一种面向高维数据的特征选择方法、装置、设备及介质制造方法及图纸

技术编号:43201637 阅读:28 留言:0更新日期:2024-11-01 20:20
本发明专利技术公开了一种面向高维数据的特征选择方法、装置、设备及介质,涉及数据处理技术领域,包括以下步骤:将待处理的高维数据集中的多个不同的特征子集作为多个个体,构建初始种群,构建初始种群;对初始种群进行迭代进化,得到最优个体,得到最优的特征子集。本发明专利技术采用了层级化的种群模式,在进化过程中,来自较高层次的个体为较低层次的个体提供指导,从而探索数据集特征之间潜在的组合效应。其次,当种群中的所有个体都不包含某个特征时,可以动态地缩小搜索空间;当所有个体都包含某种特征组合时,可以帮助算法摆脱特定特征组合的控制并跳出局部最优。本发明专利技术可以在较短的运行时间内实现特征集的简化,并具有较高的分类精度。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别是涉及一种面向高维数据的特征选择方法、装置、设备及介质


技术介绍

1、随着检测设备和互联网技术的快速发展,人们接触和收集的数据呈指数级增长。其中,许多特征与数据建模分析无关或冗余,导致了“维度灾难”问题。维度灾难是指在高维数据中进行模式识别和数据挖掘时所面临的困难和挑战。高维数据具有庞大而复杂的搜索空间,要获取用于分析和建模的最佳特征子集,需要较高的计算成本。dna微阵列表达谱数据就是这样的超高维数据,样本可能仅有几百个,但其维度却高达几万个。这类数据集通常包含大量冗余和不相关的特征,可能会干扰分类过程并降低分类性能。解决这个问题的方法之一是通过选择相关且有用的特征来获得更好的分类性能,这种方法称为特征选择。

2、近年来,多目标优化(moo)算法已成为特征选择(fs)领域的一个研究重点。多文献通过引入了moo技术,将特征数量视为fs任务的额外优化问题。用于fs的moo算法通常能产生较好的结果,其关键在于存在多个最优解供种群学习,从而提高种群多样性,并增强了特征之间的组合效应。不过,moo技术也存在过程复杂、计算成本本文档来自技高网...

【技术保护点】

1.一种面向高维数据的特征选择方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种面向高维数据的特征选择方法,其特征在于,通过下式进行个体评估:

3.如权利要求1所述的一种面向高维数据的特征选择方法,其特征在于,对初始种群中个体的数量扩充至种群规模,得到合并种群,包括以下步骤:

4.如权利要求3所述的一种面向高维数据的特征选择方法,其特征在于,对合并种群中每个个体进行评估,得到多个评估值,根据多个评估值将多个个体进行划分至不同的层级,包括以下步骤:

5.如权利要求4所述的一种面向高维数据的特征选择方法,其特征在于,若该个体位于最高层...

【技术特征摘要】

1.一种面向高维数据的特征选择方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种面向高维数据的特征选择方法,其特征在于,通过下式进行个体评估:

3.如权利要求1所述的一种面向高维数据的特征选择方法,其特征在于,对初始种群中个体的数量扩充至种群规模,得到合并种群,包括以下步骤:

4.如权利要求3所述的一种面向高维数据的特征选择方法,其特征在于,对合并种群中每个个体进行评估,得到多个评估值,根据多个评估值将多个个体进行划分至不同的层级,包括以下步骤:

5.如权利要求4所述的一种面向高维数据的特征选择方法,其特征在于,若该个体位于最高层级,则从最高层级中抽取除自身之外的两个个体;若该个体不是位于最高层级,则分别从最接近的高层级以及对应层级中各抽取一个个体,包括以下步骤:

6....

【专利技术属性】
技术研发人员:黎敏马欢
申请(专利权)人:南昌工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1