一种混合式的多目标优化集成式特征选择方法技术

技术编号:43799244 阅读:22 留言:0更新日期:2024-12-27 13:19
本发明专利技术公开了一种混合式的多目标优化集成式特征选择方法,涉及多目标技术领域。本发明专利技术有效结合过滤式特征选择方法和包裹式特征选择方法,充分考虑各特征之间的关联分别采用互信息、方差阈值和卡方验证三种过滤式特征选择方法进行种群初始化,解决了采用传统的单一包裹式特征选择方法计算成本高和过度拟合问题;且采用一种多目标优化算法—UNSGAIII的包裹式方法,与其他优化算法不同的是UNSGAIII方法是一种适用于多目标权衡求解问题的算法,解决了针对特殊用户可以提供一种多方案求解和单一过滤式特征选择预测精度低的问题,并且提高了收敛速度和全局搜索能力。

【技术实现步骤摘要】

本专利技术涉及多目标,具体为一种混合式的多目标优化集成式特征选择方法


技术介绍

1、随着现代医疗技术的发展和大规模生物医学数据的指数型增长,如何有效地利用这些数据并从中提取有价值的信息成为当前的研究热点之一。特征选择是数据挖掘中的关键数据预处理技术,旨在从原始特征集中选择出最具代表性和高信息量的特征子集,有利于构建高效的预测模型和提取有意义的信息。对数据进行特征选择不仅减少了特征的数量,而且提高了任务模型的性能,有助于找到疾病早期识别和诊断的重要特征,对于识别潜在的生物标记、改善疾病诊断和预后预测具有现实意义。

2、数据降维通常分为特征提取和特征选择两种方法。特征提取是指通过某种转换方法将原始特征空间映射到一个新的特征空间,新的特征空间通常具有更低的维度,但仍保留了原始数据的重要信息。常见的特征提取方法有主成分分析、独立成分分析、线性判别分析等。特征选择是从原始特征集中选择最具代表性、最相关或最具预测能力的特征子集,以降低数据维度并保留最重要的信息,不改变数据的原始结构。通常将特征选择分为过滤式、包裹式和混合式三种方法。</p>

3、由n本文档来自技高网...

【技术保护点】

1.一种混合式的多目标优化集成式特征选择方法,其特征在于:至少包括以下步骤:

2.根据权利要求1所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述数据预处理模块将数据集按训练集和测试集分别划分为85%和15%;

3.根据权利要求1所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述并行过滤式特征选择模块包括三个过滤式特征选择算法,所述三个过滤式特征选择算法分别为互信息、方差阈值和卡方检验,所述并行过滤式特征选择模块通过三个过滤式特征选择并行结合生成三个特征子集,将三个特征子集采用特征子集归并去重技术得到初步最佳特征子集,对后续训练模型会提...

【技术特征摘要】

1.一种混合式的多目标优化集成式特征选择方法,其特征在于:至少包括以下步骤:

2.根据权利要求1所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述数据预处理模块将数据集按训练集和测试集分别划分为85%和15%;

3.根据权利要求1所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述并行过滤式特征选择模块包括三个过滤式特征选择算法,所述三个过滤式特征选择算法分别为互信息、方差阈值和卡方检验,所述并行过滤式特征选择模块通过三个过滤式特征选择并行结合生成三个特征子集,将三个特征子集采用特征子集归并去重技术得到初步最佳特征子集,对后续训练模型会提升计算效率。

4.根据权利要求3所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述互信息的应用过程至少包括以下步骤:

5.根据权利要求3所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述方差...

【专利技术属性】
技术研发人员:熊刚黄朝虹申小曼刘威
申请(专利权)人:重庆理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1