【技术实现步骤摘要】
本专利技术涉及多目标,具体为一种混合式的多目标优化集成式特征选择方法。
技术介绍
1、随着现代医疗技术的发展和大规模生物医学数据的指数型增长,如何有效地利用这些数据并从中提取有价值的信息成为当前的研究热点之一。特征选择是数据挖掘中的关键数据预处理技术,旨在从原始特征集中选择出最具代表性和高信息量的特征子集,有利于构建高效的预测模型和提取有意义的信息。对数据进行特征选择不仅减少了特征的数量,而且提高了任务模型的性能,有助于找到疾病早期识别和诊断的重要特征,对于识别潜在的生物标记、改善疾病诊断和预后预测具有现实意义。
2、数据降维通常分为特征提取和特征选择两种方法。特征提取是指通过某种转换方法将原始特征空间映射到一个新的特征空间,新的特征空间通常具有更低的维度,但仍保留了原始数据的重要信息。常见的特征提取方法有主成分分析、独立成分分析、线性判别分析等。特征选择是从原始特征集中选择最具代表性、最相关或最具预测能力的特征子集,以降低数据维度并保留最重要的信息,不改变数据的原始结构。通常将特征选择分为过滤式、包裹式和混合式三种方法。<
...【技术保护点】
1.一种混合式的多目标优化集成式特征选择方法,其特征在于:至少包括以下步骤:
2.根据权利要求1所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述数据预处理模块将数据集按训练集和测试集分别划分为85%和15%;
3.根据权利要求1所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述并行过滤式特征选择模块包括三个过滤式特征选择算法,所述三个过滤式特征选择算法分别为互信息、方差阈值和卡方检验,所述并行过滤式特征选择模块通过三个过滤式特征选择并行结合生成三个特征子集,将三个特征子集采用特征子集归并去重技术得到初步最佳特征子集
...【技术特征摘要】
1.一种混合式的多目标优化集成式特征选择方法,其特征在于:至少包括以下步骤:
2.根据权利要求1所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述数据预处理模块将数据集按训练集和测试集分别划分为85%和15%;
3.根据权利要求1所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述并行过滤式特征选择模块包括三个过滤式特征选择算法,所述三个过滤式特征选择算法分别为互信息、方差阈值和卡方检验,所述并行过滤式特征选择模块通过三个过滤式特征选择并行结合生成三个特征子集,将三个特征子集采用特征子集归并去重技术得到初步最佳特征子集,对后续训练模型会提升计算效率。
4.根据权利要求3所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述互信息的应用过程至少包括以下步骤:
5.根据权利要求3所述的一种混合式的多目标优化集成式特征选择方法,其特征在于:所述方差...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。