基于机器学习的嵌入式特征筛选方法技术

技术编号:41259807 阅读:24 留言:0更新日期:2024-05-11 09:18
本发明专利技术公开了一种基于机器学习的嵌入式特征筛选方法,涉及人工智能数据中的特征筛选领域。首先从网上下载泰坦尼克数据集,观察数据集的质量,根据不同的缺失率采用不同的填充方法进行填充;其次,将填充完的数据进行数据预处理,包括有:无关特征删除、缺失值处理、编码转换、数据缩放等;随后,使用嵌入法进行特征筛选,使用Pearson相关系数、GBDT和LassoCV这三种方法作为基模型,融合三种方法来进行特征选择;最后,拟采用三种不同的机器学习模型(如SVM、随机森林算法和BP神经网络)进行效果评估。本发明专利技术这种基于特征筛选和多种机器学习算法的组合可以帮助我们找到最优的特征集合,并提高模型的效果和预测准确性。

【技术实现步骤摘要】

本专利技术涉及人工智能数据中的特征筛选领域,具体为一种基于机器学习的嵌入式特征筛选方法


技术介绍

1、在处理结构型数据时,特征工程中的特征选择是很重要的一个环节,特征选择是选择对模型重要的特征。它的好处在于:(1)减少训练数据大小,加快模型训练速度;(2)减少模型复杂度,避免过拟合;(3)特征数少,有利于解释模型;(4)如果选择对的特征子集,模型准确率可能会提升。

2、机器学习是指机器通过统计学算法,对大量历史数据进行学习,进而利用生成的经验模型指导业务。它是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是一门多学科交叉专业,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。机器学习是人工智能及模式识别领域的共同研究热点,其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题。机器学习是研究怎样使用计算机模拟或实现人类学习活动的科学,是人工智能中最具智能特征,最前沿的研究领域之一。自20世纪80本文档来自技高网...

【技术保护点】

1.一种基于机器学习的嵌入式特征筛选方法,其特征在于:包括如下步骤:

【技术特征摘要】

1.一种基于机器学习的嵌入式特征筛...

【专利技术属性】
技术研发人员:李灯熬赵菊敏晁江鹏
申请(专利权)人:太原理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1