自动化特征工程模型的训练方法及自动化特征工程方法技术

技术编号:34569811 阅读:38 留言:0更新日期:2022-08-17 13:00
本公开提供了一种自动化特征工程模型的训练方法及自动化特征工程方法,涉及机器学习等人工智能技术领域。该方法包括:获取训练数据集,其中,训练数据集中的训练数据包括建模场景信息;基于建模场景信息确定自动化特征工程策略;利用训练数据集和自动化特征工程策略进行训练,得到自动化特征工程模型。本公开提供的自动化特征工程模型的训练方法训练得到了不同建模场景信息对应的自动化特征工程模型。型。型。

【技术实现步骤摘要】
自动化特征工程模型的训练方法及自动化特征工程方法


[0001]本公开涉及人工智能
,尤其涉及机器学习
,具体涉及一种自动化特征工程模型的训练方法及自动化特征工程方法。

技术介绍

[0002]数据清洗通过对原始数据集进行缺失值处理、异常值处理、去重处理、噪音处理、检查数据一致性等操作来提高数据质量。特征工程,是指用一系列工程化的方式从原始数据中筛选出更好的数据特征,以提升模型的训练效果。一个预测模型的性能很大程度上取决于数据清洗和特征工程的质量。

技术实现思路

[0003]本公开提供了一种自动化特征工程模型的训练方法及自动化特征工程方法。
[0004]根据本公开的第一方面,提供了一种自动化特征工程模型的训练方法,包括:获取训练数据集,其中,训练数据集中的训练数据包括建模场景信息;基于建模场景信息确定自动化特征工程策略;利用训练数据集和自动化特征工程策略进行训练,得到自动化特征工程模型。
[0005]根据本公开的第二方面,提供了一种自动化特征工程方法,包括:获取待处理数据对应的目标建模场景信息;确定目标建本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种自动化特征工程模型的训练方法,包括:获取训练数据集,其中,所述训练数据集中的训练数据包括建模场景信息;基于所述建模场景信息确定自动化特征工程策略;利用所述训练数据集和所述自动化特征工程策略进行训练,得到自动化特征工程模型。2.根据权利要求1所述的方法,其中,所述基于所述建模场景信息确定自动化特征工程策略,包括:从预先定义的策略集合中获取所述建模场景信息对应的自动化特征工程策略,其中,所述预先定义的策略集合中包括不同建模场景信息对应的自动化特征工程策略。3.根据权利要求2所述的方法,其中,所述自动化特征工程策略包括至少一项操作,所述操作包括:求和操作、归一化操作、填充缺失值操作、类型转换操作、判断是否为空操作。4.根据权利要求1所述的方法,还包括:基于所述建模场景信息确定数据清洗策略;利用所述数据清洗策略对所述训练数据集中的训练数据进行清洗,得到清洗后的训练数据;所述利用所述训练数据集和所述自动化特征工程策略进行训练,得到自动化特征工程模型,包括:利用所述清洗后的训练数据和所述自动化特征工程策略进行训练,得到自动化特征工程模型。5.根据权利要求4所述的方法,其中,所述利用所述清洗后的训练数据和所述自动化特征工程策略进行训练,得到自动化特征工程模型,包括:利用所述清洗后的训练数据初始化所述自动化特征工程策略,得到初始化后的自动化特征工程策略;分别确定所述初始化后的自动化特征工程策略中的每项操作对应的特征信息;利用所述特征信息对所述初始化后的自动化特征工程策略进行训练,得到所述自动化特征工程模型。6.一种自动化特征工程方法,包括:获取待处理数据对应的目标建模场景信息;确定所述目标建模场景信息对应的自动化特征工程模型;将所述待处理数据输入至所述自动化特征工程模型,输出得到处理后的目标数据。7.根据权利要求6所述的方法,还包括:展示所述自动化特征工程模型对应的特征溯源图;和/或展示用于复现所述自动化特征工程模型对所述待处理数据的处理过程的代码。8.一种自动化特征工程模型的训练装置,包括:第一获取模块,被配置成获取训练数据集,其中,所述训练数据集中的训练数据包括建模场景信息;第一确定模块,被配置成基于所述建模场景信息确定自动化特征工程策略;训练模块,被配置成利用所述训练数据集和所述自动化特征工程策略进行训练,得到自动化特征工程模型。
9.根据权利要求8所述的装置,其中,所述第一确定模块包括:获...

【专利技术属性】
技术研发人员:谭荣钱正宇施恩李晓晨叶方捷林湘粤梁阳
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1