【技术实现步骤摘要】
一种特征挖掘模型的训练方法、装置、介质及设备
[0001]本专利技术涉及特征挖掘
,具体涉及一种特征挖掘模型的训练方法、装置、介质及设备。
技术介绍
[0002]在机器学习模型的应用场景中,经常遇到时序特征加工的问题,例如在金融风控中,原始数据是用户的信用卡消费流水或企业的发票流水信息,传统的特征加工方法完全依赖建模专家人工定义特征(例如“最近三个月的消费流水总额度”、“最近一年的月均消费次数”等)用来训练机器学习模型。
[0003]上述人工定义特征的方法非常依赖建模专家对业务特征的理解,当遇到一个陌生的业务领域时,就有哪些特征比较有效,只能根据手动构造大量特征之后再验证筛选,这会耗费大量的人力物力。
[0004]另一方面,人工定义的特征有其局限性,不能充分发挥数据的价值,很可能会遗漏掉一些比较重要的特征,进而影响最终的建模效果。
技术实现思路
[0005]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种特征挖掘模型的训练方法、装置、介质及设备,用于解决现有技术中的至少一个缺陷。 ...
【技术保护点】
【技术特征摘要】
1.一种特征挖掘模型的训练方法,其特征在于,包括:确定第一业务标签和第二业务标签;获取目标业务场景下与所述第一业务标签对应的第一训练集和与所述第二业务标签对应的第二训练集,所述第一训练集用于训练第一机器学习模型;利用训练好的第一机器学习模型对所述第二训练集进行特征提取,得到第一特征集;通过人工提取的方式对所述第二训练集进行特征提取,得到第二特征集;合并所述第一特征集与所述第二特征集,得到合并特征集;利用所述合并特征集训练第二机器学习模型。2.根据权利要求1所述的特征挖掘模型的训练方法,其特征在于,所述第一机器学习模型包括:时序模型。3.根据权利要求1所述的特征挖掘模型的训练方法,其特征在于,所述方法还包括对所述合并特征集进行筛选,得到目标特征集;所述目标特征集用于训练第二机器学习模型。4.根据权利要求1所述的特征挖掘模型的训练方法,其特征在于,所述第一业务标签与所述第二业务标签不同。5.一种基于时序模型的自动化特征挖掘装置,其特征在于,包括:标签确定模块,用于确定第一业务标签和第二业务标签;训练集获取模块,用于获取目标业务场景下与所述第一业务标签对应的第一训练集和与所述第二业务标签对应的第二训练集,所述第一训练集用于训练第一机器学习模型;第一特征提取模块...
【专利技术属性】
技术研发人员:刘玉明,
申请(专利权)人:云从科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。