当前位置: 首页 > 专利查询>SAP欧洲公司专利>正文

用于使用深度强化学习进行预测建模的自动特征工程制造技术

技术编号:37994055 阅读:29 留言:0更新日期:2023-06-30 10:08
公开了用于为预测建模在数据集上执行特征工程的系统、方法和计算机可读介质。数据集可以包括用于预测模型的多个特征。可以将数据集提供给神经网络,以确定对预测模型影响最大的特征和对预测模型没有正面影响的特征。深度强化学习代理可以选择在数据集上执行的动作。可以将动作应用于数据集,以生成新的特征并获得经变换的数据集。可以从数据集中移除对预测模型没有正面影响的特征。可以为经变换的数据集计算奖励。可以将经变换的数据集和奖励传递到神经网络,以进行进一步迭代和对预测模型的特征的优化。特征的优化。特征的优化。

【技术实现步骤摘要】
用于使用深度强化学习进行预测建模的自动特征工程
[0001]相关申请的交叉引用
[0002]本专利申请要求获得于2021年12月20日提交的、题为“用于使用深度强化学习进行预测建模的自动特征工程”的在先提交的第63/291,789美国临时专利申请(

789专利)的所有共同主题方面的权益。在本文中,所标识的

789临时专利申请通过引用整体并入本申请。


[0003]本教导的实施例涉及用于预测建模的特征工程。具体地,本教导的实施例涉及利用深度强化学习以改进预测模型的自动特征工程。

技术介绍

[0004]在预测建模中,将变量输入到经学习的预测模型中,以预测与输入变量关联的系统的结果。通常,将所有的变量输入到预测模型中,即使不是所有的变量影响预测模型的结果。在一些情况下,可能将多余并对模型的结果有负面影响的变量输入到模型中。特征工程可以用于将输入变量的范围缩小到对预测模型的结果影响最大的缩减的特征集合。
[0005]在典型的特征工程系统中,利用各种方法来生成实现对预测模型结果影响较高的缩减的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.存储计算机可执行指令的一个或多个非暂时性计算机可读介质,当计算机可执行指令在由处理器执行时,执行一种为预测建模在数据集上执行特征工程的方法,所述方法包括:接收数据集,所述数据集包括多个特征;响应于接收数据集,通过将数据集变换为数值向量来将数据集输入到神经网络中;从神经网络接收对多个特征中的至少一个特征执行的动作的选择;响应于接收动作的选择,通过将动作应用于至少一个特征来变换数据集以获得经变换的数据集;基于动作来计算神经网络的奖励;确定是否达到神经网络的预算;响应于确定达到预算,将多个特征存储在最终模型中;以及响应于确定未达到预算,将经变换的数据集和奖励输入到神经网络中,以进行进一步迭代。2.根据权利要求1所述的介质,其中,多个特征中的每个特征由包括统计特点和从以下各项选择的至少一个特点的向量表示:平均即时奖励、使用变换的次数、剩余预算、数值特征的数量、日期时间特征或字串特征。3.根据权利要求1所述的介质,其中,预算包括时间预算或处理预算之一。4.根据权利要求1所述的介质,其中,通过预测模型在数据集上的性能和来自先前迭代的先前奖励之间的差来计算奖励。5.根据权利要求1所述的介质,其中,所选择的动作是多个动作之一,以及其中,所选择的动作包括多个动作中的最优中间奖励分数或基于作为参数给出的概率的随机动作。6.根据权利要求1所述的介质,其中,计算奖励包括:确定奖励和来自先前神经网络迭代的先前奖励之间的差。7.根据权利要求1所述的介质,其中,所述方法还包括:确定多个特征中的特征不改进预测模型;以及响应于确定所述特征不改进预测模型,从数据集中移除所述特征。8.一种为预测建模在数据集上执行特征工程的方法,所述方法包括:接收数据集,所述数据集包括多个特征;响应于接收数据集,将数据集输入到神经网络中;从神经网络接收对多个特征中的至少一个特征执行的动作的选择;响应于接收动作的选择,通过将动作应用于至少一个特征来变换数据集以获得经变换的数据集;基于动作来计算神经网络的奖励;确定是否达到神经网络的预算;响应于确定达到预算,将多个特征存储在最终模型中;以及响应于确定未达到预算,将经变换的数据集和奖励输入到神经网络中,以进行进一步迭代。
9.根据权利要求8所述的方法,还包括:确定...

【专利技术属性】
技术研发人员:M布亚迪A阿拉维
申请(专利权)人:SAP欧洲公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1