一种基于注意力机制和强化学习的自动特征构造方法技术

技术编号：27599954 阅读：15 留言：0更新日期：2021-03-10 10:21

本发明专利技术公开一种基于注意力机制和强化学习的自动特征构造方法，依次包括以下步骤：步骤1：给定分类问题的数据集D

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力机制和强化学习的自动特征构造方法

[0001]本专利技术涉及一种自动特征构造方法，具体涉及一种基于注意力机制和强化学习的自动特征构造方法，属于自动机器学习

技术介绍

[0002]近年来自动机器学习本身已成为机器学习的新子领域，机器学习的每个步骤都可以向着自动化方向发展，其中模型选择和超参数优化方面的研究专家们已经提出了比较成熟可用的框架，一般的分类或者回归的机器学习模型已经实现了低门槛或者零门槛甚至免费建模的程度。如今，特征工程是工业界应用AI的难关之一，特征的质量是后续学习模型性能的最重要的基础。
[0003]由于原始特征很少会产生令人满意的结果，因此经常需要执行手动特征生成以更好地表示数据并提高学习性能。但是，这通常是繁琐且难以泛化的工作，从而激发了自动特征生成相关的研究工作。大多数自动特征生成的早期工作通过严格预定义的方法经过组合变换来生成特征，使得方法可扩展性差；后来出现基于深度学习的方法以隐式方式学习高阶的特征交叉，但模型又缺乏可解释性。
[0004]针对上述存在的问题，本专利技术提出了一种基于注意力机制和强化学习的自动特征构造方法TideKit。该方法可以自动学习输入特征的高阶相互作用，同时可广泛应用于特征为数值型的分类问题，并且具有良好的模型可解释性。

技术实现思路

[0005]技术问题：
[0006]本专利技术的目的在于解决现有自动特征生成技术中存在的不足，提供一种基于注意力机制和强化学习的自动特征构造方法。
[0007]技术方案

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制和强化学习的自动特征构造方法，其特征在于，依次包括以下步骤：(1)给定分类问题的数据集D
TR
，包含一个数值型特征集合S，设置参数最大迭代次数,嵌入尺寸的取值；(2)将数据集和参数传入TideKit模型，运行模型得到分类结果。2.根据权利要求1所述的一种基于注意力机制和强化学习的自动特征构造方法，其特征在于，具体步骤为：(21)基于自注意力机制的自动特征生成方法，具体实现于模型的交互层中，对于每个交互层，高阶特征通过自注意力机制进行组合，使用自注意力得分评估不同种类的组合；通过堆叠多个交互层，对组合的原始特征的不同顺序进行建模；(22)基于强化学习的自动特征选择方法，将特征选择过程转换为马尔可夫决策过程，基于策略梯度并行地评估出每个特征的候选概率，通过迭代不断探索与利用...

【专利技术属性】
技术研发人员：何洁月，蔡嘉跃，吴宇，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人