一种基于强化学习的表格数据增强方法及装置制造方法及图纸

技术编号:42386095 阅读:20 留言:0更新日期:2024-08-16 16:13
本发明专利技术公开了一种基于强化学习的表格数据增强方法及装置,涉及表格数据处理领域,通过收集表格数据,对表格数据特征进行聚类,计算每个特征簇和所有特征簇并集的状态信号,输入级联的演员‑批评家智能体中驱动智能体生成新的特征,计算智能体的奖励信号;迭代进行,每次迭代后根据奖励信号依次更新批评者和演员的参数;智能体优化后,用于对待测表格数据进行处理,生成新的最优表格数据特征,得到增强后的表格数据。本发明专利技术通过优化表格数据特征空间,达到提高下游分类、回归、异常检测等各类机器学习模型的性能。

【技术实现步骤摘要】

本专利技术涉及表格数据处理领域,具体涉及一种基于强化学习针对表格数据进行数据特征增强的方法及装置。


技术介绍

1、数据特征生成是特征工程的一部分,是数据驱动的人工智能的研究范畴,也是机器学习中的重要步骤。对表格数据来讲,特征生成是指从原始数据中创建或转换出具有信息量的特征,以便在下游的分类、回归、异常检测等任务中获得更好的效果。这些特征应该捕捉到数据的关键模式和特性,帮助下游任务的模型更好地理解和使用输入数据。

2、特征生成对于构建有效的下游任务模型至关重要,但传统上在实践中,想要达到较好的特征生成效果,使用手动生成特征十分依赖专家知识,但专家知识存在获取成本高、学科之间有壁垒的问题,且手动生成特征时间成本很高,因此自动的特征生成已经成为机器学习的重要研究领域。目前已经有许多技术能够自动进行特征选择,主要可以分为两类:基于潜在表征学习的技术和基于特征变换的技术。

3、基于潜在表征学习的特征生成技术是将原始数据转换为潜在空间中的数据,得到潜在空间中的特征空间,从而能够自动提取有意义的特征。比如深度分解机,它是一种用于推荐系统的深度学习本文档来自技高网...

【技术保护点】

1.一种基于强化学习的表格数据增强方法,其特征在于,包含以下步骤:

2.如权利要求1所述的方法,其特征在于,步骤2)中聚类步骤包括:

3.如权利要求1所述的方法,其特征在于,步骤3)中通过计算统计信息来计算状态信号,步骤包括:

4.如权利要求3所述的方法,其特征在于,统计信息包括数量、标准差、最小值、最大值、第一分位数、第二分位数和第三四分位数。

5.如权利要求1所述的方法,其特征在于,步骤3)中通过自动编码器来计算状态信号,步骤包括:

6.如权利要求1所述的方法,其特征在于,步骤3)中通过图自动编码器来计算状态信号,步骤包括:...

【技术特征摘要】

1.一种基于强化学习的表格数据增强方法,其特征在于,包含以下步骤:

2.如权利要求1所述的方法,其特征在于,步骤2)中聚类步骤包括:

3.如权利要求1所述的方法,其特征在于,步骤3)中通过计算统计信息来计算状态信号,步骤包括:

4.如权利要求3所述的方法,其特征在于,统计信息包括数量、标准差、最小值、最大值、第一分位数、第二分位数和第三四分位数。

5.如权利要求1所述的方法,其特征在于,步骤3)中通过自动编码器来计算状态信号,步骤包括:

6.如权利要求1所述的方法,其特征在于,步骤3)中通过图自动编码器来计算状态信号,步骤包括:

7.如权利要求1所述的方法,其特征在于,步骤4)中第一个智能体的状态信号是特征簇并集的状态信号,第二个智能体的状态信号是特征簇并集的状态信号与第一个智能体选择的特征簇的状态信号的逐行串联,第三...

【专利技术属性】
技术研发人员:肖濛周园春贺天琦黄肖翰
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1