目标因子筛选方法及装置制造方法及图纸

技术编号:39764304 阅读:17 留言:0更新日期:2023-12-22 02:19
本申请涉及一种目标因子筛选方法及装置,方法包括:依据任务类型生成相应的数据集,并获取数据集中各因子类型对应的标签信息;基于第一筛选标准和标签信息对获取到的多种因子筛选方法进行检验,构建合格因子筛选方法集,并对合格因子筛选方法集中各因子筛选方法进行功能分类,得到不同功能因子筛选方法集;基于第二筛选标准对不同功能因子筛选方法集中相应的因子筛选方法集进行组合,生成多个因子筛选流程,对多个因子筛选流程进行评分,根据评分结果确定出目标因子筛选流程;采用本方法能够对各因子筛选流程进行校验和评价,保证了因子筛选方法流程的合理性,选取出最佳的目标因子筛选流程,提高了筛选的可靠性

【技术实现步骤摘要】
目标因子筛选方法及装置


[0001]本申请涉及数据处理
,特别是涉及一种目标因子筛选方法及装置


技术介绍

[0002]随着因子构建方法的发展,比如利用遗传规划等算法,各种时序特征提取的自动化工程项目,使得高频因子的维度急速增加,这种巨大的规模可能会给许多机器学习算法和深度学习算法带来可扩展性和学习性能方面的严重问题;在面对高维数据的机器学习或深度学习任务中,特征
(
因子
)
筛选变得非常必要

[0003]然而,现有的因子筛选算法在针对大量观测数据和因子数据进行筛选时存在可靠性低的问题


技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高筛选的可靠性的目标因子筛选方法及装置

[0005]第一方面,本申请提供了一种目标因子筛选方法,方法包括:
[0006]依据任务类型,生成相应的数据集,获取数据集中各因子类型对应的标签信息;
[0007]基于第一筛选标准和标签信息,对各备选因子筛选方法进行检验本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种目标因子筛选方法,其特征在于,所述方法包括:依据任务类型,生成相应的数据集,获取所述数据集中各因子类型对应的标签信息;基于第一筛选标准和所述标签信息,对各备选因子筛选方法进行检验,构建合格因子筛选方法集;对所述合格因子筛选方法集中各因子筛选方法进行功能分类,得到不同功能因子筛选方法集;基于第二筛选标准对所述不同功能因子筛选方法集中相应的因子筛选方法进行组合,生成多个因子筛选流程;对所述多个所述因子筛选流程进行评分,根据评分结果确定出目标因子筛选流程
。2.
根据权利要求1所述的目标因子筛选方法,其特征在于,所述目标因子包括高频因子和高维因子中的至少一种;所述因子类型包括信息因子

冗余因子

相关因子和无关因子;所述生成相应的数据集,包括:根据所述信息因子

所述冗余因子

所述相关因子和所述无关因子,随机生成相应数量的样本;将所述样本

所述信息因子

所述冗余因子

所述相关因子和所述无关因子进行合成,得到所述数据集
。3.
根据权利要求2所述的目标因子筛选方法,其特征在于,所述第一筛选标准包括所述合格因子筛选方法集中的因子筛选方法包含所述信息因子;所述信息因子用于合成目标变量;所述冗余因子用于合成所述信息因子;所述相关因子为部分数据由所述目标变量合成的因子;所述无关因子为与所述目标变量无关的因子
。4.
根据权利要求1所述的目标因子筛选方法,其特征在于,所述第二筛选标准包括处理顺序;所述处理顺序包括依次进行的删除操作和选择操作;所述基于第二筛选标准对所述不同功能因子筛选方法集中相应的因子筛选方法集进行组合,生成多个因子筛选流程,包括:通过所述依次进行的删除操作和选择操作,对所述不同功能因子筛选方法集进行处理,得到第一方法集;采用模型调整器对所述第一方法集进...

【专利技术属性】
技术研发人员:刘冠徐建程陈雪东赵禹平万宇雷田孟奇
申请(专利权)人:上海金仕达软件科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1