特征筛选方法、装置、计算机设备、存储介质制造方法及图纸

技术编号:44575438 阅读:18 留言:0更新日期:2025-03-14 12:39
本申请涉及一种特征筛选方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:首先对初始的待筛选特征信息进行第一特征筛选,将满足第一类设定条件的特征存储至第一筛选集,然后对第一筛选集中的特征进行第二特征筛选,将满足第二类设定条件的特征存储至第二筛选集,接着将第二筛选集中的特征输入多个机器学习模型,针对每个特征进行打分,得到多个打分结果并进行加权计算,分别得到每个特征的总分值,最后对总分值进行排名,筛选出的特征存储至最终特征池。其中,第一特征筛选、第二特征筛选和基于多个机器学习模型的筛选三者对应的计算量依次递进。采用本方法可以提高特征筛选的效率。

【技术实现步骤摘要】

本申请涉及数据处理,特别是涉及一种特征筛选方法、装置、计算机设备、存储介质和计算机程序产品。


技术介绍

1、随着数据处理技术的发展,出现了特征筛选方法,这个技术在机器学习和金融量化领域具有重要的应用价值,目前的特征筛选方法通常将所有特征都输入到模型中进行筛选。

2、然而,目前的特征筛选方法,当特征数量庞大时,会消耗大量时间和计算资源,降低整个特征选择过程的效率。因此,需要一种更高效的方法,在保证准确性的前提下,能够快速筛选出最重要的特征,提高特征选择的效率。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种特征筛选方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种特征筛选方法,包括:

3、获取初始的待筛选特征信息,对所述待筛选特征信息进行第一特征筛选,选出所述待筛选特征信息中与目标变量之间的第一相关性指标满足第一类设定条件的特征并存储至存储器中的第一筛选集;

4、从所述存储器获取所述第一筛选集,对所述第一筛选集本文档来自技高网...

【技术保护点】

1.一种特征筛选方法,其特征在于,应用于处理器,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一相关性指标包括线性相关性指标和非线性相关性指标两类指标;

3.根据权利要求2所述的方法,其特征在于,所述线性相关性指标有多个;

4.根据权利要求3所述的方法,其特征在于,所述多个线性相关度指标包括第一皮尔逊系数相关程度和结果可信程度;

5.根据权利要求1所述的方法,其特征在于,所述第二相关性指标,包括共线性指标和低方差指标两类指标;

6.根据权利要求5所述的方法,其特征在于,所述共线性指标为所述第一筛选集中特征与其他...

【技术特征摘要】

1.一种特征筛选方法,其特征在于,应用于处理器,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一相关性指标包括线性相关性指标和非线性相关性指标两类指标;

3.根据权利要求2所述的方法,其特征在于,所述线性相关性指标有多个;

4.根据权利要求3所述的方法,其特征在于,所述多个线性相关度指标包括第一皮尔逊系数相关程度和结果可信程度;

5.根据权利要求1所述的方法,其特征在于,所述第二相关性指标,包括共线性指标和低方差指标两类指标;

6.根据权利要求5所述的方法,...

【专利技术属性】
技术研发人员:田孟奇傅佳洁徐建程蒋锐权李建久赵禹平王祺诚王艺滢
申请(专利权)人:上海金仕达软件科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1