System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 特征筛选方法、装置以及设备制造方法及图纸_技高网

特征筛选方法、装置以及设备制造方法及图纸

技术编号:40326485 阅读:11 留言:0更新日期:2024-02-09 14:20
本说明书涉及人工智能技术领域,尤其涉及一种特征筛选方法、装置以及设备。其中特征筛选方法,包括:对多种原始用户特征进行衍生处理,得到衍生用户特征;根据衍生用户特征与原始用户特征的映射关系,确定衍生用户特征与原始用户特征的影响因子;获取衍生用户特征的第一重要性数据,所述衍生用户特征用于训练风险模型;根据第一重要性数据和影响因子,确定多种原始用户特征的第二重要性数据;根据第二重要性数据,对多种原始用户特征进行筛选。本说明书实施例可以减小原始用户特征筛选时的计算量,提高筛选效率。

【技术实现步骤摘要】

本说明书涉及人工智能,尤其涉及一种特征筛选方法、装置以及设备


技术介绍

1、机器学习已广泛应用于各个领域。在针对某个业务场景构建机器学习模型的过程中,可以对多种原始特征进行特征衍生处理,进而利用衍生特征来构建机器学习模型。

2、为了减少模型过拟合的风险,提高模型的准确性,可以对多种原始特征进行筛选,以从所述多种原始特征中筛选出比较重要的原始特征来构建机器学习模型。已有技术中,可以将多种原始特征划分为多个特征组,不同特征组中包含不同种类的原始特征。可以分别对每个特征组中的原始特征进行特征衍生处理,可以利用衍生特征来构建机器学习模型。可以将多个特征组所对应机器学习模型的性能进行对比,以选取性能最好的机器学习模型。这样能够获得性能最好的机器学习模型所对应的特征组,也实现了对所述多种原始特征进行筛选。

3、上述已有技术中,需要将多种原始特征划分为尽可能多的特征组,分别针对每个特征组来训练机器学习模型。造成对原始特征进行筛选时的计算量较大,占用了较多的计算资源,增加了计算机设备的运行负载。另外,也造成对原始特征进行筛选时的效率较低。


技术实现思路

1、本说明书实施例提供一种特征筛选方法、装置以及设备,用于降低对原始特征进行筛选时的计算量,降低计算资源的占用,提高对原始特征进行筛选时的效率。

2、本说明书实施例提了供一种特征筛选方法,包括:

3、对多种原始用户特征进行衍生处理,得到衍生用户特征;

4、根据衍生用户特征与原始用户特征的映射关系,确定衍生用户特征与原始用户特征的影响因子,所述影响因子用于表示衍生用户特征对原始用户特征的影响力;

5、获取衍生用户特征的第一重要性数据,所述衍生用户特征用于训练风险模型,所述第一重要性数据用于表示衍生用户特征对风险模型预测结果的影响程度;

6、根据第一重要性数据和影响因子,确定多种原始用户特征的第二重要性数据,所述第二重要性数据用于表示原始用户特征对风险模型预测结果的影响程度;

7、根据第二重要性数据,对多种原始用户特征进行筛选。

8、本说明书实施例还提供了一种特征筛选装置,包括:

9、特征衍生模块,用于对多种原始用户特征进行衍生处理,得到衍生用户特征;

10、第一确定模块,用于根据衍生用户特征与原始用户特征的映射关系,确定衍生用户特征与原始用户特征的影响因子,所述影响因子用于表示衍生用户特征对原始用户特征的影响力;

11、获取模块,用于获取衍生用户特征的第一重要性数据,所述衍生用户特征用于训练风险模型,所述第一重要性数据用于表示衍生用户特征对风险模型预测结果的影响程度;

12、第二确定模块,用于根据第一重要性数据和影响因子,确定多种原始用户特征的第二重要性数据,所述第二重要性数据用于表示原始用户特征对风险模型预测结果的影响程度;

13、筛选模块,用于根据第二重要性数据,对多种原始用户特征进行筛选。

14、本说明书实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述特征筛选方法。

15、本说明书实施例的特征筛选方法,可以对多种原始用户特征进行衍生处理,得到衍生用户特征;可以根据衍生用户特征与原始用户特征的映射关系,确定衍生用户特征与原始用户特征的影响因子,所述影响因子用于表示衍生用户特征对原始用户特征的影响力;可以获取衍生用户特征的第一重要性数据;可以根据第一重要性数据和影响因子,确定多种原始用户特征的第二重要性数据;可以根据第二重要性数据,对多种原始用户特征进行筛选。这样可以根据特征衍生过程中衍生用户特征与原始用户特征的映射关系,确定影响因子;可以根据衍生用户特征的第一重要性数据,结合影响因子,确定原始用户特征的第二重要性数据。所述第二重要性数据能够合理地表示原始用户特征的重要性。可以利用第二重要性数据,实现对原始用户特征的筛选,以帮助用户筛选出具有业务含义的关键用户特征。从而可以避免划分大量特征组,减小筛选时的计算量,降低计算机设备运行负载,提高筛选效率。

本文档来自技高网...

【技术保护点】

1.一种特征筛选方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,在确定影响因子的步骤中包括:

4.根据权利要求1所述的方法,其特征在于,在确定影响因子的步骤中包括:

5.根据权利要求1所述的方法,其特征在于,在获取第一重要性数据的步骤中包括:

6.根据权利要求1所述的方法,其特征在于,在确定第二重要性数据的步骤中包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的方法,其特征在于,所述方法还包括:

9.一种特征筛选装置,其特征在于,包括:

10.一种计算机设备,其特征在于,包括:

【技术特征摘要】

1.一种特征筛选方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,在确定影响因子的步骤中包括:

4.根据权利要求1所述的方法,其特征在于,在确定影响因子的步骤中包括:

5.根据权利要求1所述的方法,其特征在于,在获取第一重要性数据...

【专利技术属性】
技术研发人员:李婉华
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1