【技术实现步骤摘要】
特征数据的筛选方法、装置、电子设备及计算机存储介质
本申请涉及计算机
,特别涉及一种特征数据的筛选方法、装置、电子设备及计算机存储介质。
技术介绍
随着科技的不断发展,各种个性化的预测模型的出现为用户处理信息过载问题提供了一个有效的工具,例如:预测模型通过对海量的用户历史购物信息进行学习,从而可以向用户推荐用户感兴趣的信息和商品;在做个人贷款项目时,预测模型通过用户的历史信息进行学习,从而对用户在进行贷款时是否会发生还款逾期的情况进行预测等。目前,在对模型进行训练的过程中,通常会选取多个特征对模型进行训练,但是,在选取特征的过程中并不能分辨哪些特征为有效特征,哪些特征为无效特征,如果在模型的训练过程中加入了无效的特征,就会降低模型的性能,即影响后续使用模型进行预测时的准确性。
技术实现思路
有鉴于此,本申请提供一种特征数据的筛选方法、装置、电子设备及计算机存储介质,用于挑选出有效的特征对计算模型进行训练,从而提高训练得到的计算模型的性能。本申请第一方面提供了一种特征数据的筛选方法,包 ...
【技术保护点】
1.一种特征数据的筛选方法,其特征在于,包括:/n获取特征集合;其中,所述特征集合中包括至少一个特征;/n将所述特征集合中的所有特征输入至计算模型,由所述计算模型处理输入的特征,得到所述计算模型的基准性能分值;其中,所述计算模型为一个用于实现梯度提升迭代决策树的框架;/n将所述特征集合中除待检测特征以外的每一个特征输入所述计算模型,由所述计算模型处理输入的特征,得到所述计算模型的参考性能分值;其中,所述待检测特征指代所述特征集合中的每一个特征;/n确定所述参考性能分值大于所述基准性能分值所对应的待检测特征为有效特征;其中,所述有效特征用于训练所述计算模型。/n
【技术特征摘要】
1.一种特征数据的筛选方法,其特征在于,包括:
获取特征集合;其中,所述特征集合中包括至少一个特征;
将所述特征集合中的所有特征输入至计算模型,由所述计算模型处理输入的特征,得到所述计算模型的基准性能分值;其中,所述计算模型为一个用于实现梯度提升迭代决策树的框架;
将所述特征集合中除待检测特征以外的每一个特征输入所述计算模型,由所述计算模型处理输入的特征,得到所述计算模型的参考性能分值;其中,所述待检测特征指代所述特征集合中的每一个特征;
确定所述参考性能分值大于所述基准性能分值所对应的待检测特征为有效特征;其中,所述有效特征用于训练所述计算模型。
2.根据权利要求1所述的筛选方法,其特征在于,所述获取特征集合之后,还包括:
按照预设的组合方式对所述特征集合中的特征进行组合,得到组合后的特征;
将所述组合后的特征加入所述特征集合。
3.根据权利要求2所述的筛选方法,其特征在于,所述按照预设的组合方式对所述特征集合中的特征进行组合,得到组合后的特征之前,还包括:
将每一个所述特征输入至所述计算模型中,计算得到每一个所述特征的分值;
按照所述特征的分值将每一个所述特征从大到小进行排序,得到排序后的特征集合;
在所述排序后的特征集合中选取预设个数的特征,作为筛选后的特征集合;
其中,所述所述按照预设的组合方式对所述特征集合中的特征进行组合,得到组合后的特征,包括:
按照预设的组合方式对所述筛选后的特征集合中的特征进行组合,得到组合后的特征。
4.根据权利要求2所述的筛选方法,其特征在于,所述预设的组合方式为:将至少两个所述特征相加,将至少两个所述特征相减,将至少两个所述特征相乘,或将至少两个所述特征相除。
5.一种特征数据的筛选装置,其特征在于,包括:
获取单元,用于获取特征集合;其中,所述特征集合中包括至少一个特征;
输入单元,用于将特征集合中的所有特征输...
【专利技术属性】
技术研发人员:丁锐,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。