基于RFM和DFS算法的智能特征自动衍生方法技术

技术编号:33201364 阅读:43 留言:0更新日期:2022-04-24 00:38
本发明专利技术涉及一种基于RFM和DFS算法的智能特征自动衍生方法,包括:获取基础数据;对基础数据依次进行信息维度划分、指标维度划分,得到多个不同的指标维度;基于指标维度,进一步对数据进行RFM划分,以确定出数据对应的RFM类别、得到基础特征;根据基础特征,结合DFS算法,交叉产生具有业务意义的特征。与现有技术相比,本发明专利技术能够自主产生具有业务含义的特征。本发明专利技术能够自主产生具有业务含义的特征。本发明专利技术能够自主产生具有业务含义的特征。

【技术实现步骤摘要】
基于RFM和DFS算法的智能特征自动衍生方法


[0001]本专利技术涉及数据挖掘
,尤其是涉及一种基于RFM和DFS算法的智能特征自动衍生方法。

技术介绍

[0002]在大数据时代,为了能够从海量数据中获取所需信息,有必要进行数据挖掘处理,数据挖掘是人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。
[0003]目前,在金融业务场景下,数据挖掘的方法主要是通过人工方法去实现,即由算法工程师按照一定的算法(如神经网络算法)将特征进行衍生、或者利用无意义特征衍生方法对数据进行无序组合,这种方式并没有充分考虑特征的业务含义、没有结合业务含义进行衍生,尽管能够产生大量特征,但产生的这些特征都不能进行直白的业务解释,也就难以产生大量且有意义的特征。
[0004]此外,在数据挖掘过程中,60%~70%的工作量花费在数据加工上,大量的重复劳动导致数据挖掘效率较低,也无法保证特征衍生的准确性。

技术实现思路

[0005]本专利技术的目的就是为了克本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于RFM和DFS算法的智能特征自动衍生方法,其特征在于,包括以下步骤:S1、获取基础数据;S2、对基础数据依次进行信息维度划分、指标维度划分,得到多个不同的指标维度;S3、基于指标维度,进一步对数据进行RFM划分,以确定出数据对应的RFM类别、得到基础特征;S4、根据基础特征,结合DFS算法,交叉产生具有业务意义的特征。2.根据权利要求1所述的一种基于RFM和DFS算法的智能特征自动衍生方法,其特征在于,所述基础数据的来源包括客户基本信息、征信数据、三方数据、贷前埋点信息以及行内关系数据。3.根据权利要求1所述的一种基于RFM和DFS算法的智能特征自动衍生方法,其特征在于,所述步骤S2具体包括以下步骤:S21、对基础数据进行信息维度划分,得到多个信息维度,所述信息维度包括贷款纬度、位置信息、征信查询信息和历史逾期信息;S22、在多个信息维度基础上进行指标维度划分,得到多个指标维度,所述指标维度包括信用卡交易逾期类、现金借贷逾期类和消费贷贷款类。4.根据权利要求1所述的一种基于RFM和DFS算法的智能特征自动衍生方法,其特征在于,所述步骤S3具体包括以下步骤:S31、对多个指标维度分别进行数据清洗;S32、针对每个数据清洗后的指标维度,分别进行RFM划分,以确定出...

【专利技术属性】
技术研发人员:姚千山汪克高
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1