风控模型的建模方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:19122910 阅读:33 留言:0更新日期:2018-10-10 05:36
本申请涉及一种风控模型的建模方法、装置、计算机设备和存储介质,所述方法包括:获取用户数据的特征信息;利用所述特征信息建立初始风控模型,所述风控模型包括多个变量;对多个变量分别进行线性回归运算,统计所述变量对应的膨胀因子;将所述膨胀因子与第一阈值进行比较,当所述膨胀因子达到所述第一阈值时,将所述膨胀因子对应的变量标记为共线性变量;将一个或多个共线性变量从所述风控模型中剔除,得到最终的风控模型。采用本方法能够准确地剔除共线性变量以增加模型的稳定性。

【技术实现步骤摘要】
风控模型的建模方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种风控模型的建模方法、装置、计算机设备和存储介质。
技术介绍
随着互联网以及大数据的快速发展,数据挖掘在挽留客户、客户营销和发现高价值客户中起着越来越重要的作用,可以从大量数据中挖掘出有价值的信息。利用用户的数据特征建立风险控制模型,并进行分析,进而可以利用风险控制模型对用户进行信用评估。在建模的过程中,很难在众多因素中找到互不相干又同时对目标变量有显著作用的变量,则会出现变量相关的情形。变量之间一般不是相互独立的,甚至变量之间会存在严重的多重共线性,多重共线性是指变量之间存在完全的线性关系或者近似的线性关系。一些冗余的共线性变量会引起模型过度拟合。因此通常需要消除共线性变量,以增强模型的稳定性。传统的消除共线性的方法包括删除引发共线性的变量、增加样本容量和有偏估计方法。删除引发共线性的变量,是根据假设结果删除容易引发共线性的变量,但会导致模型估计产生偏倚。增加样本容量的方法简单易行,但拟合优度增加,原有参数估计值方差也增大,无法确诊共线性变量。传统的有偏估计方法包括领回归、主成分分析和片最小二乘估本文档来自技高网...
风控模型的建模方法、装置、计算机设备和存储介质

【技术保护点】
1.一种风控模型的建模方法,包括:获取用户数据的特征信息;利用所述特征信息建立初始风控模型,所述风控模型包括多个变量;对多个变量分别进行线性回归运算,统计所述变量对应的膨胀因子;将所述膨胀因子与第一阈值进行比较,当所述膨胀因子达到所述第一阈值时,将所述膨胀因子对应的变量标记为共线性变量;将一个或多个共线性变量从所述风控模型中剔除,得到最终的风控模型。

【技术特征摘要】
1.一种风控模型的建模方法,包括:获取用户数据的特征信息;利用所述特征信息建立初始风控模型,所述风控模型包括多个变量;对多个变量分别进行线性回归运算,统计所述变量对应的膨胀因子;将所述膨胀因子与第一阈值进行比较,当所述膨胀因子达到所述第一阈值时,将所述膨胀因子对应的变量标记为共线性变量;将一个或多个共线性变量从所述风控模型中剔除,得到最终的风控模型。2.根据权利要求1所述的方法,其特征在于,所述获取用户数据的特征信息的步骤之前,还包括:获取数据库中用户的注册数据和用户的历史数据;根据用户的注册数据获取第三方平台的用户行为数据;对所述注册数据、历史数据和行为数据进行分析,得到分析后的用户数据;获取预设关键字,利用预设关键字提取所述用户数据中的特征信息。3.根据权利要求1所述的方法,其特征在于,所述利用所述特征信息建立初始风控模型的步骤包括:提取所述特征信息对应的特征变量;对所述特征变量进行特征选择,得到用户最优特征变量;利用所述用户最优特征变量建立初始风控模型。4.根据权利要求3所述的方法,其特征在于,所述对所述特征变量进行特征选择,得到用户最优特征变量的步骤包括:获取用户数据的特征信息,提取所述特征信息对应的特征变量;对所述特征变量进行聚类,得到多个聚类结果;对所述多个聚类结果内的特征变量分别进行组合,得到多个特征组合,所述特征组合包括多个组合特征变量;对多个组合特征变量进行相关性检验,检验通过时,对所述组合特征变量添加交互标签;将添加交互标签后的组合特征变量解析对应的特征变量,利用解析得到的特征变量生成用户最优特征变量。5.根据权利要求4所述的方法,其特征在于,所述将添加交互标签...

【专利技术属性】
技术研发人员:徐定坚赖晓彬刘奕慧
申请(专利权)人:深圳市牛鼎丰科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1