【技术实现步骤摘要】
风控模型优化方法、装置、计算机设备及存储介质
本专利技术涉及一种风控模型优化方法、装置、计算机设备及存储介质,尤其是指一种风控模型优化方法、装置、计算机设备及存储介质。
技术介绍
目前,互联网金融贷款服务公司,在进行放贷服务时,通过风控模型来对用户的贷款申请进件进行审核,但是现有的风控模型,只加载一些常规衍生的特征,对于用户的数据没有进行深入的挖掘,同时在进行模型训练时没有考虑样本数据的时间特性对模型预测的影响,在模型预测精确度,减少错判误杀上还有提升空间。
技术实现思路
本专利技术所要解决的技术问题是:提供一种能够提高模型预测精度的风控模型优化方法、装置、计算机设备及存储介质。为了解决上述技术问题,本专利技术采用的技术方案为:一种风控模型优化方法,包括以下步骤,S10、获取样本用户的多个维度的数据,生成样本用户画像数据;S20、根据样本用户的画像数据,借助知识图谱和复杂网络,关联和推导出样本用户的画像数据的常规特征因子;S30、通过大数据,挖掘出样本用户的画像数据之间的隐 ...
【技术保护点】
1.一种风控模型优化方法,其特征在于:包括以下步骤,/nS10、获取样本用户的多个维度的数据,生成样本用户画像数据;/nS20、根据样本用户的画像数据,借助知识图谱和复杂网络,关联和推导出样本用户的画像数据的常规特征因子;/nS30、通过大数据,挖掘出样本用户的画像数据之间的隐藏关系,得到样本用户的画像数据的隐藏特征因子;/nS40、计算样本用户的时间序列影响因子;/nS50、对常规特征因子、隐藏特征因子及时间序列影响因子进行预处理;/nS60、对经过预处理的常规特征因子、隐藏特征因子及时间序列影响因子进行特征分解,度量每个特征对模型精确度的影响,去除噪声,形成机器学习模型 ...
【技术特征摘要】
1.一种风控模型优化方法,其特征在于:包括以下步骤,
S10、获取样本用户的多个维度的数据,生成样本用户画像数据;
S20、根据样本用户的画像数据,借助知识图谱和复杂网络,关联和推导出样本用户的画像数据的常规特征因子;
S30、通过大数据,挖掘出样本用户的画像数据之间的隐藏关系,得到样本用户的画像数据的隐藏特征因子;
S40、计算样本用户的时间序列影响因子;
S50、对常规特征因子、隐藏特征因子及时间序列影响因子进行预处理;
S60、对经过预处理的常规特征因子、隐藏特征因子及时间序列影响因子进行特征分解,度量每个特征对模型精确度的影响,去除噪声,形成机器学习模型训练数据;
S70、通过机器学习模型训练数据进行xgboost模型训练,得到风控预测模型。
2.如权利要求1所述的风控模型优化方法,其特征在于:所述步骤S50具体包括,
对常规特征因子、隐藏特征因子及时间序列影响因子进行回溯、归一化、分箱、异常值缺失值处理。
3.如权利要求2所述的风控模型优化方法,其特征在于:所述步骤S70具体包括,
通过机器学习模型训练数据进行xgboost模型训练,不断地进行特征分裂来生长一棵决策树,每一轮学习一棵决策树,拟合上一轮模型的预测值与实际值之间的残差,得到风控预测模型。
4.如权利要求1所述的风控模型优化方法,其特征在于:所述隐藏特征因子包括,
样本用户的户籍所在区域的历史坏样本总数、样本用户的户籍所在区域的历史坏样本率;样本用户的户籍所在省份的人均gdp;样本用户的户籍所在市的人均gdp;样本用户的户籍所在县/区域的人口数;样本用户的户籍所在县/区域的人均gdp。
5.一种风控模型优化装置,其特征在于:包括,
样本数据获取模块,用于获取样本用户的多个维度的数据,生成样本用户画像数据;
常规因子计算模块,用于根据样本用户的画像数据,借助知识图谱和复杂网络,关联和推导出样本用户的画像数据...
【专利技术属性】
技术研发人员:陈岚,雷雨,胡帅,陈志健,
申请(专利权)人:深圳市富之富信息技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。