【技术实现步骤摘要】
一种互联网信贷逾期预测方法、装置、服务器和存储介质
本专利技术实施例涉及互联网金融
,尤其涉及一种互联网信贷逾期预测方法、装置、服务器和存储介质。
技术介绍
互联网金融行业公司也逐渐把个人信用贷款业务作为研究突破的重要领域之一。然而,随着大数据技术的日益成熟,互联网金融个人信用原始数据集数据类型越来越复杂且数据量大,互联网金融公司面临着数据集越来越大、数据特征越来越复杂的问题。数据集中各个指标都有可能影响个人信用评估的效果,个人基本信息、经济情况和历史信用记录等多被证明是重要因素。目前常用的互联网信贷用户的逾期预测方法主要是基于专家经验制定的评分卡和基于LR模型的传统信用评分卡。前者根据专家经验制定一套评分规则,再根据用户的实际数据,使用该规则进行信用评分。这种方法评估结果不准确,同时无法充分挖掘数据信息,对数据的利用率不高。
技术实现思路
本专利技术提供一种互联网信贷逾期预测方法,将用户数据输入模型,得到逾期预测结果,实现对用户信贷逾期概率的准确预测。第一方面,本专利技术实 ...
【技术保护点】
1.一种互联网信贷逾期预测方法,其特征在于,包括:/n获取待评估用户的当前用户数据,所述当前用户数据包括性别、年龄、工作年限、通话记录、和/或历史借贷行为;/n使用所述当前用户数据输入预设的逾期预测模型进行预测,以得到所述待评估用户的信贷逾期概率;/n根据所述信贷逾期概率对待评估用户进行信贷预期评估。/n
【技术特征摘要】
1.一种互联网信贷逾期预测方法,其特征在于,包括:
获取待评估用户的当前用户数据,所述当前用户数据包括性别、年龄、工作年限、通话记录、和/或历史借贷行为;
使用所述当前用户数据输入预设的逾期预测模型进行预测,以得到所述待评估用户的信贷逾期概率;
根据所述信贷逾期概率对待评估用户进行信贷预期评估。
2.根据权利要求1所述的互联网信贷逾期预测方法,其特征在于,所述逾期预测模型的生成方法包括:
获取历史用户的样本用户数据,所述样本用户数据包括历史用户的性别、年龄、工作年限、通话记录、和/或历史借贷行为,所述样本用户数据还包括用户标签,所述用户标签记载所述历史用户出现信贷逾期或未出现信贷逾期;
将所述样本用户数据分为训练集和测试集;
从所述训练集中筛选出第一数据特征;
将所述训练集通过GBDT模型学习得到第二数据特征;
将所述第一数据特征和第二数据特征合并生成第三数据特征,使用LR模型训练所述第三数据特征,生成所述逾期预测模型。
3.根据权利要求2所述的互联网信贷逾期预测方法,其特征在于,所述从所述训练集中筛选出第一数据特征,包括:
对所述训练集进行EDA数据分析,获取所述训练集的缺失值、异常值、众数、平均值、第1中位数、第2中位数、第3中位数、标准差、最大值和最小值的分布状态;
对所述训练集依次执行数据处理和变量筛选,生成第一数据特征。
4.根据权利要求3所述的互联网信贷逾期预测方法,其特征在于,所述对所述训练集依次执行数据处理和变量筛选,生成第一数据特征,包括:
基于第一预设阈值,去掉所述训练集中缺失率超过第一预设阈值的训练集数据;
采用卡方分箱法,对去除缺失率过高的所述训练集数据进行分箱操作;
将分箱操作后的所述训练集数据的特征从非线性可分空间映射到近似线性可分空间内,生成待处理变量;
基于第二预设阈值,删除所述待处理变量中iv值超出第二预设阈值的变量,同时,基于第三预设阈值,删除所述待处理变量中VIF方差膨胀因子值超出第三预设阈值的变量,生成第一数据特征。
5.根据权利要求2所述的互联网信贷逾期预测方法,其特征在于,所述将所述训练集通过GBDT模型学习得到第二数据特征,包括:
所述GBDT模型使用决策树模型作...
【专利技术属性】
技术研发人员:李萍,
申请(专利权)人:随手北京信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。