【技术实现步骤摘要】
基于GBDT算法的评分卡模型的建模方法及其系统
本专利技术涉及互联网金融风控
,特别涉及基于GBDT算法的评分卡模型的建模方法及其系统。
技术介绍
随着互联网的兴起,P2P借贷、消费金融、汽车租赁等互联网金融公司呈现出百家争鸣、百花齐放的局面,但欺诈黑色产业链也开始不断地渗透到该新兴领域,只有拥有良好的风控技术,才可能在这股浪潮中健康发展。互联网金融风控技术主要使用传统的信用评分卡,借鉴国外的FICO比较成熟成型的逻辑回归算法建立的风险预测模型,该信用评分卡算法通过对借款人的身份地位、职业特征、收支状况、征信历史等维度评估预测借款人的还款能力和意愿。基于逻辑回归算法的传统的金融风控评分卡模型优点在于解释性强,简单易于理解,能够直接看到各个特征的权重,也能容易地吸收新的数据来更新模型,广泛应用在信用风险控制领域。但随着大数据的发展,逻辑回归算法对于新型互联网数据局限性也比较明显,具体问题及难点有以下几点:(1)数据预处理繁琐:数据形式呈现多样化,具有非结构化、饱和度低、数据稀疏等特性,复杂度极大提升,人工数据处理 ...
【技术保护点】
1.基于GBDT算法的评分卡模型的建模方法,其特征在于,包括以下步骤:/n步骤一:建模样本的选择定义,首先根据产品业务定义样本的正负,其次抽取建模样本,排除特殊客户;/n步骤二:数据特征获取,从步骤一中的建模样本中获取特征数据,所述特征数据包括人行征信、职业特征、收支状况、银行流水、职业特征、身份地位以及客户授权获取的第三方数据,得到模型初始数据;/n步骤三:数据预处理,将步骤二中获取的初始数据划分为连续型数据和离散型数据,并分别对连续型数据和离散型数据做统计性分析,清洗数据中受“污染”的数据,检查数据一致性,处理无效值和缺失值;/n步骤四:特征工程,首先,将步骤三中预处理 ...
【技术特征摘要】
1.基于GBDT算法的评分卡模型的建模方法,其特征在于,包括以下步骤:
步骤一:建模样本的选择定义,首先根据产品业务定义样本的正负,其次抽取建模样本,排除特殊客户;
步骤二:数据特征获取,从步骤一中的建模样本中获取特征数据,所述特征数据包括人行征信、职业特征、收支状况、银行流水、职业特征、身份地位以及客户授权获取的第三方数据,得到模型初始数据;
步骤三:数据预处理,将步骤二中获取的初始数据划分为连续型数据和离散型数据,并分别对连续型数据和离散型数据做统计性分析,清洗数据中受“污染”的数据,检查数据一致性,处理无效值和缺失值;
步骤四:特征工程,首先,将步骤三中预处理后的数据做分箱处理,其次,根据各个分箱的证据权重WOE继续分箱优化,最终得到变量的较优的信息价值IV,之后根据信息价值IV和KS选择进入模型的变量,并用证据权重WOE替代转换模型的变量,生成建模数据;
步骤五:GBDT算法开发,将步骤四得到的建模数据按比例随机或跨时间划分为训练集和测试集,将训练集放到GBDT算法模型当中进行训练,并用测试集来验证训练后模型的评估指标;
步骤六:模型调参评估,对模型进行调参处理,根据模型的评估指标评估模型的区分能力、预测能力和稳定性,并生成评估报告,与其他算法模型对比,得出模型是否可以使用的结论;
步骤七:模型部署及监控,包括选择模型部署的系统平台,将模型部署到系统平台上,监控模型的信息价值IV、均值、PSI、AUC并根据监控定期更新模型。
2.根据权利要求1所述的基于GBDT算法的评分卡模型的建模方法,其特征在于,所述步骤三中的受“污染”的数据包括冗余数据、单一水平数据、稀疏数据、缺失不完整数据...
【专利技术属性】
技术研发人员:江远强,
申请(专利权)人:百维金科上海信息科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。