【技术实现步骤摘要】
一种基于贷款多头数据的贷前审批预警方法及系统
本专利技术涉及贷前审批预警
,特别涉及一种基于贷款多头数据的贷前审批预警方法及系统。
技术介绍
目前,现行的商业银行贷前控制信用体系大多以来的是银行人员的主观判断和经验积累,属于主观信用模式,很容易致使对企业的实际运营情况掌握不透彻这种情况,虚拟数据的使商业银行发放出很多不良贷款,严重困扰控股商业银行的发展。
技术实现思路
本专利技术目的之一在于提供了一种基于贷款多头数据的贷前审批预警方法,利用大数据其独特的客观化的信用体系,与商业银行贷前控制信用体系相结合,建立起人与物、物与物之间庞大的数据资源库,通过这种创新型的数据资源共享,为银行的贷前控制获取前所未有的海量实体行为数据,提供用户的判别与评价、预警等级分数。本专利技术实施例提供的一种基于贷款多头数据的贷前审批预警方法,包括:步骤S1:通过预设数据源获取用户的贷款多头数据;步骤S2:基于预设规则对贷款多头数据进行预处理,获得第一数据;步骤S3:采用预设方法对第一数据进行 ...
【技术保护点】
1.一种基于贷款多头数据的贷前审批预警方法,其特征在于,包括:/n步骤S1:通过预设数据源获取用户的贷款多头数据;/n步骤S2:基于预设规则对所述贷款多头数据进行预处理,获得第一数据;/n步骤S3:采用预设方法对所述第一数据进行筛选,获得第二数据;/n步骤S4:将所述第二数据输入预先训练好的模型中,所述模型输出用户的判别与评价、预警等级分数。/n
【技术特征摘要】
1.一种基于贷款多头数据的贷前审批预警方法,其特征在于,包括:
步骤S1:通过预设数据源获取用户的贷款多头数据;
步骤S2:基于预设规则对所述贷款多头数据进行预处理,获得第一数据;
步骤S3:采用预设方法对所述第一数据进行筛选,获得第二数据;
步骤S4:将所述第二数据输入预先训练好的模型中,所述模型输出用户的判别与评价、预警等级分数。
2.如权利要求1所述的基于贷款多头数据的贷前审批预警方法,其特征在于,
所述预设数据源包括:数据采集器、券商业务数据、合作方数据和第三方数据市场中一种或多种结合;
所述预设规则包括:数据清洗、数据集成、数据规约和数据变换;
所述数据清洗包括:去重、缺失值处理、异常值处理、特征编码和标准化处理中一种或多种;
所述预设方法包括:质量检查、变量衍生、击中率检查、匹配数据的质量检查、PSI检查、IV检查;
所述模型包括:逻辑回归模型。
3.如权利要求2所述的基于贷款多头数据的贷前审批预警方法,其特征在于,还包括:采用历史数据对初始模型进行增强学习训练得到所述预先训练好的模型,具体包括:
步骤S11:导入历史数据划分m个训练样本,并对参数ω,b进行初始化;
步骤S12:获取预测的输出结果y2;计算公式如下:
y2=log(ωTX+b);
其中,所述X表示m个所述训练样本组成的样本矩阵,所述ω表示回归分析矩阵,所述y2表示预测输出结果,所述b表示一个常数;
步骤S13:计算对应的损失函数,计算公式如下:
L(y1,y2)=-(y2log(y1))+(1-y2)log(1-y1);
其中,所述L(y1,y2)表示损失函数,所述y1表示输出结果y2=1的概率;
步骤S14:定义代价函数j(ω,b)为m个训练样本的损失函数的平均值,计算公式为
其中,y2i为第i个所述训练样本的输出结果,y1i为第i个所述训练样本的输出结果为1的概率;
步骤S15:计算梯度,计算公式为:
其中,所述Z表示m个样本的数据信息下标其表示为维度,所述A表示预测结果,所述Y表示真实结果,所述ω表示回归分析矩阵,所述X表示样本矩阵,所述m表示样本维度,所述b表示常数;
步骤S16:更新参数ω,b,更新公式为:
其中,所述ω表示更新后的回归分析矩阵,所述b表示更新后的常数
在预设迭代次数内,重复执行步骤S11至步骤S16,得到导数最小的代价函数,将此时模型作为所述预先训练好的模型。
4.如权利要求1所述的基于贷款多头数据的贷前审批预警方法,其特征在于,所述步骤S2:基于预设规则对所述贷款多头数据进行预处理,获得第一数据;具体包括:
获取b组每组M个所述贷款多头数据的评估数据;所述评估数据记为:Pf={(Of,p,μf,p),(F,αF),p=1,···,M};
获取识别框架K={O1,···,Oh}、对应所述识别框架中元素的效用函数μ(Oh)和评估值函数q(Oh);
确定每组所述评估数据的效用,计算公式如下:
其中,μf,p为第f组所述评估数据的效用,Of,p为第f组评估数据的第p个评估数据.μf,p为Of,p根据所述评估数据基于所述识别框架和所述效用函数获得的效用值,F为所述评估数据的初始效用值,αF所述评估数据的初始效用值的权重;
确定每组所述评估数据的评估值,计算公式如下:
其中,T(Pf)为第f组所述评估数据的评估值,μf,p为Of,p根据所述评估数据基于所述识别框架和所述评估值函数获得的评估值,d为初始效用值与所述初始评估值的关系系数;
基于b组所述评估数据的评估值,计算所述贷款多头数据的可信度T,计算公式为:
其中,E为所述评估数据的评估值的标准方差,λ为修正系数;
当所述贷款多头数据的可信度T大于预设阈值时,将所述贷款多头数据作为第一数据。
5.如权利要求1所述的基于贷款多头数据的贷前审批预警方法,其特征在于,所述步骤S2:基于预设规则对所述贷款多头数据进行预处理,获得第一数据;具体还包括:
将所述贷款多头数据进行聚类分组,获得多组待筛选数据;
提取其中一组待筛选数据,
解析所述待筛选数据,确定提取的一组待筛选数据中相互冲突的第一冲突数据和第二冲突数据;
解析所述第一冲突数据和所述第二冲突数据,分别获取第一冲突数据和第二冲突数据的预设数据源的置信度权重和对应的置信值;
基于所述置信度权重和置信值,计算所述第一冲突数据和所述第二冲突数据的总体置信度,计算公式为:
和
其中,D表示所述第一冲突数据的总体置信度,m表示在提取的一组所述待筛选数据中所述第一冲突数据的条数,β1,i表示第i条所述第一冲突数据对应的预设数据源的置信度权重,D1,i表示第i条所述第一冲突数据对应的置信值,D′表示所述第二冲突数据的总体置信度,n表示在提取的一组所述待筛选数据中所述第二冲突数据的条数,β2,j表示第j条所述第二冲突数据对应的预设数据源的置信度权重,D2,j表示第j条所述第二冲突数据对应的置信值;
计算所述第一冲突数据和所述第二冲突的置信比,计算公式如下:
当置信比大于预设比值时,保留所述第一冲突数据和所述第二冲突数据中总体置信度高的,删除总体置信度低的;当置信比小于等于预设比值时,重新从预设数据源获取所述第一冲突数据和所述第二冲突数据,和/或,输出所述第一冲突数据和所述第二冲突数据。
<...
【专利技术属性】
技术研发人员:陈亚娟,龙泳先,何侃,廖博帆,杨磊磊,
申请(专利权)人:北京睿知图远科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。