【技术实现步骤摘要】
一种基于贷款多头数据的用户画像生成方法及系统
本专利技术涉及用户画像
,特别涉及一种基于贷款多头数据的用户画像生成方法及系统。
技术介绍
目前,多头借贷就是一个借款者向2或2家以上的金融单位提出借贷需求。由于用户的偿还能力是有限的,向多方借款必存在着较高的风险。一般来说,当借贷人出现了多头借贷的情况,说明该借贷人资金需求出现了比较困难的情况,有理由怀疑其还款概率。有数据显示,多头借贷用户的逾期不还风险是普通用户的3-4倍,贷款申请者每多申请一家机构,违约率就上升20%。究其原因,这些用户往往是在拆东墙补西墙,或者增加了新的较大金额消费,本金加利息导致债务不断累积。当超出偿还能力时,只能逾期。由于互金平台的逾期并不计入央行征信,不会对用户借款产生直接影响,也导致一部分用户在逾期时肆无忌惮,同时多头借贷也为各平台审查风控带来巨大挑战。
技术实现思路
本专利技术目的之一在于提供了一种基于贷款多头数据的用户画像生成方法,基于用户的贷款多头数据构建识别用户的用户画像,使各个平台根据用户画像可以直接确定 ...
【技术保护点】
1.一种基于贷款多头数据的用户画像生成方法,其特征在于,包括:/n步骤S1:从预设途径获取用户的贷款多头数据;/n步骤S2:对所述贷款多头数据进行预处理,获得建模数据;/n步骤S3:基于预设模型算法对所述建模数据进行处理,获得降维数据;/n步骤S4:基于所述降维数据,构建用户标签;/n步骤S5:基于所述用户标签,建立用户画像。/n
【技术特征摘要】
1.一种基于贷款多头数据的用户画像生成方法,其特征在于,包括:
步骤S1:从预设途径获取用户的贷款多头数据;
步骤S2:对所述贷款多头数据进行预处理,获得建模数据;
步骤S3:基于预设模型算法对所述建模数据进行处理,获得降维数据;
步骤S4:基于所述降维数据,构建用户标签;
步骤S5:基于所述用户标签,建立用户画像。
2.如权利要求1所述的基于贷款多头数据的用户画像生成方法,其特征在于,
所述预设途径包括:数据采集器、券商业务数据、合作方数据和第三方数据市场中一种或多种结合;
所述预处理的方法包括:数据清洗、数据集成、数据规约和数据变换;
所述数据清洗包括:去重、缺失值处理、异常值处理、特征编码和标准化处理中一种或多种;
所述预设模型算法包括:PCA算法。
3.如权利要求1所述的基于贷款多头数据的用户画像生成方法,其特征在于,所述步骤S3:基于预设模型算法对所述建模数据进行处理,获得降维数据,具体包括:
步骤S31:对所述建模数据进行特征筛选;筛选方法包括:质量检查、变量衍生、击中率检查、匹配数据的质量检查、PSI检查、IV检查;
步骤S32:提取异常值占比小于95%,PSI指标小于0.25,且IV值大于0.01的所述建模数据送入所述预设模型算法;
步骤S33:将筛选后的所述建模数据构建n行m列的样本矩阵X;
步骤S34:对所述样本矩阵X进行中心化,即去均值操作,具体为:
其中,表示第j行第i列的所述样本;表示第j行的所述样本的均值;
步骤S35:计算所述样本的协方差矩阵XXT;
步骤S36:对所述协方差矩阵XXT进行特征分解,计算特征值;
步骤S37:选取最大的l个特征值对应的特征向量ζ1,ζ2,…,ζl;
步骤S38:建立投影矩阵Z=[ζ1,ζ2,…,ζl],将所述投影矩阵与所述样本矩阵相乘等到降维后的数据集。
4.如权利要求1所述的基于贷款多头数据的用户画像生成方法,其特征在于,所述步骤S5:基于所述用户标签,建立用户画像,具体包括:
步骤S51:获取用户的画像需求,解析所述画像需求,确定所述画像需求包含的第一标签的词条;
步骤S52:从所述用户标签中提取所述第一标签的值;
步骤S53:获取用户的画像载体图片;
步骤S54:对所述画像载体图片进行二值化处理,
步骤S55:将经过二值化处理的所述画像载体图片划为规则存储区和标签存储区;所述规则存储区位于所述画像载体图片的左上角,所述规则存储区的长宽都为所述画像载体图片的长宽的N分之一,N大于等于2;
步骤S56:根据所述第一标签的数目将所述标签存储区从上到下划分为多个标签单元;所述第一标签的数目与所述标签单元的数目相等;
步骤S57:将所述第一标签按照数据大小从小到大排列,并从上到下一一对应存储到所述标签单元中;
步骤S58:将所述标签存储区的划分规则、所述第一标签的数据大小存储在所述规则存储单元。
5.如权利要求1所述的基于贷款多头数据的用户画像生成方法,其特征在于,还包括:步骤S6:对所述用户画像的可信度进行评估;
对所述用户画像的可信度进行评估,具体包括:
获取识别框架K={O1,…,Oh}、对应所述识别框架中元素的效用函数μ(Oh)和评估值函数q(Oh);
获取M个对于所述用户画像的评估数据作为一条评估证据,共计获取b条所述评估证据,第f条评估证据记为Pf={(Of,p,μf,p),(F,αF),p=1,…,M};
确定所述评估证据的效用,计算公式如下:
其中,μ(Pf)为第f条所述评估证据的效用,Of,p为第f条评估证据的第p个评估数据;μf,p为Of,p根据所述评估数据基于所述识别框架和所述效用函数获得的效用值,F为所述评估证据的初始效用值,αF所述评估证据的初始效用值的权重;
确定所述评估证据的评估值,计算公式如下:
其中,T(Pf)为第f条所述评估证据的评估值,μf,p为Of,p根据所述评估数据基于所述识别框架和所述评估值函数获得的评估值,d为初始效用值与所述初始评估值的关系系数;
基于b条所述评估证据的评估值,计算所述用户画像的可信度T,计算...
【专利技术属性】
技术研发人员:陈建,龙泳先,刘天欣,王月月,边亚瑜,
申请(专利权)人:北京睿知图远科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。