The embodiment of the present invention discloses a personal credit scoring method and device based on instruction data. The methods include: obtaining the sample account group and selecting positive and negative samples from the sample account group according to the preset rules; subdividing the first preset index group into boxes, and obtaining the corresponding WOE value of each subbox according to the proportion of negative samples in each subbox; and obtaining the preset logistic regression according to the corresponding WOE value of each subbox. Estimators of the parameters of the model; allocation of penalties to the estimators of the parameters of the logistic regression model, which are used to configure the contribution of signaling data and other non-signaling data to the logistic regression model; scoring the user's personal credit according to the logistic regression model, and obtaining the user's personal credit score \u3002 The embodiment of the present invention improves the logistic regression model based on signaling data to ensure that signaling data occupies a larger proportion in the logistic regression model, and has the advantage of more accurate scoring compared with the existing technology.
【技术实现步骤摘要】
基于指令数据的个人信用评分方法及装置
本专利技术实施例涉及信用风险管理
,具体涉及一种基于指令数据的个人信用评分方法及装置。
技术介绍
截至2015年9月末,央行征信系统已经收录8.7亿自然人和2102万户企业及其他组织,央行征信系统收集的信息以银行信贷信息为核心,还包括社保、公积金、民事裁决与执行、公共事业和通讯缴费记录等。实际上,移动公司拥有翔实的用户行为数据、用户背景资料,还可以掌握用户位置信息的信令数据、通话通信记录、交费消费记录,这些数据也早已经纳入到了国家征信系统中。作为大数据应用落地最具有实用价值的征信领域,移动公司一直都在不断的探索。在实现本专利技术实施例的过程中,专利技术人发现通信运营商建立的个人信用评分方法主要考虑了用户的基本信息、业务订购信息、消费能力、通信行为、历史欠费停机记录、交往圈等多方面的因素,但由于考虑的因素并没有侧重点,因此实际得到的评分结果并不准确。
技术实现思路
本专利技术实施例的一个目的是解决现有技术由于评分考虑的因素没有侧重点导致评分结果不准确的问题。本专利技术实施例提出了一种基于指令数据的个人信用评分方法,包括:获取样本账户群,并按照预设规则从样本账户群中选取出正样本和负样本;对第一预设指标群进行分箱处理,并根据每个分箱内负样本的占比获取每个分箱对应的WOE值;根据每个分箱对应的WOE值获取预构建逻辑回归模型的参数的估计量;对所述逻辑回归模型参数的估计量配置惩罚项,所述惩罚项用于配置信令数据与其他非信令数据对所述逻辑回归模型的贡献;根据所述逻辑回归模型对用户的个人信用进行评分,获取用户的个人信用评分。可选的,所 ...
【技术保护点】
1.一种基于指令数据的个人信用评分方法,其特征在于,包括:获取样本账户群,并按照预设规则从样本账户群中选取出正样本和负样本;对第一预设指标群进行分箱处理,并根据每个分箱内负样本的占比获取每个分箱对应的WOE值;根据每个分箱对应的WOE值获取预构建逻辑回归模型的参数的估计量;对所述逻辑回归模型参数的估计量配置惩罚项,所述惩罚项用于配置信令数据与其他非信令数据对所述逻辑回归模型的贡献;根据所述逻辑回归模型对用户的个人信用进行评分,获取用户的个人信用评分。
【技术特征摘要】
1.一种基于指令数据的个人信用评分方法,其特征在于,包括:获取样本账户群,并按照预设规则从样本账户群中选取出正样本和负样本;对第一预设指标群进行分箱处理,并根据每个分箱内负样本的占比获取每个分箱对应的WOE值;根据每个分箱对应的WOE值获取预构建逻辑回归模型的参数的估计量;对所述逻辑回归模型参数的估计量配置惩罚项,所述惩罚项用于配置信令数据与其他非信令数据对所述逻辑回归模型的贡献;根据所述逻辑回归模型对用户的个人信用进行评分,获取用户的个人信用评分。2.根据权利要求1所述的方法,其特征在于,所述按照预设规则从样本账户群中选取出正样本和负样本包括:采用熵值法判断每个样本账户的第二预设指标群的离散程度;根据每个样本账户的第二预设指标群的离散程度从所述样本账户群中选取正样本和负样本。3.根据权利要求1所述的方法,其特征在于,所述对所述逻辑回归模型参数的估计量配置惩罚项包括:对所述第一预设指标群进行分析,获取与信令数据相关的第一指标组以及与信令数据无关的第二指标组;构建所述第二指标组中指标的系数与所述第一指标组中指标的系数的惩罚项;将所述惩罚项配置至所述逻辑回归模型参数的估计量。4.根据权利要求3所述的方法,其特征在于,所述惩罚项为其中,ψ1为惩罚系数,βj为所述第二指标组中第j个指标的系数,为所述第一指标组中第kn个指标的系数。5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述逻辑回归模型对用户的个人信用进行评分包括:在预设约束条件下,将所述逻辑回归模型转化为评分模型;将用户的第二预设指标群对应的数据作为评分模型的输入,获取所述第二预设指标群中每个指标对应各分箱的评分值;根据每个指标对应各分箱的评分值获取用...
【专利技术属性】
技术研发人员:张湛梅,张晓川,徐睿,崔志顺,
申请(专利权)人:中国移动通信集团广东有限公司,中国移动通信集团公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。