基于指令数据的个人信用评分方法及装置制造方法及图纸

技术编号:19548148 阅读:39 留言:0更新日期:2018-11-24 21:21
本发明专利技术实施例公开了一种基于指令数据的个人信用评分方法及装置。方法包括:获取样本账户群,并按照预设规则从样本账户群中选取出正样本和负样本;对第一预设指标群进行分箱处理,并根据每个分箱内负样本的占比获取每个分箱对应的WOE值;根据每个分箱对应的WOE值获取预构建逻辑回归模型的参数的估计量;对所述逻辑回归模型参数的估计量配置惩罚项,所述惩罚项用于配置信令数据与其他非信令数据对所述逻辑回归模型的贡献;根据所述逻辑回归模型对用户的个人信用进行评分,获取用户的个人信用评分。本发明专利技术实施例基于信令数据对逻辑回归模型进行改进,以保证信令数据在逻辑回归模型中占有较大的比重,与现有技术相比,具有评分更加准确的优点。

Individual Credit Scoring Method and Device Based on Instruction Data

The embodiment of the present invention discloses a personal credit scoring method and device based on instruction data. The methods include: obtaining the sample account group and selecting positive and negative samples from the sample account group according to the preset rules; subdividing the first preset index group into boxes, and obtaining the corresponding WOE value of each subbox according to the proportion of negative samples in each subbox; and obtaining the preset logistic regression according to the corresponding WOE value of each subbox. Estimators of the parameters of the model; allocation of penalties to the estimators of the parameters of the logistic regression model, which are used to configure the contribution of signaling data and other non-signaling data to the logistic regression model; scoring the user's personal credit according to the logistic regression model, and obtaining the user's personal credit score \u3002 The embodiment of the present invention improves the logistic regression model based on signaling data to ensure that signaling data occupies a larger proportion in the logistic regression model, and has the advantage of more accurate scoring compared with the existing technology.

【技术实现步骤摘要】
基于指令数据的个人信用评分方法及装置
本专利技术实施例涉及信用风险管理
,具体涉及一种基于指令数据的个人信用评分方法及装置。
技术介绍
截至2015年9月末,央行征信系统已经收录8.7亿自然人和2102万户企业及其他组织,央行征信系统收集的信息以银行信贷信息为核心,还包括社保、公积金、民事裁决与执行、公共事业和通讯缴费记录等。实际上,移动公司拥有翔实的用户行为数据、用户背景资料,还可以掌握用户位置信息的信令数据、通话通信记录、交费消费记录,这些数据也早已经纳入到了国家征信系统中。作为大数据应用落地最具有实用价值的征信领域,移动公司一直都在不断的探索。在实现本专利技术实施例的过程中,专利技术人发现通信运营商建立的个人信用评分方法主要考虑了用户的基本信息、业务订购信息、消费能力、通信行为、历史欠费停机记录、交往圈等多方面的因素,但由于考虑的因素并没有侧重点,因此实际得到的评分结果并不准确。
技术实现思路
本专利技术实施例的一个目的是解决现有技术由于评分考虑的因素没有侧重点导致评分结果不准确的问题。本专利技术实施例提出了一种基于指令数据的个人信用评分方法,包括:获取样本账户群,并按照预设规则从样本账户群中选取出正样本和负样本;对第一预设指标群进行分箱处理,并根据每个分箱内负样本的占比获取每个分箱对应的WOE值;根据每个分箱对应的WOE值获取预构建逻辑回归模型的参数的估计量;对所述逻辑回归模型参数的估计量配置惩罚项,所述惩罚项用于配置信令数据与其他非信令数据对所述逻辑回归模型的贡献;根据所述逻辑回归模型对用户的个人信用进行评分,获取用户的个人信用评分。可选的,所述按照预设规则从样本账户群中选取出正样本和负样本包括:采用熵值法判断每个样本账户的第二预设指标群的离散程度;根据每个样本账户的第二预设指标群的离散程度从所述样本账户群中选取正样本和负样本。可选的,所述对所述逻辑回归模型参数的估计量配置惩罚项包括:对所述第一预设指标群进行分析,获取与信令数据相关的第一指标组以及与信令数据无关的第二指标组;构建所述第二指标组中指标的系数与所述第一指标组中指标的系数的惩罚项;将所述惩罚项配置至所述逻辑回归模型参数的估计量。可选的,所述惩罚项为其中,ψ1为惩罚系数,βj为所述第二指标组中第j个指标的系数,为所述第一指标组中第kn个指标的系数。可选的,所述根据所述逻辑回归模型对用户的个人信用进行评分包括:在预设约束条件下,将所述逻辑回归模型转化为评分模型;将用户的第二预设指标群对应的数据作为评分模型的输入,获取所述第二预设指标群中每个指标对应各分箱的评分值;根据每个指标对应各分箱的评分值获取用户的个人信用评分。本专利技术实施例提出了一种基于指令数据的个人信用评分装置,包括:获取模块,用于获取样本账户群,并按照预设规则从样本账户群中选取出正样本和负样本;分箱模块,用于对第一预设指标群进行分箱处理,并根据每个分箱内负样本的占比获取每个分箱对应的WOE值;建模模块,用于根据每个分箱对应的WOE值获取预构建逻辑回归模型的参数的估计量;配置模块,用于对所述逻辑回归模型参数的估计量配置惩罚项,所述惩罚项用于配置信令数据与其他非信令数据对所述逻辑回归模型的贡献;评分模块,用于根据所述逻辑回归模型对用户的个人信用进行评分,获取用户的个人信用评分。可选的,所述获取模块,用于采用熵值法判断每个样本账户的第二预设指标群的离散程度;根据每个样本账户的第二预设指标群的离散程度从所述样本账户群中选取正样本和负样本。可选的,所述配置模块,用于对所述第一预设指标群进行分析,获取与信令数据相关的第一指标组以及与信令数据无关的第二指标组;构建所述第二指标组中指标的系数与所述第一指标组中指标的系数的惩罚项;将所述惩罚项配置至所述逻辑回归模型参数的估计量。可选的,所述惩罚项为其中,ψ1为惩罚系数,βj为所述第二指标组中第j个指标的系数,为所述第一指标组中第kn个指标的系数。可选的,所述评分模块,用于在预设约束条件下,将所述逻辑回归模型转化为评分模型;将用户的第二预设指标群对应的数据作为评分模型的输入,获取所述第二预设指标群中每个指标对应各分箱的评分值;根据每个指标对应各分箱的评分值获取用户的个人信用评分。由上述技术方案可知,本专利技术实施例提出的一种基于指令数据的个人信用评分方法及装置基于信令数据对逻辑回归模型进行改进,以保证信令数据在逻辑回归模型中占有较大的比重,与现有技术相比,具有评分更加准确的优点。附图说明通过参考附图会更加清楚的理解本专利技术的特征和优点,附图是示意性的而不应理解为对本专利技术进行任何限制,在附图中:图1示出了本专利技术一实施例提供的基于指令数据的个人信用评分方法的流程示意图;图2示出了本专利技术另一实施例提供的基于指令数据的个人信用评分方法的流程示意图;图3示出了本专利技术一实施例提供的基于指令数据的个人信用评分装置的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1示出了本专利技术一实施例提供的基于指令数据的个人信用评分方法的流程示意图,参见图1,该方法可由处理器实现,具体包括如下区别技术特征:110、获取样本账户群,并按照预设规则从样本账户群中选取出正样本和负样本;需要说明的是,此处的样本账户可以为某企业的用户的手机号码、用户编号等用户唯一标识性的信息;然后,基于一些划分的规则从中选取出正样本和负样本,即好的用户和坏的用户各有多少个,或者占总样本的百分比是多少。其中,划分的规则有多种,例如:黄金分割法。120、对第一预设指标群进行分箱处理,并根据每个分箱内负样本的占比获取每个分箱对应的WOE值;需要说明的是,分箱处理法为较为成熟的技术,此处不再赘述。130、根据每个分箱对应的WOE值获取预构建逻辑回归模型的参数的估计量;140、对所述逻辑回归模型参数的估计量配置惩罚项,所述惩罚项用于配置信令数据与其他非信令数据对所述逻辑回归模型的贡献;需要说明的是,为将模型的评分因素侧重于信令数据,需要限定其他非信令数据与信令数据之间的关系,以保证信令数据在逻辑回归模型中所占的比重要大于其他非信令数据所占比重。150、根据所述逻辑回归模型对用户的个人信用进行评分,获取用户的个人信用评分。需要说明的是,模型建立完成后,将用户的第一预设指标群的相关信息作为模型的输入,得出用户的个人信用评分。可见,本实施例基于信令数据对逻辑回归模型进行改进,以保证信令数据在逻辑回归模型中占有较大的比重,与现有技术相比,具有评分更加准确的优点。下面对上述步骤进行详细说明:首先,步骤110中选取正/负样本的方法可以包括如下步骤:采用熵值法判断每个样本账户的第二预设指标群的离散程度;根据每个样本账户的第二预设指标群的离散程度从所述样本账户群中选取正样本和负样本。其次,步骤140具体包括:对所述第一预设指标群进行分析,获取与信令数据相关的第一指标组以及与信令数据无关的第二指标组;构建所述第二指标组中指标的系数与所述第一指标组中指标的系数的本文档来自技高网...

【技术保护点】
1.一种基于指令数据的个人信用评分方法,其特征在于,包括:获取样本账户群,并按照预设规则从样本账户群中选取出正样本和负样本;对第一预设指标群进行分箱处理,并根据每个分箱内负样本的占比获取每个分箱对应的WOE值;根据每个分箱对应的WOE值获取预构建逻辑回归模型的参数的估计量;对所述逻辑回归模型参数的估计量配置惩罚项,所述惩罚项用于配置信令数据与其他非信令数据对所述逻辑回归模型的贡献;根据所述逻辑回归模型对用户的个人信用进行评分,获取用户的个人信用评分。

【技术特征摘要】
1.一种基于指令数据的个人信用评分方法,其特征在于,包括:获取样本账户群,并按照预设规则从样本账户群中选取出正样本和负样本;对第一预设指标群进行分箱处理,并根据每个分箱内负样本的占比获取每个分箱对应的WOE值;根据每个分箱对应的WOE值获取预构建逻辑回归模型的参数的估计量;对所述逻辑回归模型参数的估计量配置惩罚项,所述惩罚项用于配置信令数据与其他非信令数据对所述逻辑回归模型的贡献;根据所述逻辑回归模型对用户的个人信用进行评分,获取用户的个人信用评分。2.根据权利要求1所述的方法,其特征在于,所述按照预设规则从样本账户群中选取出正样本和负样本包括:采用熵值法判断每个样本账户的第二预设指标群的离散程度;根据每个样本账户的第二预设指标群的离散程度从所述样本账户群中选取正样本和负样本。3.根据权利要求1所述的方法,其特征在于,所述对所述逻辑回归模型参数的估计量配置惩罚项包括:对所述第一预设指标群进行分析,获取与信令数据相关的第一指标组以及与信令数据无关的第二指标组;构建所述第二指标组中指标的系数与所述第一指标组中指标的系数的惩罚项;将所述惩罚项配置至所述逻辑回归模型参数的估计量。4.根据权利要求3所述的方法,其特征在于,所述惩罚项为其中,ψ1为惩罚系数,βj为所述第二指标组中第j个指标的系数,为所述第一指标组中第kn个指标的系数。5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述逻辑回归模型对用户的个人信用进行评分包括:在预设约束条件下,将所述逻辑回归模型转化为评分模型;将用户的第二预设指标群对应的数据作为评分模型的输入,获取所述第二预设指标群中每个指标对应各分箱的评分值;根据每个指标对应各分箱的评分值获取用...

【专利技术属性】
技术研发人员:张湛梅张晓川徐睿崔志顺
申请(专利权)人:中国移动通信集团广东有限公司中国移动通信集团公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1