评分卡原因码技术运行方法、装置、终端设备及存储介质制造方法及图纸

技术编号:30543914 阅读:34 留言:0更新日期:2021-10-30 13:21
本发明专利技术提供了一种评分卡原因码技术运行方法、装置、终端设备及存储介质,涉及分布式系统领域。该方法包括:初始数据源获取;评分卡模型构建,计算每个变量得分的中间得分X1;评分卡模型评分贡献度计算,每个变量得分减去中间得分X1得到变量初始贡献度X2,变量初始贡献度X2乘以变量权重得到变量最终贡献度X3;评分卡模型评分贡献度编码;评分卡模型评分贡献度排序。本发明专利技术获得了发明专利技术特征贡献度指标、发明专利技术特征贡献码指标、发明专利技术特征贡献分组指标。通过以上指标可充分做到评分可解释性:所有样本所有特征的贡献度;所有样本单个特征的贡献度;单个样本所有特征的贡献度;单个样本单个特征的贡献度。贡献度。贡献度。

【技术实现步骤摘要】
评分卡原因码技术运行方法、装置、终端设备及存储介质


[0001]本专利技术涉及分布式系统领域,具体而言,涉及一种评分卡原因码技术运行方法、装置、终端设备及存储介质。

技术介绍

[0002]评分卡原因码技术是一种针对客户信用或欺诈风险评分卡建立的得分可解释技术。目前在评分开发和评分应用之间缺乏一道桥梁,而评分卡原因码技术就顺利地将二者连接在一起,利用通俗易懂的数据和语言向评分应用者展示出客户为何得到这个分数,客户在哪些维度上做了加分或者减分处理,与此同时,评分开发者还可用原因码来分析变量的贡献度,哪些变量对整体客群的加分或者减分贡献较大,可以说,评分卡原因码技术对评分更佳广泛的传播和应用奠定了稳固的基础。
[0003]评分卡的理论基础是:假设历史客户的风险特征与未来应用保持基本一致的情况下,在大数法则基础上,通过对历史客户的各类信息进行分析,根据历史客户以上属性与好坏事件率的关系(先验概率),来预测未来客户的好坏概率,并将概率转化为评分,以方便业务应用。关于模型解释性,线性模型和决策树这种算法本来就有很好解释性的模型,Python中sklean库中有很多模型都有importance这一接口,可以查看特征的重要性。只不过传统的importance的计算方法其实有很多争议,且并不总是一致。因为模型本身是个黑盒,可从整体上来进行分析,但具体到某个样本,想要探究分高分低的原因,需要做很多繁琐的分析工作,效率极低,模型并不能给你想要的答案。评分结果是一个数值型分值,例如某个客户得分600分,如何评价这个客户得分较高或者较低,该得分是基于哪些变量得到的,哪些变量得分较高或者较低,这些问题目前都没有指标来衡量。而且,如果要去衡量评分的来源,需要评分开发人员配合打开评分规则来检索,不具备良好的拓展性和灵活性。

技术实现思路

[0004]基于上述现有技术存在的需要对每个发布任务的程序分别进行监控,得到的任务日志也比较复杂,不利于监控分布式系统中的任务运行情况的问题,本专利技术实施例提供一种评分卡原因码技术运行方法、装置、终端设备及存储介质,所述评分卡原因码技术运行方法包括以下步骤:
[0005]S101、初始数据源获取;
[0006]S102、评分卡模型构建,计算每个变量得分的中间得分X1,中间得分X1是所有变量得分的平均分或者中位分;
[0007]S103、评分卡模型评分贡献度计算,每个变量得分减去中间得分X1得到变量初始贡献度X2,变量初始贡献度X2乘以变量权重得到变量最终贡献度X3;
[0008]S104、评分卡模型评分贡献度编码,分别将中间得分X1、变量初始贡献度X2以及变量最终贡献度X3中的若干分组得出的若干贡献度进行编码;
[0009]S105、评分卡模型评分贡献度排序,对每个客户循环处理,提取排名靠前的N个变
量贡献度和原因码;以及排名靠后的N个变量贡献度和原因码。
[0010]进一步的:评分卡原因码技术运行方法还包括评分卡原因码分析,评分卡原因码分析步骤包括:
[0011]S201、判断变量最终贡献度X3正负值,变量最终贡献度X3>0代表该客户在此变量得分在平均水平以上,即该客户在此变量得分较高;变量最终贡献度X3<0代表该客户在此变量得分在平均水平以下,即该客户在此变量得分较低;
[0012]S202、对每个客户的所有变量最终贡献度X3进行大小排序,筛选出大于0的排名前N位的变量,以及小于0的排名前N位的变量,进一步可分析得出该客户在哪些维度上表现较好,以及在哪些维度上表现较差;
[0013]S203、对某个客户群体的所有变量最终贡献度X3进行排序,筛选出大于0的排名前N位的变量,以及小于0的排名前N位的变量,进一步可分析得出哪些变量大于0出现的次数较多和平均贡献较大,以及哪些变量小于0出现的次数较多和平均贡献较大。
[0014]一种终端设备,该终端设备包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当终端设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行时执行如前述实施例中所述的评分卡原因码技术运行方法的步骤。
[0015]一种装置包括数据获取模块、数据分析模块以及数据推送展示模块,所述数据获取模块用于录入客户初始数据,数据分析模块用于将客户初始数据进行分析处理,数据推送展示模块用于将分析结果推送至操作人员处并用于显示。
[0016]在本申请中,评分卡原因码专利技术取得了以下技术效果:获得了专利技术特征贡献度指标、专利技术特征贡献码指标、专利技术特征贡献分组指标。通过以上指标可充分做到评分可解释性:所有样本所有特征的贡献度;所有样本单个特征的贡献度;单个样本所有特征的贡献度;单个样本单个特征的贡献度。
附图说明
[0017]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0018]图1示出了本专利技术实施例提供的评分卡原因码技术运行方法的流程示意图;
[0019]图2示出了本专利技术评分卡原因码分析步骤的流程示意图;
[0020]图3示出了本专利技术实施例提供的评分卡原因码技术装置的结构示意图;
[0021]图4示出了本专利技术实施例提供的终端设备的结构示意图。
具体实施方式
[0022]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,应当理解,本专利技术中附图仅起到说明和描述的目的,并不用于限定本专利技术的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本专利技术中使用的流程图示出了根据本专利技术的一些实施例实现的操
作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本
技术实现思路
的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
[0023]另外,本专利技术所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0024]需要说明的是,本专利技术实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。还应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。在本专利技术的描述中,还需要说明的是,术语“第一”、“本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种评分卡原因码技术运行方法,其特征在于,所述方法包括:S101、初始数据源获取;S102、评分卡模型构建,计算每个变量得分的中间得分X1;S103、评分卡模型评分贡献度计算,每个变量得分减去中间得分X1得到变量初始贡献度X2,变量初始贡献度X2乘以变量权重得到变量最终贡献度X3;S104、评分卡模型评分贡献度编码;S105、评分卡模型评分贡献度排序。2.根据权利要求1所述的方法,其特征在于,评分卡原因码技术运行方法还包括评分卡原因码分析,评分卡原因码分析步骤包括:S201、判断变量最终贡献度X3正负值;S202、对每个客户的所有变量最终贡献度X3进行大小排序;S203、对某个客户群体的所有变量最终贡献度X3进行排序,筛选出大于0的排名前N位的变量,以及小于0的排名前N位的变量。3.根据权利要求1所述的方法,其特征在于,中间得分X1是所有变量得分的平均分或者中位分。4.根据权利要求2所述的方法,其特征在于,变量最终贡献度X3>0代表该客户在此变量得分在平均水平以上,即该客户在此变量得分较高;变量最终贡献度X3<0代表该客户在此变量得分在平均水平以下,即该客户在此变量得分较低。5.根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:徐建华
申请(专利权)人:中信银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1