一种基于大数据的信用评分方法和系统技术方案

技术编号:24856814 阅读:36 留言:0更新日期:2020-07-10 19:09
本发明专利技术涉及一种基于大数据的信用评分方法和系统,包括:利用ETL工具按照给定的指标配置项从大数据平台采集指标明细数据;通过对指标明细数据进行预处理生成中间证据权重转换数据;利用逻辑回归模型根据中间证据权重转换数据获取指标系数;根据预先配置的信用参数和指标系数构建评分卡模型并利用评分卡模型输出信用评分。本发明专利技术能够实现对海量数据的自动处理并通过自动构建模型实现信用评分,避免了不同数据处理过程相互隔离、处理效率低以及模型缺乏监控预警的问题。

【技术实现步骤摘要】
一种基于大数据的信用评分方法和系统
本专利技术涉及信用评分
,尤其涉及一种基于大数据的信用评分方法和系统。
技术介绍
随着互联网技术的发展,数据的存储、计算和分析等方式在不断变革发展,大数据在更广泛的行业领域得到了深入应用,特别是在互联网金融领域的发展。对于金融行业而言,针对体量大、多样性、更新快的金融数据,如何高效解决信息不对称问题有效进行风险管理,成为当下互联网金融风控的核心问题。评分卡作为信用风险行为评分的经典模型,在反欺诈、贷后风险管理、逾期催收等方面发挥重要作用;在金融大数据环境下,如何实现自动化、集成监控的信用评分卡解决方案,是金融领域相关企业公司面临的一大难题。传统的信用评分卡模型,一般的做法是基于关系型数据库提取客户金融行为数据,经过数据清洗、特征分箱等预处理,并构建逻辑回归模型,然后结合金融业务参数配置生成评分卡,最后是对评分卡模型的校验和实施应用。这种方式主要应用在数据规模较小、客户量不多、自动化和时效性要求不高的金融应用场景,但在互联网大数据的背景下,迫切需要一种结合大数据处理、自动化和集成监控的信用评分卡整体解决方案。目前业界有不少分析挖掘的软件工具,比如商用软件SAS就有评分卡分析模块,另外R和Python也有第三方库支持评分卡模型的构建等等。然而,这些软件工具处理过程,基本也存在上述提到的诸多限制:(1)难以处理海量大规模的客户行为数据;(2)不同的数据处理过程相互隔离,自动化程度低,处理时效较低;(3)缺乏监控预警,难以分析模型稳定性和指标异常原因。
技术实现思路
为了解决上述技术问题,本专利技术的目的在于提供一种基于大数据的信用评分方法和系统。根据本专利技术的一个方面,提供了一种基于大数据的信用评分方法,包括:利用ETL工具按照给定的指标配置项从大数据平台采集指标明细数据;通过对指标明细数据进行预处理生成中间证据权重转换数据;利用逻辑回归模型根据中间证据权重转换数据获取指标系数;根据预先配置的信用参数和指标系数构建评分卡模型并利用评分卡模型输出信用评分;采用PSI监控指标对评分卡模型进行评估监控。通过对指标明细数据进行预处理生成中间证据权重转换数据包括:设置过滤条件并将指标明细数据中符合过滤条件的数据除去;对过滤后的数据进行信息量计算和证据权重计算。进一步的,利用逻辑回归模型根据中间证据权重转换数据获取指标系数包括:利用步进式变量选取方法从中间证据权重转换数据选取变量并根据选取的变量生成建模数据集;将建模数据集划分为训练数据集和测试数据集;利用训练数据集和测试数据集训练逻辑回归模型;利用逻辑回归模型输出中间证据权重转换数据对应的指标系数。进一步的,根据预先配置的信用参数和指标系数构建评分卡模型并利用评分卡模型输出信用评分包括:设置逾期/正常的比值比、逾期/正常的比值比对应的预期分值和比率翻番的分值作为信用参数;根据信用参数和指标系数计算基础分数和每个指标对应分配到的分数;根据基础分数和每个指标对应分配到的分数计算得到信用评分。根据本专利技术的另一个方面,提供了一种基于大数据的信用评分系统,包括:数据采集单元,配置用于利用ETL工具按照给定的指标配置项从大数据平台采集指标明细数据;数据处理单元,配置用于通过对指标明细数据进行预处理生成中间证据权重转换数据;系数获取单元,配置用于利用逻辑回归模型根据中间证据权重转换数据获取指标系数;评分输出单元,配置用于根据预先配置的信用参数和指标系数构建评分卡模型并利用评分卡模型输出信用评分;模型监控单元,配置用于采用PSI监控指标对评分卡模型进行评估监控。进一步的,数据处理单元包括:数据过滤模块,配置用于设置过滤条件并将指标明细数据中符合过滤条件的数据除去;数据计算模块,配置用于对过滤后的数据进行信息量计算和证据权重计算。进一步的,系数获取单元包括:变量选取模块,配置用于利用步进式变量选取方法从中间证据权重转换数据选取变量并根据选取的变量生成建模数据集;数据划分模块,配置用于将建模数据集划分为训练数据集和测试数据集;回归训练模块,配置用于利用训练数据集和测试数据集训练逻辑回归模型;系数输出模块,配置用于利用逻辑回归模型输出中间证据权重转换数据对应的指标系数。进一步的,评分输出单元包括:参数设置模块,配置用于设置逾期/正常的比值比、逾期/正常的比值比对应的预期分值和比率翻番的分值作为信用参数;分数计算模块,配置用于根据信用参数和指标系数计算基础分数和每个指标对应分配到的分数;评分输出模块,配置用于根据基础分数和每个指标对应分配到的分数计算得到信用评分。本专利技术还提供一种设备,包括一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上任一项所述的方法。根据本专利技术的另一个方面,提供了一种存储有计算机程序的计算机可读存储介质,该程序被处理器执行时实现如上任一项所述的方法。与现有技术相比,本专利技术具有以下有益效果:1、本专利技术示例的一种基于大数据的信用评分方法,通过利用ETL工具从大数据平台采集指标明细数据,通过将指标明细数据预处理自动创建逻辑回归模型并生成评分卡模型,利用评分卡模型即可获得。利用PSI监控指标对评分卡模型进行评估监控,保证评分卡模块的稳定性。本专利技术能够实现对海量数据的自动处理并通过自动构建模型实现信用评分,避免了不同数据处理过程相互隔离、处理效率低以及模型缺乏监控预警的问题。2、本专利技术示例的一种基于大数据的信用评分系统,通过数据采集单元从大数据平台采集指标明细数据,并通过数据处理单元对采集的指标明细数据进行预处理,系数获取单元通过逻辑回归模型获取指标系数,评分输出单元通过设置信用参数并结合指标系数生成评分卡模型,进而得到信用评分,模型监控单元采用PSI监控指标对评分卡模型进行评估监控,保证评分卡模型的稳定性。3、本专利技术中示例的设备,通过处理器执行中转车辆排序方法,能够更好地达成业务时效,提高服务质量。4、本专利技术中示例的可读存储介质,储存有被处理器执行时实现的所述中转车辆排序方法,便于中转车辆排序系统的使用及推广。附图说明图1为本专利技术流程图。图2是本专利技术的计算机系统的结构示意图。具体实施方式为了更好的了解本专利技术的技术方案,下面结合具体实施例、说明书附图对本专利技术作进一步说明。实施例1:本实施例的一种基于大数据的信用评分系统,包括:数据采集单元,配置用于利用ETL工具按照给定的指标配置项从大数据平台采集指标明细数据;数据处理单元,包括数据过滤模块,配置用于设置过滤条件并将指标明细数据中符合过滤条件的数据除去;数据计算模块,配置用于对过滤后本文档来自技高网
...

【技术保护点】
1.一种基于大数据的信用评分方法,其特征在于,包括:/n利用ETL工具按照给定的指标配置项从大数据平台采集指标明细数据;/n通过对所述指标明细数据进行预处理生成中间证据权重转换数据;/n利用逻辑回归模型根据所述中间证据权重转换数据获取指标系数;/n根据预先配置的信用参数和所述指标系数构建评分卡模型并利用所述评分卡模型输出信用评分。/n

【技术特征摘要】
1.一种基于大数据的信用评分方法,其特征在于,包括:
利用ETL工具按照给定的指标配置项从大数据平台采集指标明细数据;
通过对所述指标明细数据进行预处理生成中间证据权重转换数据;
利用逻辑回归模型根据所述中间证据权重转换数据获取指标系数;
根据预先配置的信用参数和所述指标系数构建评分卡模型并利用所述评分卡模型输出信用评分。


2.根据权利要求1所述的基于大数据的信用评分方法,其特征在于,所述通过对指标明细数据进行预处理生成中间证据权重转换数据包括:
设置过滤条件并将所述指标明细数据中符合所述过滤条件的数据除去;
对过滤后的数据进行信息量计算和证据权重计算。


3.根据权利要求1所述的基于大数据的信用评分方法,其特征在于,所述利用逻辑回归模型根据所述中间证据权重转换数据获取指标系数包括:
利用步进式变量选取方法从中间证据权重转换数据选取变量并根据选取的变量生成建模数据集;
将所述建模数据集划分为训练数据集和测试数据集;
利用所述训练数据集和所述测试数据集训练逻辑回归模型;
利用所述逻辑回归模型输出所述中间证据权重转换数据对应的指标系数。


4.根据权利要求1所述的基于大数据的信用评分方法,其特征在于,所述方法还包括:采用PSI监控指标对评分卡模型进行评估监控。


5.根据权利要求1-4任一项所述的基于大数据的信用评分方法,其特征在于,所述根据预先配置的信用参数和所述指标系数构建评分卡模型并利用所述评分卡模型输出信用评分包括:
设置逾期/正常的比值比、逾期/正常的比值比对应的预期分值和比率翻番的分值作为信用参数;
根据所述信用参数和指标系数计算基础分数和每个指标对应分配到的分数;
根据所述基础分数和每个指标对应分配到的分数计算得到信用评分。


6.一种基于大数据的信用评分系统,其特征在于,包括:
...

【专利技术属性】
技术研发人员:陈东沂姚小龙刘玉霞严敏郭林东
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1