一种构建及验证信用评分方程的方法和系统设计技术方案

技术编号:15691863 阅读:95 留言:0更新日期:2017-06-24 05:25
本发明专利技术公开了一种构建及验证信用评分方程的方法和系统设计,中央计算机服务器与公共网络连接,中央计算机服务器有个基于一系列指令的计算机可用媒介,该指令由处理器执行,使处理器执行评估借款人信用风险的电子过程,包括如下流程:1)通过公共网络从以下至少一个数据源搜索和收集借款人的数据集;2)将数据集转换成一些与借款人信用风险相关的变量;3)用统计或机器学习的方法独立处理每一个变量来产生描述借款人特定方面的元变量;4)基于借款人多个变量和元变量计算目标信用风险得分。本发明专利技术独立处理众多变量中的每个变量从而产生描述借款人一些特定方面(元变量)的一系列独立决策集。

Method and system design for constructing and Validating Credit Scoring equation

The invention discloses a design method and system construction and validation of credit scoring equation, the central computer server connected to the public network, the central computer server has a computer usable medium of a series of instructions based on the instructions executed by the processor, the processor performs electronic process assessment of the borrower's credit risk, including the following steps: 1) set from at least one of the following data source search and collect the borrower data through the public network; 2) data sets will be converted into some related to the borrower's credit risk variables; 3) independent methods of statistical or machine learning to deal with each variable to describe variable specific aspects of the borrower; 4) borrowers more variables and variables to calculate the target score based on credit risk. The invention independently processes each variable in the plurality of variables, thereby generating a series of independent decision sets that describe certain aspects of the borrower (meta variables).

【技术实现步骤摘要】
一种构建及验证信用评分方程的方法和系统设计
本专利技术涉及信用评分
,尤其涉及一种构建及验证信用评分方程的方法和系统设计。
技术介绍
日常购买行为中被人们广泛使用。在50年代的美国,信用决策由银行信审员制定,通常由于信审员和申请人在一个地区居住并熟悉申请人,那么信审员基于对申请人的了解决定是否发放贷款。此法虽然有效却也非常有限,因为信审员的数目总是要比申请人的数目少很多。到了70年代,FICO分的出现极大助力了信贷的审批,有效地降低了信贷审批过程对信审员的依赖。但是,风控的功能仍然不完整。诸如银行和信用卡公司之类的贷款方使用信用分数来评估借钱给消费者后的潜在风险。为了决定谁将获得贷款,银行使用信用评分方程来衡量个人或实体的信用价值。传统的信用评分方程通常使用的变量数目较少,而且变量的转换也是人工完成。传统信用分的方法包括三个步骤。首先,观察样本的每个变量(比如薪水,已贷的使用情况,还款历史等)。其次,系统通过离散化给每个变量赋值(比如用数字0到10来描述还款频率,0代表没有还款历史,1代表基本不经常还,10代表每次都按时还款)。最后,在所有变量都经过数值转化后,系统将使用一个既有的固定的公式,或者编写公式,或者一个机器学习算法来构建一个公式从而产生一组信用分数。传统的变量转换方法在上世纪50和60年代得到了很大发展,当时计算能力和信息获取都是非常困难的。因此可想而知,传统的变量转换通常是非常简单,且仅局限于:1)易于填充数值的单个数值型变量;2)存在明显量化解释的非数值变量;3)取值种类非常少的字符型变量。然而,传统的变量转换方法对于多组变量并不完全适用,特别是当数据存在部分或全部缺失的情况。对于无法被转换的变量更是完全不适用。由于质量控制需要的原因,传统变量转换方法也受到能处理的数据量的限制。每一次的转换和填充都需要人工花相当多的时间来分析一个或多个字段以及谨慎决定如何填充数值。因此,能有效分析的字段的数量限制在了,在一定的时间段内单人能够理解的范围内。也正是因为这个原因,很少风险模型能使用超过数十个字段(例如,FICO分是基于5个基本的维度,包括还款历史,信用卡使用,信用历史,所用信用类别,近期信用搜索记录)。没有一个传统的变量转换方法能同时考虑数以百计(千记,万记,甚至百万级别的更少)的字段。而自动化的模型中增加这些变量,将使得评分结果能够模拟过去信审人员的准确率同时还能保持甚至增加信用审批量。因此,提升和改进用来建立和验证信用评分模型的系统和方法也就变得日趋重要。
技术实现思路
本专利技术的目的是为了解决现有技术中存在的缺点,而提出的一种构建及验证信用评分方程的方法和系统设计。为了实现上述目的,本专利技术采用了如下技术方案:一种构建及验证信用评分方程的方法和系统设计,中央计算机服务器与公共网络连接,中央计算机服务器有个基于一系列指令的计算机可用媒介,该指令由处理器执行,使处理器执行评估借款人信用风险的电子过程,包括如下流程:1)通过公共网络从以下至少一个数据源搜索和收集借款人的数据集:借款人、私有数据、公共数据或社交网络数据源;2)将数据集转换成一些与借款人信用风险相关的变量;3)用统计或机器学习的方法独立处理每一个变量来产生描述借款人特定方面的元变量;4)基于借款人多个变量和元变量计算目标信用风险得分。优选的,从借款人处收集借款人数据可以通过公共网络进行现场采访或通过用户填写在线调查问卷完成。优选的,从私有数据处收集借款人数据包括如下:1)为私人提供借款人特定数据的子集的数据供应商;2)从数据供应商处收集全部或部分借款人的相关数据存储到变量数据库中。优选的,从公共数据处收集借款人数据包括如下:1)进行字符串搜索、自动爬取或用项目或协议获取;2)收集所有返回的结果并存储到变量数据库中。优选的,社交网络数据中收集借款人数据包括如下:1)在社交网络上搜索借款人发布的数据;2)在社交网络上搜索借款人相关的数据,由社交媒介服务器编译;3)在社交网络上搜索借款人社交网络上部分或全部成员的社交图谱信息,从而借款人档案和社交网络数据之间有一度或多度的分离;4)收集所有返回的结果存储到变量数据库中。优选的,数据集转换成多个变量可以通过将收集到的数据转换成标准日期格式、标准时间格式、范围、百分等级、经纬度等来完成。优选的,统计或机器学习的方法独立处理每一个变量来产生描述借款人特定方面的元变量,过程包括如下:1)把借款人每一个变量的数据与借款人档案中其它变量的数据比较;2)把借款人每一个变量的数据与其他和借款人有相似特征、相似处境的人群的平均期望比较;3)比较借款人在准备申请贷款期间的行为。优选的,提到的计算机系统,其中产生一些变量,包括如下:1)通过使用风险分离技术或复杂统计技术找出预测子集,从而分析数据,找出至少有一个共同特征的申请人类别;2)使用线性回归或回归树将类别成员从不能可靠产生相关信号的非类别成员中区分出来;3)选择出衡量某特定类别不同方面的元变量。优选的,基于借款人多个变量和元变量计算目标信用风险得分,过程包括如下:1)将元变量引入到统计或金融模型中,每个模型得出不同的预测结果;2)使用简单的算术、机器学习或统计算法来集成每个模型归一化后的分数,得到一个综合分数。与现有技术相比,本专利技术的有益效果是:本专利技术主要提供了用于建立和验证基于信贷目标的信审系统与方法。一种有效地建立和验证信审功能的方法是在第一台电脑上对每个新借款人的基础数据都产生一个数据集(原始数据);把这些数据集都标准化为一系列变量(转化数据);使用各种算法(统计、量化金融、机器学习等算法)独立处理众多变量中的每个变量从而产生描述借款人一些特定方面(元变量)的一系列独立决策集。如下所述,比较推荐的做法是进一步在各类预测算法中加入相应的元变量,不同算法代表不同角度的预测能力。然后,每一个模型以各自的信心(confidence)来“投票”,并被融合到最终分数里。附图说明图1是“信息缺失型”借款人提供信用的系统方框图;图2是本专利技术所推荐的建立和验证信用评估方程的系统框图;图3是是用来描述在建立和验证信用评估方程过程中模型集成评分的流程图;图4是用来描述基于选定目标建立和验证评分方程的方法的流程图;图5是用来描述建立和验证信用评估方程的流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合具体实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。实施例1一种构建及验证信用评分方程的方法和系统设计,中央计算机服务器与公共网络连接,中央计算机服务器有个基于一系列指令的计算机可用媒介,该指令由处理器执行,使处理器执行评估借款人信用风险的电子过程,包括如下流程:1)通过公共网络从以下至少一个数据源搜索和收集借款人的数据集:借款人、私有数据、公共数据或社交网络数据源;2)将数据集转换成一些与借款人信用风险相关的变量;3)用统计或机器学习的方法独立处理每一个变量来产生描述借款人特定方面的元变量;4)基于借款人多个变量和元变量计算目标信用风险得分。从借款人处收集借款人数据可以通过公共网络进行现场采访或通过用户填写在线调查问卷完成。从私有数据处收集借款人数据包括如下:1)为私人提供借本文档来自技高网
...
一种构建及验证信用评分方程的方法和系统设计

【技术保护点】
一种构建及验证信用评分方程的方法和系统设计,其特征在于:中央计算机服务器与公共网络连接,中央计算机服务器有个基于一系列指令的计算机可用媒介,该指令由处理器执行,使处理器执行评估借款人信用风险的电子过程,包括如下流程:1)通过公共网络从以下至少一个数据源搜索和收集借款人的数据集:借款人、私有数据、公共数据或社交网络数据源;2)将数据集转换成一些与借款人信用风险相关的变量;3)用统计或机器学习的方法独立处理每一个变量来产生描述借款人特定方面的元变量;4)基于借款人多个变量和元变量计算目标信用风险得分。

【技术特征摘要】
1.一种构建及验证信用评分方程的方法和系统设计,其特征在于:中央计算机服务器与公共网络连接,中央计算机服务器有个基于一系列指令的计算机可用媒介,该指令由处理器执行,使处理器执行评估借款人信用风险的电子过程,包括如下流程:1)通过公共网络从以下至少一个数据源搜索和收集借款人的数据集:借款人、私有数据、公共数据或社交网络数据源;2)将数据集转换成一些与借款人信用风险相关的变量;3)用统计或机器学习的方法独立处理每一个变量来产生描述借款人特定方面的元变量;4)基于借款人多个变量和元变量计算目标信用风险得分。2.根据权利要求1所述的一种构建及验证信用评分方程的方法和系统设计,其特征在于:从借款人处收集借款人数据可以通过公共网络进行现场采访或通过用户填写在线调查问卷完成。3.根据权利要求1所述的一种构建及验证信用评分方程的方法和系统设计,其特征在于:从私有数据处收集借款人数据包括如下:1)为私人提供借款人特定数据的子集的数据供应商;2)从数据供应商处收集全部或部分借款人的相关数据存储到变量数据库中。4.根据权利要求1所述的一种构建及验证信用评分方程的方法和系统设计,其特征在于:从公共数据处收集借款人数据包括如下:1)进行字符串搜索、自动爬取或用项目或协议获取;2)收集所有返回的结果并存储到变量数据库中。5.根据权利要求1所述的一种构建及验证信用评分方程的方法和系统设计,其特征在于:社交网络数据中收集借款人数据包括如下:1)在社交网络上搜索借款人发布的数据;2)在社交网络上搜索借款人相关的数据,由社交媒介服务器编译;3)在社...

【专利技术属性】
技术研发人员:顾凌云
申请(专利权)人:上海冰鉴信息科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1