实时信用风险管理系统技术方案

技术编号:18166507 阅读:193 留言:0更新日期:2018-06-09 12:04
本发明专利技术总体上涉及用于将计算基础设施并入统计学习框架以实时风险评估和制定决策的系统和方法。

【技术实现步骤摘要】
实时信用风险管理系统
本专利技术总体上涉及个人金融、信用风险和银行领域,更具体地涉及信用评分方法和系统领域。本专利技术的优选实施例提供一种用于将计算基础设施并入统计学习框架以实时评估风险和制定决策的系统和方法。更具体地说,本专利技术涉及用于对借款人信用进行评分的改进系统,该借款人包括个人以及其他类型的实体,这些实体包括但不限于法人、公司、小企业和信托以及任何其他公认的金融实体。
技术介绍
银行依赖于可靠的信用评分系统来评估个人或实体的贷款偿还能力。专利技术于二十世纪七十年代的传统信用评分系统至今仍在使用。传统信用评分系统只基于少量风险因素(也称为协变量)来预估申请人违约的可能性。这些协变量限于(1)具有连续值的数值协变量;(2)具有多个层面的非数值分类协变量,其可以被转换为多个虚拟协变量;和(3)其他非数值协变量。例如,传统信用评分系统包括人口统计协变量:申请人的年龄(连续)、年收入(连续)、性别(两层面分类:男性和女性),房屋所有权(四层面分类:租用,自有,抵押和其他)和申请人地址(非数值协变量)。通常情况下,字符串的完整信息不能直接用于传统信用评分系统;部分信息经常被提取作为决策的一个组成部分。例如,申请人地址是一个字符串,其由门牌号、街道名称、城市、州和邮政编码组成。通常只有邮政编码被信用评分系统用作收入的替代指标,作为决定个人还款能力的风险因素。传统信用评分基于固定公式从少量风险因素计算得出综合得分。在该公式中,与风险因素相关的系数或权重通常是根据以前的经验或公共数据预先确定的。通过假设申请人的还款能力与该综合得分值是高度相关的,系统通过得分的高低决定是否批复申请人的借贷要求。最常见的决策系统是将综合得分按照阈值二分为批准或拒绝申请的状态。阈值可以是任意的,也可以由受试者工作特征(ReceiverOperatingCharacteristic,ROC)曲线决定。传统信用评分系统使用少量协变量会带来系统偏差。例如,居住在较低收入社区的信贷申请人的获批率会总是低于拥有相似人口统计特征但居住在高收入社区的申请人。此外,传统信用评分系统根据风险因素计算出的概率通常只给予批准或拒绝两个状态。并且,在此决策过程中不考虑发放借贷或信贷的金额和期限。换句话说,无论申请人请求借款一百美元还是十万美元,决策遵循的程序完全一样。此外,传统信用评分系统不受宏观经济因素变化而变化。例如,在经济衰退期间,消费者在面临收入下降时可能会增加信用卡借款。因此传统信用评分系统常常无法捕捉到时间依赖性的变化,这可能会放大系统风险。传统信用评分系统也受到其能处理的数据量的限制,这些数据包括申请人数量和协变量数量。例如,FairIsaac公司的经典风险模型FICO评分只包含五个协变量:(1)偿付记录情况,(2)信用使用情况,(3)信用记录时长,(4)所使用的信贷类型,以及(5)最近的信用调查情况。它也缺乏机制来插补缺失的数据。大量地去除缺失的样本可能会导致决策结果的偏差。目前为止,没有一种信用评分系统可以有效地结合客户购买记录、社交媒体数据等非传统的消费数据来适应大数据时代。这些数据有别于传统的征信数据,它往往由成千上万、数以百万计的具有微弱信号的协变量构成。所有上述问题在很大程度上阻碍了高级分析模型的建立。运用这些技术复杂程度更高的模型可以产生更准确的结果。因此,我们提出一种改进的用于对借贷者征信进行评级和风险管理的系统。本申请要求于2017年3月2日提交的标题为“REAL-TIMECREDITRISKMANAGEMENTSYSTEM(实时信用风险管理系统)”的美国临时专利申请号62/466,135的权益,其全部公开内容通过引用并入本文。
技术实现思路
为了在现有征信系统的基础上进行改进,本专利技术的优选实施例提供一种将计算基础设施并入统计学习框架以进行实时评估风险和制定决策的数据处理系统。该数据处理系统可以接收内容请求,以显示批准或者拒绝贷款的申请的决策,以及批准的贷款金额。本专利技术的优选实施例提供了一种方法,该方法针对信息资源评估申请人在给定时间点偿还贷款的可能性。将计算基础设施并入统计学习框架进行实时评估风险和制定决策的一种优选方法可以包括获取借款人信息和宏观经济因素以生成原始数据(RAWDATA);清理原始数据以生成用于下游分析的干净数据(CLEANDATA);对协变量进行预筛选以去除过多的噪音;执行机器学习算法来进一步降低协变量的维度;使用在前一步骤中选择的协变量集合对每种类型的事件(比如,违约和提前偿付)构建个体化风险得分;对每种类型的事件对应的风险分组进行评估和比较,以计算整体风险。清理原始数据以生成干净数据是非常必要的。在一些实施例中,这个步骤包括移除异常值,插补具有偏态分布的缺失变换协变量以满足正态性假设,将字符串或字符转换为数值等。本专利技术的优选实施例还可以用于在竞争风险模型(CompetingRiskModel)下,预测和借贷相关的不同类型的风险(例如,违约的风险和提前偿付的风险)。与传统信用评分体系只考虑单一事件,即违约的风险形成鲜明对比的是,新的征信系统可同时考虑多种类型的风险,例如前面提到的违约的风险和提前偿付的风险。这些风险的概率,通常在数学上是非独立且相互关联的,例如一笔债务如果提前偿付了,是不可能构成违约风险;而已经违约的债务,是不存在提前偿付的风险。因此,新的征信系统里构建的竞争风险模型是基于多种类型风险的联合分布上。这些风险(以违约的风险和提前偿付的风险为例)的概率受到个人层面的协变量的影响,如申请时借款人的人口统计学特征和信用记录;同时,它们也会受到宏观经济风险因素、如当前基准利率。例如,当利率下降时,提前偿付比率上升,使更少债务违约。该框架还能够将类型更复杂的竞争风险与多态模型相结合。例如,风险事件类型可以更细分为:提前偿付、宽限期内偿付、晚15-30天偿付、晚30-60天偿付、违约。以下参照附图详细描述优选实施例的系统和方法的其他变型、特征和方面。根据本专利技术的优选实施例,一种用于将计算基础设施并入统计学习框架以同时评估多种类型风险和制定决策的系统包括:至少一个用户设备;至少一个中央计算机;数据处理系统;选择以下至少一个数据源:征信机构数据源,历史记录数据源,交易数据源,经济数据源和社交媒体数据源;以及通信连接用户设备、所述至少一个计算机和数据源的网络。该中央计算机是服务器,该数据处理系统还包括本专利技术优选实施例中的采集单元、处理单元和分析单元。根据本专利技术的优选实施例,该采集单元包括至少一个可扩展的存储基础设施,该处理单元包括用于数据并行和容错的接口,并且用该户设备可操作以通过在网络上经由HTTP、REST架构模式和SOAP协议中的至少一个访问信息资源。根据本专利技术的优选实施例,一种用于将计算基础设施并入统计学习框架以同时评估多种类型风险和制定决策的方法包括:获取借款人信息的步骤;生成原始数据的步骤;对原始数据进行清理和转换以从中产生干净数据的步骤;对干净数据进行预筛选以去除过多的噪音并稳定协变量选择的步骤;使用至少一种统计机器学习算法进一步降低干净数据维度的步骤;评估和比较风险细分选项的步骤;以及选择最佳模型和最佳细分的步骤。另外,根据本专利技术的优选实施例,该方法还包括将该原始数据存储在可扩展存储基础设施内的本文档来自技高网
...
实时信用风险管理系统

【技术保护点】
一种用于将计算基础设施并入统计学习框架以实时风险评估和制定决策的系统,所述系统包括:至少一个用户设备;至少一个中央计算机;数据处理系统;选择以下至少一个数据源:借款人数据源、征信机构数据源、历史记录数据源、交易数据源、经济数据源和社交媒体数据源;以及通信连接所述至少一个用户设备、所述至少一个计算机和所述至少一个数据源的网络。

【技术特征摘要】
2017.03.02 US 62/466,1351.一种用于将计算基础设施并入统计学习框架以实时风险评估和制定决策的系统,所述系统包括:至少一个用户设备;至少一个中央计算机;数据处理系统;选择以下至少一个数据源:借款人数据源、征信机构数据源、历史记录数据源、交易数据源、经济数据源和社交媒体数据源;以及通信连接所述至少一个用户设备、所述至少一个计算机和所述至少一个数据源的网络。2.如权利要求1所述的系统,其中所述至少一个中央计算机是服务器。3.如权利要求1所述的系统,其中所述数据处理系统还包括:采集单元,处理单元,以及分析单元。4.如权利要求2所述的系统,其中所述采集单元包括至少一个可扩展存储基础设施。5.如权利要求2所述的系统,其中所述处理单元包括用于数据并行和容错的接口。6.如权利要求1所述的系统,其中所述用户设备是可操作的以经由HTTP、REST架构模式和SOAP协议中的至少一个访问所述网络上的信息资源。7.一种用于将计算基础设施并入统计学习框架以同时评估多种风险和制定决策的方法,所述方法包括:获取借款人信息的步骤;生成原始数据的步骤;对所述原始数据进行清理和转换以从中产生干净数据的步骤;对所述干净数据进行预筛选以去除过多的噪音并稳定协变量选择的步骤;使用至少一种统计机器学习算法来处理所述干净数据以降低所述干净数据维度的步骤;评估和比较风险细分选项的步骤;以及选择最佳模型和最佳细分的步骤。8.如权利要求7所述的方法,所述方法还包括将所述原始数据存储在可扩展存储基础设施内的步骤。9.如权利要求7所述的方法,其中所述生成原始数据的步骤包括以下步骤:采集借款人基本信息数据;采集征信机构数据;采集历史记录数据;采集交易数据;采集经济数据,以及采集社交媒体数据。10.如权利要求9所述的方法,其中所述借款人基本信息数据包括:借款人的人口统计特征概况;居住州;年收入;婚姻状况;和房屋所有权状况。11.如权利要求9所述的方法,其中所述征信机构数据包括:...

【专利技术属性】
技术研发人员:赵亮侯佳忆
申请(专利权)人:明特奇点医疗科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1