一种专家模型与机器学习模型融合的小商户信用评估方法技术

技术编号:17162842 阅读:44 留言:0更新日期:2018-02-01 20:55
本发明专利技术提供一种专家模型与机器学习模型融合的小商户信用评估方法,包括数据采集、数据的清洗,整理,结构化,入数据库、中层特征提取和量化、专家模型评分、机器学习模型预测、两种模型融合输出用户的最终信用分值和输出用户评级结果六个步骤,本发明专利技术由于加入了机器学习模型可以将看似不重要的变量也利用起来,因为多个弱变量经过学习之后可以得到一个强变量,让一切数据皆信用成为可能,两种模型不断融合,真正做到精准、动态信用评估,评分结果即可以解释,又可以规避人为操作风险。

A method of credit evaluation for small merchants with a combination of expert model and machine learning model

The invention provides a kind of expert model and machine learning model integration of small business credit evaluation method, including data acquisition, data cleaning, sorting, structured, into the database, mid-level feature extraction and quantification, expert scoring model, machine learning model prediction, two kinds of model integration output the user's final credit score and user rating output the six steps of the invention, due to the addition of machine learning models can be seemingly unimportant variables are also used, because many weak variables after training can get a strong variable, let all the credit data are possible, two kinds of model integration, truly accurate, dynamic credit evaluation, the score can be explained, and can avoid the risk of a human operator.

【技术实现步骤摘要】
一种专家模型与机器学习模型融合的小商户信用评估方法
本专利技术具体涉及一种专家模型与机器学习模型融合的小商户信用评估方法。
技术介绍
在大数据时代,互联网金融呈现出的多种形式把以大数据为代表的现代信息技术和应用结合起来,构建了新的商业模式,如果探究互联网金融与大数据流行之间的关联,背后有一个很关键的因素,就是互联网金融一直无法解答一个核心命题-风险控制。互联网金融的核心环节是风控,行业的健康成长也有赖于此。互联网金融不能简单的将传统金融服务模式搬上线,其核心竞争力不是营销获客能力而是大数据风控能力。传统信用评分模型(后面统称为专家模型),建立在业务员、风控经理和审批经理对信贷业务的理解、经验和知识积累上。基本形式是:针对每一个用户,在保证总分不变的情况下,对不同的数据项,按照重要程度给予不同分值,所有数据项加起来的总分做为该用户的信用总分(评分卡原理)。分值越高代表该人的信用状况越好(例如:芝麻信用得分)。国外比较流行的FICO(费埃哲)准则,是应用数学模型对个人信用报告包含的信息进行量化分析。该模型主要的评估内容是客户以往发生的信用行为,其对近期行为的衡量权重要高于远期行为,该模型本文档来自技高网...
一种专家模型与机器学习模型融合的小商户信用评估方法

【技术保护点】
一种专家模型与机器学习模型融合的小商户信用评估方法,其特征在于:步骤如下:第一步:用户通过app输入一些信息、我们在用户授权后根据用户提交的关键信息(帐号,查询密码等)通过网络爬虫抓取原始数据和通过第三方数据提供商获得用户数据三种方式来获取与用户相关的任何信息;第二步:对用户数据进行交叉验证(通过关联关系去掉不真实的信息)、清洗(去掉冗余和无用信息),整理后保存到数据库中,建立关系型数据库,做到通过用户关键信息(一般是注册时系统给用户分配的用户ID号,该ID号可以映射到用户姓名和身份证号码)即可获得用户的所有信息;第三步:中层特征提取和量化:从数据库中获取对应用户的结构化数据,提取或者量化专家...

【技术特征摘要】
1.一种专家模型与机器学习模型融合的小商户信用评估方法,其特征在于:步骤如下:第一步:用户通过app输入一些信息、我们在用户授权后根据用户提交的关键信息(帐号,查询密码等)通过网络爬虫抓取原始数据和通过第三方数据提供商获得用户数据三种方式来获取与用户相关的任何信息;第二步:对用户数据进行交叉验证(通过关联关系去掉不真实的信息)、清洗(去掉冗余和无用信息),整理后保存到数据库中,建立关系型数据库,做到通过用户关键信息(一般是注册时系统给用户分配的用户ID号,该ID号可以映射到用户姓名和身份证号码)即可获得用户的所有信息;第三步:中层特征提取和量化:从数据库中获取对应用户的结构化数据,提取或者量化专家模型中评分项的数值;第四步:将步骤三中量化后的中层特征值输入到专家模型评分模块,输出用户的信用得分;同时也将这些特征值输入到机器学习预测模型输出用户的违约概率。第五步:融合专家模型评分模块和机器学习预测模型得出信用分值,从逻辑上讲,对于专家模型输出的得分越高的用户,其机器学习模型输出的违约概率值越小,由于初期专家模型相对于机器学习模型来说更加准确,因此在最终输出分值中专家模型占的权重要大于机器学习模型:设两者权重分别为0.8,0.2;专家模型输出分值为Xk,机器学习模型输出的违约概率为Pk,则k用户最终得分S应该为:0.8Xk+0.2(1-Pk)x850;第六步:根据用户得分进行风险评级,例如分为以下五个级别:黑名单用户,不给予贷款(100分及以下);劣质用户,不给予贷款(350分以下);可贷款用户,存在一定风险(350~500分);可贷款用户,风险一般(500~650分);优质用户,风险很小(650~850分)。2.根据权利要求1所述的一种专家模型与机器学习模型融合的小商户信用评估方法,其特征在于:所述的专家模型评分模块包括还款能力:考察的是用户偿还信用贷款的能力范围,与用户的可贷款额度最相关;还款意愿:考察的是用户是否愿意偿还贷款,与用户过往的还款习惯相关性最大;违约风险:考察的是用户的还款能力和还款意愿是否稳定,用户的违约成本是否很大,足以约束用户不去违约,考察的是小商户户的收入波动情况,行业或者社会地位,婚姻状况等等;另外还需要考察申贷小商户在行业中所处地位,法人的社会关系、社会地位,家庭关系是否牢固,子女情况;信用积分:主要考察目前收集到的用户信息是否完整,用户在贷款平台上注册的时间是否较长,用户提交信息的可信度。3.根据权利要求1所述的一种专家模型与机器学习模型融合的小商户信用评估方法,其特征在于:所述的专家模型评分模块具体步骤如下:第一步,特征工程:借鉴FICO准则,其他借贷平台评分卡评分项经验...

【专利技术属性】
技术研发人员:周玉刘龙张晖
申请(专利权)人:花生米浙江数据信息服务股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1