当前位置: 首页 > 专利查询>冯世程专利>正文

一种P2P借贷平台运营风险评估系统技术方案

技术编号:18862841 阅读:20 留言:0更新日期:2018-09-05 15:11
本发明专利技术涉及一种P2P借贷平台运营风险评估系统,通过对大量P2P平台数据进行分析归纳出备选特征表,然后将备选特征表内的特征分为数据数值特性和数据存在特性,通过对这两个特性与平台的风险指数进行相关性分析,从而选取出主要特征对模型进行训练,确保模型的准确率和提高工作效率。

An operational risk assessment system for P2P lending platform

The present invention relates to a P2P lending platform operational risk assessment system. By analyzing a large number of P2P platform data, the alternative feature table is concluded, and then the features in the alternative feature table are divided into data numerical characteristics and data existence characteristics. By analyzing the correlation between the two characteristics and the platform risk index, the alternative feature table is selected. The main features are extracted to train the model to ensure the accuracy and efficiency of the model.

【技术实现步骤摘要】
一种P2P借贷平台运营风险评估系统
本专利技术涉及一种风险评估系统,具体涉及一种P2P借贷平台运营风险评估系统。
技术介绍
P2P是英文person-to-person的缩写,意即个人对个人,又称点对点网络借款,是一种将小额资金聚集起来借贷给有资金需求人群的一种民间小额借贷模式,属于互联网金融产品的一种,属于民间小额借贷,借助互联网、移动互联网技术的网络信贷平台及相关理财行为、金融服务。目前国内的P2P借贷平台多达几千家,对P2P平台的分析不仅仅要针对借款人的信用风险的分析,而且要对平台本身的运营风险进行分析,需要通过一些数据判断某一个平台是好是坏,即是否存在跑路风险,然而不同的平台数据类型不同,并且存在较多的相关性不强的数据,如果选用全部的数据对模型进行训练,工作效率不高,并且准确性不足,如何选用合适的数据进行模型训练,对模型的评估准确率存在较大影响。
技术实现思路
本专利技术其目的在于公开一种P2P借贷平台运营风险评估系统,该方法通过收集大量的平台数据,从而总结备选特征表,然后对备选特征表内的特征进行相关性分析,提取出主要特征,采用主要特征及其特征数据对模型进行训练,从而提高工作效率和提高模型的评估准确率。实现本专利技术所述P2P借贷平台运营风险评估系统的技术方案是:一种P2P借贷平台运营风险评估系统,包括以下步骤:1)第一次数据采集:获取多个P2P借贷平台的运营数据;2)备选特征表建立:对第一次数据采集获得的运营数据进行筛选和提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据,依据特征数据的模式特征将特征分类建立备选特征表;3)将备选特征表内的特征分为两个特性:数据数值特性和数据存在特性,数据数值特性为特征存在特征数据这一特性,数据存在特性为特征是否存在这一特性;4)相关程度分析和特征选取:对特征的数据数值特性采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析,通过上述四种分析方法,每个特征均获得4个分析值,选取相关性分析绝对值0.4以上,同时P值0.005以下的特征;对特征的数据存在特性采用强关系指标进行相关性分析,特征A的强关系指标=所有正常平台的特征A存在数据的比例-所有逃跑平台的特征A存在数据的比例,选取强关系指标最大的几个特征;选取同时满足特征的数据数值特性相关性分析的选取条件和特征的数据存在特性相关性分析的选取条件的特征,将其定义为主要特征;5)风险评估模型构建:建立一个用于计算出平台的运营风险值的风险评估模型;6)模型训练:取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行训练;7)确定风险评估模型:通过模型训练后,取第一次数据采集中第二预设量的正常平台和第二预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行测试,测试用的平台数据与训练用的平台数据不能重叠,通过测试结果对风险评估模型进行调整,重复测试与调整,直到测试结果能够准确反应平台的运营风险值;8)二次数据采集:获取需要评估的P2P借贷平台的运营数据;9)数据预处理:在二次数据采集获取的运营数据中提取出主要特征与主要特征数据;10)风险输出:将数据预处理后的主要特征与主要特征数据放入到训练好后的风险评估模型中,获取风险值,将风险值输入到判断器中,从而输出风险程度。进一步地,在第一次数据采集与第二次数据采集过程中,通过网络爬取或者P2P借贷平台提供方式获取P2P借贷平台的运营数据。进一步地,在步骤4)中,数据存在特性的记录方式为一个平台如果存在特征A,则平台在特征A的元素值设为1,否则,平台在特征A的元素值设为0,这种记录方式能清楚明了的记录数据存在特性,并且也能简化后续的工作。进一步地,在步骤5)中可采用逻辑回归模型、神经网络模型、朴素贝叶斯模型、随机森林模型、梯度提升树模型中的一种模型建立风险评估模型。进一步地,所述模式特征包括数值型、文字型和判断型三种。进一步地,第一预设量为100~150家,第二预设量为75~100家,数据越多,模型的准确性越高,但是工作量也越大,选取合适的训练集能将工作产出效益最大化。进一步地,第二预设量至少为第一预设量的一半。本专利技术的有益效果为:本专利技术通过对大量P2P平台数据进行分析归纳出备选特征表,然后将备选特征表内的特征分为数据数值特性和数据存在特性,通过对这两个特性与平台的风险指数进行相关性分析,从而选取出主要特征对模型进行训练,确保模型的准确率和提高工作效率。具体实施方式下面将结合本专利技术实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例:一种P2P借贷平台运营风险评估系统,包括以下步骤:1)第一次数据采集:获取多个P2P借贷平台的运营数据;2)备选特征表建立:对第一次数据采集获得的运营数据进行筛选和提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据,依据特征数据的模式特征将特征分类建立备选特征表,备选特征表内特征有发标密度、逾期标数、单位时间逾期标数比、平均的标额度、完成标数比、平均的标借贷时间、平均的标回报率、平台的标质押比、先息后本的标比、一次性本息的标比、等额本息的标比、未婚的标比、已婚的标比、男性的标比、女性的标比、平台平均学历值、离异的标比、平台借款人有房比例、平台借款人有车比例等;3)将备选特征表内的特征分为两个特性:数据数值特性和数据存在特性,数据数值特性为特征存在特征数据这一特性,数据存在特性为特征是否存在这一特性;4)相关程度分析和特征选取:对特征的数据数值特性采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析,通过上述四种分析方法,每个特征均获得4个分析值,选取相关性分析绝对值0.4以上,同时P值0.005以下的特征,p值的定义决定了相关性的准确性,根据定义,p=0.05时候样本中变量关联有5%的可能是由于偶然性造成的,p=0.005时候样本中变量关联有0.5%的可能是由于偶然性造成的,P值的选用决定了主要特征的多少,经过多次模拟,我们认为采用P=0.005时候最合理;对特征的数据存在特性采用强关系指标进行相关性分析,特征A的强关系指标=所有正常平台的特征A存在数据的比例-所有逃跑平台的特征A存在数据的比例,选取强关系指标最大的几个特征;选取同时满足特征的数据数值特性相关性分析的选取条件和特征的数据存在特性相关性分析的选取条件的特征,将其定义为主要特征;5)风险评估模型构建:建立一个用于计算出平台的运营风险值的风险评估模型;6)模型训练:取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行训练;7)确定风险评估模型:通过模型训练后,取第一次数据采集中第二预设量的正常平台和第二预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行测试,测试用的平台数据与训练用的平台数据不能重叠,通过测试结果对风险评估模型进行本文档来自技高网...

【技术保护点】
1.一种P2P借贷平台运营风险评估系统,其特征在于,包括以下步骤:1)第一次数据采集:获取多个P2P借贷平台的运营数据;2)备选特征表建立:对第一次数据采集获得的运营数据进行筛选和提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据,依据特征数据的模式特征将特征分类建立备选特征表;3)将备选特征表内的特征分为两个特性:数据数值特性和数据存在特性,数据数值特性为特征存在特征数据这一特性,数据存在特性为特征是否存在这一特性;4)相关程度分析和特征选取:对特征的数据数值特性采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析,通过上述四种分析方法,每个特征均获得4个分析值,选取相关性分析绝对值0.4以上,同时P值0.005以下的特征;对特征的数据存在特性采用强关系指标进行相关性分析,特征A的强关系指标=所有正常平台的特征A存在数据的比例‑所有逃跑平台的特征A存在数据的比例,选取强关系指标最大的几个特征;选取同时满足特征的数据数值特性相关性分析的选取条件和特征的数据存在特性相关性分析的选取条件的特征,将其定义为主要特征;5)风险评估模型构建:建立一个用于计算出平台的运营风险值的风险评估模型;6)模型训练:取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行训练;7)确定风险评估模型:通过模型训练后,取第一次数据采集中第二预设量的正常平台和第二预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行测试,测试用的平台数据与训练用的平台数据不能重叠,通过测试结果对风险评估模型进行调整,重复测试与调整,直到测试结果能够准确反应平台的运营风险值;8)二次数据采集:获取需要评估的P2P借贷平台的运营数据;9)数据预处理:在二次数据采集获取的运营数据中提取出主要特征与主要特征数据;10)风险输出:将数据预处理后的主要特征与主要特征数据放入到训练好后的风险评估模型中,获取风险值,将风险值输入到判断器中,从而输出风险程度。...

【技术特征摘要】
1.一种P2P借贷平台运营风险评估系统,其特征在于,包括以下步骤:1)第一次数据采集:获取多个P2P借贷平台的运营数据;2)备选特征表建立:对第一次数据采集获得的运营数据进行筛选和提取,提取出特征和与特征相对应的数据,与特征相对应的数据定义为特征数据,依据特征数据的模式特征将特征分类建立备选特征表;3)将备选特征表内的特征分为两个特性:数据数值特性和数据存在特性,数据数值特性为特征存在特征数据这一特性,数据存在特性为特征是否存在这一特性;4)相关程度分析和特征选取:对特征的数据数值特性采用皮尔森相关系数、斯皮尔曼相关系数、肯德尔相关系数和p值进行相关性分析,通过上述四种分析方法,每个特征均获得4个分析值,选取相关性分析绝对值0.4以上,同时P值0.005以下的特征;对特征的数据存在特性采用强关系指标进行相关性分析,特征A的强关系指标=所有正常平台的特征A存在数据的比例-所有逃跑平台的特征A存在数据的比例,选取强关系指标最大的几个特征;选取同时满足特征的数据数值特性相关性分析的选取条件和特征的数据存在特性相关性分析的选取条件的特征,将其定义为主要特征;5)风险评估模型构建:建立一个用于计算出平台的运营风险值的风险评估模型;6)模型训练:取第一次数据采集中第一预设量的正常平台和第一预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数据对风险评估模型进行训练;7)确定风险评估模型:通过模型训练后,取第一次数据采集中第二预设量的正常平台和第二预设量的逃跑平台的数据,提取出这些平台的主要特征与主要特征数...

【专利技术属性】
技术研发人员:冯世程
申请(专利权)人:冯世程
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1