一种基于支持向量机的P2P网络贷款风险评估模型制造技术

技术编号:11207407 阅读:115 留言:0更新日期:2015-03-26 15:59
本发明专利技术公开了一种基于支持向量机的P2P网络贷款风险评估模型,包括:(1)数据预处理;(2)建立模型;(3)根据模型给出的结果做出风险评估。通过上述方式,本发明专利技术基于支持向量机的P2P网络贷款风险评估模型具有减少人为因素的影响、客观科学、预测效果更好、准确率更高、减少无关属性、大大减少数据处理量、使预测所需的学习时间更短、对样本数据量要求不高等优点,在基于支持向量机的P2P网络贷款风险评估模型的普及上有着广泛的市场前景。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于支持向量机的P2P网络贷款风险评估模型,包括:(1)数据预处理;(2)建立模型;(3)根据模型给出的结果做出风险评估。通过上述方式,本专利技术基于支持向量机的P2P网络贷款风险评估模型具有减少人为因素的影响、客观科学、预测效果更好、准确率更高、减少无关属性、大大减少数据处理量、使预测所需的学习时间更短、对样本数据量要求不高等优点,在基于支持向量机的P2P网络贷款风险评估模型的普及上有着广泛的市场前景。【专利说明】-种基于支持向量机的P2P网络贷款风险评估模型
本专利技术涉及网络贷款评估模型领域,特别是涉及一种基于支持向量机的P2P网络 贷款风险评估模型。
技术介绍
P2P (Peer-to-Peer)网络借贷是指个人与个人之间的小额无担保借贷,不以银行 等金融机构为中介,直接通过互联网络平台确立借贷关系并完成相关交易手续,实现了"金 融脱媒",具有贷款门槛低、覆盖面广、信息流通快、交易手续便捷、涉及金额小、借款期限较 短等特点,具有非常大的发展潜力。 而P2P网络贷款存在一定的风险,如何保证所贷出去的款都是能够收回的(贷款 人有能力偿还的),也就是"风险控制"显得十分重要。那么根据以上贷款人提供的基本信 息,由客观科学的模型方法评估这次贷款的风险等级,从而给出有价值的决策参考信息则 显得异常重要。 但因网络的虚拟性、信息的不对称、平台的风险控制措施不健全等问题,增加了借 款者违约的可能性,导致P2P网络借贷市场的借款违约率偏高,贷款风险难以控制。 目前国内对信用风险评估的研究大多采取定性的方式,很少能对其进行定量分析 与研究。本模型正是根据P2P网络贷款数据高纬度、非线性以及小样本等特点针对性的选 取支持向量机算法,定量评估其贷款风险。 假设一个网络申贷人提供的申贷基本信息如下表格所示: 表1申贷人基本信息表 【权利要求】1. 一种基于支持向量机的P2P网络贷款风险评估模型,其特征在于,包括以下步骤: (1) 数据预处理:从数据库中获取往年P2P贷款记录,进行数据预处理,主要采用主成 分分析技术,即给出每条属性对最终结果的影响程度,选取贡献程度之和大于一定比重的 前几列属性作为主属性; (2) 建立模型:在往年P2P贷款记录的主属性的基础上建立模型, (a) 特征空间映射:为了加强线性可分性,将原来的输入空间映射到一个高维点积空 间,即特征空间, 如果非线性矢量函数g(x) = 将m维输入矢量X映射到1维特征空 间,则特征空间的线性决策函数为: D(x) =Wrg(x)+h (1) 根据Hilaert-Schmiat定理,如果一个对称函数H(x,X,)满足 H(x,X') = >O (2) ?.j-iJ 式⑵中,M为自然数,hphj为实数, 则存在一个映射函数g(x),能够将X映射到点积特征空间,该映射函数满足H(k,r) =gr(x)g(x')(3) 如果式(2)成立,则式(2)或式(4)称作Mercer条件,满足上述两个式子中的任意一个的函数称为半正定 核函数或Mercer核函数; (b) 利用试探法得到最优参数: 设定C初始值、参考点、变化方向、步长,训练第一个和第二个SVM,i=2, 计算第i次的ASVR, 判断与上次相比变化值是否超出门限, (b. 1)如果结果为"是",则判断SVR与参考点相比是否下降, (b. 1. 1)如果结果为"否",则判断参考点的步长是否增加过, (b. 1. 1. 1)如果结果为"是",则判断参考点的步长是否减小过, (b. 1. 1. 1. 1)如果结果为"是",则根据步长的范围作出相应修改:如果当前步长大于 1,减小步长;如果小于1,增加步长,求出下一个C的值, (b.I. 1. 1.2)如果结果为"否",则减小步长,记当前参考点步长减小过,求出下一个C的值, (b.I. 1. 2)如果结果为"否",则增加步长,记当前参考点步长增加过,并更新参考点为 当前值,求出下一个C的值, (b. 1. 2)如果结果为"是",则步长不变,变化方向不变,并更新参考点为当前值,求出 下一个C的值, (b. 2)如果结果为"否",则C、步长、变化方向不变,并更新参考点为当前值, 令i+Ι赋值给i,并返回计算第i次的ASVR,最终获得最优参数; (C)基于核函数的支持向量机分类:利用核函数的优点在于不再需要直接处理高维特 征空间, 采用核函数H(X,X')代替g(x),则原来的优化问题转化为: M约束条件为:23?成=0 , 、η. 1μ, 〇>£%>0, 1=1,…M 由于Η(χ,χ')是一个半正定核函数,因此,式(5)中优化问题是一个二次凸规划问题, 具有全局最优解, 根据KKT互补条件,可以求得此时分类决策函数为= + 5(6) SS S 其中偏置项a由下式决定(取非边界支持向量平均值)未知数据X分类结果为: 类IgA(X)M) 类 2 若A(X)〈0 若A(x)=0,则X不可分, 将步骤(b)中获得的最优参数带入上述模型获得结果; (3)根据模型给出的结果做出风险评估。2.根据权利要求1所述的基于支持向量机的P2P网络贷款风险评估模型,其特征在于, 步骤(1)中的所述一定比重的数值为90%。【文档编号】G06Q40/02GK104463673SQ201410801984【公开日】2015年3月25日 申请日期:2014年12月22日 优先权日:2014年12月22日 【专利技术者】黄刘生, 戚名钰, 陆潇榕, 杨威, 刘相言, 孙嘉堃, 汪琦 申请人:中国科学技术大学苏州研究院本文档来自技高网...

【技术保护点】
一种基于支持向量机的P2P网络贷款风险评估模型,其特征在于,包括以下步骤:(1)数据预处理:从数据库中获取往年P2P贷款记录,进行数据预处理,主要采用主成分分析技术,即给出每条属性对最终结果的影响程度,选取贡献程度之和大于一定比重的前几列属性作为主属性;(2)建立模型:在往年P2P贷款记录的主属性的基础上建立模型,(a)特征空间映射:为了加强线性可分性,将原来的输入空间映射到一个高维点积空间,即特征空间,如果非线性矢量函数g(x)=[g1(x),…,gl(x)]将m维输入矢量x映射到l维特征空间,则特征空间的线性决策函数为:(1)根据Hilaert‑Schmiat定理,如果一个对称函数H(x,x,)满足(2)式(2)中,M为自然数,hi,hj为实数,则存在一个映射函数g(x),能够将x映射到点积特征空间,该映射函数满足(3)如果式(2)成立,则(4)式(2)或式(4)称作Mercer条件,满足上述两个式子中的任意一个的函数称为半正定核函数或Mercer核函数;(b)利用试探法得到最优参数:设定C初始值、参考点、变化方向、步长,训练第一个和第二个SVM,i=2,计算第i次的ASVR,判断与上次相比变化值是否超出门限,  (b.1)如果结果为“是”,则判断SVR与参考点相比是否下降,    (b.1.1)如果结果为“否”,则判断参考点的步长是否增加过,      (b.1.1.1)如果结果为“是”,则判断参考点的步长是否减小过,        (b.1.1.1.1)如果结果为“是”,则根据步长的范围作出相应修改:如果当前步长大于1,减小步长;如果小于1,增加步长,求出下一个C的值,        (b.1.1.1.2)如果结果为“否”,则减小步长,记当前参考点步长减小过,求出下一个C的值,      (b.1.1.2)如果结果为“否”,则增加步长,记当前参考点步长增加过,并更新参考点为当前值,求出下一个C的值,    (b.1.2)如果结果为“是”,则步长不变,变化方向不变,并更新参考点为当前值,求出下一个C的值,(b.2)如果结果为“否”,则C、步长、变化方向不变,并更新参考点为当前值,令i+1赋值给i,并返回计算第i次的ASVR,最终获得最优参数;(c)基于核函数的支持向量机分类:利用核函数的优点在于不再需要直接处理高维特征空间,采用核函数H(x,x’)代替g(x),则原来的优化问题转化为:(5)约束条件为:,,由于H(x,x’)是一个半正定核函数,因此,式(5)中优化问题是一个二次凸规划问题,具有全局最优解,根据KKT互补条件,可以求得此时分类决策函数为(6)其中偏置项a由下式决定(取非边界支持向量平均值)(7)未知数据x分类结果为:类1    若A(x)>0类2    若A(x)<0若A(x)=0,则x不可分,将步骤(b)中获得的最优参数带入上述模型获得结果;(3)根据模型给出的结果做出风险评估。...

【技术特征摘要】

【专利技术属性】
技术研发人员:黄刘生戚名钰陆潇榕杨威刘相言孙嘉堃汪琦
申请(专利权)人:中国科学技术大学苏州研究院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1