The invention provides a method for establishing an internet financial wind control model. By improving the C4.5 decision tree and utilizing the Fayyad boundary point determination theorem, the invention reduces the calculation time for selecting the optimal threshold of attributes and the overall running time. The correlation coefficient in statistics is used to overcome the bias of multi-valued attributes, improve the accuracy of decision tree prediction, and take the correlation degree between each attribute and blacklist discrimination as the selection measure of attributes. This improved C4.5 algorithm is used to generate an early warning model of Internet financial wind control. It mainly solves the problems of long running time and inadequate prediction accuracy of traditional C4.5 decision tree model.
【技术实现步骤摘要】
建立互联网金融风控模型的方法
本专利技术涉及一种建立互联网金融风控模型的方法。
技术介绍
C4.5算法是由RossQuinlan开发的用于产生决策树的算法。该算法是对RossQuinlan之前开发的ID3算法的一个扩展。C4.5算法产生的决策树可以被用作分类目的,因此该算法也可以用于统计分类。C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到类别的映射关系,并且这个映射能用于对新的类别未知的实体进行分类。但是,传统的C4.5决策树模型存在运行时间较长和预测精度不够等问题。
技术实现思路
本专利技术的目的在于提供一种建立互联网金融风控模型的方法,能够解决传统的C4.5决策树模型存在运行时间较长和预测精度不够等问题。为解决上述问题,本专利技术提供一种建立互联网金融风控模型的方法,包括:结合统计学中相关系数理论,得出条件属性与决策属性之间的相关系数,根据相关系数的大小得出所述条件属性与决策属性之间的相关性大小 ...
【技术保护点】
1.一种建立互联网金融风控模型的方法,其特征在于,包括:结合统计学中相关系数理论,得出条件属性与决策属性之间的相关系数,根据相关系数的大小得出所述条件属性与决策属性之间的相关性大小;分析数据来源,利用所述条件属性与决策属性之间的相关性大小,确定影响黑名单判别的重要影响因子,选出所述重要影响因子作为决策属性并放入数据集;根据所述得出的所述条件属性与决策属性之间的相关性大小,并利用最大相关系数值的属性作为根结点,采用预设方法递归建立决策树的子结点,以形成决策树;利用悲观剪枝算法对所述形成的决策树进行剪枝,形成简洁的决策树;基于所述简洁的决策树建立互联网金融风控模型。
【技术特征摘要】
1.一种建立互联网金融风控模型的方法,其特征在于,包括:结合统计学中相关系数理论,得出条件属性与决策属性之间的相关系数,根据相关系数的大小得出所述条件属性与决策属性之间的相关性大小;分析数据来源,利用所述条件属性与决策属性之间的相关性大小,确定影响黑名单判别的重要影响因子,选出所述重要影响因子作为决策属性并放入数据集;根据所述得出的所述条件属性与决策属性之间的相关性大小,并利用最大相关系数值的属性作为根结点,采用预设方法递归建立决策树的子结点,以形成决策树;利用悲观剪枝算法对所述形成的决策树进行剪枝,形成简洁的决策树;基于所述简洁的决策树建立互联网金融风控模型。2.如权利要求1所述的建立互联网金融风控模型的方法,其特征在于,根据如下公式,得出条件属性与决策属性之间的相关系数:令公式中,Ak表示为决策树中不同的条件属性,B为决策树中的决策属性。Cov(Ak,B)为Ak与B的协方差,D(Ak)为Ak的方差,D(B)为B...
【专利技术属性】
技术研发人员:刘云翔,韩贝,徐琛,李晓丹,
申请(专利权)人:上海应用技术大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。