用户信用评估方法及装置、电子设备、存储介质制造方法及图纸

技术编号:20546976 阅读:17 留言:0更新日期:2019-03-09 19:49
本公开是关于一种用户信用评估方法及装置、电子设备、存储介质,涉及互联网技术领域,该方法包括:获取目标用户的多个特征信息,所述多个特征信息包括第一类参数和第二类参数;对所述第一类参数和所述第二类参数进行预处理;将预处理后的所述第一类参数进行转化,生成目标参数;将预处理后的所述第二类参数和所述目标参数输入机器学习模型,得到所述目标用户的信用评估结果;其中,IV值低于预设阈值的特征信息为所述第一类参数,IV值高于所述预设阈值的特征信息为所述第二类参数。本公开能够更准确的确定用户信用评估结果,准确识别信用风险。

【技术实现步骤摘要】
用户信用评估方法及装置、电子设备、存储介质
本公开涉及互联网
,具体而言,涉及一种用户信用评估方法、用户信用评估装置、电子设备以及计算机可读存储介质。
技术介绍
信用评估卡模型是金融领域最常见的一种风险评分模型,这种模型在可解释性和算法复杂度取得平衡。相关技术中,一般都是使用强金融属性的参数预测用户的违约概率。但是大多情况下获取的用户数据并不具备很强的金融属性。因此,能使用的强金融属性参数的数据量较少,可能导致预测的信用评估结果并不准确且应用范围受到限制,不能准确衡量用户风险。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种用户信用评估方法及装置、电子设备、存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的不能准确衡量用户风险的问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种用户信用评估方法,包括:获取目标用户的多个特征信息,所述多个特征信息包括第一类参数和第二类参数;对所述第一类参数和所述第二类参数进行预处理;将预处理后的所述第一类参数进行转化,生成目标参数;将预处理后的所述第二类参数和所述目标参数输入机器学习模型,得到所述目标用户的信用评估结果;其中,IV值低于预设阈值的特征信息为所述第一类参数,IV值高于所述预设阈值的特征信息为所述第二类参数。在本公开的一种示例性实施例中,对所述第一类参数和所述第二类参数进行预处理包括:通过证据权重值对所述第一类参数和第二类参数分别进行分箱处理,得到分箱后的第一类参数和分箱后的第二类参数。在本公开的一种示例性实施例中,将预处理后的所述第一类参数进行转化,生成目标参数包括:采用线性判别式算法对每个主题关联的分箱后的第一类参数进行特征组合,生成所述目标参数。在本公开的一种示例性实施例中,所述方法还包括:对所述目标参数进行再次分箱,并将再次分箱后的目标参数放入候选参数池;将分箱后的第二类参数放入所述候选变量池。在本公开的一种示例性实施例中,将预处理后的所述第二类参数和所述目标参数输入机器学习模型包括:剔除所述候选变量池中分箱后的第二类参数和再次分箱后的目标参数之间的多重共线性,得到剩余参数;将所述剩余参数输入所述机器学习模型。在本公开的一种示例性实施例中,剔除所述候选变量池中分箱后的第二类参数和再次分箱后的目标参数之间的多重共线性,得到剩余参数包括:从所述候选变量池中剔除证据权重值小于预设值的分箱后的第二类参数以及再次分箱后的目标参数,得到所述剩余参数。在本公开的一种示例性实施例中,从所述候选变量池中剔除证据权重值小于预设值的分箱后的第二类参数以及再次分箱后的目标参数包括:按照所述证据权重值从小到大的排列顺序,对所述证据权重值小于所述预设值的分箱后的第二类参数和再次分箱后的目标参数进行剔除;重新计算经过剔除的分箱后的第二类参数和再次分箱后的目标参数的证据权重值;按照所述证据权重值从小到大的排列顺序,对重新计算的证据权重值小于所述预设值的分箱后的第二类参数和再次分箱后的所述目标参数进行剔除,直至剔除完所述证据权重值小于所述预设值的第二类参数和目标参数为止。根据本公开的一个方面,提供一种用户信用评估装置,包括:特征获取模块,用于获取目标用户的多个特征信息,所述多个特征信息包括第一类参数和第二类参数;参数预处理模块,用于对所述第一类参数和所述第二类参数进行预处理;目标参数生成模块,用于将预处理后的所述第一类参数进行转化,生成目标参数;评估结果确定模块,用于将预处理后的所述第二类参数和所述目标参数输入机器学习模型,得到所述目标用户的信用评估结果;其中,IV值低于预设阈值的特征信息为所述第一类参数,IV值高于所述预设阈值的特征信息为所述第二类参数。根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的用户信用评估方法。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的用户信用评估方法。本公开示例性实施例中提供的一种用户信用评估方法、用户信用评估装置、电子设备以及计算机可读存储介质中,一方面,通过对预处理后的第一类参数进行转化生成目标参数,能够使第一类参数转化生成的目标参数用于信用评估,避免了相关技术中只将第二类参数用于信用评估而导致的数据量不足以及应用范围小的问题,增加了数据量和应用范围;另一方面,通过将预处理后的第二类参数以及转化后生成的目标参数输入机器学习模型,增加了数据量,从而能够基于预处理后的第二类参数以及转化后生成的目标参数得到准确的信用评估结果,准确衡量用户信用风险。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出本公开示例性实施例中一种用户信用评估方法示意图;图2示意性示出本公开示例性实施例中用户信用评估的具体流程图;图3示意性示出本公开示例性实施例中一种用户信用评估装置的框图;图4示意性示出本公开示例性实施例中一种电子设备的框图;图5示意性示出本公开示例性实施例中一种程序产品。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。本示例实施方式中首先提供了一种用户信用评估方法,参考图1所示,对用户信用评估方法进行详细描述。在步骤S110中,获取目标用户的多个特征信息,所述多个特征信息包括第一类参数和第二类参数。本示例性实施例中,特征信息指的是目标用户的历史数据对应的数据特征,具体可包括第一类参数和第二类参数。其中,IV值低于预设阈值的特征信息为所述第一类参数,IV值高于所述预设阈值本文档来自技高网...

【技术保护点】
1.一种用户信用评估方法,其特征在于,包括:获取目标用户的多个特征信息,所述多个特征信息包括第一类参数和第二类参数;对所述第一类参数和所述第二类参数进行预处理;将预处理后的所述第一类参数进行转化,生成目标参数;将预处理后的所述第二类参数和所述目标参数输入机器学习模型,得到所述目标用户的信用评估结果;其中,IV值低于预设阈值的特征信息为所述第一类参数,IV值高于所述预设阈值的特征信息为所述第二类参数。

【技术特征摘要】
1.一种用户信用评估方法,其特征在于,包括:获取目标用户的多个特征信息,所述多个特征信息包括第一类参数和第二类参数;对所述第一类参数和所述第二类参数进行预处理;将预处理后的所述第一类参数进行转化,生成目标参数;将预处理后的所述第二类参数和所述目标参数输入机器学习模型,得到所述目标用户的信用评估结果;其中,IV值低于预设阈值的特征信息为所述第一类参数,IV值高于所述预设阈值的特征信息为所述第二类参数。2.根据权利要求1所述的用户信用评估方法,其特征在于,对所述第一类参数和所述第二类参数进行预处理包括:通过证据权重值对所述第一类参数和第二类参数分别进行分箱处理,得到分箱后的第一类参数和分箱后的第二类参数。3.根据权利要求2所述的用户信用评估方法,其特征在于,将预处理后的所述第一类参数进行转化,生成目标参数包括:采用线性判别式算法对每个主题关联的分箱后的第一类参数进行特征组合,生成所述目标参数。4.根据权利要求3所述的用户信用评估方法,其特征在于,所述方法还包括:对所述目标参数进行再次分箱,并将再次分箱后的目标参数放入候选参数池;将分箱后的第二类参数放入所述候选变量池。5.根据权利要求4所述的用户信用评估方法,其特征在于,将预处理后的所述第二类参数和所述目标参数输入机器学习模型包括:剔除所述候选变量池中分箱后的第二类参数和再次分箱后的目标参数之间的多重共线性,得到剩余参数;将所述剩余参数输入所述机器学习模型。6.根据权利要求5所述的用户信用评估方法,其特征在于,剔除所述候选变量池中分箱后的第二类参数和再次分箱后的目标参数之间的多重共线性,得到剩余参数包括:从所述候选变量池中剔除证据权重值小于预...

【专利技术属性】
技术研发人员:陈鹏程马莹陈金辉
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1