一种互联网征信评估方法和系统技术方案

技术编号:18942357 阅读:21 留言:0更新日期:2018-09-15 11:27
本发明专利技术实施例公开了一种互联网征信评估方法和系统;本发明专利技术实施例在得到训练数据集后,可以按照预设策略为该训练数据集中的各个训练样本设置权重,然后,采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型,并基于该训练后评估模型对用户的互联网征信进行评估;该方案可以大大提高评估的合理性和准确性,改善应用效果。

An Internet credit rating method and system

The embodiment of the invention discloses an Internet credit evaluation method and system; after obtaining the training data set, the embodiment of the invention can set the weight for each training sample in the training data set according to the preset strategy, and then train the preset evaluation model with the weighted training data set, and after training, the preset evaluation model is trained. The evaluation model is used to evaluate the user's Internet credit based on the trained evaluation model, which can greatly improve the rationality and accuracy of the evaluation and improve the application effect.

【技术实现步骤摘要】
一种互联网征信评估方法和系统
本专利技术涉及通信
,具体涉及一种互联网征信评估方法和系统。
技术介绍
随着大数据时代的来临,互联网征信的应用也越来越为广泛,其除了可以应用于互联网金融之外,还可以覆盖到其他的生活场景,比如打车、租车或酒店预订等,因此,如何保证互联网征信评估的准确和公平,也逐渐成为人们所关注的问题。在现有技术中,一般可以通过收集用户的在训练期的行为数据作为训练数据集,然后,从中提取用户特征,利用决策树、以及逻辑回归等机器学习算法,来建立信用评分模型,并基于该信用评分模型对用户的信用进行评估。其中,训练数据集由违约用户和非违约用户组成,并切分成训练集和验证集,训练集用于训练模型,验证集用于对得到的模型进行评估,而评估的标准就是在验证集上的预测误差尽量小,该预测误差主要是预测违约情况(即预测用户是否违约)与真实违约情况的差异。在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,现有的互联网征信评估不够合理,准确性不高,导致应用效果不佳。
技术实现思路
本专利技术实施例提供一种互联网征信评估方法和系统,可以提高评估的合理性和准确性,改善应用效果。本专利技术实施例提供一种互联网征信评估方法,包括:获取多个用户数据,所述用户数据包括用户的属性数据、行为数据和信用记录;从所述用户数据中选择训练样本,得到训练数据集;按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型;基于所述训练后评估模型对用户的互联网征信进行评估。本专利技术实施例还提供一种互联网征信评估系统,包括:获取单元,用于获取多个用户数据,所述用户数据包括用户的属性数据、行为数据和信用记录;选择单元,用于从所述用户数据中选择训练样本,得到训练数据集;设置单元,用于按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;训练单元,用于采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型;评估单元,用于基于所述训练后评估模型对用户的互联网征信进行评估。本专利技术实施例在得到训练数据集后,可以按照预设策略为该训练数据集中的各个训练样本设置权重,然后,采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型,并基于该训练后评估模型对用户的互联网征信进行评估;由于该方案可以按照预设策略为各个训练样本设置权重,再据此进行模型训练,因此,有利于对不同训练样本的违约影响进行区分,相对于现有只考虑训练样本是否违约的评估方案而言,可以大大提高评估的合理性和准确性,改善应用效果。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1a是本专利技术实施例提供的互联网征信评估方法的框架图;图1b是本专利技术实施例提供的互联网征信评估方法的流程图;图2是本专利技术实施例提供的互联网征信评估方法的另一流程图;图3a是本专利技术实施例提供的互联网征信评估系统的结构示意图;图3b是本专利技术实施例提供的互联网征信评估系统的另一结构示意图;图4是本专利技术实施例提供的服务器的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供一种互联网征信评估方法和系统。其中,该互联网征信评估系统具体可以集成在服务器等设备中。例如,参见图1a,该互联网征信评估系统可以获取多个用户数据,如用户的属性数据、行为数据和信用记录等,然后,从该用户数据中选择训练样本,并按照预设策略为各个训练样本设置权重,比如,可以对各个训练样本的收益进行分析,基于分析结果为其设置权重,使得不同训练样本的违约对总体收益的影响可以得到区分,等等,此后,便可以采用这些带权重的训练样本对预设评估模型进行训练,并基于训练后评估模型对用户的互联网征信进行评估,从而提高评估的合理性和准确性。其中,该预设评估模型可以根据实际应用的需求进行建立,比如,该评估模型可以包括用于预测用户违约情况的损失函数、以及用于预测用户收益情况的损失函数,即本专利技术实施例所说的第一损失函数和第二损失函数,等等。以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。实施例一、本实施例将从互联网征信评估系统的角度进行描述,该互联网征信评估系统具体可以集成在服务器,比如评估服务器等设备中。一种互联网征信评估方法,包括:获取多个用户数据,从该用户数据中选择训练样本,得到训练数据集,按照预设策略为该训练数据集中的各个训练样本设置权重,得到带权重的训练数据集,采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型,基于该训练后评估模型对用户的互联网征信进行评估。如图1b所示,该互联网征信评估方法的具体流程可以如下:101、获取多个用户数据。其中,该用户数据可以包括用户的属性数据、行为数据和信用记录等数据。其中,用户的属性数据可以包括用户在平台注册或者从其他渠道获取的用户信息,比如用户的性别、年龄、地域、和/或学历等人口属性信息;用户的行为数据可以包括用户在平台登录、点击、发消息、购物、支付、和/或阅读等行为所产生的数据;用户的信用记录可以包括用户的违约记录等信息。102、从该用户数据中选择训练样本,得到训练数据集。其中,选择的方式可以有多种,比如,可以随机进行选择,或者,也可以根据用户的收益分布来进行选择,等等。以根据用户的收益分布来进行选择为了,则步骤“从该用户数据中选择训练样本,得到训练数据集”,具体可以如下:(1)根据该用户数据分析用户收益。比如,以贷款为例,该用户收益指的是资方(即贷款提供方,比如银行等机构)提供贷款给某个用户后,该用户为资方带来的利益收入,一般可以包括贷款利息收益和逾期罚息收益,因此,可以通过分析贷款利息收益和逾期罚息收益来计算该用户收益,即步骤“根据该用户数据分析用户收益”具体可以包括:根据该用户数据确定用户的贷款利息收益,以及根据该用户数据确定用户的逾期罚息收益,然后,计算该贷款利息收益和逾期罚息收益的和,得到用户收益,用公式表示即为:用户收益=贷款利息收益+逾期罚息收益。其中,贷款利息收益的计算方法可以根据实际应用的需求而定,例如,可以根据本金和贷款利率来计算该贷款利息收益,等等,具体可以如下:贷款利息收益=r1*M。r1为贷款利率,M为本金。需说明的是,该贷款利率的单位可以根据实际应用的需求来进行设置,比如,可以设定为贷款日利率、贷款月利率或贷款年利率,等等,为了描述方便,在本专利技术实施例中,将均以r1为贷款月利率为例进行说明。此外,该贷款利率的具体取值也可以根据实际应用的需求进行设置,在此不再赘述。其中,逾期罚息是用户由于逾期还款导致的罚款收益,但是,需说明的是,用户的逾期罚息越大,并不代表逾期罚息收益越大,因为用户如果逾期越久,该用户就越危险(即信用越差),很可能会因为本文档来自技高网...

【技术保护点】
1.一种互联网征信评估方法,其特征在于,包括:获取多个用户数据,所述用户数据包括用户的属性数据、行为数据和信用记录;从所述用户数据中选择训练样本,得到训练数据集;按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型;基于所述训练后评估模型对用户的互联网征信进行评估。

【技术特征摘要】
1.一种互联网征信评估方法,其特征在于,包括:获取多个用户数据,所述用户数据包括用户的属性数据、行为数据和信用记录;从所述用户数据中选择训练样本,得到训练数据集;按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型;基于所述训练后评估模型对用户的互联网征信进行评估。2.根据权利要求1所述的方法,其特征在于,所述从所述用户数据中选择训练样本,得到训练数据集,包括:根据所述用户数据分析用户收益;根据用户收益从所述用户数据中选择训练样本,使得所选择的训练样本的用户收益的分布与所述用户数据的用户收益的分布一致,得到训练数据集。3.根据权利要求2所述的方法,其特征在于,所述根据所述用户数据分析用户收益,包括:根据所述用户数据确定用户的贷款利息收益;根据所述用户数据确定用户的逾期罚息收益;计算所述贷款利息收益和逾期罚息收益的和,得到用户收益。4.根据权利要求3所述的方法,其特征在于,所述根据所述用户数据确定用户的逾期罚息收益,包括:根据所述用户数据确定用户的本金、逾期罚款利率以及逾期时间;若所述逾期时间未超过预设阈值,则将所述逾期时间、逾期罚款利率、以及本金的乘积,作为逾期罚息收益;若所述逾期时间超过预设阈值,则计算所述逾期时间与预设阈值的差,将所述差、所述贷款利息收益和逾期罚息收益的逾期罚款利率、以及本金的乘积的相反数,作为逾期罚息收益。5.根据权利要求2所述的方法,其特征在于,所述按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集,包括:根据用户收益的大小为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;或者,根据用户收益的大小、以及用户的信用记录为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集。6.根据权利要求1至5任一项所述的方法,其特征在于,所述采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型之前,还包括:设置第一损失函数和第二损失函数,所述第一损失函数为用于预测用户违约情况的损失函数,所述第二损失函数为用于预测用户收益情况的损失函数;根据所述第一损失函数和第二损失函数建立评估模型。7.根据权利要求6所述的方法,其特征在于,所述根据所述用于预测用户违约情况的损失函数、以及用于预测用户收益情况的损失函数建立评估模型之前,还包括:设置平衡系数,所述平衡系数用于控制第一损失函数和第二损失函数的比重关系;所述根据所述第一损失函数和第二损失函数建立评估模型,包括:根据所述第一损失函数、第二损失函数、以及平衡系数建立评估模型。8.根据权利要求1至5任一项所述的方法,其特征在于,所述基于所述训练后评估模型对用户的互联网征信进行评估,包括:接收互联网征信评估请求,所述互联网征信评估请求指示需要进行评估的目标用户;获取所述目标用户的用户数据;根据所述目标用户的用户数据,通过所述训练后评估模型对目标用户的互联网征信进行评估。9.根据权利要求8所述的方法,其特征在于,所述根据所述目标用户的用户数据,通过所述训练后评估模型对目标用户的互联网征信进行评估,包括:利用所述训练后评估模型对所述目标用户的用户数据进行计算,得到评估概率...

【专利技术属性】
技术研发人员:黎新
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1