The embodiment of the invention discloses an Internet credit evaluation method and system; after obtaining the training data set, the embodiment of the invention can set the weight for each training sample in the training data set according to the preset strategy, and then train the preset evaluation model with the weighted training data set, and after training, the preset evaluation model is trained. The evaluation model is used to evaluate the user's Internet credit based on the trained evaluation model, which can greatly improve the rationality and accuracy of the evaluation and improve the application effect.
【技术实现步骤摘要】
一种互联网征信评估方法和系统
本专利技术涉及通信
,具体涉及一种互联网征信评估方法和系统。
技术介绍
随着大数据时代的来临,互联网征信的应用也越来越为广泛,其除了可以应用于互联网金融之外,还可以覆盖到其他的生活场景,比如打车、租车或酒店预订等,因此,如何保证互联网征信评估的准确和公平,也逐渐成为人们所关注的问题。在现有技术中,一般可以通过收集用户的在训练期的行为数据作为训练数据集,然后,从中提取用户特征,利用决策树、以及逻辑回归等机器学习算法,来建立信用评分模型,并基于该信用评分模型对用户的信用进行评估。其中,训练数据集由违约用户和非违约用户组成,并切分成训练集和验证集,训练集用于训练模型,验证集用于对得到的模型进行评估,而评估的标准就是在验证集上的预测误差尽量小,该预测误差主要是预测违约情况(即预测用户是否违约)与真实违约情况的差异。在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,现有的互联网征信评估不够合理,准确性不高,导致应用效果不佳。
技术实现思路
本专利技术实施例提供一种互联网征信评估方法和系统,可以提高评估的合理性和准确性,改善应用效果。本专利技术实施例提供一种互联网征信评估方法,包括:获取多个用户数据,所述用户数据包括用户的属性数据、行为数据和信用记录;从所述用户数据中选择训练样本,得到训练数据集;按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型;基于所述训练后评估模型对用户的互联网征信进行评估。本专利技术实施例还提供一种互联网征信评估 ...
【技术保护点】
1.一种互联网征信评估方法,其特征在于,包括:获取多个用户数据,所述用户数据包括用户的属性数据、行为数据和信用记录;从所述用户数据中选择训练样本,得到训练数据集;按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型;基于所述训练后评估模型对用户的互联网征信进行评估。
【技术特征摘要】
1.一种互联网征信评估方法,其特征在于,包括:获取多个用户数据,所述用户数据包括用户的属性数据、行为数据和信用记录;从所述用户数据中选择训练样本,得到训练数据集;按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型;基于所述训练后评估模型对用户的互联网征信进行评估。2.根据权利要求1所述的方法,其特征在于,所述从所述用户数据中选择训练样本,得到训练数据集,包括:根据所述用户数据分析用户收益;根据用户收益从所述用户数据中选择训练样本,使得所选择的训练样本的用户收益的分布与所述用户数据的用户收益的分布一致,得到训练数据集。3.根据权利要求2所述的方法,其特征在于,所述根据所述用户数据分析用户收益,包括:根据所述用户数据确定用户的贷款利息收益;根据所述用户数据确定用户的逾期罚息收益;计算所述贷款利息收益和逾期罚息收益的和,得到用户收益。4.根据权利要求3所述的方法,其特征在于,所述根据所述用户数据确定用户的逾期罚息收益,包括:根据所述用户数据确定用户的本金、逾期罚款利率以及逾期时间;若所述逾期时间未超过预设阈值,则将所述逾期时间、逾期罚款利率、以及本金的乘积,作为逾期罚息收益;若所述逾期时间超过预设阈值,则计算所述逾期时间与预设阈值的差,将所述差、所述贷款利息收益和逾期罚息收益的逾期罚款利率、以及本金的乘积的相反数,作为逾期罚息收益。5.根据权利要求2所述的方法,其特征在于,所述按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集,包括:根据用户收益的大小为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;或者,根据用户收益的大小、以及用户的信用记录为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集。6.根据权利要求1至5任一项所述的方法,其特征在于,所述采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型之前,还包括:设置第一损失函数和第二损失函数,所述第一损失函数为用于预测用户违约情况的损失函数,所述第二损失函数为用于预测用户收益情况的损失函数;根据所述第一损失函数和第二损失函数建立评估模型。7.根据权利要求6所述的方法,其特征在于,所述根据所述用于预测用户违约情况的损失函数、以及用于预测用户收益情况的损失函数建立评估模型之前,还包括:设置平衡系数,所述平衡系数用于控制第一损失函数和第二损失函数的比重关系;所述根据所述第一损失函数和第二损失函数建立评估模型,包括:根据所述第一损失函数、第二损失函数、以及平衡系数建立评估模型。8.根据权利要求1至5任一项所述的方法,其特征在于,所述基于所述训练后评估模型对用户的互联网征信进行评估,包括:接收互联网征信评估请求,所述互联网征信评估请求指示需要进行评估的目标用户;获取所述目标用户的用户数据;根据所述目标用户的用户数据,通过所述训练后评估模型对目标用户的互联网征信进行评估。9.根据权利要求8所述的方法,其特征在于,所述根据所述目标用户的用户数据,通过所述训练后评估模型对目标用户的互联网征信进行评估,包括:利用所述训练后评估模型对所述目标用户的用户数据进行计算,得到评估概率...
【专利技术属性】
技术研发人员:黎新,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。