一种基于迁移学习的客户信用评分方法及装置制造方法及图纸

技术编号:20969914 阅读:14 留言:0更新日期:2019-04-29 17:26
本发明专利技术公开了一种基于迁移学习的客户信用评分方法及装置,方法包括:获取客户信用评分样本的源领域数据及目标领域数据,对源领域数据及目标领域数据分别进行特征提取;获取源领域数据和目标领域数据的共同特征,根据共同特征对源领域数据和目标领域数据分别进行调整后生成对应的源领域数据集和目标领域数据集;根据深度学习算法对源领域数据集进行训练,生成深度学习模型;利用深度学习模型对目标领域数据集进行训练生成迁移学习模型;获取客户数据,结合深度学习模型和迁移学习模型,生成客户信用评分。本发明专利技术实施例基于迁移学习算法,从客户信用评分样本的源领域数据转移到目标领域,目标领域模型性能更佳,为进一步的业务活动提供了方便。

A Customer Credit Scoring Method and Device Based on Transfer Learning

The invention discloses a customer credit scoring method and device based on migration learning, which includes: acquiring source domain data and target domain data of customer credit scoring samples, extracting features of source domain data and target domain data respectively, acquiring common features of source domain data and target domain data, and according to common characteristics, acquiring source domain data and target domain number. The source domain data set and target domain data set are generated after adjusting respectively; the source domain data set is trained according to the deep learning algorithm to generate the deep learning model; the target domain data set is trained by the deep learning model to generate the transfer learning model; the customer data is acquired, and the customer credit evaluation is generated by combining the deep learning model and the transfer learning model. Points. The embodiment of the invention is based on the migration learning algorithm, transferring the source domain data of the customer credit score sample to the target domain, so that the target domain model has better performance and provides convenience for further business activities.

【技术实现步骤摘要】
一种基于迁移学习的客户信用评分方法及装置
本专利技术涉及互联网金融
,尤其涉及一种基于迁移学习的客户信用评分方法及装置。
技术介绍
随着互联网的快速发展,各种形式的业务不断涌现。个人和中小企业的无担保贷款也越来越多的出现在人们的生活中。在信用风险评估领域,经常会面临借款人没有历史数据或者数据有限的情形。基于这样的情形,银行针对无账号群体或者小微企业进行信用评分的方式主要是专家规则的方法。由于专家规则的评分模型存在很大不确定性,导致借贷方需要付出高价费用或者不提供信用评分。客户信用评估是银行等金融企业日常经营活动的重要组成部分。客户信用评估现有技术中采用定性分析和统计分析,定性分析是最早用于信用评估的方法,其后统计分析方法被逐渐引入到客户的信用评估中,但定性分析和统计分析都需要有大量的已知的样本数据,现有的个人和中小企业的无担保贷款是属于新开展的业务,样本数不足,因此现有技术中在样本数据少时,无法对客户信用进行评估。
技术实现思路
鉴于上述现有技术的不足,本专利技术的目的在于提供一种基于迁移学习的客户信用评分方法及装置,旨在解决现有技术中在样本数据少时,无法对客户信用进行评估的问题。本专利技术的技术方案如下:一种基于迁移学习的客户信用评分方法,所述方法包括:获取客户信用评分样本的源领域数据及目标领域数据,对所述源领域数据及目标领域数据分别进行特征提取;获取源领域数据和目标领域数据的共同特征,根据共同特征对源领域数据和目标领域数据分别进行调整后生成对应的源领域数据集和目标领域数据集;根据深度学习算法对源领域数据集进行训练,生成深度学习模型;利用深度学习模型对目标领域数据集进行训练生成迁移学习模型;获取客户数据,结合深度学习模型和迁移学习模型,生成客户信用评分。可选地,所述获取客户数据,结合深度学习模型和迁移学习模型,生成客户信用评分后,还包括:对于客户信用评分低于评分阈值的客户业务进行控制。可选地,所述源领域为单笔还款的小额短期贷款,目标领域为多次偿还的大额分期贷款。可选地,所述对所述源领域数据及目标领域数据分别进行特征提取,包括:对所述源领域数据进行预处理,对预处理后的源领域数据的特征进行提取;对所述目标领域数据进行预处理,对预处理后的目标领域数据的特征进行提取;对所述源领域数据和所述目标领域数据的共同特征进行提取,所述共同特征包括:月净收入与贷款支付的比率,收到当前收入的月数,以前的贷款数量,月净收入和居住在当前地址的月数。可选地,所述获取源领域数据和目标领域数据的共同特征,根据共同特征对源领域数据和目标领域数据分别进行调整后生成对应的源领域数据集和目标领域数据集,包括:获取源领域数据和目标领域数据的共同特征,获取共同特征在源领域数据和目标领域数据各自的均值分布;根据均值分布分别生成源领域数据和目标领域数据各个共同特征的调整因子;将各自领域的共同特征乘以调整因子,生成新的特征值;根据新的特征值分别生成源领域数据集和目标领域数据集。可选地,所述根据深度学习算法对源领域数据集进行训练,生成深度学习模型,包括:根据深度学习算法对源领域数据集进行训练;经过多次迭代后根据模型的性能挑选出最佳模型,将最佳模型作为深度学习模型,保存深度学习模型的网络结构和各层节点的参数。可选地,所述利用深度学习模型对目标领域数据集进行训练生成迁移学习模型,包括:保持深度学习模型的第一层网络至倒数第二层的参数不变,重新初始化最后一层网络节点的权重参数;在深度学习模型中输入目标领域数据集,经过多次迭代后生成迁移学习模型,并保存对应的最后的一层网络参数。本专利技术又一实施例还提供了一种基于迁移学习的客户信用评分装置,所述装置包括至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的基于迁移学习的客户信用评分方法。本专利技术的另一实施例还提供了一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的基于迁移学习的客户信用评分方法。本专利技术的另一种实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行上述的基于迁移学习的客户信用评分方法。有益效果:本专利技术公开了一种基于迁移学习的客户信用评分方法及装置,相比于现有技术,本专利技术实施例基于迁移学习算法,从客户信用评分样本的源领域数据转移到目标领域中,目标领域模型性能更佳,为进一步的业务活动提供了方便。附图说明下面将结合附图及实施例对本专利技术作进一步说明,附图中:图1为本专利技术一种基于迁移学习的客户信用评分方法较佳实施例的流程图;图2为本专利技术一种基于迁移学习的客户信用评分装置较佳实施例的硬件结构示意图。具体实施方式为使本专利技术的目的、技术方案及效果更加清楚、明确,以下对本专利技术进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。以下结合附图对本专利技术实施例进行介绍。请参阅图1,图1为本专利技术一种基于迁移学习的客户信用评分方法较佳实施例的流程图。如图1所示,其包括步骤:步骤S100、获取客户信用评分样本的源领域数据及目标领域数据,对所述源领域数据及目标领域数据分别进行特征提取;步骤S200、获取源领域数据和目标领域数据的共同特征,根据共同特征对源领域数据和目标领域数据分别进行调整后生成对应的源领域数据集和目标领域数据集;步骤S300、根据深度学习算法对源领域数据集进行训练,生成深度学习模型;步骤S400、利用深度学习模型对目标领域数据集进行训练生成迁移学习模型;步骤S500、获取客户数据,结合深度学习模型和迁移学习模型,生成客户信用评分。具体实施时,本专利技术实施例的方法能够提高信用评分模型的精确度并且保证模型的稳定性,其原理是结合相关信用风险领域的信息知识与新领域的标签数据进行预测。源领域为单笔还款的小额短期贷款,目标领域为多次偿还的大额分期贷款。例如,小额短期贷款可以是贷款金额小于等于2万元人民币且贷款期限在1年之内的贷款。大额分期贷款可以是贷款金额大于等于5万元人民币且小于等于100万元人民币,还款期数大于1期的贷款。在一些其他的实施例中,小额短期贷款和大额分期贷款也可根据各个银行的规定而设置为其他的额度、期限或期数。作为一种建模方法,迁移学习的主要思想是利用相近领域中的知识及信息来辅助目标领域中的建模。因此迁移学习可以成为解决目标领域样本数量不足的一种解决方案,通过利用相关领域的知识来增加信息的缺乏并改善金融包容性。例如,将知识从小额短期贷款转移到更大和更长期的贷款,或从公用事业账单支付转移支偿还贷款。我们在信用风险模型实施的初始阶段调查了迁移学习应用,其中可用的历史标记数据有限。在信用风险领域,业务优先级是模型性能的稳定性和准确性,以便预测违约概率。本专利技术实施例中我们能够将来自类似信用风险领域的迁移模型的结果与基于新领域新获取的标记数据的新模型相结合。通过这种方法,能够实现最佳的准确性并保持整体模型的稳定性。本文档来自技高网...

【技术保护点】
1.一种基于迁移学习的客户信用评分方法,其特征在于,所述方法包括:获取客户信用评分样本的源领域数据及目标领域数据,对所述源领域数据及目标领域数据分别进行特征提取;获取源领域数据和目标领域数据的共同特征,根据共同特征对源领域数据和目标领域数据分别进行调整后生成对应的源领域数据集和目标领域数据集;根据深度学习算法对源领域数据集进行训练,生成深度学习模型;利用深度学习模型对目标领域数据集进行训练生成迁移学习模型;获取客户数据,结合深度学习模型和迁移学习模型,生成客户信用评分。

【技术特征摘要】
1.一种基于迁移学习的客户信用评分方法,其特征在于,所述方法包括:获取客户信用评分样本的源领域数据及目标领域数据,对所述源领域数据及目标领域数据分别进行特征提取;获取源领域数据和目标领域数据的共同特征,根据共同特征对源领域数据和目标领域数据分别进行调整后生成对应的源领域数据集和目标领域数据集;根据深度学习算法对源领域数据集进行训练,生成深度学习模型;利用深度学习模型对目标领域数据集进行训练生成迁移学习模型;获取客户数据,结合深度学习模型和迁移学习模型,生成客户信用评分。2.根据权利要求1所述的基于迁移学习的客户信用评分方法,其特征在于,所述获取客户数据,结合深度学习模型和迁移学习模型,生成客户信用评分后,还包括:对于客户信用评分低于评分阈值的客户业务进行控制。3.根据权利要求1所述基于迁移学习的客户信用评分方法,其特征在于,所述源领域为单笔还款的小额短期贷款,目标领域为多次偿还的大额分期贷款。4.根据权利要3所述的基于迁移学习的客户信用评分方法,其特征在于,所述对所述源领域数据及目标领域数据分别进行特征提取,包括:对所述源领域数据进行预处理,对预处理后的源领域数据的特征进行提取;对所述目标领域数据进行预处理,对预处理后的目标领域数据的特征进行提取;对所述源领域数据和所述目标领域数据的共同特征进行提取,所述共同特征包括:月净收入与贷款支付的比率,收到当前收入的月数,以前的贷款数量,月净收入和居住在当前地址的月数。5.根据权利要求1所述的基于迁移学习的客户信用评分方法,其特征在于,所述获取源领域数据和目标领域数据的共同特征,根据共同特征对源领域数据和目标领域数据分别进行调整后生成对应的源领域数据集和目标领域数据集,包括:获取源领域数据和目标领域数据的共同特征,获取共同特征在源领域数据和目标领域数据各自的均值分布;根据均值分布分...

【专利技术属性】
技术研发人员:苏里亚托亨德拉关查尔斯
申请(专利权)人:深圳市数丰科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1