基于迁移学习的风控方法及系统、计算机装置、存储介质制造方法及图纸

技术编号:22077759 阅读:34 留言:0更新日期:2019-09-12 14:51
本发明专利技术提供一种基于迁移学习的风控方法,所述方法筛选源样本中若干和目标样本相似的样本,合并筛选后的源样本和目标样本训练弱分类器,组合弱分类器生成强分类器来生成风险识别模型,利用所生成的风险识别模型根据待审核的现金贷业务的信息识别待审核的现金贷业务的风险级别,以及根据识别结果进行风控。本发明专利技术还提供实现所述基于迁移学习的风控方法的系统、计算机装置、存储介质。本发明专利技术可对现金贷业务进行有效风险预测。

Wind Control Method and System, Computer Device and Storage Media Based on Transfer Learning

【技术实现步骤摘要】
基于迁移学习的风控方法及系统、计算机装置、存储介质
本专利技术涉及计算机
,具体涉及一种基于迁移学习的风控方法及系统、计算机装置、存储介质。
技术介绍
在商业银行的业务中,普通信用贷和现金贷是两类常见的贷款方式。表面上看,普通信用贷和现金贷审核的用户材料大致相同,但是由于风险点不同,导致风控要求也差异很大。普通信用贷就是借款人无需抵押品或者第三方担保,仅靠借款人信用程度作为还款保证。开展普通信用贷款业务的主体为商业银行、贷款公司、电子金融机构等。一般普通信用贷款期限为1-3年,贷款金额为几千到几万。信用贷款的风险较大,需要对借款人的经营状况、经济效益、发展前景综合考量。现金贷是一种小额短期借贷产品,具有以下五个特点:额度小、周期短、流程快、效率高,贷款期限一般为7-30天,平均贷款金额为1000,年化利率平均在50%-200%之间。根据目前市场上的现金贷业务种类,可以分为随借随还类贷款、发薪日贷款(paydayloan)、短期贷款、中期贷款四大类。由此可见,现金贷的借贷门槛低,是一种高利率高风险的盈利方式,对现金贷的风控显得尤为重要。
技术实现思路
鉴于以上内容,有必要提出一种基于本文档来自技高网...

【技术保护点】
1.一种基于迁移学习的风控方法,其特征在于,所述方法包括:获取步骤,获取源样本D′s和目标样本Dt,其中,所述源样本D′s包括k个样本,所述目标样本Dt包括m个样本,将所述源样本D′s和目标样本Dt作为总样本,从而总样本的数目等于所述源样本的数目k和所述目标样本的数目m之和;第一设置步骤,为所述总样本中每个样本分别设置初始权重,以及根据所述总样本中的每个样本的权重获得每个样本的权重向量;第二设置步骤,设置最大迭代次数为N次,t表示迭代次数;第一执行步骤,基于所述总样本中的每个样本的权重以及所述每个样本的权重向量计算所述每个样本在第t次迭代时的权重比率;第二执行步骤,将所述源样本D′s与所述目标...

【技术特征摘要】
1.一种基于迁移学习的风控方法,其特征在于,所述方法包括:获取步骤,获取源样本D′s和目标样本Dt,其中,所述源样本D′s包括k个样本,所述目标样本Dt包括m个样本,将所述源样本D′s和目标样本Dt作为总样本,从而总样本的数目等于所述源样本的数目k和所述目标样本的数目m之和;第一设置步骤,为所述总样本中每个样本分别设置初始权重,以及根据所述总样本中的每个样本的权重获得每个样本的权重向量;第二设置步骤,设置最大迭代次数为N次,t表示迭代次数;第一执行步骤,基于所述总样本中的每个样本的权重以及所述每个样本的权重向量计算所述每个样本在第t次迭代时的权重比率;第二执行步骤,将所述源样本D′s与所述目标样本Dt混合获得混合后的总样本,以线性回归作为基分类器,将混合后的总样本结合每个样本在第t次迭代时的权重比率训练所述基分类器获得一个弱分类器;第三执行步骤,计算所述弱分类器误分类所述目标样本Dt的错误率;第四执行步骤,计算所述源样本D′s的权重更新速率,以及根据所述目标样本Dt被误分类的错误率计算所述目标样本Dt的权重更新速率;第五执行步骤,根据所述目标样本Dt的权重更新速率以及所述源样本D′s的权重更新速率确定所述源样本D′s和目标样本Dt中的每个样本在第t+1次迭代时的权重;判断步骤,判断当前是否已经执行了N次迭代,其中,若当前尚未执行N次迭代,则设置t=t+1后触发所述第一执行步骤;若当前已经执行了N次迭代,则触发第六执行步骤;所述第六执行步骤,根据第N/2次到第N次迭代过程中所训练获得的弱分类器分别对所总样本的风险级别的预测,组合该第N/2次到第N次迭代过程中所训练获得的弱分类器获得一个强分类器;及第七执行步骤,将所述强分类器作为风险识别模型,利用所述风险识别模型根据待审核的贷款业务的信息识别待审核的贷款业务的风险级别,并根据识别结果进行风控。2.如权利要求1所述的基于迁移学习的风控方法,其特征在于,所述目标样本Dt所包括的所述m个样本为现金贷样本,所述源样本D′s所包括的所述k个样本为普通信用贷款样本,该方法获取所述源样本D′s的步骤包括:获取样本集Ds,其中,所述样本集Ds包括n个普通信用贷款的样本;对所述n个普通信用贷款的样本和所述m个现金贷的样本中的每个样本进行标记,包括:将所述n个普通信用贷款样本作为负样本,为所述n个普通信用贷款样本中的每个样本增加一个公共字段Sample_Flag,并设置Sample_Flag=-1;将所述m个现金贷样本作为正样本,为所述m个现金贷样本中的每个样本增加一个公共字段Sample_Flag,并设置Sample_Flag=1;将标记后的所述n个普通信用贷款样本与所述m个现金贷样本混合,将混合后的所有样本随机切分为训练集和验证集;利用朴素贝叶斯作为基分类器,以所述训练集所包括的每个样本的公共字段Sample_Flag的值作为分类标签训练该基分类器;利用经过训练的所述基分类器对所述测试集进行预测,输出所述测试集中每个样本为正样本的概率;按照所输出的每个样本为正样本的概率的大小对所述测试集所包括的所有样本进行降序排列,筛选出降序排列后的前k个普通信用贷款样本,将筛选出的该k个普通信用贷款样本作为所述源样本D′s。3.如权利要求1所述的基于迁移学习的风控方法,其特征在于,所述总样本中的每个样本在第t次迭代时的权重比率由公式:计算得到,其中,代表总样本中每个样本在第t次迭代时的权重比率,代表所述总样本中每个样本在第t次迭代时的权重向量,代表总样本中每个样本在第t次迭代时的权重。4.如权利要求1所述的基于迁移学习的风控方法,其...

【专利技术属性】
技术研发人员:吴良顺
申请(专利权)人:卓尔智联武汉研究院有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1