一种风险预测的方法、装置、存储介质及电子设备制造方法及图纸

技术编号:38578163 阅读:4 留言:0更新日期:2023-08-26 23:24
一种风险预测的方法、装置、存储介质及电子设备,涉及大数据领域或金融领域。方法包括:获取第一目标域的数据与多个第一源域的数据,所述第一目标域和每个所述第一源域的数据对应一类产品的历史交易数据、历史违约数据和客户信息数据,所述第一目标域对应目标产品;根据每个所述第一源域和所述第一目标域分别对应的客户特征和标签,确定与所述第一目标域的相似度大于或等于预设阈值的各第二源域,所述标签用于指示客户风险;训练获取风险预测模型,所述风险预测模型的训练数据中包括各所述第二源域的数据;根据所述风险预测模型对所述目标产品的目标客户进行风险预测。该方案能够提升客户风险预测结果的准确性。提升客户风险预测结果的准确性。提升客户风险预测结果的准确性。

【技术实现步骤摘要】
一种风险预测的方法、装置、存储介质及电子设备


[0001]本申请涉及大数据
,尤其涉及一种风险预测的方法、装置、存储介质及电子设备。

技术介绍

[0002]目前,金融机构在对客户提供服务时,往往需要进行风险预测,风险预测用于确定客户的违约风险。通过风险预测,可以减少为高风险客户提供服务,或者加对高风险客户的行为监督。这对于维护金融市场的安全性和稳定性,以及维护社会经济发展的稳定性有重要的意义。
[0003]传统的客户风险分析的方式为:收集目标客户历史出现的违约记录,以及该产品对应的客户违约记录,然后进行建模分析。但是,金融产品的高风险客户数量往往比较稀缺,导致建模分析的训练数据少,预测结果准确性低。

技术实现思路

[0004]为了解决现有技术存在的上述问题,本申请提供了一种风险预测的方法、装置、存储介质及电子设备,能够提升客户风险预测结果的准确性。
[0005]第一方面,本申请提供了一种风险预测的方法,该方法包括:获取第一目标域的数据与多个第一源域的数据,所述第一目标域和每个所述第一源域的数据对应一类产品的历史交易数据、历史违约数据和客户信息数据,所述第一目标域对应目标产品;根据每个所述第一源域和所述第一目标域分别对应的客户特征和标签,确定与所述第一目标域的相似度大于或等于预设阈值的各第二源域,所述标签用于指示客户风险;训练获取风险预测模型,所述风险预测模型的训练数据中包括各所述第二源域的数据;根据所述风险预测模型对所述目标产品的目标客户进行风险预测。
[0006]利用本申请提供的方法,首先获取第一目标域和多个第一源域。其中,第一目标阈值包括了目标产品对应的数据,第一源域包括了非目标产品对应的数据。本申请根据客户特征和标签,确定出与第一目标域的相似度大于或等于预设阈值的各第二源域。然后将各第二源域的数据加入模型训练的训练数据中,以得到风险预测模型。该方案较大程度上利用了现有的数据,通过衡量数据的相似性找到迁移学习价值较高的数据域,大大降低了负迁移的出现概率,因此缓解了数据类别不平衡的问题,扩充了模型训练的可用数据,提高了分析效率和模型效果,因此能够提升客户风险预测结果的准确性。
[0007]在一种可能的实现方式中,所述根据每个所述第一源域和所述第一目标域分别对应的客户特征和标签,确定与所述第一目标域的相似度大于或等于预设阈值的各第二源域,具体包括:以所述客户特征和所述标签作为变量,确定每个所述第一源域分别与所述第一目标域的互信息值;将所述互信息值确定为所述相似度,将大于所述预设阈值的互信息值对应的第一源域确定为一个所述第二源域。
[0008]在一种可能的实现方式中,所述训练获取风险预测模型,具体包括:将所述第一目
标域的数据和各所述第二源域的数据作为训练数据,对全连接神经网络FCNN模型进行训练,所述FCNN模型的隐藏层包括k层,所述k为大于1的整数;利用所述第一目标域的数据,对训练后的所述FCNN模型的隐藏层的最后m层进行更新,所述m为小于所述k的正整数;将更新后的所述FCNN模型作为所述风险预测模型。
[0009]在一种可能的实现方式中,所述训练获取风险预测模型,具体包括:将各所述第二源域的数据作为训练数据,对全连接神经网络FCNN模型进行训练,所述FCNN模型的隐藏层包括k层,所述k为大于1的整数;利用所述第一目标域的数据,对训练后的所述FCNN模型的隐藏层的最后m层进行更新,所述m为小于所述k的正整数;将更新后的所述FCNN模型作为所述风险预测模型。
[0010]在一种可能的实现方式中,所述方法还包括:对所述第一目标域中的数据进行更新,以获取到第二目标域;利用所述第二目标域的数据,对所述风险预测模型的隐藏层的最后m层进行更新,以获取更新后的风险预测模型。
[0011]在一种可能的实现方式中,所述利用所述第一目标域的数据,对训练后的所述FCNN模型的隐藏层的最后m层进行更新之前,所述方法还包括:确定所述第一目标域的数据的数量与各所述第二源域的数据的数量和之间的比例值;根据所述比例值,以及预先确定的比例值和所述m之间的对应关系,确定所述m的取值。
[0012]在一种可能的实现方式中,所述客户特征包括以下中的一项或者多项:客户属性和客户交易行为;所述客户交易行为包括交易次数和交易频率。
[0013]第二方面,本申请还提供了一种风险预测的装置,装置包括:获取单元、确定单元、模型训练单元和风险预测单元。获取单元用于获取第一目标域的数据与多个第一源域的数据,所述第一目标域和每个所述第一源域的数据对应一类产品的历史交易数据、历史违约数据和客户信息数据,所述第一目标域对应目标产品。确定单元根据每个所述第一源域和所述第一目标域分别对应的客户特征和标签,确定与所述第一目标域的相似度大于或等于预设阈值的各第二源域,所述标签用于指示客户风险。模型训练单元用于训练获取风险预测模型,所述风险预测模型的训练数据中包括各所述第二源域的数据。风险预测单元用于根据所述风险预测模型对所述目标产品的目标客户进行风险预测。
[0014]利用该装置,降低了负迁移的出现概率,因此缓解了数据类别不平衡的问题,扩充了模型训练的可用数据,提高了分析效率和模型效果,因此能够提升客户风险预测结果的准确性。
[0015]在一种可能的实现方式中,确定单元具体用于以所述客户特征和所述标签作为变量,确定每个所述第一源域分别与所述第一目标域的互信息值;将所述互信息值确定为所述相似度,将大于所述预设阈值的互信息值对应的第一源域确定为一个所述第二源域。
[0016]在一种可能的实现方式中,模型训练单元具体用于将所述第一目标域的数据和各所述第二源域的数据作为训练数据,对全连接神经网络FCNN模型进行训练,所述FCNN模型的隐藏层包括k层,所述k为大于1的整数;利用所述第一目标域的数据,对训练后的所述FCNN模型的隐藏层的最后m层进行更新,所述m为小于所述k的正整数;将更新后的所述FCNN模型作为所述风险预测模型。
[0017]在一种可能的实现方式中,模型训练单元具体用于将各所述第二源域的数据作为训练数据,对全连接神经网络FCNN模型进行训练,所述FCNN模型的隐藏层包括k层,所述k为
大于1的整数;利用所述第一目标域的数据,对训练后的所述FCNN模型的隐藏层的最后m层进行更新,所述m为小于所述k的正整数;将更新后的所述FCNN模型作为所述风险预测模型。
[0018]在一种可能的实现方式中,该装置还包括更新单元,更新单元具体用于对所述第一目标域中的数据进行更新,以获取到第二目标域;利用所述第二目标域的数据,对所述风险预测模型的隐藏层的最后m层进行更新,以获取更新后的风险预测模型。
[0019]在一种可能的实现方式中,模型训练单元还具体用于确定所述第一目标域的数据的数量与各所述第二源域的数据的数量和之间的比例值;根据所述比例值,以及预先确定的比例值和所述m之间的对应关系,确定所述m的取值。
[0020]第三方面,本申请还提供了一种存储介质,其上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险预测的方法,其特征在于,所述方法包括:获取第一目标域的数据与多个第一源域的数据,所述第一目标域和每个所述第一源域的数据对应一类产品的历史交易数据、历史违约数据和客户信息数据,所述第一目标域对应目标产品;根据每个所述第一源域和所述第一目标域分别对应的客户特征和标签,确定与所述第一目标域的相似度大于或等于预设阈值的各第二源域,所述标签用于指示客户风险;训练获取风险预测模型,所述风险预测模型的训练数据中包括各所述第二源域的数据;根据所述风险预测模型对所述目标产品的目标客户进行风险预测。2.根据权利要求1所述的风险预测的方法,其特征在于,所述根据每个所述第一源域和所述第一目标域分别对应的客户特征和标签,确定与所述第一目标域的相似度大于或等于预设阈值的各第二源域,具体包括:以所述客户特征和所述标签作为变量,确定每个所述第一源域分别与所述第一目标域的互信息值;将所述互信息值确定为所述相似度,将大于所述预设阈值的互信息值对应的第一源域确定为一个所述第二源域。3.根据权利要求1所述的风险预测的方法,其特征在于,所述训练获取风险预测模型,具体包括:将所述第一目标域的数据和各所述第二源域的数据作为训练数据,对全连接神经网络FCNN模型进行训练,所述FCNN模型的隐藏层包括k层,所述k为大于1的整数;利用所述第一目标域的数据,对训练后的所述FCNN模型的隐藏层的最后m层进行更新,所述m为小于所述k的正整数;将更新后的所述FCNN模型作为所述风险预测模型。4.根据权利要求1所述的风险预测的方法,其特征在于,所述训练获取风险预测模型,具体包括:将各所述第二源域的数据作为训练数据,对全连接神经网络FCNN模型进行训练,所述FCNN模型的隐藏层包括k层,所述k为大于1的整数;利用所述第一目标域的数据,对训练后的所述FCNN模型的隐藏层的最后m层进行更新,所述m为小于所述k的正整数;将更新后的所述FCNN模型作为所述风险预测模型。5.根据权利要求3或...

【专利技术属性】
技术研发人员:唐雪涛盛康李笑宇
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1