基于迁移学习构建风控模型的方法和风险控制方法技术

技术编号:37380344 阅读:40 留言:0更新日期:2023-04-27 07:22
本发明专利技术公开了一种基于迁移学习构建风控模型的方法和风险控制方法。所述方法包括:根据源域样本数据和目标域样本数据的数据分布特点选择风控模型;基于预设的优化目标,确定用于拉近所述源域样本数据和所述目标域样本数据在指定空间中的分布距离的变换矩阵;使用所述变换矩阵将所述源域样本数据和所述目标域样本数据变换到指定空间,使用空间变换后的源域样本数据和目标域样本数据训练所述风控模型。在目标域样本数量较少的情况下,可以通过迁移学习的方式,使用源域的样本数据训练风控模型,避免风控场景面临的冷启动问题,优化风控能力。风控能力。风控能力。

【技术实现步骤摘要】
基于迁移学习构建风控模型的方法和风险控制方法


[0001]本专利技术涉及机器学习
,特别涉及一种基于迁移学习构建风控模型的方法和风险控制方法。

技术介绍

[0002]金融机构在政策和高度市场竞争下,对风险管理的精准度与效率要求极高。
[0003]金融机构关于客户个人风险的预测,目前使用最普遍的工具是逻辑回归信用评分卡,其应用的范围包括进件、贷后管理及催收等。要建立逻辑回归信用评分卡,需要收集一定量带标签的样本数据,在金融场景中,对于新接入的场景方和资金方,常常面临缺少带标签的实际样本数据,而导致无法建立逻辑回归信用评分卡,或建立的逻辑回归信用评分卡可用率和可信度比较低,从而无法对客户个人风险进行有效预测。

技术实现思路

[0004]本申请专利技术人发现,在金融场景中,不同场景方和资金方对应的信贷业务具有相关性和相似性,而且迁移学习就是利用数据、模型之间的相似性,在不同领域之间进行数据的迁移,从而扩展传统机器学习技术的能力边界,因此,如果将迁移学习用于包括金融风控领域在内的场景,将给新的场景方或资方的接入带来了更多的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于迁移学习构建风控模型的方法,其特征在于,包括:根据源域样本数据和目标域样本数据的数据分布特点选择风控模型;基于预设的优化目标,确定用于拉近所述源域样本数据和所述目标域样本数据在指定空间中的分布距离的变换矩阵;使用所述变换矩阵将所述源域样本数据和所述目标域样本数据变换到指定空间,使用空间变换后的源域样本数据和目标域样本数据训练所述风控模型。2.如权利要求1所述的方法,其特征在于,所述根据源域样本数据和目标域样本数据的数据分布特点选择风控模型,包括:根据所述源域样本数据和所述目标域样本数据的相同属性特征和不同属性特征选择风控模型;所述属性特征包括特征空间、标签空间和概率分布中的至少一项;所述特征空间包括特征的数量和/或维度,所述标签空间包括标签类别,所述概率分布包括联合概率分布、边缘概率分布和条件概率分布中的至少一项。3.如权利要求1所述的方法,其特征在于,基于预设的优化目标,确定用于拉近所述源域样本数据和所述目标域样本数据在指定空间中的分布距离的变换矩阵,包括:若所述目标域样本数据带有标签,将所述源域样本数据和所述目标域样本数据输入预先构建立的优化目标函数,得到满足预设的优化目标的变换矩阵;若所述目标域样本数据没有标签,使用所述源域样本数据预训练所述风控模型,基于预训练的风控模型对所述目标域样本数据进行分类,根据分类结果为所述目标域样本数据添加伪标签,将所述源域样本数据和添加伪标签后的目标域样本数据输入预先构建立的优化目标函数,得到满足预设的优化目标的变换矩阵。4.如权利要求1所述的方法,其特征在于,确定变换矩阵之前,还包括:根据所述源域样本数据的概率分布和所述目标域样本数据的概率分布,构建优化源域样本数据和目标域样本数据在指定空间中分布距离的优化目标函数。5.如权利要求4所述的方法,其特征在于,根据所述源域样本数据的概率分布和所述目标域样本数据的概率分布,构建优化源域样本数据和目标域样本数据在指定空间中分布距离的优化目标函数,包括:根据所述源域样本数据的边缘概率和所述目标域样本数据的边缘概率,确定边缘概率距离;根据所述源域样本数据的条件概率和所述目标域样本数据的条件概率,确定条件概率距离;基于动态平衡因子,对所述边缘概率...

【专利技术属性】
技术研发人员:张震郭延祥曾海峰刘俊阳王铜麟
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1