模型训练方法、违约传导风险识别方法、装置及存储介质制造方法及图纸

技术编号:22388400 阅读:19 留言:0更新日期:2019-10-29 06:50
本说明书实施例提供一种模型训练方法、违约传导风险识别方法、装置及存储介质。所述方法包括:根据客户之间的关联关系,构建多个联通体网络,其中,每个联通体网络包含至少两个节点,每个节点代表一个客户信息;每个联通体网络中至少包括一个违约客户;对每个联通体网络建立标签;以附带标签的联通体网络作为训练样本,对预先构建的多个二分类模型进行训练;对所述训练后的二分类模型进行评价,选取评价指标最高的训练后的二分类模型作为违约传导风险识别模型。通过上述方法构建风险传导预测的机器学习模型,可以预测违约风险在客户之间传导的可能性。

Model training method, default conduction risk identification method, device and storage medium

【技术实现步骤摘要】
模型训练方法、违约传导风险识别方法、装置及存储介质
本说明书实施例涉及计算机
,特别涉及一种模型训练方法、违约传导风险识别方法、装置及存储介质。
技术介绍
随着经济的高速发展,我国的企业及居民的杠杆率也在极速攀升,其中,企业及居民的杠杆率中大部分均来自银行的长期、短期贷款,高杠杆率带来的违约隐患迫使各大银行提高自身的风险控制能力,以及风险转移能力。现有的违约传导风险识别中,在对企业客户进行信用分析时,确认客户本身的违约风险、发现客户的企业关系圈、以及这些关联关系的风险传导程度,都是银行信贷客户经理需要考虑的维度。比如:客户经理需要看到某企业的企业关系圈,然后想了解哪些企业和该企业有关联关系,且该企业关联关系中哪些企业有违约行为。但是,更多的情况下是经验判断,缺乏数据基础支持。
技术实现思路
本说明书实施例的目的是提供一种模型训练方法、违约传导风险识别方法、装置及存储介质,以预测违约风险在客户之间传导的可能性。为解决上述问题,本说明书实施例提供一种模型训练方法、违约传导风险识别方法、装置及存储介质是这样实现的。一种模型训练方法,所述方法包括:根据客户之间的关联关系,构建多个联通体网络,其中,每个联通体网络包含至少两个节点,每个节点代表一个客户信息;每个联通体网络中至少包括一个违约客户;对每个联通体网络建立标签;以附带标签的联通体网络作为训练样本,对预先构建的多个二分类模型进行训练;对所述训练后的二分类模型进行评价,选取评价指标最高的训练后的二分类模型作为违约传导风险识别模型。一种违约传导风险识别方法,所述方法包括:根据客户之间的关联关系,构建联通体网络,其中,所述联通体网络包含至少两个节点,每个节点代表一个客户信息;所述联通体网络中至少包括一个违约客户;将所述联通体网络输入至预设的违约传导风险识别模型,得到识别结果,所述预设的违约传导风险识别模型采用上述模型训练方法方法训练得到。一种模型训练装置,所述装置包括:构建模块,根据客户之间的关联关系,构建多个联通体网络,其中,每个联通体网络包含至少两个节点,每个节点代表一个客户信息;其中,每个联通体网络中至少包括一个违约客户;标记模块,用于对每个联通体网络建立标签;训练模块,用于以附带标签的联通体网络作为训练样本,对预先构建的多个二分类模型进行训练;评价模块,用于对所述训练后的二分类模型进行评价,选取评价指标最高的训练后的二分类模型作为违约传导风险识别模型。一种违约传导风险识别装置,所述装置包括:构建模块,用于根据客户之间的关联关系,构建联通体网络,其中,所述联通体网络包含至少两个节点,每个节点代表一个客户信息;所述联通体网络中至少包括一个违约客户;识别模块,用于将所述联通体网络输入至预设的违约传导风险识别模型,得到识别结果,所述预设的违约传导风险识别模型采用上述模型训练方法训练得到。一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被执行时实现:根据客户之间的关联关系,构建多个联通体网络,其中,每个联通体网络包含至少两个节点,每个节点代表一个客户信息;每个联通体网络中至少包括一个违约客户;对每个联通体网络建立标签;以附带标签的联通体网络作为训练样本,对预先构建的多个二分类模型进行训练;对所述训练后的二分类模型进行评价,选取评价指标最高的训练后的二分类模型作为违约传导风险识别模型。一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被执行时实现:根据客户之间的关联关系,构建联通体网络,其中,所述联通体网络包含至少两个节点,每个节点代表一个客户信息;所述联通体网络中至少包括一个违约客户;将所述联通体网络输入至预设的违约传导风险识别模型,得到识别结果,所述预设的违约传导风险识别模型采用上述模型训练方法训练得到。由以上本说明书实施例提供的技术方案可见,本说明书实施例提供的模型训练方法可以通过根据客户之间的关联关系,分析在预设时间内发生违约传导时客户之间的关联关系,并根据关联关系基于不同的算法建立违约传导风险识别模型,再对所述模型进行评价,最后根据评价结果选择相应的违约传导风险识别模型。本说明书实施例提供的模型训练方法针对已违约关联体内客户、风险分析发现的高违约概率风险客户以及任意指定法人客户,构建风险传导预测的机器学习模型,为总结共性传导模式和规律提供数据支持,可以预测违约风险在客户之间传导的可能性。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本说明书实施例一种模型训练方法的流程图;图2为本说明书实施例一种ROC曲线示意图;图3为本说明书实施例一种CAP曲线示意图;图4为本说明书实施例一种违约传导风险识别方法的流程图;图5为本说明书实施例一种违约传导风险识别结果示意图;图6为本说明书实施例一种模型训练装置的功能模块图;图7为本说明书实施例一种违约传导风险识别装置的功能模块图。具体实施方式下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。在本实施方式中,执行所述违约传导风险识别方法的主体可以是具有逻辑运算功能的电子设备,所述电子设备可以是服务器或客户端,所述客户端可以为台式电脑、平板电脑、笔记本电脑、工作站等。当然,客户端并不限于上述具有一定实体的电子设备,其还可以为运行于上述电子设备中的软体。还可以是一种通过程序开发形成的程序软件,该程序软件可以运行于上述电子设备中。图1为本说明书实施例一种模型训练方法的流程图,如图1所示,所述方法可以包括以下步骤。S110:根据客户之间的关联关系,构建多个联通体网络,其中,每个联通体网络包含至少两个节点,每个节点代表一个客户信息;每个联通体网络中至少包括一个违约客户。上述客户可以是个体工商户,也可以是企业,其中,企业还可以包括独资企业、合伙企业和公司。不论所述客户是个体工商户还是企业,客户之间通常存在一些关联关系,这些关联关系通常可以表明客户之间存在合作、交易等,这些关联关系可以包括股权信息、人员信息、交易信息、担保关系、从属关系、债务关系等能够表明这些客户之间存在一定联系的关系。在一些实施例中,可以根据客户之间的关联关系,构建多个联通体网络,其中,所述联通体网络中至少包括两个节点,每个节点代表一个客户信息,其中,每个联通体网络中至少包括一个违约客户。所述违约客户包括在约定时间点未履行约定的客户,例如客户在约定的还款日内未还款、在约定的还款日之后还款但未缴纳滞纳金以及其他信誉不良的行为。具体的,可以以违约客户为中心,根据客户之间的关联关系,向外延伸构建联通体网络。例如,如果多个违约客户之间具有关联关系,则以该多个违约客户为中心,根据客户之间的关联关系,向外延伸构建联通体网络;如果与一个违约客户具有关联关系的其他客户均未发生违约,则本文档来自技高网...

【技术保护点】
1.一种模型训练方法,其特征在于,所述方法包括:根据客户之间的关联关系,构建多个联通体网络,其中,每个联通体网络包含至少两个节点,每个节点代表一个客户信息;每个联通体网络中至少包括一个违约客户;对每个联通体网络建立标签;以附带标签的联通体网络作为训练样本,对预先构建的多个二分类模型进行训练;对所述训练后的二分类模型进行评价,选取评价指标最高的训练后的二分类模型作为违约传导风险识别模型。

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:根据客户之间的关联关系,构建多个联通体网络,其中,每个联通体网络包含至少两个节点,每个节点代表一个客户信息;每个联通体网络中至少包括一个违约客户;对每个联通体网络建立标签;以附带标签的联通体网络作为训练样本,对预先构建的多个二分类模型进行训练;对所述训练后的二分类模型进行评价,选取评价指标最高的训练后的二分类模型作为违约传导风险识别模型。2.根据权利要求1所述的方法,其特征在于,所述对每个联通体网络建立标签包括:将在预设时间内违约客户增加的联通体网络标记为有风险传导的联通体网络;将在预设时间内违约客户未增加的联通体网络标记为无风险传导的联通体网络。3.根据权利要求1所述的方法,其特征在于,所述预先构建的多个二分类模型是基于不同算法建立的。4.根据权利要求1所述的方法,其特征在于,所述客户之间的关联关系包括股权信息、人员信息、交易信息中的至少一种。5.根据权利要求1所述的方法,其特征在于,所述以附带标签的联通体网络作为训练样本,对预先构建的多个二分类模型进行训练包括:提取所述训练样本中客户的特征关系;根据所述特征关系导致发生违约传导的可能性计算所述特征关系的权重值;根据权重值大小对联通体网络是否会发生违约传导风险进行分类。6.根据权利要求3所述的方法,其特征在于,所述特征关系包括客户之间的关联关系或,客户之间的关联关系和客户的自身信息。7.根据权利要求4所述的方法,其特征在于,所述客户的自身信息包括:财务信息、行业类别信息、地域信息、经营信息中的至少一种。8.根据权利要求1所述的方法,其特征在于,所述对所述训练后的二分类模型进行评价,选取评价指标最高的训练后的二分类模型作为违约传导风险识别模型包括:使用预设的测试样本对训练后的二分类模型进行测试;根据测试结果得到各个模型的评价指标,选取评价指标最高的训练后的二分类模型作为违约传导风险识别模型。9.一种违约传导风险识别方法,其特征在于,所述方法包括:根据客户之间的关联关系,构建联通体网络,其中,所述联通体网络包含至少两个节点,每个节点代表一个客户信息;所述联通体网络中至少包括一个违约客户;将所述联通体网络输入至预设的违约传导风险识别模型,得到识别结果,所述预设的违约传导风险识别模型采用如权利要求1-8中任一项所述的方法训练得到。10.一种模型训练装置,其特征在于,所述装置包括:构建模块,根据客户之间的关联关系...

【专利技术属性】
技术研发人员:张志磊李瑾瑜陈明旺王天娇
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1