用于构建风险控制模型的方法和系统技术方案

技术编号:22308912 阅读:37 留言:0更新日期:2019-10-16 08:59
本公开提供了一种用于高效地构建风险控制模型的方法,包括:构建基础模型库以在触发新业务时选择基础模型库中的模型,来搭建缺省模型;通过自动特征生成、自动特征选择和自动调参来构建适合新业务的新模型;经由迁移学习训练缺省模型和新模型;自动融合经训练的缺省模型和经训练的新模型,以生成融合模型;将经训练的缺省模型用作线上模型,并将经训练的新模型和融合模型用作备份模型;以及当备份模型之一优于线上模型时,用该备份模型替代线上模型。

Methods and systems for building risk control models

【技术实现步骤摘要】
用于构建风险控制模型的方法和系统
本公开主要涉及风险控制,尤其涉及风险控制模型。
技术介绍
互联网金融的风险控制涉及交易和资金风险防控,包括盗用、欺诈、营销作弊、垃圾注册识别和决策等。以在超市收银台以手机APP进行支付的场景为例,风险控制系统需要检查手机账户是否被盗用、是否欺诈被骗、是否有违法套现等。在实践中,不同的风险类型会给模型的构建和更新带来不同的挑战。当前,风险控制模型在开发和部署的过程中主要碰到两个比较大的问题。一个问题是新建模型流程复杂,其中的数据清洗、模型训练、模型部署都需要耗费大量的人力,平均一个模型开发和部署耗时超过1个月。这导致针对新业务,模型响应速度比较慢。另一个问题是模型迭代周期长,整个模型的更新需要耗费大量人力和时间来进行重训和部署。这导致风险对抗能力比较差,因为风险无时不在变化,有很强的对抗性。本领域需要一种高效的用于构建风险控制模型的方法和系统,可针对新站点、新场景快速上线模型,从而为针对时刻变化的风险快速更新和迭代模型奠定基础。
技术实现思路
为解决上述技术问题,本公开提供了一种高效的用于构建风险控制模型的方案。在本公开一实施例中,提供了一种用于高效地构建风险控制模型的方法,包括:构建基础模型库以在触发新业务时选择基础模型库中的模型,来搭建缺省模型;通过自动特征生成、自动特征选择和自动调参来构建适合新业务的新模型;经由迁移学习训练缺省模型和新模型;自动融合经训练的缺省模型和经训练的新模型,以生成融合模型;将经训练的缺省模型用作线上模型,并将经训练的新模型和融合模型用作备份模型;以及当备份模型之一优于线上模型时,用该备份模型替代线上模型。在本公开的另一实施例中,搭建缺省模型进一步包括:针对各个场景提炼风险模块;针对每个风险模块构建基础模型,并基于基础模型构建基础模型库;在触发新业务时,选取基础模型库中的对应基础模型;以及使用对应基础模型搭建出适合新业务的缺省模型。在本公开的又一实施例中,所提炼的风险模块包括主动方、被动方、设备、环境、行为、关系、冲突、突变和FTG(FraudtoGross)。在本公开的另一实施例中,构建新模型进一步包括:获取原有变量池;基于原有变量池中的原有变量自动生成不同类型的特征;从原有变量池和自动生成的特征中选择适合场景的变量,以生成变量列表;针对变量列表进行自动调参;以及获取适合场景的新模型。在本公开的又一实施例中,自动特征生成包括对原有的特征进行转换、计算以及聚合而产生新的候选特征。在本公开的另一实施例中,自动特征选择涉及特征子集搜索和特征子集评价。在本公开的又一实施例中,自动调参采用网格搜索、随机搜索以及贝叶斯优化之一。在本公开一实施例中,提供了一种用于高效地构建风险控制模型的系统,包括:缺省模型搭建模块,其构建基础模型库以在触发新业务时选择基础模型库中的模型,来搭建缺省模型;新模型构建模块,其通过自动特征生成、自动特征选择和自动调参来构建适合新业务的新模型;模型训练模块,其经由迁移学习训练缺省模型和新模型;融合模型生成模块,其自动融合经训练的缺省模型和经训练的新模型,以生成融合模型;最优模型选择模块,其将经训练的缺省模型用作线上模型,并将经训练的新模型和融合模型用作备份模型,并且当备份模型之一优于线上模型时用该备份模型替代线上模型。在本公开的另一实施例中,缺省模型搭建模块进一步:针对各个场景提炼风险模块;针对每个风险模块构建基础模型,并基于基础模型构建基础模型库;在触发新业务时,选取基础模型库中的对应基础模型;以及使用对应基础模型搭建出适合新业务的缺省模型。在本公开的又一实施例中,所提炼的风险模块可包括主动方、被动方、设备、环境、行为、关系、冲突、突变和FTG(FraudtoGross)。在本公开的另一实施例中,新模型构建模块进一步:获取原有变量池;基于原有变量池中的原有变量自动生成不同类型的特征;从原有变量池和自动生成的特征中选择适合场景的变量,以生成变量列表;针对变量列表进行自动调参;以及获取适合场景的新模型。在本公开的又一实施例中,新模型构建模块进行自动特征生成包括对原有的特征进行转换、计算以及聚合而产生新的候选特征。在本公开的另一实施例中,新模型构建模块进行自动特征选择涉及特征子集搜索和特征子集评价。在本公开的又一实施例中,新模型构建模块进行自动调参采用网格搜索、随机搜索以及贝叶斯优化之一。在本公开一实施例中,提供了一种存储有指令的计算机可读存储介质,当这些指令被执行时使得机器执行如前所述的方法。提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的一些概念。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。附图说明本公开的以上
技术实现思路
以及下面的具体实施方式在结合附图阅读时会得到更好的理解。需要说明的是,附图仅作为所请求保护的专利技术的示例。在附图中,相同的附图标记代表相同或类似的元素。图1示出根据本公开一实施例的用于高效地构建风险控制模型的方法的流程图;图2示出根据本公开一实施例的用于高效地构建风险控制模型的方法的示意图;图3示出根据本公开一实施例的用于搭建缺省模型的过程的流程图;图4示出根据本公开一实施例的用于搭建缺省模型的过程的示意图;图5示出根据本公开一实施例的用于自动构建新模型的过程的流程图;图6示出根据本公开另一实施例的用于自动构建新模型的过程的示意图;图7示出根据本公开一实施例的用于高效地构建风险控制模型的系统的框图;图8示出根据本公开一实施例的用于高效地更新风险控制模型的方法的流程图;图9示出根据本公开一实施例的用于高效地更新风险控制模型的方法的示意图;图10示出根据本公开一实施例的用于高效地更新风险控制模型的系统的框图。具体实施方式为使得本公开的上述目的、特征和优点能更加明显易懂,以下结合附图对本公开的具体实施方式作详细说明。在下面的描述中阐述了很多具体细节以便于充分理解本公开,但是本公开还可以采用其它不同于在此描述的其它方式来实施,因此本公开不受下文公开的具体实施例的限制。互联网金融的风险控制涉及交易和资金风险防控。移动支付在带给人们便捷生活的同时,也面临着网络欺诈的空前挑战。在下文中,本公开将以网络欺诈为例,描述如何高效地构建风险控制模型以防控网络欺诈。本领域技术人员将能够理解,本公开的技术方案中所构建的风险控制模型并不仅限于用来防控网络欺诈,其可被广泛用于各种类型的交易和资金风险的风险防控。本公开提出了一种用于高效地构建风险控制模型的方案。针对当前本领域内新建模型流程复杂,其中的数据清洗、模型训练、模型部署都需要耗费大量的人力的问题,本公开的技术方案基于基础模型搭建、自动模型构建和融合模型生成,通过线上模型与备份模型的实时竞争,高效地构建出具有不断新增的风险特征挖掘和优化算法迭代的模型。本公开还提出了一种用于高效地更新风险控制模型的方案。该方案可以针对时刻变化的风险实现模型的快速更新和迭代,大大增加模型的自适应能力,来提升对风险的防控能力。于此同时,自动再拟合(refit)、自动重训练(retrain)、在线学习(onlinelearning)等将大大缩短模型训练和部署的周期,提升模型开发的效率。因此,本公开的技术方案不仅提供了通用的技术框架和解决方案,还提本文档来自技高网
...

【技术保护点】
1.一种用于高效地构建风险控制模型的方法,包括:构建基础模型库以在触发新业务时选择所述基础模型库中的模型,来搭建缺省模型;通过自动特征生成、自动特征选择和自动调参来构建适合所述新业务的新模型;经由迁移学习训练所述缺省模型和所述新模型;自动融合经训练的所述缺省模型和经训练的所述新模型,以生成融合模型;将经训练的所述缺省模型用作线上模型,并将经训练的所述新模型和所述融合模型用作备份模型;以及当所述备份模型之一优于所述线上模型时,用该备份模型替代所述线上模型。

【技术特征摘要】
1.一种用于高效地构建风险控制模型的方法,包括:构建基础模型库以在触发新业务时选择所述基础模型库中的模型,来搭建缺省模型;通过自动特征生成、自动特征选择和自动调参来构建适合所述新业务的新模型;经由迁移学习训练所述缺省模型和所述新模型;自动融合经训练的所述缺省模型和经训练的所述新模型,以生成融合模型;将经训练的所述缺省模型用作线上模型,并将经训练的所述新模型和所述融合模型用作备份模型;以及当所述备份模型之一优于所述线上模型时,用该备份模型替代所述线上模型。2.如权利要求1所述的方法,其特征在于,搭建缺省模型进一步包括:针对各个场景提炼风险模块;针对每个风险模块构建基础模型,并基于所述基础模型构建基础模型库;在触发新业务时,选取所述基础模型库中的对应基础模型;以及使用对应基础模型搭建出适合新业务的缺省模型。3.如权利要求2所述的方法,其特征在于,所提炼的风险模块可包括主动方、被动方、设备、环境、行为、关系、冲突、突变和FTG(FraudtoGross)。4.如权利要求1所述的方法,其特征在于,构建新模型进一步包括:获取原有变量池;基于所述原有变量池中的原有变量自动生成不同类型的特征;从所述原有变量池和所述自动生成的特征中选择适合场景的变量,以生成变量列表;针对所述变量列表进行自动调参;以及获取适合场景的新模型。5.如权利要求1所述的方法,其特征在于,所述自动特征生成包括对原有的特征进行转换、计算以及聚合而产生新的候选特征。6.如权利要求1所述的方法,其特征在于,所述自动特征选择涉及特征子集搜索和特征子集评价。7.如权利要求1所述的方法,其特征在于,所述自动调参采用网格搜索、随机搜索以及贝叶斯优化之一。8.一种用于高效地构建风险控制模型的系统,包括:缺省模型搭建模块,其构建基础模型库以在触发新业务时选择所述基础模型库中的模型,来搭建缺省...

【专利技术属性】
技术研发人员:金宏王维强赵闻飙
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1