一种机器学习模型的训练方法、装置以及电子设备制造方法及图纸

技术编号:17468063 阅读:69 留言:0更新日期:2018-03-15 05:23
本说明书提供一种机器学习模型的训练方法,包括:将训练样本集合中携带风险标签的样本标记为正样本,未携带风险标签的样本标记为负样本;基于标记的所述正样本和负样本训练有监督的风险模型,并基于训练完成的模型对所述负样本分别进行风险评估得到风险评分;过滤所述训练样本集合中所述风险评分大于预设阈值的负样本;基于过滤后的所述训练样本集合中的正样本和负样本重新训练有监督的风险模型。

【技术实现步骤摘要】
一种机器学习模型的训练方法、装置以及电子设备
本说明书涉及计算机应用领域,尤其涉及一种机器学习模型的训练方法、装置以及电子设备。
技术介绍
在移动支付领域,出于支付安全上的考虑,支付平台通常都会在风控系统中部署通过有监督的机器学习训练构建出的风险模型,对用户的日常交易进行风险评分,以及时的发现用户的异常交易。在训练风险模型时,通常可以将那些发生了交易异常的交易标记为正样本(比如用户主动报案的账户盗用等),其余未发生交易异常的交易标记为负样本。然后可以基于这些正样本和负样本进行有监督的机器学习训练。当模型训练完毕,后续可以使用该模型对用户的日常交易进行风险评分,进而支付平台可以基于用户日常交易的风险评分来进行风险决策,及时的发现用户的异常交易。
技术实现思路
本说明书提出一种机器学习模型的训练方法,包括:将训练样本集合中携带风险标签的样本标记为正样本,未携带风险标签的样本标记为负样本;基于标记的所述正样本和负样本训练有监督的风险模型,并基于训练完成的模型对所述负样本分别进行风险评估得到风险评分;过滤所述训练样本集合中所述风险评分大于预设阈值的负样本;基于过滤后的所述训练样本集合中的正样本和本文档来自技高网...
一种机器学习模型的训练方法、装置以及电子设备

【技术保护点】
一种机器学习模型的训练方法,包括:将训练样本集合中携带风险标签的样本标记为正样本,未携带风险标签的样本标记为负样本;基于标记的所述正样本和负样本训练有监督的风险模型,并基于训练完成的模型对所述负样本分别进行风险评估得到风险评分;过滤所述训练样本集合中所述风险评分大于预设阈值的负样本;基于过滤后的所述训练样本集合中的正样本和负样本重新训练有监督的风险模型。

【技术特征摘要】
1.一种机器学习模型的训练方法,包括:将训练样本集合中携带风险标签的样本标记为正样本,未携带风险标签的样本标记为负样本;基于标记的所述正样本和负样本训练有监督的风险模型,并基于训练完成的模型对所述负样本分别进行风险评估得到风险评分;过滤所述训练样本集合中所述风险评分大于预设阈值的负样本;基于过滤后的所述训练样本集合中的正样本和负样本重新训练有监督的风险模型。2.根据权利要求1所述的方法,所述过滤所述训练样本集合中所述风险评分大于预设阈值的负样本,包括:删除所述训练样本集合中所述风险评分大于预设阈值的负样本。3.根据权利要求1所述的方法,所述过滤所述训练样本集合中所述风险评分大于预设阈值的负样本,包括:将所述训练样本集合中所述风险评分大于预设阈值的负样本重新标记为正样本。4.根据权利要求3所述的方法,所述基于过滤后的所述训练样本集合中的正样本和负样本重新训练有监督的风险模型,包括:为重新标记的正样本与所述训练样本集合中原有的正样本对应的损失函数,分别配置权重值;其中,所述重新标记的正样本对应的损失函数的权重值,小于所述原有的正样本对应的损失函数的权重值;基于所述重新标记的正样本、所述训练样本集合中原有的正样本以及所述训练样本集合中剩余的负样本训练有监督的风险模型。5.根据权利要求4所述的方法,所述风险评分表征风险发生概率;所述方法还包括:将所述风险评分大于预设阈值的负样本重新标记为正样本后,将所述正样本的风险评分配置为该重新标记的负样本对应的损失函数的权重值;以及,将原有的负样本对应的损失函数的权重值设置为1。6.根据权利要求1所述的方法,还包括:基于在线数据构建预测样本;基于重新训练的模型对该预测样本进行风险评估得到风险评分。7.一种机器学习模型的训练装置,包括:标记模块,将训练样本集合中携带风险标签的样本标记为正样本,未携带风险标签的样本标记为负样本;评估模块,基于标记的所述正样本和负样本训练有监督的风险模型,并基于训...

【专利技术属性】
技术研发人员:郭龙
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1