【技术实现步骤摘要】
一种模型训练方法和系统
本说明书实施例涉及计算机领域,特别涉及一种模型训练方法和系统。
技术介绍
随着信息社会的快速发展,投资理财交易日趋电子化。在多样化的投资理财场景中,海量的业务交易通常会伴随少数违禁违规交易,不利于投资理财业务的管理和稳定发展。在一些情况下,业务交易中可能存在异常状态或非常规状态的交易业务,因此需要对异常交易进行识别并定期跟踪,实现对异常交易的动态管理。可以采用各种方式对异常交易进行识别,其中一种有效的方式为机器学习,采用该种方式,需要用正常交易和异常交易的相关信息训练机器学习模型。然而,在同一时间段内,异常交易的数量远少于正常交易的数量。因此希望有一种能够有效识别少数异常交易的模型训练方法,可以实现对海量交易中少数异常交易的监控。
技术实现思路
本说明书实施例涉及一种模型训练方法。所述方法包括:获取第一时间段内的多个正常样本;获取第二时间段内的多个异常样本,所述第二时间段大于所述第一时间段,同一时间段内正常样本的数量与异常样本的数量差距超过设定阈值;从每个正常样本和异常样本 ...
【技术保护点】
1.一种模型训练方法,包括:/n获取第一时间段内的多个正常样本;/n获取第二时间段内的多个异常样本,所述第二时间段大于所述第一时间段,同一时间段内正常样本的数量与异常样本的数量差距超过设定阈值;/n从每个正常样本和异常样本中提取目标特征;/n根据从所述多个正常样本和所述多个异常样本中提取的目标特征对模型进行训练,得到训练好的模型;/n评估所述训练好的模型;以及/n根据评估结果优化所述训练好的模型。/n
【技术特征摘要】
1.一种模型训练方法,包括:
获取第一时间段内的多个正常样本;
获取第二时间段内的多个异常样本,所述第二时间段大于所述第一时间段,同一时间段内正常样本的数量与异常样本的数量差距超过设定阈值;
从每个正常样本和异常样本中提取目标特征;
根据从所述多个正常样本和所述多个异常样本中提取的目标特征对模型进行训练,得到训练好的模型;
评估所述训练好的模型;以及
根据评估结果优化所述训练好的模型。
2.根据权利要求1所述的方法,所述方法还包括:
对所述多个正常样本和所述多个异常样本的目标特征进行分箱操作,得到至少一个目标特征分箱;
确定每个目标特征分箱的证据权重;
根据所述至少一个目标特征分箱的证据权重对模型进行训练,得到训练好的模型。
3.根据权利要求2所述的方法,所述评估所述训练好的模型,包括对所述训练好的模型进行以下至少一项评估:
模型输出的正常结果与异常结果的数量比是否满足设定条件;
模型效果衰减的幅度是否满足设定条件;或者
所述至少一个目标特征分箱的证据权重是否满足设定条件。
4.根据权利要求3所述的方法,所述评估所述至少一个目标特征分箱的证据权重是否满足设定条件,包括:
评估所述至少一个目标特征分箱数的证据权重是否出现空值;
所述根据评估结果优化所述训练好的模型,包括:
当所述至少一个目标特征分箱数的证据权重出现空值时,重新对所述多个正常样本和所述多个异常样本的目标特征进行分箱操作。
5.根据权利要求1所述的方法,所述根据评估结果优化所述训练好的模型,包括:
调整至少一个目标特征的阈值。
6.根据权利要求1所述的方法,所述方法还包括:
根据所述多个正常样本和/或所述多个异常样本,确定至少一个候选特征;
对所述至少一个候选特征进行相关性检查;
根据所述相关性检查的结果对所述至少一个候选特征进行去重,得到所述目标特征。
7.根据权利要求1所述的方法,所述方法还包括:
根据所述多个正常交易样本确定交易量超过设定阈值的大型交易方;
从所述多个正常交易样本中去除所述大型交易方的交易数据;
根据去除所述大型交易方的交易数据的正常交易样本和所述多个异常交易样本对模型进行训练,得到训练好的模型。
8.根据权利要求1所述的方法,所述方法还包括:
获取更新后的第一时间段内的多个更新后的正常样本;
获取更新后的第二时间段内的多个更新后的异常样本;
根据所述多个更新后的正常样本和所述多个更新后的异常样本对模型进行训练,得到更新后的模型。
9.根据权利要求1所述的方法,所述方法还包括:
根据业务需求确定所述第一时间段和/或所述第二时间段,以使所述多个正常样本与所述多个异常样本的数量比达到设定比例。
10.根据权利要求1所述的方法,所述第二时间段为所述第一时间段之前的一段时间。
11.根据权利要求1所述的方法,所述方法还包括:
标记所述多个正常样本和所述多个异常样本的正常或异常情况;
以所述从所述多个正常样本和所述多个异常样本中提取的目标特征为输入,以所述标记为参考标准对模型进行训练,得到训练好的模型。
12.一种模型训练系统,包括:
获取模块,用于获取第一时间段内的多个正常样本,还用于获取第二时间段内的多个异常样本,所述第二时间段大于所述第一时间段,同一时间段内正常样本的数量...
【专利技术属性】
技术研发人员:李杨,邓天成,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。