基于第二模型获取第一模型的训练样本的方法和装置制造方法及图纸

技术编号:20567200 阅读:48 留言:0更新日期:2019-03-14 09:43
本说明书实施例提供一种基于第二模型获取第一模型的训练样本的方法和装置,所述方法包括:获取至少一个第一样本,每个第一样本包括特征数据和标签值,所述标签值与第一模型的预测值相对应;以及将所述至少一个第一样本的特征数据分别输入所述第二模型以使得第二模型分别基于各个第一样本的特征数据进行多次输出,并基于所述第二模型分别输出的各个输出值,从所述至少一个第一样本中获取用于训练所述第一模型的第一训练样本集,其中,所述输出值预测是否选择相应的第一样本作为训练样本。

【技术实现步骤摘要】
基于第二模型获取第一模型的训练样本的方法和装置
本说明书实施例涉及机器学习,更具体地,涉及一种基于第二模型获取第一模型的训练样本的方法和装置。
技术介绍
在例如支付宝的支付平台中,每天都有上亿的现金交易,其中有非常小的比例的欺诈交易。因此,需要通过反欺诈模型把欺诈交易识别出来,所述反欺诈模型例如为交易可信模型、反套现模型、盗卡盗账户模型等等。为了训练上述反欺诈模型,通常将欺诈交易作为正例,将非欺诈交易作为负例。通常,正例会远远少于负例,比如说在千分之一,万分之一,十万分之一。因此,直接应用传统的机器学习训练方法训练上述反欺诈模型时,很难训练好该模型。目前已有的解决方案是对正例进行升采样,或者对负例进行降采样。因此,需要一种更有效的获取模型的训练样本的方案。
技术实现思路
本说明书实施例旨在提供一种更有效的获取模型的训练样本的方案,以解决现有技术中的不足。为实现上述目的,本说明书一个方面提供一种基于第二模型获取第一模型的训练样本的方法,包括:获取至少一个第一样本,每个第一样本包括特征数据和标签值,所述标签值与第一模型的预测值相对应;以及将所述至少一个第一样本的特征数据分别输入所述第二模型以本文档来自技高网...

【技术保护点】
1.一种基于第二模型获取第一模型的训练样本的方法,包括:获取至少一个第一样本,每个第一样本包括特征数据和标签值,所述标签值与第一模型的预测值相对应;以及将所述至少一个第一样本的特征数据分别输入所述第二模型以使得第二模型分别基于各个第一样本的特征数据进行多次输出,并基于所述第二模型分别输出的各个输出值,从所述至少一个第一样本中获取用于训练所述第一模型的第一训练样本集,其中,所述输出值预测是否选择相应的第一样本作为训练样本。

【技术特征摘要】
1.一种基于第二模型获取第一模型的训练样本的方法,包括:获取至少一个第一样本,每个第一样本包括特征数据和标签值,所述标签值与第一模型的预测值相对应;以及将所述至少一个第一样本的特征数据分别输入所述第二模型以使得第二模型分别基于各个第一样本的特征数据进行多次输出,并基于所述第二模型分别输出的各个输出值,从所述至少一个第一样本中获取用于训练所述第一模型的第一训练样本集,其中,所述输出值预测是否选择相应的第一样本作为训练样本。2.根据权利要求1所述的方法,其中,所述第二模型包括与输入的样本的特征数据对应的概率函数、基于所述概率函数计算选择该样本作为所述第一模型的训练样本的概率,并基于该概率输出相应的输出值,所述第二模型通过以下训练步骤训练:获取至少一个第二样本,每个第二样本包括特征数据和标签值,所述标签值与第一模型的预测值相对应;将所述至少一个第二样本的特征数据分别输入所述第二模型以使得第二模型分别基于各个第二样本的特征数据进行多次输出,并基于所述第二模型分别输出的各个输出值,从所述至少一个第二样本中确定所述第一模型的第二训练样本集,其中,所述输出值预测是否选择相应的第二样本作为训练样本;使用所述第二训练样本集训练所述第一模型,获取训练后的第一模型基于预定多个测试样本的第一预测损失;基于所述第一预测损失计算与所述第二模型的多次输出对应的回报值;以及基于所述至少一个第二样本的特征数据、所述第二模型中与各个特征数据分别对应的概率函数、所述第二模型分别相对于各个特征数据的各个输出值、及所述回报值,通过策略梯度算法训练所述第二模型。3.根据权利要求2所述的方法,还包括,在获取训练后的第一模型基于预定多个测试样本的第一预测损失之后,将所述第一模型恢复为该训练之前的模型。4.根据权利要求2或3所述的方法,所述回报值等于初始预测损失减去所述第一预测损失之差,其中,所述方法还包括:在获取至少一个第二样本之后,从所述至少一个第二样本随机获取初始训练样本集;以及使用所述初始训练样本集训练所述第一模型,获取该训练后的第一模型基于所述多个测试样本的初始预测损失。5.根据权利要求2或3所述的方法,其中,所述训练步骤循环多次,所述回报值等于当前训练的上一次训练中的第一预测损失减去当前训练中的所述第一预测损失之差。6.根据权利要求2所述的方法,其中,所述至少一个第一样本与所述至少一个第二样本相同或不同。7.根据权利要求1所述的方法,其中,所述第一模型为反欺诈模型,所述特征数据为交易的特征数据,所述标签值指示该交易是否为欺诈交易。8.一种基于第二模型获取第一模型的训练样本的装置,包括:第一样本获取单元,配置为,获取至少一个第一样本,每个第一样本包括特征数据和标签值,所述标签值与第一模型的预测值相对应;以及输入单元,配置为,将所述至少一个第一样本的特...

【专利技术属性】
技术研发人员:陈岑周俊陈超超李小龙
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1