当前位置: 首页 > 专利查询>贝宝公司专利>正文

基于交易后数据的机器学习制造技术

技术编号:29071405 阅读:15 留言:0更新日期:2021-06-30 09:25
公开了与使用交易后信息对交易进行分类有关的技术。可以使用用于一组交易的第一数据作为训练数据输入来训练第一分类器模块,其中第一数据包括交易前信息和交易后信息。在所公开的技术中,在训练第一分类器模块过程中,用于一组交易中的交易的正确分类是已知的。在所公开的技术中,训练架构基于经训练的第一分类器对一组交易中的多个交易的分类输出,为多个交易生成各自的权重。在所公开的技术中,训练架构基于生成的权重使用用于一组交易的第二数据作为训练数据输入来训练第二分类器模块。在一些实施例中,经训练的第二分类器模块仅基于用于一个或多个未决交易的交易前信息对一个或多个未决交易进行分类。个或多个未决交易进行分类。个或多个未决交易进行分类。

【技术实现步骤摘要】
【国外来华专利技术】基于交易后数据的机器学习


[0001]本公开总体上涉及机器学习分类器,并且更具体而言,涉及基于交易后数据使用实例权重的训练分类器。

技术介绍

[0002]可以出于各种原因对交易(包括出于进一步检查而识别某些类型的交易(例如,出于计算机安全目的而检测异常交易))进行分类。机器学习可以用于训练各种类型的分类器来识别交易类型。历来仅基于交易完成之前可用的信息来训练分类器(例如,因为这是对交易进行实时分类时唯一可用的信息)。一般而言,提高分类器的准确性可以减少或避免安全问题。
附图说明
[0003]图1A是示出根据一些实施例的使用交易后信息来生成用于训练数据的权重的示例性训练架构的框图。
[0004]图1B是示出根据一些实施例的根据图1A的架构来训练的示例性分类器的框图。
[0005]图2示出根据一些实施例的与训练交易有关的示例性交易前信息和交易后信息。
[0006]图3示出根据一些实施例的指示与未决交易(pending transaction)有关的交易前信息和交易后信息的示例性时间线。
[0007]图4A是示出根据一些实施例的针对来自教师分类器的不同输出值的示例性数量的交易的图示。
[0008]图4B是示出根据一些实施例的基于来自教师分类器的输出值而具有不同的分配权重的示例性数量的交易的图示。
[0009]图5A是示出根据一些实施例的,相对于图4A的图示,来自具有更多低置信度输出值的教师分类器的不同输出值的示例性数量的交易的图示。
[0010]图5B是示出根据一些实施例的基于图5A的输出值而具有不同权重的示例性数量的交易的图示。
[0011]图6是示出根据一些实施例的用于使用一个或多个生成的权重来训练分类模块的示例性方法的框图。
[0012]图7是示出根据一些实施例的示例性计算设备的框图。
[0013]本说明书包括对各种实施例的引用,以指示本公开并非旨在指代一个特定的实施方式,而是指代落入包括所附权利要求在内的本公开精神内的一系列实施例。可以以与本公开一致的任何合适的方式来组合特定特征、结构或特性。
[0014]在本公开内,可以将不同实体(可以以不同的名称称为“单元”、“电路”、其他部件等)描述或要求保护为“被配置”成执行一个或多个任务或操作。在本文中使用此表述—(被配置成[执行一个或多个任务]的[实体])来指代结构(即,诸如电子电路之类的实体事物)。更具体而言,此表述用于指示此结构被布置成在操作过程中执行一个或多个任务。可以说
某个结构被“配置成”执行某个任务(即使此结构当前未在操作中)。“被配置成对一个或多个交易进行分类的经训练的交易分类器”旨在涵盖,例如,在操作过程中执行此功能的设备(即使当前未使用相应的设备(例如,当其电池未与之连接时))。因此,被描述或叙述为“被配置成”执行某个任务的实体是指实体事物,诸如,存储可执行以执行任务的程序指令的设备、电路、内存等。此短语在本文中不用于指代无形事物。
[0015]“被配置成”一词并不旨在表示“可配置成”。例如,尽管未编程的移动计算设备可以是“可配置成”执行某个特定功能,但它不会被视为“被配置成”执行此功能。在适当的编程之后,移动计算设备可以被配置成执行此功能。
[0016]在所附权利要求中陈述了一种结构“被配置成”执行一个或多个任务的明确意图是不对权利要求要素引用35U.S.C.
§
112(f)。因此,所提交的本申请中的权利要求均不应被解释为具有装置加功能元件。如果申请人希望在专利审查程序过程中引用第112(f)条,则将使用“用于
……
的装置”[执行功能]构造来陈述权利要求要素。
[0017]如本文所用,“基于”一词用于描述影响确定的一个或多个因素。此词语不排除额外的因素可能会影响确定的可能性。也就是说,确定可以仅基于指定因素或基于指定因素以及其他未指定因素。考量一下短语“基于B来确定A”。此短语指定B是一个因素,且用于确定A或影响A的确定。此短语不排除对A的确定也可以基于其他因素,诸如,C。此短语还旨在涵盖其中仅基于B来确定A的实施例。如本文所用,短语“基于”与短语“至少部分基于”同义。
[0018]如本文所用,术语“处理元件”是指被配置成执行程序指令(或其部分或其组合)的各种元件。处理元件包括,例如,ASIC(专用集成电路)之类的电路,单个处理器核心的部分或电路,整个处理器核心,单个处理器,现场可编程门阵列(FPGA)之类的可编程硬件设备,和/或包括多个处理器的系统的较大部分,及其任何组合。
具体实施方式
[0019]公开了用于使用机器学习技术以基于交易后数据生成的权重来训练交易分类器的技术。当对交易进行实时分类时(例如,确定是否核准交易),交易后信息在分类时不可用。因此,交易后信息历来没有被用于训练分类器。
[0020]然而,在所公开的实施例中,基于交易后数据来训练教师分类器,并且使用此教师分类器来生成实例权重(例如,每个交易的权重用作训练输入)。然后,可以使用实例权重来训练实时分类器。例如,高度加权的交易可能对训练实时分类器有更大的影响。在各种实施例中,在分类器训练中使用交易后信息可以提高交易分类器的准确性,并且进而可以提高某些类型的交易(例如,不合要求的交易)的捕获率。
[0021]训练架构和实时分类的概述
[0022]图1A是示出根据一些实施例的示例性训练架构的框图,此示例性训练架构使用交易后信息来生成用于训练数据的权重。在所示的实施例中,训练架构100包括教师分类器110、权重生成器模块120,以及交易分类器130。在所示的实施例中,训练架构100产生经训练的交易分类器140,下面将参考图1B进行讨论。在各种实施例中,图1A的元件中的一者或多者可以访问用于训练交易的已知的正确分类。
[0023]在图1A中,教师分类器110接收交易前信息和交易后信息作为输入。在所示的实施例中,教师分类器110生成分类器输出。在一些实施例中,分类器输出指示交易处于某个类
别中的预测可能性。例如,对于具有两个类别输出的分类器,可以使用介于0和1之间的值来指示概率,其中值为0指示发生第一类交易(例如,正常交易)的可能性很高,而值为1指示发生第二类交易(例如,诈骗性交易)的可能性很高。介于两者之间的值可指示置信度较低的预测。例如,值为0.4可指示交易可能正常,但置信度相当低。出于说明的目的,包括了用于分类器输出的示例性数值范围0到1,但并不意图限制本公开的范围;可以设想其他输出范围和其他数量的类别。分类器输出的示例性集合在下面参考图4A和图5A讨论。
[0024]在所示的实施例中,权重生成器模块120基于来自教师分类器110的分类器输出来生成用于交易的权重。在所示的实施例中,权重生成器模块120将生成的用于训练的交易前权重传送到交易分类器130。在一些实施例中,基于教师分类器110的输出,使用各种不同的加权技术来生成权重。在输出范围为0到1的一些实施例中,将分类器110本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:使用用于一组交易的第一数据作为训练数据输入来训练第一分类器模块,其中,所述第一数据包括用于所述一组交易中的交易的交易前信息和交易后信息两者,并且其中,用于所述一组交易中的交易的正确分类是已知的;基于经训练的第一分类器对所述一组交易中的多个交易的分类输出,为所述多个交易生成各自的权重;基于所生成的权重使用用于所述一组交易的第二数据作为训练数据输入来训练第二分类器模块;以及仅基于用于一个或多个未决交易的交易前信息,使用经训练的第二分类器模块,对所述一个或多个未决交易进行分类。2.根据权利要求1所述的方法,其中,基于所生成的权重进行训练包括以下项中的一者或多者:基于第一交易的权重大于第二交易的权重,对所述第一交易执行比所述第二交易更多的训练迭代;或者基于第一交易的权重大于第二交易的权重,对所述第一交易执行比所述第二交易更大的训练调整。3.根据权利要求1所述的方法,其中,生成各自的权重是使用多种不同的加权技术以生成多组权重来执行的;其中,训练所述第二分类器模块是使用所述多组权重针对所述第二分类器模块的多个版本执行的;其中,所述方法还包括:选择所述第二分类器模块的多个版本中的经训练的版本。4.根据权利要求1所述的方法,其中,基于正确的分类与由经训练的第一分类器模块为所述交易而生成的输出预测之间的关系来生成各自的权重。5.根据权利要求1所述的方法,其中,生成各自的权重为输出预测距所述正确分类较远的交易提供更大的权重。6.根据权利要求1所述的方法,其中,基于所生成的权重来训练所述第二分类器模块是使用梯度提升树机器学习技术来执行的。7.根据权利要求1所述的方法,其中,用于所述一组交易中的第一交易的交易后信息包括用于在所述第一交易之后执行的一个或多个交易以及与所述第一交易相关联的用户的非交易活动的信息。8.根据权利要求1所述的方法,其中,用于所述一组交易的第二数据包括用于所述一组交易中的交易的交易前信息,并且不包括用于所述一组交易中的交易的交易后信息。9.根据权利要求1所述的方法,其中,加权指示不使用所述一组交易中的一个或多个交易来训练所述第二分类器模块。10.一种非暂时性计算机可读介质,其上存储有指令,所述指令能够由计算设备执行,以执行以下操作,所述操作包括:使用用于一组交易的第一数据作为训练数据输入来训练第一分类器模块,其中,所述第一数据包括用于所述一组交易中的交易的交易前信息和交易后信息两者,并且其中,用于所述一组交易中的交易的正确分类是已知的;
基于经训练的第一分类器对所述一组交易中的多个交...

【专利技术属性】
技术研发人员:莫因
申请(专利权)人:贝宝公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1