机器学习模型的建模方法及装置制造方法及图纸

技术编号:16102174 阅读:20 留言:0更新日期:2017-08-29 22:41
本发明专利技术提供了机器学习模型的建模方法及装置,通过针对每一个中间目标变量所对应的机器学习子模型进行训练,获得各机器学习子模型的概率值,进而将各机器学习子模型的概率值进行概率求和,基于求和所获得的目标概率值以及用于描述交易行为的特征变量建立用于判定目标行为的目标机器学习模型。在虚假交易判断的应用场景中,目标行为即为虚假交易,从而每一个机器学习子模型用于判定对应的中间目标变量所指示的虚假交易类型,对各机器学习子模型的概率值进行概率求和就能够获得用于判定属于多种虚假交易类型中的至少一种的概率,基于这一概率值所构建的模型便能够对于多种虚假交易类型进行判定,实现了节省成本,提高虚假交易的识别效率的目的。

【技术实现步骤摘要】
机器学习模型的建模方法及装置
本专利技术涉及计算机技术,尤其涉及一种机器学习模型的建模方法及装置。
技术介绍
在利用机器学习模型进行行为模式的判定时,往往采用针对同属于某一种目标行为的各种具体行为进行共性特征提取,从而依据这些共性特征构建机器学习模型。在判定某一个具体行为是否属于该目标行为时,所构建的机器学习模型依据其是否具有这些共性特征,来确定是否为该目标行为。以网络中的虚假交易为例,虚假交易是指卖方用户和/或买方用户通过虚构或隐瞒交易事实、规避或恶意利用信用记录规则、干扰或妨害信用记录秩序等不正当方式获取虚假的商品销量、店铺评分、信用积分或商品评论等不当利益的行为。例如现在已经出现了刷单、炒信、套现和制造虚假订单贷款等虚假交易类型,为了规范网络交易行为,需要对虚假交易这种行为模式进行判定。由于虚假交易有着不同的类型,每一种类型的虚假交易又有着多种具体的实现方式,同时各种类型虚假交易之间的交易行为差异较大,在现有技术中,无法采用提取共性特征的方式构建用于判断虚假交易的机器模型,因此,现有技术中采用了每一个机器学习模型针对某一种实现形式或者一个类型的虚假交易进行判定的方式。在利用机器学习模型识别虚假交易时,便需要建立多个模型,需要耗费大量成本,识别效率较低。
技术实现思路
本专利技术提供一种机器学习模型的建模方法及装置,用于构建一个能够适用于在目标行为具有多种不同类型的实现形式时,对目标行为进行综合判定的机器学习模型,从而节省成本,提高识别效率。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面,提供了一种机器学习模型的建模方法,包括:获得互斥的各中间目标变量;其中,所述中间目标变量用于指示虚假交易的类型;分别对各中间目标变量对应的机器学习子模型进行训练,获得各机器学习子模型的概率值;其中,所述机器学习子模型用于根据描述交易行为的特征变量判定对应中间目标变量指示的虚假交易类型;对各机器学习子模型的概率值进行概率求和,获得目标概率值;根据所述目标概率值和所述特征变量,建立用于判定虚假交易的目标机器学习模型。第二方面,提供了一种机器学习模型的建模装置,包括:获得模块,用于获得互斥的各中间目标变量;其中,所述中间目标变量用于指示虚假交易的类型;训练模块,用于分别对各中间目标变量对应的机器学习子模型进行训练,获得各机器学习子模型的概率值;其中,所述机器学习子模型用于根据描述交易行为的特征变量判定对应中间目标变量指示的虚假交易类型;求和模块,用于对各机器学习子模型的概率值进行概率求和,获得目标概率值;建模模块,用于根据所述目标概率值和所述特征变量,建立用于判定虚假交易的目标机器学习模型。本专利技术实施例提供的机器学习模型的建模方法及装置,通过针对每一个中间目标变量所对应的机器学习子模型进行训练,获得各机器学习子模型的概率值,进而将各机器学习子模型的概率值进行概率求和,基于求和所获得的目标概率值以及用于描述交易行为的特征变量建立用于判定目标行为的目标机器学习模型。由于每一个机器学习子模型用于判定目标行为的某一特定类型,对各机器学习子模型的概率值进行概率求和,从而获得样本属于多种目标行为类型中的至少一种类型的概率,基于这一概率所构建的机器学习模型可以用于对目标行为进行综合判定。举例来说,若将这种建模方法应用于虚假交易的应用场景中,所构建的模型便能够对于虚假交易进行综合判定,而无需现有技术中需要针对虚假交易的不同实现形式或类型构建多个模型,实现了节省成本,提高虚假交易的识别效率的目的。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本专利技术实施例一提供的一种机器学习模型的建模方法的流程示意图;图2为本专利技术实施例二提供的一种机器学习模型的建模方法的流程示意图;图3为重构目标变量的流程示意图;图4为本专利技术实施例三提供的一种机器学习模型的建模装置的结构示意图;图5为本专利技术实施例四提供的一种机器学习模型的建模装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。下面结合附图对本专利技术实施例提供的机器学习模型的建模方法及装置进行详细描述。实施例一图1为本专利技术实施例一提供的一种机器学习模型的建模方法的流程示意图,本实施例所提供的方法,可以用于进行虚假交易的判断中,也就是说,本实施例中所提及的目标行为可以为虚假交易,本实施例所提供的方法还可以用于其他异常交易中,本实施例中对此不做限定,如图1所示,包括:步骤101、分别对各中间目标变量对应的机器学习子模型进行训练,获得各机器学习子模型的概率值。其中,机器学习子模型用于根据描述交易行为的特征变量判定对应中间目标变量指示的目标行为类型。具体地,目标行为有着多种实现形式,可以将交易行为相似的实现形式划分为一种类型,从而使得在每一种类型的内部,交易行为是相似的,但每一种类型之间的交易行为往往具有较大的差异性。例如,在虚假交易判定的应用场景中,虚假交易有着多种实现形式,在刷单、套现、骗贷和炒信的实现形式中,炒信和刷单的交易行为相似性较高,可以划分为一个类型,而套现和骗贷的交易行为则与之具有较大差异,可以分别作为一个类型。在进行目标行为的类别划分时,可以根据用于指示目标行为的具体实现形式的初始目标变量之间的相容或互斥状态,对相容的初始目标变量进行合并,获得相互之间为互斥状态的中间目标变量。若不同实现形式的目标行为的交易行为差异性较大,则不同实现形式所对应的初始目标变量之间为相斥的;若不同实现形式的目标行为的交易行为差异性较小,则不同实现形式所对应的初始目标变量之间为相容的。构建各中间目标变量对应的机器学习子模型,机器学习子模型是一个二分类模型,用于根据描述交易行为的特征变量判定样本是否属于对应中间目标变量指示的目标行为类型。利用训练样本,对各机器学习子模型进行训练,获得各机器学习子模型的概率值。步骤102、对各机器学习子模型的概率值进行概率求和,获得目标概率值。由于每一个机器学习子模型用于判定对应的中间目标变量所指示的目标行为类型,对各机器学习子模型的概率值进行概率求和就能够获得用于判定属于多种目标行为类型中的至少一种的概率,即目标概率值。步骤103、根据目标概率值和特征变量,建立用于判定目标行为的目标机器学习模型。具体地,构建用于判定目标行为的目标机器学习模型,目标机器学习模型是一个二分类模型,目标机器学习模型的概率取目标概率值,目标机器学习模型的输入为描述交易行为的特征变量,输出为用于指示是否为目标行为的目标变量,该目标变量的取值为0或1,当根据样本的特征变量判定出目标变量取值为1时,该样本为正本文档来自技高网...
机器学习模型的建模方法及装置

【技术保护点】
一种机器学习模型的建模方法,其特征在于,包括:分别对各中间目标变量对应的机器学习子模型进行训练,获得各机器学习子模型的概率值;其中,所述机器学习子模型用于根据描述交易行为的特征变量判定对应中间目标变量指示的目标行为类型;对各机器学习子模型的概率值进行概率求和,获得目标概率值;根据所述目标概率值和所述特征变量,建立用于判定是否为目标行为的目标机器学习模型。

【技术特征摘要】
1.一种机器学习模型的建模方法,其特征在于,包括:分别对各中间目标变量对应的机器学习子模型进行训练,获得各机器学习子模型的概率值;其中,所述机器学习子模型用于根据描述交易行为的特征变量判定对应中间目标变量指示的目标行为类型;对各机器学习子模型的概率值进行概率求和,获得目标概率值;根据所述目标概率值和所述特征变量,建立用于判定是否为目标行为的目标机器学习模型。2.根据权利要求1所述的建模方法,其特征在于,所述分别对各中间目标变量对应的机器学习子模型进行训练之前,包括:根据各初始目标变量之间的相容或互斥状态,对相容的初始目标变量进行合并,获得相互之间为互斥状态的中间目标变量;其中,所述初始目标变量用于指示目标行为的实现形式。3.根据权利要求2所述的建模方法,其特征在于,所述根据各初始目标变量之间的相容或互斥状态,对相容的初始目标变量进行合并,获得相互之间为互斥状态的中间目标变量,包括:将两两之间为互斥状态的初始目标变量组成初始目标变量对;构建包括各初始目标变量的拆分集合;依次针对每一个初始目标变量对,执行根据所述初始目标变量对,将拆分集合拆分为两个下一级的拆分集合的步骤,在每一个下一级的拆分集合中包含有所述初始目标变量对中的一个初始目标变量,以及被拆分的拆分集合中除所述初始目标变量对之外的全部元素;其中,所述下一级的拆分集合用于根据下一个初始目标变量对进行拆分;对相互之间存在包含关系的拆分集合进行合并,获得目标子集;将同一目标子集中的初始目标变量合并,作为所述中间目标变量。4.根据权利要求2所述的建模方法,其特征在于,所述根据各初始目标变量之间的相容或互斥状态,对相容的初始目标变量进行合并,获得相互之间为互斥状态的中间目标变量之前,还包括:根据公式确定初始目标变量之间的相容或互斥状态;其中,Numij表示历史交易数据中初始目标变量yi和初始目标变量yj同时定义为正样本的交易记录的条数,Numi表示所述历史交易数据中初始目标变量yi定义为正样本的交易记录的条数,Numj表示所述历史交易数据中初始目标变量yj定义为正样本的交易记录的条数,1≤i≤N,1≤j≤N,N为初始特征变量的总数,H=1时两初始目标变量之间为互斥,H=0时两初始目标变量之间为相融,T1和T2为预设阈值,0<T1<1,0<T2<1。5.根据权利要求2所述的建模方法,其特征在于,所述机器学习子模型为线性模型,所述分别对各中间目标变量对应的机器学习子模型进行训练,获得各机器学习子模型的概率之前,还包括:针对每一个机器学习子模型,计算特征变量Xq与各初始目标变量ys之间的协方差;其中,所述初始目标变量ys用于合并获得所述机器学习子模型所对应的中间目标变量;若所述特征变量Xq与各初始目标变量ys之间的协方差正负号不相同,则筛选掉所述特征变量Xq,否则,保留所述特征变量Xq。6.根据权利要求2所述的建模方法,其特征在于,所述分别对各中间目标变量对应的机器学习子模型进行训练,获得各机器学习子模型的概率之前,还包括:针对每一个机器学习子模型,根据各初始目标变量ys权重Ws所确定出的交易记录复制条数,对所述历史交易数据中的交易记录进行复制;其中,所述初始目标变量ys用于合并获得所述机器学习子模型所对应的中间目标变量;将复制后的历史交易数据作为所述机器学习子模型的训练样本。7.根据权利要求6所述的建模方法,其特征在于,所述对所述历史交易数据中的交易记录进行复制之前,还包括:针对每一条交易记录,将初始目标变量ys及所述初始目标变量ys的权重Ws,代入公式获得所述交易记录的复制条数CN;其中,所述交易记录为所述初始目标变量ys正样本时,ys=1,否则,ys=0;S为所述初始目标变量ys的个数。8.根据权利要求1所述的建模方法,其特征在于,所述对各机器学习子模型的概率值进行概率求和,获得目标概率值,包括:将各机器学习子模型的概率pv代入公式计算获得机器学习模型的概率P;...

【专利技术属性】
技术研发人员:张柯褚崴施兴谢树坤谢锋
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1