机器学习模型的建模方法及装置制造方法及图纸

技术编号：16102174 阅读：20 留言：0更新日期：2017-08-29 22:41

本发明专利技术提供了机器学习模型的建模方法及装置，通过针对每一个中间目标变量所对应的机器学习子模型进行训练，获得各机器学习子模型的概率值，进而将各机器学习子模型的概率值进行概率求和，基于求和所获得的目标概率值以及用于描述交易行为的特征变量建立用于判定目标行为的目标机器学习模型。在虚假交易判断的应用场景中，目标行为即为虚假交易，从而每一个机器学习子模型用于判定对应的中间目标变量所指示的虚假交易类型，对各机器学习子模型的概率值进行概率求和就能够获得用于判定属于多种虚假交易类型中的至少一种的概率，基于这一概率值所构建的模型便能够对于多种虚假交易类型进行判定，实现了节省成本，提高虚假交易的识别效率的目的。

全部详细技术资料下载

【技术实现步骤摘要】
机器学习模型的建模方法及装置
本专利技术涉及计算机技术，尤其涉及一种机器学习模型的建模方法及装置。
技术介绍
在利用机器学习模型进行行为模式的判定时，往往采用针对同属于某一种目标行为的各种具体行为进行共性特征提取，从而依据这些共性特征构建机器学习模型。在判定某一个具体行为是否属于该目标行为时，所构建的机器学习模型依据其是否具有这些共性特征，来确定是否为该目标行为。以网络中的虚假交易为例，虚假交易是指卖方用户和/或买方用户通过虚构或隐瞒交易事实、规避或恶意利用信用记录规则、干扰或妨害信用记录秩序等不正当方式获取虚假的商品销量、店铺评分、信用积分或商品评论等不当利益的行为。例如现在已经出现了刷单、炒信、套现和制造虚假订单贷款等虚假交易类型，为了规范网络交易行为，需要对虚假交易这种行为模式进行判定。由于虚假交易有着不同的类型，每一种类型的虚假交易又有着多种具体的实现方式，同时各种类型虚假交易之间的交易行为差异较大，在现有技术中，无法采用提取共性特征的方式构建用于判断虚假交易的机器模型，因此，现有技术中采用了每一个机器学习模型针对某一种实现形式或者一个类型的虚假交易进行判定的方式。在利用机器学习模型识别虚假交易时，便需要建立多个模型，需要耗费大量成本，识别效率较低。
技术实现思路
本专利技术提供一种机器学习模型的建模方法及装置，用于构建一个能够适用于在目标行为具有多种不同类型的实现形式时，对目标行为进行综合判定的机器学习模型，从而节省成本，提高识别效率。为达到上述目的，本专利技术的实施例采用如下技术方案：第一方面，提供了一种机器学习模型的建模方法，包括：获得互斥的各中...
机器学习模型的建模方法及装置

【技术保护点】
一种机器学习模型的建模方法，其特征在于，包括：分别对各中间目标变量对应的机器学习子模型进行训练，获得各机器学习子模型的概率值；其中，所述机器学习子模型用于根据描述交易行为的特征变量判定对应中间目标变量指示的目标行为类型；对各机器学习子模型的概率值进行概率求和，获得目标概率值；根据所述目标概率值和所述特征变量，建立用于判定是否为目标行为的目标机器学习模型。

【技术特征摘要】
1.一种机器学习模型的建模方法，其特征在于，包括：分别对各中间目标变量对应的机器学习子模型进行训练，获得各机器学习子模型的概率值；其中，所述机器学习子模型用于根据描述交易行为的特征变量判定对应中间目标变量指示的目标行为类型；对各机器学习子模型的概率值进行概率求和，获得目标概率值；根据所述目标概率值和所述特征变量，建立用于判定是否为目标行为的目标机器学习模型。2.根据权利要求1所述的建模方法，其特征在于，所述分别对各中间目标变量对应的机器学习子模型进行训练之前，包括：根据各初始目标变量之间的相容或互斥状态，对相容的初始目标变量进行合并，获得相互之间为互斥状态的中间目标变量；其中，所述初始目标变量用于指示目标行为的实现形式。3.根据权利要求2所述的建模方法，其特征在于，所述根据各初始目标变量之间的相容或互斥状态，对相容的初始目标变量进行合并，获得相互之间为互斥状态的中间目标变量，包括：将两两之间为互斥状态的初始目标变量组成初始目标变量对；构建包括各初始目标变量的拆分集合；依次针对每一个初始目标变量对，执行根据所述初始目标变量对，将拆分集合拆分为两个下一级的拆分集合的步骤，在每一个下一级的拆分集合中包含有所述初始目标变量对中的一个初始目标变量，以及被拆分的拆分集合中除所述初始目标变量对之外的全部元素；其中，所述下一级的拆分集合用于根据下一个初始目标变量对进行拆分；对相互之间存在包含关系的拆分集合进行合并，获得目标子集；将同一目标子集中的初始目标变量合并，作为所述中间目标变量。4.根据权利要求2所述的建模方法，其特征在于，所述根据各初始目标变量之间的相容或互斥状态，对相容的初始目标变量进行合并，获得相互之间为互斥状态的中间目标变量之前，还包括：根据公式确定初始目标变量之间的相容或互斥状态；其中，Numij表示历史交易数据中初始目标变量yi和初始目标变量yj同时定义为正样本的交易记录的条数，Numi表示所述历史交易数据中初始目标变量yi定义为正样本的交易记录的条数，Numj表示所述历史交易数据中初始目标变量yj定义为正样本的交易记录的条数，1≤i≤N，1≤j≤N，N为初始特征变量的总数，H＝1时两初始目标变量之间为互斥，H＝0时两初始目标变量之间为相融，T1和T2为预设阈值，0＜T1＜1，0＜T2＜1。5.根据权利要求2所述的建模方法，其特征在于，所述机器学习子模型为线性模型，所述分别对各中间目标变量对应的机器学习子模型进行训练，获得各机器学习子模型的概率之前，还包括：针对每一个机器学习子模型，计算特征变量Xq与各初始目标变量ys之间的协方差；其中，所述初始目标变量ys用于合并获得所述机器学习子模型所对应的中间目标变量；若所述特征变量Xq与各初始目标变量ys之间的协方差正负号不相同，则筛选掉所述特征变量Xq，否则，保留所述特征变量Xq。6.根据权利要求2所述的建模方法，其特征在于，所述分别对各中间目标变量对应的机器学习子模型进行训练，获得各机器学习子模型的概率之前，还包括：针对每一个机器学习子模型，根据各初始目标变量ys权重Ws所确定出的交易记录复制条数，对所述历史交易数据中的交易记录进行复制；其中，所述初始目标变量ys用于合并获得所述机器学习子模型所对应的中间目标变量；将复制后的历史交易数据作为所述机器学习子模型的训练样本。7.根据权利要求6所述的建模方法，其特征在于，所述对所述历史交易数据中的交易记录进行复制之前，还包括：针对每一条交易记录，将初始目标变量ys及所述初始目标变量ys的权重Ws，代入公式获得所述交易记录的复制条数CN；其中，所述交易记录为所述初始目标变量ys正样本时，ys＝1，否则，ys＝0；S为所述初始目标变量ys的个数。8.根据权利要求1所述的建模方法，其特征在于，所述对各机器学习子模型的概率值进行概率求和，获得目标概率值，包括：将各机器学习子模型的概率pv代入公式计算获得机器学习模型的概率P；...

【专利技术属性】
技术研发人员：张柯，褚崴，施兴，谢树坤，谢锋，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人