交易风险策略推荐方法、装置、服务器及存储介质制造方法及图纸

技术编号:21607182 阅读:31 留言:0更新日期:2019-07-13 18:47
本发明专利技术实施例提供了一种交易风险策略推荐方法,根据新增样本进行决策树训练,并依据决策树的规则路径进行策略推荐,由此,当有新样本输入之后,可自动实现策略推荐,无需靠个人经验进行判断,解放人力的同时,可提高准确性。

Recommendation Method, Device, Server and Storage Medium of Transaction Risk Strategy

【技术实现步骤摘要】
交易风险策略推荐方法、装置、服务器及存储介质
本说明书实施例涉及互联网
,尤其涉及一种交易风险策略推荐方法、装置、服务器及存储介质。
技术介绍
随着互联网的快速发展,各种形式的业务不断涌现,如在线银行、在线支付、在线购物等基于互联网的服务业务。人们已经越来越习惯在网上进行各种生活或商务活动。由于互联网是一个开放的网络,任何人在任何地方都可以很方便地连接到互联网上。互联网在给人们生活提供便利的同时,也带来了风险。尤其是随着电子商务平台和第三方交易平台的发展,网络金融犯罪以及网上诈骗、信用卡盗刷等不断出现。因此,确定交易是否存在风险越来越重要。
技术实现思路
本说明书实施例提供及一种交易风险策略推荐方法、装置、服务器及存储介质。第一方面,本说明书实施例提供一种交易风险策略推荐方法,包括:获取有关风险交易的样本数据;将所述样本数据划分为多组不同的预测集和训练集,利用训练集分多次训练出多个决策树;对于每棵决策树采取该决策树对应的预测集进行预测;统计各叶子节点被预测集数据击中的次数,选择被击中次数最多的叶子节点的规则路径进行策略推荐。第二方面,本说明书实施例提供一种交易风险策略推荐装置,包括:获取单元,用于获取有关风险交易的样本数据;分组单元,用于将所述样本数据划分为多组不同的预测集和训练集训练单元,用于利用训练集分多次训练出多个决策树;预测单元,用于对于每棵决策树采取该决策树对应的预测集进行预测;推荐单元,用于统计各叶子节点被预测集数据击中的次数,选择被击中次数最多的叶子节点的规则路径进行策略推荐。第三方面,本说明书实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行上述任一项所述方法的步骤。第四方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。本说明书实施例有益效果如下:本说明书实施例提供的交易风险策略推荐方法中,根据新增样本进行决策树训练,并依据决策树的规则路径进行策略推荐,由此,当有新样本输入之后,可自动实现策略推荐,无需靠个人经验进行判断,解放人力的同时,可提高准确性。利用决策树算法,可自动选择策略的风险变量,运行速度快、效果高。在一种可选方式中,通过规则策略出现次数与新增策略覆盖率最大化进行结合,可推荐出最优策略。附图说明图1为本说明书实施例交易风险策略推荐的场景示意图;图2为本说明书实施例第一方面提供的交易风险策略推荐方法流程图;图3为本说明书实施例第一方面提供的交易风险策略推荐方法实例中决策树示意图;图4为本说明书实施例第一方面提供的交易风险策略推荐方法实例流程图;图5为本说明书实施例第二方面提供的交易风险策略推荐装置结构示意图;图6为本说明书实施例第三方面提供的交易风险策略推荐服务器结构示意图。具体实施方式为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。请参见图1,为本说明书实施例的交易风险策略推荐的场景示意图。终端100位于用户侧,与网络侧的服务器200通信。终端100中的交易处理客户端101可以是基于互联网实现业务的APP或网站,为用户提供交易的界面并将交易数据提供给网络侧进行处理;服务器200中的异常交易识别系统201用于对交易处理客户端101中涉及的异常交易进行识别以及风险控制。目前网络交易中存在各种各样的风险,例如,在线支付场景中,可能存在欺诈、账号盗用、银行卡盗用等风险。为了应对这些风险,各个网站都运行维护着风险防控基础策略体系,但当新的风险形式出现,策略端需要对新风险进行分析,在短时间内补上新的策略来防控这些风险。对于新风险目前是依靠技术人员设想可能有效的策略,再进行仿真实验,再最终确定上线策略。这种办法消耗人力与时间,且不一定能达到最优效果。第一方面,本说明书实施例提供一种交易风险策略推荐方法,请参考图2,包括S201-S204。S201:获取有关风险交易的样本数据。为了应对新的交易风险,当新的风险出现且目前策略无法防控时,取出包含新的案件的若干天的数据作为样本,包括黑样本数据和白样本数据。数据需有以下几类变量:事件标识(事件ID)变量、黑白样本标签变量、是否为已有策略的稽核事件变量、风险策略变量。其中:“事件ID变量”是事件唯一标识;“黑白样本标签变量”为了区别黑白样本,黑样本是风险交易样本,白样本是正常交易样本;“是否为已有策略的稽核事件变量”指目前已有的策略是否已经识别该事件,主要用于区分该事件是被已有策略还是新策略识别,从而确定被新策略识别出的比例;“风险策略变量”是指一些基础风险变量,用于产生策略的变量,风险策略变量是根据经验设定的,例如可以包括“银行卡更换变量”、“设备更换变量”等很多个风险策略变量。S202:将样本数据划分为多组不同的预测集和训练集,利用训练集分多次训练出多个决策树。决策树(DecisionTree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,代表的是对象属性与对象值之间的一种映射关系。决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。例如本说明书实施例可以采取CART进行决策树训练。分类回归树(CART,ClassificationAndRegressionTree)属于一种决策树。CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将输入空间即特征空间划分为有限个单元,并在这些单元上确定预测的概率分布,也就是在输入给定的条件下输出的条件概率分布。为了训练决策树需要对样本数据划分为多组的预测集和训练集。例如将样本数据划分为多组不同的预测集和训练集的方式为:将样本数据划分为预置数目的分段;任选一个分段作为预测集,其余分段的数据集合作为训练集,构成多组中的其中一组预测集和训练集。例如预置数目N=5,因此对数据随机切分成5段,每次取出一段作为预测集(OOT),其余的做为训练集(INS),循环5次。假设样本数据分为5段分别为段1、段2、段3、段4、段5;那么是分别对段1作为预测集、段2-段5作为训练集;段2作为预测集、段1、段3-段5作为训练集…这样循环5次。在确定了每组的预测集和训练集之后,即可利用训练集分多次训练出多个决策树。一棵决策树由分支节点(树的结构)和叶节点(树的输出)组成。决策树的训练的目标是通过最小化某种形式的损失函数或者经验风险,来确定每个分支函数的参数,以及叶节点的输出。决策树自上而下的循环分支学习(RecursiveRegression)采用了贪心算法。每个分支节点只关心自己的目标函数。具体来说,给定一个分支节点本文档来自技高网...

【技术保护点】
1.一种交易风险策略推荐方法,包括:获取有关风险交易的样本数据;将所述样本数据划分为多组不同的预测集和训练集,利用训练集分多次训练出多个决策树;对于每棵决策树采取该决策树对应的预测集进行预测;统计各叶子节点被预测集数据击中的次数,选择被击中次数最多的叶子节点的规则路径进行策略推荐。

【技术特征摘要】
1.一种交易风险策略推荐方法,包括:获取有关风险交易的样本数据;将所述样本数据划分为多组不同的预测集和训练集,利用训练集分多次训练出多个决策树;对于每棵决策树采取该决策树对应的预测集进行预测;统计各叶子节点被预测集数据击中的次数,选择被击中次数最多的叶子节点的规则路径进行策略推荐。2.根据权利要求1所述的方法,所述样本数据是新增风险对应的样本数据,且包括黑样本数据和白样本数据;所述样本数据具有事件标识变量、黑白样本标签变量、是否为已有策略的稽核事件变量、风险策略变量中的任一项或任几项组合。3.根据权利要求2所述的方法,在所述获取有关风险交易的样本数据之后,还包括:对样本数据进行预处理;所述对样本数据进行预处理包括:对数据中的缺失值进行补充、将字符型变量转换为数值型变量、根据事件标识对数据进行去重处理、对数据进行平滑处理中的任一项或任几项组合。4.根据权利要求1所述的方法,所述将所述样本数据划分为多组不同的预测集和训练集包括:将所述样本数据划分为预置数目的分段;任选一个分段作为预测集,其余分段的数据集合作为训练集,构成所述多组中的其中一组预测集和训练集。5.根据权利要求1-4任一项所述的方法,还包括:计算每个叶子节点的新增覆盖率和新增打扰率;在新增打扰率小于预置的最大新增打扰率阈值的条件下,确定具有最大新增覆盖率的叶子节点;在进行策略推荐过程中,对于被击中次数相同的叶子节点,优先选择具有最大新增覆盖率的叶子节点的规则路径进行策略推荐。6.根据权利要求5所述的方法,所述叶子节点的新增覆盖率是指所述叶子节点击中的总黑样本数与所述叶子节点击中的已有策略稽核黑样本数的差值与所有黑样本数的比值;所述叶子节点的新增打扰率是指所述叶子节点击中的总白样本数与所述叶子节点击中的已有策略稽核白样本数的差值与所有白样本数的比值。7.一种交易风险策略推荐装置,包括:获取单元,用于获取有关风险交易的样本数据;分组单元,用于将所述样本数据划分为多组不同的预测集和训练集训练单元,用于...

【专利技术属性】
技术研发人员:叶芸赵闻飙金宏
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1