当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于自学习滑动时间窗口的网络支付欺诈检测方法技术

技术编号:21142656 阅读:24 留言:0更新日期:2019-05-18 05:36
本发明专利技术公开一种基于自学习滑动时间窗口的网络支付欺诈检测方法,目的为了寻找更为有效的网络支付欺诈检测的实现方案,其包括如下步骤:获取实时检测的某个用户新来的一笔交易记录,并基于交易记录和预置的滑动时间窗口提取不依赖于滑动时间窗口的特征和依赖于滑动时间窗口的特征;将不依赖于滑动时间窗口的特征和依赖于滑动时间窗口的特征输入到训练完毕的随机森林分类器模型中,得到并返回交易记录存在欺诈可能性的概率。本发明专利技术利用强化学习中的学习自动机对滑动时间窗口大小进行动态学习和调整,解决传统欺诈检测系统存在滞后性的弊病。

【技术实现步骤摘要】
一种基于自学习滑动时间窗口的网络支付欺诈检测方法
本专利技术涉及互联网金融领域,具体而言,本专利技术涉及一种基于自学习滑动时间窗口的网络支付欺诈检测方法。
技术介绍
随着移动互联网的兴起,各种传统的业务逐渐转至线上,互联网金融,电子商务迅速发展,网络在线支付的产生将带来大量的电子交易数据,同时伴随着在线支付欺诈交易数量的大量增加。攻击者通过窃取用户账户,盗取个人隐私信息,甚至恶意攻击服务器等方式来完成欺诈。为保障用户和公司业务安全,需要建立切实有效的网络支付欺诈检测系统。目前传统的网络支付欺诈检测系统通常具有时效性,使用这些单一的欺诈检测系统不符合千变万化的互联网在线支付场景下的要求,互联网欺诈行为方式充满了多样性与进化性,用户的交易行为模式也存在概念漂移的现象,显然传统的方法不具备自适应于环境的自我更新机制,存在一定的滞后性,人工调整模型需要大量的运营和维护成本,所以亟需一个可以自动学习的、自适应于环境变化的网络支付欺诈检测方法来解决这些问题。
技术实现思路
为了寻找更为有效的网络支付欺诈检测的实现方案,通过分析欺诈交易的分布特征,发现其通常以成簇的方式出现在一段时间里,同时,这种成簇出现的方式随时间的变化也会发生形式的转变,捕捉到内在的变化原因并动态地调整原有的模型,就能够实现在不同时间段实时准确的检测欺诈交易的发生,为此,本专利技术提供了一种基于自学习滑动时间窗口的网络支付欺诈检测方法。为实现上述目的,本专利技术一种基于自学习滑动时间窗口的网络支付欺诈检测方法,其包括如下步骤:获取实时检测的某个用户新来的一笔交易记录,并基于所述交易记录和预置的滑动时间窗口提取不依赖于所述滑动时间窗口的特征和依赖于所述滑动时间窗口的特征,其中,所述不依赖于滑动时间窗口的特征包括交易的验签方式、当前交易是否使用该用户的常用IP地址、交易金额是否超过金额限额、交易金额是否超过交易前账户余额、两笔相邻交易的时间间隔、两笔相邻交易的交易金额差;所述依赖于滑动时间窗口的特征包括滑动时间窗口内用户的交易次数、滑动时间窗口内所有交易金额的平均值、滑动时间窗口内所有交易金额的方差值、滑动时间窗口内所有交易金额的累积值、滑动时间窗口内相邻交易金额差的均值、滑动时间窗口内相邻交易金额差的方差值、滑动时间窗口内相邻交易时间间隔的均值、滑动时间窗口内相邻交易时间间隔的方差值;将所述不依赖于滑动时间窗口的特征和所述依赖于滑动时间窗口的特征输入到训练完毕的随机森林分类器模型中,得到并返回所述交易记录存在欺诈可能性的概率。优选地,所述获取实时检测的某个用户新来的一笔交易记录之前,包括如下步骤:基于历史交易记录得到预置的滑动时间窗口和训练完毕的随机森林分类器模型。优选地,其特征在于,所述基于历史交易记录得到预置的滑动时间窗口和训练完毕的随机森林分类器模型包括如下步骤:步骤S1:从历史交易记录中选取特定时间段内的交易记录,并判断所述特定时间段之前的时间段是否生成滑动时间窗口值,若无,则根据以下公式(1),初始化滑动时间窗口大小的概率密度函数,其中N为滑动时间窗口大小候选集个数;若有,则根据前一个时间段的滑动时间窗口值xl和公式(2),初始化滑动时间窗口大小的概率密度函数,其中σ2为滑动时间窗口大小的概率密度函数初始化的超参数,xl为前一个时间段的滑动时间窗口值;步骤S2:在t时刻按照概率从滑动时间窗口大小的概率密度函数ft(x)中选择出一个滑动时间窗口值xt;在滑动时间窗口值xt下,为所述特定时间段内的交易记录分别提取出依赖于所述滑动时间窗口值xt的特征,并结合不依赖于滑动时间窗口值xt的特征和标签组成训练样本集合,所述标签指的是历史交易记录是否是欺诈交易的标记;步骤S3:将所述训练样本集合输入随机森林分类器进行模型训练,得到随机森林分类器模型;提取所述特定时间段内预设时间段内的交易记录并根据公式(3),tprt=0.4*(tprt|fprt=0.05%)+0.3*(tprt|fprt=0.1%)+0.2*(tprt|fprt=0.5%)+0.1*(tprt|fprt=1.0%)(3)得到t时刻的随机森林分类器模型性能评价指标,也即加权tpr值tprt,再将t时刻的加权tpr值tprt加入集合TPR中,去除集合TPR中对应t-m时刻的加权tpr值tprt-m值,使得集合TPR的大小保持为m,其中,公式(3)中的fprt代表t时刻的随机森林分类器模型的打扰率性能指标,m为集合TPR的大小;步骤S4:根据t时刻的加权tpr值tprt、集合TPR、集合TPR的中值TPRmed和最大值TPRmax,利用公式(4)判断所述滑动时间窗口值xt下的随机森林分类器模型的加权tpr值是否高于随机森林分类器模型性能集合TPR中的中值TPRmed,以此计算出t时刻选择的滑动时间窗口值xt下的奖励值βt,并反馈给学习自动机;步骤S5:学习自动机接收到奖励值βt后,根据在t时刻滑动时间窗口大小的概率密度函数,按照公式(5)更新得到t+1时刻的滑动时间窗口大小的概率密度函数ft+1(x);在t+1时刻的滑动时间窗口大小的概率密度函数中,当某个滑动时间窗口值所对应的概率值低于预置阈值th时,则将所述概率值设为0,并对整个滑动时间窗口大小的概率密度函数作归一化处理,使得所有滑动时间窗口大小值对应的概率之和为1;其中,λ和σ1为高斯邻居函数的超参数,α为归一化参数,其值为所有滑动时间窗口值的概率密度之和的倒数;步骤S6:重复步骤S2-S5,经过iter次迭代后停止迭代,输出对应概率值最高的滑动时间窗口值作为预置的滑动时间窗口,同时得到训练完毕的随机森林分类器模型,其中,iter为学习自动机迭代次数。优选地,其特征在于,所述预置阈值th范围为0—1。优选地,其特征在于,所述从历史交易记录中选取特定时间段内的交易记录为从历史交易记录中选取两个月的交易记录。优选地,其特征在于,所述提取所述特定时间段内预设时间段内的交易记录位提取所述特定时间段内后十日的交易记录。优选地,其特征在于,所述基于所述交易记录和预置的滑动时间窗口提取不依赖于所述滑动时间窗口的特征包括如下步骤:基于所述交易记录的原始数据字段提取不依赖于滑动时间窗口的特征。优选地,其特征在于,所述基于所述交易记录和预置的滑动时间窗口提取依赖于所述滑动时间窗口的特征包括如下步骤:将所述交易记录的原始交易时间字段和交易金额字段加入到REDIS数据库中对应的交易列表的表头;根据预置的滑动时间窗口,判断所述交易列表中是否有超出所述预置的滑动时间窗口的历史交易记录,若存在,则从所述交易列表的表尾删除冗余的历史交易记录;对预置的滑动时间窗口内的所有交易记录进行统计计算,提取出依赖于滑动时间窗口的特征。与现有技术相比,本专利技术一种基于自学习滑动时间窗口的网络支付欺诈检测方法具有如下有益效果:本专利技术一种基于自学习滑动时间窗口的网络支付欺诈检测方法利用强化学习中的学习自动机对滑动时间窗口大小进行动态学习和调整,进而设计出一种基于自学习的滑动时间窗口的网络支付欺诈检测方法,解决传统欺诈检测系统存在滞后性的弊病,为互联网金融信息化时代网络支付安全问题的解决提供了新的思路和解决方法,在一定程度上提高了为检测欺诈交易、拦截欺诈交易和保护用户和企业的资金安全领域的技本文档来自技高网...

【技术保护点】
1.一种基于自学习滑动时间窗口的网络支付欺诈检测方法,其特征在于,所述基于自学习滑动时间窗口的网络支付欺诈检测方法包括如下步骤:获取实时检测的某个用户新来的一笔交易记录,并基于所述交易记录和预置的滑动时间窗口提取不依赖于所述滑动时间窗口的特征和依赖于所述滑动时间窗口的特征,其中,所述不依赖于滑动时间窗口的特征包括交易的验签方式、当前交易是否使用该用户的常用IP地址、交易金额是否超过金额限额、交易金额是否超过交易前账户余额、两笔相邻交易的时间间隔、两笔相邻交易的交易金额差;所述依赖于滑动时间窗口的特征包括滑动时间窗口内用户的交易次数、滑动时间窗口内所有交易金额的平均值、滑动时间窗口内所有交易金额的方差值、滑动时间窗口内所有交易金额的累积值、滑动时间窗口内相邻交易金额差的均值、滑动时间窗口内相邻交易金额差的方差值、滑动时间窗口内相邻交易时间间隔的均值、滑动时间窗口内相邻交易时间间隔的方差值;将所述不依赖于滑动时间窗口的特征和所述依赖于滑动时间窗口的特征输入到训练完毕的随机森林分类器模型中,得到并返回所述交易记录存在欺诈可能性的概率。

【技术特征摘要】
1.一种基于自学习滑动时间窗口的网络支付欺诈检测方法,其特征在于,所述基于自学习滑动时间窗口的网络支付欺诈检测方法包括如下步骤:获取实时检测的某个用户新来的一笔交易记录,并基于所述交易记录和预置的滑动时间窗口提取不依赖于所述滑动时间窗口的特征和依赖于所述滑动时间窗口的特征,其中,所述不依赖于滑动时间窗口的特征包括交易的验签方式、当前交易是否使用该用户的常用IP地址、交易金额是否超过金额限额、交易金额是否超过交易前账户余额、两笔相邻交易的时间间隔、两笔相邻交易的交易金额差;所述依赖于滑动时间窗口的特征包括滑动时间窗口内用户的交易次数、滑动时间窗口内所有交易金额的平均值、滑动时间窗口内所有交易金额的方差值、滑动时间窗口内所有交易金额的累积值、滑动时间窗口内相邻交易金额差的均值、滑动时间窗口内相邻交易金额差的方差值、滑动时间窗口内相邻交易时间间隔的均值、滑动时间窗口内相邻交易时间间隔的方差值;将所述不依赖于滑动时间窗口的特征和所述依赖于滑动时间窗口的特征输入到训练完毕的随机森林分类器模型中,得到并返回所述交易记录存在欺诈可能性的概率。2.如权利要求1所述的基于自学习滑动时间窗口的网络支付欺诈检测方法,其特征在于,所述获取实时检测的某个用户新来的一笔交易记录之前,包括如下步骤:基于历史交易记录得到预置的滑动时间窗口和训练完毕的随机森林分类器模型。3.如权利要求2所述的基于自学习滑动时间窗口的网络支付欺诈检测方法,其特征在于,所述基于历史交易记录得到预置的滑动时间窗口和训练完毕的随机森林分类器模型包括如下步骤:步骤S1:从历史交易记录中选取特定时间段内的交易记录,并判断所述特定时间段之前的时间段是否生成滑动时间窗口值,若无,则根据以下公式(1),初始化滑动时间窗口大小的概率密度函数,其中N为滑动时间窗口大小候选集个数;若有,则根据前一个时间段的滑动时间窗口值xl和公式(2),初始化滑动时间窗口大小的概率密度函数,其中σ2为滑动时间窗口大小的概率密度函数初始化的超参数,xl为前一个时间段的滑动时间窗口值;步骤S2:在t时刻按照概率从滑动时间窗口大小的概率密度函数ft(x)中选择出一个滑动时间窗口值xt;在滑动时间窗口值xt下,为所述特定时间段内的交易记录分别提取出依赖于所述滑动时间窗口值xt的特征,并结合不依赖于滑动时间窗口值xt的特征和标签组成训练样本集合,所述标签指的是历史交易记录是否是欺诈交易的标记;步骤S3:将所述训练样本集合输入随机森林分类器进行模型训练,得到随机森林分类器模型;提取所述特定时间段内预设时间段内的交易记录并根据公式(3),tprt=0.4*(tprt|fprt=0.05%)+0.3*(tprt|fprt=0.1%)+0.2*(tprt|fprt=0.5%)+0.1*(tprt|fprt=1.0%)(3)得到t时刻的随机森林分类器模型性能评价指标,也即加权...

【专利技术属性】
技术研发人员:王成王昌琪
申请(专利权)人:同济大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1