【技术实现步骤摘要】
一种基于自学习滑动时间窗口的网络支付欺诈检测方法
本专利技术涉及互联网金融领域,具体而言,本专利技术涉及一种基于自学习滑动时间窗口的网络支付欺诈检测方法。
技术介绍
随着移动互联网的兴起,各种传统的业务逐渐转至线上,互联网金融,电子商务迅速发展,网络在线支付的产生将带来大量的电子交易数据,同时伴随着在线支付欺诈交易数量的大量增加。攻击者通过窃取用户账户,盗取个人隐私信息,甚至恶意攻击服务器等方式来完成欺诈。为保障用户和公司业务安全,需要建立切实有效的网络支付欺诈检测系统。目前传统的网络支付欺诈检测系统通常具有时效性,使用这些单一的欺诈检测系统不符合千变万化的互联网在线支付场景下的要求,互联网欺诈行为方式充满了多样性与进化性,用户的交易行为模式也存在概念漂移的现象,显然传统的方法不具备自适应于环境的自我更新机制,存在一定的滞后性,人工调整模型需要大量的运营和维护成本,所以亟需一个可以自动学习的、自适应于环境变化的网络支付欺诈检测方法来解决这些问题。
技术实现思路
为了寻找更为有效的网络支付欺诈检测的实现方案,通过分析欺诈交易的分布特征,发现其通常以成簇的方式出现在一段时间里,同时,这种成簇出现的方式随时间的变化也会发生形式的转变,捕捉到内在的变化原因并动态地调整原有的模型,就能够实现在不同时间段实时准确的检测欺诈交易的发生,为此,本专利技术提供了一种基于自学习滑动时间窗口的网络支付欺诈检测方法。为实现上述目的,本专利技术一种基于自学习滑动时间窗口的网络支付欺诈检测方法,其包括如下步骤:获取实时检测的某个用户新来的一笔交易记录,并基于所述交易记录和预置的滑动时间窗 ...
【技术保护点】
1.一种基于自学习滑动时间窗口的网络支付欺诈检测方法,其特征在于,所述基于自学习滑动时间窗口的网络支付欺诈检测方法包括如下步骤:获取实时检测的某个用户新来的一笔交易记录,并基于所述交易记录和预置的滑动时间窗口提取不依赖于所述滑动时间窗口的特征和依赖于所述滑动时间窗口的特征,其中,所述不依赖于滑动时间窗口的特征包括交易的验签方式、当前交易是否使用该用户的常用IP地址、交易金额是否超过金额限额、交易金额是否超过交易前账户余额、两笔相邻交易的时间间隔、两笔相邻交易的交易金额差;所述依赖于滑动时间窗口的特征包括滑动时间窗口内用户的交易次数、滑动时间窗口内所有交易金额的平均值、滑动时间窗口内所有交易金额的方差值、滑动时间窗口内所有交易金额的累积值、滑动时间窗口内相邻交易金额差的均值、滑动时间窗口内相邻交易金额差的方差值、滑动时间窗口内相邻交易时间间隔的均值、滑动时间窗口内相邻交易时间间隔的方差值;将所述不依赖于滑动时间窗口的特征和所述依赖于滑动时间窗口的特征输入到训练完毕的随机森林分类器模型中,得到并返回所述交易记录存在欺诈可能性的概率。
【技术特征摘要】
1.一种基于自学习滑动时间窗口的网络支付欺诈检测方法,其特征在于,所述基于自学习滑动时间窗口的网络支付欺诈检测方法包括如下步骤:获取实时检测的某个用户新来的一笔交易记录,并基于所述交易记录和预置的滑动时间窗口提取不依赖于所述滑动时间窗口的特征和依赖于所述滑动时间窗口的特征,其中,所述不依赖于滑动时间窗口的特征包括交易的验签方式、当前交易是否使用该用户的常用IP地址、交易金额是否超过金额限额、交易金额是否超过交易前账户余额、两笔相邻交易的时间间隔、两笔相邻交易的交易金额差;所述依赖于滑动时间窗口的特征包括滑动时间窗口内用户的交易次数、滑动时间窗口内所有交易金额的平均值、滑动时间窗口内所有交易金额的方差值、滑动时间窗口内所有交易金额的累积值、滑动时间窗口内相邻交易金额差的均值、滑动时间窗口内相邻交易金额差的方差值、滑动时间窗口内相邻交易时间间隔的均值、滑动时间窗口内相邻交易时间间隔的方差值;将所述不依赖于滑动时间窗口的特征和所述依赖于滑动时间窗口的特征输入到训练完毕的随机森林分类器模型中,得到并返回所述交易记录存在欺诈可能性的概率。2.如权利要求1所述的基于自学习滑动时间窗口的网络支付欺诈检测方法,其特征在于,所述获取实时检测的某个用户新来的一笔交易记录之前,包括如下步骤:基于历史交易记录得到预置的滑动时间窗口和训练完毕的随机森林分类器模型。3.如权利要求2所述的基于自学习滑动时间窗口的网络支付欺诈检测方法,其特征在于,所述基于历史交易记录得到预置的滑动时间窗口和训练完毕的随机森林分类器模型包括如下步骤:步骤S1:从历史交易记录中选取特定时间段内的交易记录,并判断所述特定时间段之前的时间段是否生成滑动时间窗口值,若无,则根据以下公式(1),初始化滑动时间窗口大小的概率密度函数,其中N为滑动时间窗口大小候选集个数;若有,则根据前一个时间段的滑动时间窗口值xl和公式(2),初始化滑动时间窗口大小的概率密度函数,其中σ2为滑动时间窗口大小的概率密度函数初始化的超参数,xl为前一个时间段的滑动时间窗口值;步骤S2:在t时刻按照概率从滑动时间窗口大小的概率密度函数ft(x)中选择出一个滑动时间窗口值xt;在滑动时间窗口值xt下,为所述特定时间段内的交易记录分别提取出依赖于所述滑动时间窗口值xt的特征,并结合不依赖于滑动时间窗口值xt的特征和标签组成训练样本集合,所述标签指的是历史交易记录是否是欺诈交易的标记;步骤S3:将所述训练样本集合输入随机森林分类器进行模型训练,得到随机森林分类器模型;提取所述特定时间段内预设时间段内的交易记录并根据公式(3),tprt=0.4*(tprt|fprt=0.05%)+0.3*(tprt|fprt=0.1%)+0.2*(tprt|fprt=0.5%)+0.1*(tprt|fprt=1.0%)(3)得到t时刻的随机森林分类器模型性能评价指标,也即加权...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。