System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种金融网络中高效的异常子图发现方法技术_技高网

一种金融网络中高效的异常子图发现方法技术

技术编号:41103437 阅读:5 留言:0更新日期:2024-04-25 13:58
本发明专利技术公开了一种金融网络中高效的异常子图发现方法,首先,构建异常子图编码器学习金融网络中图结构和财务分布背后的隐藏特征;然后采用粗选原型发现算法在金融网络中识别出粗略选择出来的异常原型,利用来自编码器阶段的训练参数将候选子图编码为向量,并与训练的异常子图进行匹配;最后,通过异常子图优化算法使用强化学习框架对异常子图进行优化。本发明专利技术提出的RADIO模型比最先进的模型更加高效和有效,可以平稳地扩展到非常大的金融网络。

【技术实现步骤摘要】

本专利技术属于网络,具体涉及一种金融网络中高效的异常子图发现方法


技术介绍

1、从金融网络中提取异常子图是一个重要的问题。这个问题通常用于检测欺诈和洗钱行为。例如,银行业可以检测那些将非法资金转移到无法追踪账户的犯罪分子,并保护人们的财产。

2、在目前的研究中,大多数异常发现解决方案忽略了洗钱的链式转账结构。具体而言,它们只考虑单步转账。然而,洗钱行为涉及不止一步的转账。为了解决这个问题,一些最近的研究工作提出检测涉及两步转账的子图。这些方法的问题在于它们只考虑结构信息,而忽略了相关的交易信息。但是一些涉及两步转账的子图可能是正常的,也就是说它们的交易是合法的。例如,大学账户向学生账户分发奖学金、津贴等,学生账户支付学费、宿舍费等给大学账户。这是一个两步转账,但交易是合法的。

3、为了解决以上问题,同时需要考虑交易信息,目前最好的方法antibenford建议利用benford定律对非法交易进行评估。benford定律,规定以数字o开头的数字的比例在自然数据集(如税收记录、股票报价等)中遵循单调递减函数,即log10(1+1/o)。antibenford还通过可视化实际交易数据集中的第一位数字分布来验证benford定律在金融交易中的存在。

4、虽然antibenford通过利用结构和交易信息来识别与benford定律偏离的密集子图,取得了显著的进展,但它也表现出一定的局限性。首先,antibenford从金融网络中发现最密集的子图,然后根据它们与benford定律的偏离程度来筛选出正常的子图。然而,最密集的子图可能包含一些节点之间的正常交易。例如,在图1中,节点1经常向他/她喜欢的餐馆和超市支付日常开支,即节点2到5,但这些交易是合法的。这种方法会错过更微妙、更显著偏离的子图。具体而言,在图1(a)中,antibenford方法返回密度为8.4的最密集子图。然而,在图1(b)中存在一个更异常的子图,其密度相对较低为7.3,但与benford定律的偏离比图1(a)中的子图更显著。这需要对候选子图进行精细调整,这对于通过探索潜在更异常的子图来增强检测效果至关重要。其次,对所有异常子图的度量计算的依赖性带来了计算上的挑战。它通过检查每个候选子图与benford定律的偏离程度来逐一搜索异常子图。当由于通过偏离程度检查的概率较低而导致所需数量的异常子图增加时,尤其是对于大规模的金融网络,这个顺序过程就成为一个瓶颈。例如,antibenford在2018年1月期间需要32.8小时来从以太坊金融网络中发现800个异常子图,这对于及时追踪洗钱行为太慢。由于这些问题的存在,所以需要找到一种在异常子图的发现方面更高效的办法。


技术实现思路

1、为了克服现有技术的不足,本专利技术提供了一种金融网络中高效的异常子图发现方法,首先,构建异常子图编码器学习金融网络中图结构和财务分布背后的隐藏特征;然后采用粗选原型发现算法在金融网络中识别出粗略选择出来的异常原型,利用来自编码器阶段的训练参数将候选子图编码为向量,并与训练的异常子图进行匹配;最后,通过异常子图优化算法使用强化学习框架对异常子图进行优化。本专利技术提出的radio模型比最先进的模型更加高效和有效,可以平稳地扩展到非常大的金融网络。

2、本专利技术解决其技术问题所采用的技术方案包括如下步骤:

3、步骤1:构建异常子图编码器;

4、步骤1-1:从训练的异常子图中抽样生成正子图样本对和负子图样本对;

5、步骤1-2:对抽样的正子图样本对和负子图样本对应用加权图神经网络,用于对图的连接性和交易频率进行建模;

6、步骤1-3:通过最小化正子图样本对之间的向量距离和最大化负子图样本对之间的向量距离,优化模型参数;

7、步骤2:粗选原型发现;

8、步骤2-1:对于金融网络中的每个节点v∈v,构建其k-ego网络;在每个k-ego网络上应用一种具有线性时间复杂度的子图发现算法,该算法通过迭代剥离k-ego网络,也就是删除度最小的节点并重新计算剩余图的密度直到密度ρ(s)最高的子图被确定为近似最密子图;

9、步骤2-2:采用早期修剪策略,从近似最密子图中筛选出top-p异常子图;使用统计量,其中该统计量计算了子图中的实际分布与预期的benford分布之间的偏差,如下式(4)所示:

10、

11、其中,是子图中交易金额的第一个数字等于o∈{1,···,9}的边的数量,表示基于benford定律的预期边数,其中交易金额的第一个数字等于o;

12、步骤2-3:只选择基于与benford定律的偏差而确定的top-p异常子图作为进一步考虑的候选项;

13、步骤2-4:使用步骤1中定义的加权图神经网络,将每个子图的图结构编码成向量空间;然后,将嵌入与训练中的异常子图的编码向量接近的子图被确定为粗选的异常原型

14、步骤3:异常子图优化;

15、步骤3-1:强化学习中的状态;

16、在第i步,状态包括及其边界其中表示从粗选原型发现算法中得到的粗选异常原型;边界包括直接连接到的节点,根据它们与中节点的累积交易频率进行选择;具体来说,选择具有最大累积交易频率总和的节点,限制为m个节点;形式上,边界节点定义为式(5)所示:

17、

18、其中,rs,c表示节点s和节点c之间的交易频率,条件|i|≤m确保边界中节点的数量不超过m;

19、定义第i+1步时节点v的表示如式(6)所示:

20、

21、其中,fβ(v)i表示节点v在第i步时由加权图神经网络得到的节点表示,β表示可训练参数;是一个指示函数,如果条件满足则返回1,否则返回0;表示第i+1步时的子图g[sp];

22、步骤3-2:行动;

23、在第i步,选择中的一个节点进行排除,并选择中的一个节点进行添加,然后得到为了删除节点和添加节点行动,还添加了一个虚拟节点表示停止行动;

24、应用一个多层感知机来提取行动空间中节点背后的隐藏特征,然后通过softmax函数将它们映射到选择删除或添加特定节点的概率;

25、对于删除或添加行动,检查这些行动是否会导致更高的和值,其中是第i+1步时子图g[sp]的平均χ2统计量;如果条件满足,则执行该行动;具体而言,该行动的定义如式(7)所示:

26、

27、其中,vai表示第i步的行动空间,包括边界和当前子图qi(v)表示第i步节点u的表示;α表示mlp中的可训练参数;对于删除行动,仅在移除节点不会导致一个断开的子图时才排除该节点;

28、步骤3-3:奖励;

29、定义异常度为式(8):

30、

31、其中,表示子图的每个节点的平均χ2,是子图的密度;每一步的奖励被定义为所选行动导致的异常度增加

32、将问题优化为一个最大化问题,目标是本文档来自技高网...

【技术保护点】

1.一种金融网络中高效的异常子图发现方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种金融网络中高效的异常子图发现方法,其特征在于,所述步骤1具体为:

3.根据权利要求1所述的一种金融网络中高效的异常子图发现方法,其特征在于,所述金融网络中高效的异常子图发现方法的总时间复杂性如式(10)所示:

【技术特征摘要】

1.一种金融网络中高效的异常子图发现方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种金融网络中高效的异常子图发现方法,其特征在于,所述步骤1...

【专利技术属性】
技术研发人员:韩笑琳张轶焜马晨昊宋凌云尚学群
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1