一种用于资金网络的图数据处理方法技术

技术编号:34141537 阅读:14 留言:0更新日期:2022-07-14 17:56
本发明专利技术实施例提供了一种用于资金网络的图数据处理方法,包括:获取与所述资金网络相关的图数据,其中,所述图数据包括节点和边,其中节点表示用户,边表示资金流向以及资金数额;根据图数据中的每条边构建与之方向相反的虚边;获取图数据的源节点以及用于限定所需资金环路要求的约束参数,从源节点开始根据图数据中的边和约束参数进行正向遍历以及根据图数据中的虚边和约束参数进行反向遍历;基于正向遍历和反向遍历的结果,确定图数据中存在的资金环路;本发明专利技术可以高效地确定图数据满足所需资金环路要求的资金环路。进而基于确定的资金环路对资金网络中的风险,如洗钱、信用卡诈骗等,进行把控。进行把控。进行把控。

【技术实现步骤摘要】
一种用于资金网络的图数据处理方法


[0001]本专利技术涉及图数据处理领域,具体来说涉及资金网络的图数据处理领域,更具体地说,涉及一种用于资金网络的图数据处理方法。

技术介绍

[0002]随着对数据间关系的形象表示以及对数据大规模分析的需求持续增长,在许多领域中,大规模的图计算受到了广泛关注。图(Graph)是描述事物关联属性最常用的一种数据结构,现实生活中的诸多应用场景都可以用图结构来表示。例如,用户之间的转账形成的资金网络可以用带权重的有向图来直观的表示,其中用户对应于图结构中的顶点,转账方向以及金额对应于图结构中的边。资金网络表示为图结构之后,就有多种方法来对图数据进行处理。通过对金融风控的资金流水图结构进行建模与分析,可以有效的识别其中的循环转账,能辅助公安等机关挖掘出洗钱的组织,也能帮助银行预防信用卡的诈骗。
[0003]在对图结构进行分析时,需要对图结构进行遍历,其中主要采用的算法是宽度优先搜索算法(Breadth First Search,简称BFS算法)。BFS算法是解决图遍历问题的经典算法,也是很多重要图算法的基础。其基本思想是,对于图结构G=(V,E),其中V表示顶点集合,E表示边集合,在给定源顶点后,BFS算法将开始搜索图G中源顶点所有可达的邻居顶点。在BFS算法开始时,将源顶点放入当前层的活跃顶点队列。如果当前层队列存在活跃顶点,依次检查队列中活跃顶点的所有邻居顶点;如果某一个邻居顶点没有被访问过,则更新该邻居顶点的父亲和距离信息,然后将该邻居顶点放入下一层的活跃顶点队列。循环迭代,直到处理完当前层队列中的所有顶点,开始下一层的搜索。
[0004]BFS算法逐层不重不漏的遍历特性决定了它能查找到资金网络中所有的循环转账,这样可以发现图数据中存在的所有环路。但是,由于资金流水网络的数据规模巨大,某些特性的环路并不是用户所需的。因此,如果直接采用现有BFS算法,BFS算法会逐层遍历直至最后一层,易产生无效的计算,浪费计算资源和降低检测效率,导致检测时效性不高。因此,有必要对现有技术进行改进。

技术实现思路

[0005]因此,本专利技术的目的在于克服上述现有技术的缺陷,提供一种用于资金网络的图数据处理方法。
[0006]本专利技术的目的是通过以下技术方案实现的:
[0007]根据本专利技术的第一方面,提供一种用于资金网络的图数据处理方法,包括:获取与所述资金网络相关的图数据,其中,所述图数据包括节点和边,其中节点表示用户,边表示资金流向以及资金数额;根据图数据中的每条边构建与之方向相反的虚边;获取图数据的源节点以及用于限定所需资金环路要求的约束参数,从源节点开始根据图数据中的边和约束参数进行正向遍历以及根据图数据中的虚边和约束参数进行反向遍历;基于正向遍历和反向遍历的结果,确定图数据中存在的资金环路。
[0008]在本专利技术的一些实施例中,所述约束参数包括资金环路的规模、相邻边的资金比限制、相邻边的资金浮动比限制、最低资金数额要求或者其组合。
[0009]在本专利技术的一些实施例中,所述从源节点开始基于图数据中的边和约束参数进行正向遍历以及基于图数据中的虚边和约束参数进行反向遍历的步骤包括:根据资金环路的规模参数,确定正向遍历的第一遍历深度以及反向遍历的第二遍历深度;基于BFS算法,从源节点开始根据图数据中的边进行正向遍历,其中,正向遍历的深度达到第一遍历深度时终止正向遍历的BFS算法并存储正向遍历的结果;基于BFS算法,从源节点开始根据图数据中的虚边进行反向遍历,其中,反向遍历的深度达到第二遍历深度时终止反向遍历的BFS算法并存储反向遍历的结果。
[0010]在本专利技术的一些实施例中,所述从源节点开始基于图数据中的边和约束参数进行正向遍历以及基于图数据中的虚边和约束参数进行反向遍历的步骤包括:在正向遍历和反向遍历时,根据两条相邻边的资金数额确定相邻边的资金比;将资金比不满足资金比限制的相邻边确定为不可达相邻边,为不可达相邻边标记不可达信息。
[0011]在本专利技术的一些实施例中,所述从源节点开始基于图数据中的边和约束参数进行正向遍历以及基于图数据中的虚边和约束参数进行反向遍历的步骤包括:在正向遍历和反向遍历时,根据两条相邻边的资金数额确定相邻边的资金浮动比;将资金浮动比不满足资金浮动比限制的相邻边确定为不可达相邻边,为不可达相邻边标记不可达信息。
[0012]在本专利技术的一些实施例中,在正向遍历的过程中发现边中的不可达相邻边时,同时为边中的不可达相邻边所对应的虚边中相邻边标记不可达信息;或者在反向遍历的过程中发现虚边中的不可达相邻边时,同时为虚边中的不可达相邻边所对应的边中相邻边标记不可达信息。
[0013]在本专利技术的一些实施例中,所述从源节点开始基于图数据中的边和约束参数进行正向遍历以及基于图数据中的虚边和约束参数进行反向遍历的步骤包括:在正向遍历或者反向遍历时,根据边的资金数额确定不满足最低资金数额要求的边,不对该边所指向的节点进行后续的遍历。
[0014]在本专利技术的一些实施例中,所述方法还包括:根据资金网络中一段时间内的初始转账数据,构建图数据。
[0015]在本专利技术的一些实施例中,所述图数据按照以下方式构建:获取资金网络对应的初始转账数据,所述初始转账数据包括资金关系中的账号和转账金额;将初始转账数据中两个账号之间同方向的所有转账合并为一次转账后,递归去除入度和出度之和小于等于1的账号,得到第一转账数据;根据第一转账数据中所有的本端账号以及对端账号进行重映射,为所有账号分配编号连续的局部用户ID,得到第二转账关系,并建立局部用户ID与账号的映射关系;根据第二转账关系构建图数据。
[0016]在本专利技术的一些实施例中,所述图数据处理方法还包括:利用多个处理线程并行处理所述图数据。
[0017]在本专利技术的一些实施例中,利用多个处理线程并行处理所述图数据的步骤包括:在开始处理图数据之前,确定用于处理图数据的处理核总数以及每个处理核对应缓存的数据块大小;根据所述处理核总数生成对应数量的处理线程,在每个处理核所在设备为处理线程保留专属内存区域以及在所有处理核都能访问的设备中为所有线程保留共享内存区
域的配置信息;根据每个处理核对应缓存的数据块大小,设置处理线程处理的数据块大小,以与其所要部署的核对应缓存的数据块大小相一致;利用生成的多个处理线程对图数据进行并行处理,并且利用专属内存区域保存各线程进行遍历所需的数据以及中间遍历结果,利用共享内存区域保存遍历过程所需共享的信息。
[0018]根据本专利技术的第二方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序可被处理器执行以实现第一方面中任一项所述方法的步骤。
[0019]根据本专利技术的第三方面,提供一种电子设备,包括:一个或多个处理器;以及存储器,其中存储器用于存储可执行指令;所述一个或多个处理器被配置为经由执行所述可执行指令以实现权利要求第一方面所述方法的步骤。
附图说明
[0020]以下参照附图对本专利技术实施例作进一步说明,其中:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于资金网络的图数据处理方法,其特征在于,包括:获取与所述资金网络相关的图数据,其中,所述图数据包括节点和边,其中节点表示用户,边表示资金流向以及资金数额;根据图数据中的每条边构建与之方向相反的虚边;获取图数据的源节点以及用于限定所需资金环路要求的约束参数,从源节点开始根据图数据中的边和约束参数进行正向遍历以及根据图数据中的虚边和约束参数进行反向遍历;基于正向遍历和反向遍历的结果,确定图数据中存在的资金环路。2.根据权利要求1所述的图数据处理方法,其特征在于,所述约束参数包括资金环路的规模、相邻边的资金比限制、相邻边的资金浮动比限制、最低资金数额要求或者其组合。3.根据权利要求2所述的图数据处理方法,其特征在于,所述从源节点开始基于图数据中的边和约束参数进行正向遍历以及基于图数据中的虚边和约束参数进行反向遍历的步骤包括:根据资金环路的规模参数,确定正向遍历的第一遍历深度以及反向遍历的第二遍历深度;基于BFS算法,从源节点开始根据图数据中的边进行正向遍历,其中,正向遍历的深度达到第一遍历深度时终止正向遍历的BFS算法并存储正向遍历的结果;基于BFS算法,从源节点开始根据图数据中的虚边进行反向遍历,其中,反向遍历的深度达到第二遍历深度时终止反向遍历的BFS算法并存储反向遍历的结果。4.根据权利要求2所述的图数据处理方法,其特征在于,所述从源节点开始基于图数据中的边和约束参数进行正向遍历以及基于图数据中的虚边和约束参数进行反向遍历的步骤包括:在正向遍历和反向遍历时,根据两条相邻边的资金数额确定相邻边的资金比;将资金比不满足资金比限制的相邻边确定为不可达相邻边,为不可达相邻边标记不可达信息。5.根据权利要求2所述的图数据处理方法,其特征在于,所述从源节点开始基于图数据中的边和约束参数进行正向遍历以及基于图数据中的虚边和约束参数进行反向遍历的步骤包括:在正向遍历和反向遍历时,根据两条相邻边的资金数额确定相邻边的资金浮动比;将资金浮动比不满足资金浮动比限制的相邻边确定为不可达相邻边,为不可达相邻边标记不可达信息。6.根据权利要求4或5所述的图数据处理方法,其特征在于,在正向遍历的过程中发现边中的不可达相邻边时,同时为边中的不可达相邻边所对应的虚边中相邻边标记不可达信息;或者在反向遍历的过程中发现虚边中的不可达相邻边时,同时为虚边中的不可达相邻边所对应的边中相邻边标记不可达信息。7...

【专利技术属性】
技术研发人员:段宏键曹华伟张园叶笑春范东睿
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1