一种基于图神经网络的非正常关键账户发现方法、系统、设备及存储介质技术方案

技术编号:30331757 阅读:21 留言:0更新日期:2021-10-10 00:41
本发明专利技术涉及一种基于图神经网络的非正常关键账户发现方法、系统、设备及存储介质,包括步骤如下:(1)数据预处理:对非正常金融账户的历史交易记录依次进行数据清洗、关键数据项提取、组织内账户交易关系构建等操作;(2)非正常组织金融交易网络图构建;根据步骤(1)构建的组织内账户交易关系构建非正常组织金融交易网络图;(3)非正常组织关键账户发现;通过训练好的TRGA模型实现非正常组织关键账户发现。本发明专利技术能够取得很好的非正常关键账户发现效果。本方法可以为相关工作人员的非正常侦查工作提供辅助研判信息,提高工作效率,节省时间。随着更多非正常标记数据的发现,分类模型会得到进一步的完善,检测识别结果准确率也有增加趋势。势。势。

【技术实现步骤摘要】
一种基于图神经网络的非正常关键账户发现方法、系统、设备及存储介质


[0001]本专利技术涉及一种基于图神经网络的非正常关键账户发现方法、系统、设备及存储介质,属于机器学习的


技术介绍

[0002]若某金融账户是非正常组织的领导者账户、申购账户和返利账户,则被称为非正常组织的关键账户。非正常组织资金的表现形式存在一定的规律性和特殊性,可分为申购资金和返利资金两部分。申购资金主要向关键账户中的申购账户转移,资金流特点表现为交易频繁,但每次交易的金额小。在积累一段时间的申购资金后,申购账户将这部分的申购资金转移给组织的领导者账户。领导者账户从中扣留一部分的资金作为自己的分红,然后将剩余的资金转移给返利账户用于给底层账户返利。传统关键账户发现依赖构造人工特征进行分析,人工及时间成本高昂,无法有效地处理不断涌现的大规模数据集。
[0003]在以往基于图的研究中,一般有基于手工特征的方法、基于随机游走的方法和基于图神经网络的方法。基于手工特征的方法通过构造手工特征进行图学习,例如节点的度、中心度、PageRank 值等,强烈依赖人工干预,而且无法保证构造的特征对于学习任务的有效性。基于随机游走的方法将图转化为序列,不能够充分利用图的结构信息。基于图神经网络的方法能够很好的针对目标任务进行端到端的学习从而得到有效的特征,但是现有的图神经网络模型对于图的拓扑结构特征的提取还不够充分。
[0004]目前,基于机器学习或深度学习方法的非正常组织识别领域已经取得很大进展。很多研究将 GNN、CNN等神经网络模型应用到非正常组织识别领域且效果显著,但在数据量缺乏或者非正常组织数据不够完整的情况下,很可能导致基于非正常网络拓扑特征的识别方法获得的分析结果不够精确、可用性低。目前,尚未有性能出色的深度学习模型可融合图神经网络于非正常关键账户检测,从而降低劳动密集型特征工程人工成本,提高非正常关键账户发现的能力。

技术实现思路

[0005]针对现有技术的不足,本专利技术提供了一种基于图神经网络的非正常关键账户发现方法及系统;
[0006]该方法能够针对非正常组织的异常金融交易行为,根据账户交易以及资金流动的特征,应用机器学习、深度学习、复杂网络研究及组合优化方法,从复杂金融交易网络中分析挖掘非正常金融账户、组织关键账户、组织关键资金流等信息。本专利技术能够用于:1)基于非正常交易流水数据的非正常关键账户的特征挖掘;2)基于非正常交易流水数据的关键账户发现。
[0007]本专利技术还提供了一种计算机设备及存储介质。
[0008]术语解释:
[0009]1、交易账户,主动发起资金转出行为的银行账户;
[0010]2、对手账户,接收资金的银行账户。
[0011]本专利技术的技术方案为:
[0012]一种基于图神经网络的非正常关键账户发现方法,包括步骤如下:
[0013](1)数据预处理:对非正常金融账户的历史交易记录依次进行数据清洗、关键数据项提取、组织内账户交易关系构建操作;
[0014]数据清洗,是指:清洗所有和正常账户相关的交易数据,仅保留交易双方都是非正常金融账户的历史交易记录;
[0015]关键数据项提取,是指:从非正常金融账户的历史交易记录中提取出交易账户、对手账户、进出标志信息项数据;
[0016]组织内账户交易关系构建,是指:
[0017]为新数据即组织内账户交易关系创建两个数据项:源账户和目标账户;源账户是指在当前交易中从自身转出一定金额的账户,目标账户指的是接收源账户转出金额的账户;对每笔非正常金融账户的历史交易记录,如果进出标志信息项数据为“出”,则源账户为交易账户,目标账户为对手账户;如果进出标志信息项数据为“进”,则源账户为对手账户,目标账户为交易账户;
[0018]当新数据中不存在该条数据时,将这条包含源账户和目标账户的信息添加到新数据中;同时,还对各个非正常金融账户重新进行了编码映射,将非正常金融账户映射为区间0到非正常账户数量内的编码;
[0019](2)非正常组织金融交易网络图构建;
[0020]根据步骤(1)构建的组织内账户交易关系构建非正常组织金融交易网络图;非正常组织金融交易网络图中,节点表示非正常金融账户的编码,连接两个节点之间的有向边表示这两个非正常金融账户发生过转账交易,且箭头方向表示资金的流动方向;
[0021](3)非正常组织关键账户发现;通过训练好的TRGA模型实现非正常组织关键账户发现。
[0022]根据本专利技术优选的,步骤(1)中,采用阈值法进行数据清洗,具体是指:若当前交易记录的资金流入流出次数的绝对差小于给定阈值,则认定为正常账户,清洗掉,否则,保留。
[0023]根据本专利技术优选的,步骤(3)的具体实现步骤包括:
[0024]3.1构建并训练TRGA模型;
[0025]3.2账户交易拓扑特征提取,发现非正常组织关键账户。
[0026]根据本专利技术优选的,TRGA模型包括依次连接的输入层、三路图神经网络层、多头注意力机制层、线性层及Softmax层;
[0027]TRGA模型的输入层的输入为非正常组织金融交易网络图Graph以及账户节点的one

hot特征 X;
[0028]三路图神经网络层分别对非正常组织金融交易网络图的节点从不同角度进行特征聚合以更新节点特征,再拼接不同层面获取到的节点特征,并通过多头注意力机制层来对获取到的三种节点特征进行信息加权,使TRGA模型关注到更加有效的节点拓扑结构信息;TRGA模型将多头注意力机制层的输出进行整合,即通过线性层综合节点的特征向量并进行数据降维,TRGA模型最终输出为一个长度为2的向量,基于该输出向量实现非正常组织
关键账户发现。
[0029]根据本专利技术优选的,TRGA模型的各路图神经网络层都各自独立地对节点的邻接节点信息进行聚合。
[0030]根据本专利技术优选的,在TRGA模型中,非正常组织金融交易网络图Graph以及账户节点的 one

hot特征X分别输入三路图神经网络层;在每一路图神经网络层中,其它各层网络层的输入都为当前那一路图神经网络层中的上一层网络层的输出;每一路图神经网络层最终都得到一个维度相同的节点特征矩阵;
[0031]根据本专利技术优选的,TRGA模型的其中第一路图神经网络层通过多头注意力机制层来提取有非正常组织金融交易网络图中的账户节点特征,具体是指:多头图注意力层通过多组相互独立的注意力机制,来发现中心节点与其所有邻接节点的多处相关特征,来为中心节点的邻居节点分配不同的注意力权重,从而学习到中心节点及其邻接节点间的多个相关特征。
[0032]进一步优选的,假设中心节点为v
i
,则中心节点v
i
与其邻接节点v
j
的完整的注意力权重计算公式如式(Ⅰ)所示:
[0033][0034]式(Ⅰ)中,为第k层中心节点v
i
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的非正常关键账户发现方法,其特征在于,包括步骤如下:(1)数据预处理:对非正常金融账户的历史交易记录依次进行数据清洗、关键数据项提取、组织内账户交易关系构建操作;数据清洗,是指:清洗所有和正常账户相关的交易数据,仅保留交易双方都是非正常金融账户的历史交易记录;关键数据项提取,是指:从非正常金融账户的历史交易记录中提取出交易账户、对手账户、进出标志信息项数据;组织内账户交易关系构建,是指:为新数据即组织内账户交易关系创建两个数据项:源账户和目标账户;源账户是指在当前交易中从自身转出一定金额的账户,目标账户指的是接收源账户转出金额的账户;对每笔非正常金融账户的历史交易记录,如果进出标志信息项数据为“出”,则源账户为交易账户,目标账户为对手账户;如果进出标志信息项数据为“进”,则源账户为对手账户,目标账户为交易账户;当新数据中不存在该条数据时,将这条包含源账户和目标账户的信息添加到新数据中;同时,还对各个非正常金融账户重新进行了编码映射,将非正常金融账户映射为区间0到非正常账户数量内的编码;(2)非正常组织金融交易网络图构建;根据步骤(1)构建的组织内账户交易关系构建非正常组织金融交易网络图;非正常组织金融交易网络图中,节点表示非正常金融账户的编码,连接两个节点之间的有向边表示这两个非正常金融账户发生过转账交易,且箭头方向表示资金的流动方向;(3)非正常组织关键账户发现;通过训练好的TRGA模型实现非正常组织关键账户发现。2.根据权利要求1所述的一种基于图神经网络的非正常关键账户发现方法,其特征在于,步骤(3)的具体实现步骤包括:3.1构建并训练TRGA模型;3.2账户交易拓扑特征提取,发现非正常组织关键账户。3.根据权利要求2所述的一种基于图神经网络的非正常关键账户发现方法,其特征在于,TRGA模型包括依次连接的输入层、三路图神经网络层、多头注意力机制层、线性层及Softmax层;TRGA模型的输入层的输入为非正常组织金融交易网络图Graph以及账户节点的one

hot特征X;三路图神经网络层分别对非正常组织金融交易网络图的节点从不同角度进行特征聚合以更新节点特征,再拼接不同层面获取到的节点特征,并通过多头注意力机制层来对获取到的三种节点特征进行信息加权,使TRGA模型关注到更加有效的节点拓扑结构信息;TRGA模型将多头注意力机制层的输出进行整合,即通过线性层综合节点的特征向量并进行数据降维,TRGA模型最终输出为一个长度为2的向量,基于该输出向量实现非正常组织关键账户发现。4.根据权利要求3所述的一种基于图神经网络的非正常关键账户发现方法,其特征在于,TRGA模型的各路图神经网络层都各自独立地对节点的邻接节点信息进行聚合;在TRGA模型中,非正常组织金融交易网络图Graph以及账户节点的one

hot特征X分别
输入三路图神经网络层;在每一路图神经网络层中,其它各层网络层的输入都为当前那一路图神经网络层中的上一层网络层的输出;每一路图神经网络层最终都得到一个维度相同的节点特征矩阵。5.根据权利要求3所述的一种基于图神经网络的非正常关键账户发现方法,其特征在于,TRGA模型的其中第一路图神经网络层通过多头注意力机制层来提取有非正常组织金融交易网络图中的账户节点特征,具体是指:多头图注意力层通过多组相互独立的注意力机制,来发现中心节点与其所有邻接节点的多处相关特征,来为中心节点的邻居节点分配不同的注意力权重,从而学习到中心节点及其邻接节点间的多个相关特征;进一步优选的,假设中心节点为v
i
,则中心节点v
i
与其邻接节点v
j
的完整的注意力权重计算公式如式(Ⅰ)所示:式(Ⅰ)中,为第k层中心节点v
i
与其邻接节点v
j
的注意力权重系数,为节点v
i
在第k层所对应的特征向量,为节点v
j
的特征向量,W为权重矩阵,a
T
为权重参数,激活函数为LeakyReLU(
·
),N(v
i
)代表v
i
的邻接节点集,v
j
表示v
i
的邻接节点;节点v
i
...

【专利技术属性】
技术研发人员:魏学光黄俊恒魏玉良王佰玲刘红日王巍
申请(专利权)人:哈尔滨工业大学威海
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1