【技术实现步骤摘要】
一种基于图神经网络的非正常关键账户发现方法、系统、设备及存储介质
[0001]本专利技术涉及一种基于图神经网络的非正常关键账户发现方法、系统、设备及存储介质,属于机器学习的
技术介绍
[0002]若某金融账户是非正常组织的领导者账户、申购账户和返利账户,则被称为非正常组织的关键账户。非正常组织资金的表现形式存在一定的规律性和特殊性,可分为申购资金和返利资金两部分。申购资金主要向关键账户中的申购账户转移,资金流特点表现为交易频繁,但每次交易的金额小。在积累一段时间的申购资金后,申购账户将这部分的申购资金转移给组织的领导者账户。领导者账户从中扣留一部分的资金作为自己的分红,然后将剩余的资金转移给返利账户用于给底层账户返利。传统关键账户发现依赖构造人工特征进行分析,人工及时间成本高昂,无法有效地处理不断涌现的大规模数据集。
[0003]在以往基于图的研究中,一般有基于手工特征的方法、基于随机游走的方法和基于图神经网络的方法。基于手工特征的方法通过构造手工特征进行图学习,例如节点的度、中心度、PageRank 值等,强烈依赖人工干预,而且无法保证构造的特征对于学习任务的有效性。基于随机游走的方法将图转化为序列,不能够充分利用图的结构信息。基于图神经网络的方法能够很好的针对目标任务进行端到端的学习从而得到有效的特征,但是现有的图神经网络模型对于图的拓扑结构特征的提取还不够充分。
[0004]目前,基于机器学习或深度学习方法的非正常组织识别领域已经取得很大进展。很多研究将 GNN、CNN等神经网络模型应
【技术保护点】
【技术特征摘要】
1.一种基于图神经网络的非正常关键账户发现方法,其特征在于,包括步骤如下:(1)数据预处理:对非正常金融账户的历史交易记录依次进行数据清洗、关键数据项提取、组织内账户交易关系构建操作;数据清洗,是指:清洗所有和正常账户相关的交易数据,仅保留交易双方都是非正常金融账户的历史交易记录;关键数据项提取,是指:从非正常金融账户的历史交易记录中提取出交易账户、对手账户、进出标志信息项数据;组织内账户交易关系构建,是指:为新数据即组织内账户交易关系创建两个数据项:源账户和目标账户;源账户是指在当前交易中从自身转出一定金额的账户,目标账户指的是接收源账户转出金额的账户;对每笔非正常金融账户的历史交易记录,如果进出标志信息项数据为“出”,则源账户为交易账户,目标账户为对手账户;如果进出标志信息项数据为“进”,则源账户为对手账户,目标账户为交易账户;当新数据中不存在该条数据时,将这条包含源账户和目标账户的信息添加到新数据中;同时,还对各个非正常金融账户重新进行了编码映射,将非正常金融账户映射为区间0到非正常账户数量内的编码;(2)非正常组织金融交易网络图构建;根据步骤(1)构建的组织内账户交易关系构建非正常组织金融交易网络图;非正常组织金融交易网络图中,节点表示非正常金融账户的编码,连接两个节点之间的有向边表示这两个非正常金融账户发生过转账交易,且箭头方向表示资金的流动方向;(3)非正常组织关键账户发现;通过训练好的TRGA模型实现非正常组织关键账户发现。2.根据权利要求1所述的一种基于图神经网络的非正常关键账户发现方法,其特征在于,步骤(3)的具体实现步骤包括:3.1构建并训练TRGA模型;3.2账户交易拓扑特征提取,发现非正常组织关键账户。3.根据权利要求2所述的一种基于图神经网络的非正常关键账户发现方法,其特征在于,TRGA模型包括依次连接的输入层、三路图神经网络层、多头注意力机制层、线性层及Softmax层;TRGA模型的输入层的输入为非正常组织金融交易网络图Graph以及账户节点的one
‑
hot特征X;三路图神经网络层分别对非正常组织金融交易网络图的节点从不同角度进行特征聚合以更新节点特征,再拼接不同层面获取到的节点特征,并通过多头注意力机制层来对获取到的三种节点特征进行信息加权,使TRGA模型关注到更加有效的节点拓扑结构信息;TRGA模型将多头注意力机制层的输出进行整合,即通过线性层综合节点的特征向量并进行数据降维,TRGA模型最终输出为一个长度为2的向量,基于该输出向量实现非正常组织关键账户发现。4.根据权利要求3所述的一种基于图神经网络的非正常关键账户发现方法,其特征在于,TRGA模型的各路图神经网络层都各自独立地对节点的邻接节点信息进行聚合;在TRGA模型中,非正常组织金融交易网络图Graph以及账户节点的one
‑
hot特征X分别
输入三路图神经网络层;在每一路图神经网络层中,其它各层网络层的输入都为当前那一路图神经网络层中的上一层网络层的输出;每一路图神经网络层最终都得到一个维度相同的节点特征矩阵。5.根据权利要求3所述的一种基于图神经网络的非正常关键账户发现方法,其特征在于,TRGA模型的其中第一路图神经网络层通过多头注意力机制层来提取有非正常组织金融交易网络图中的账户节点特征,具体是指:多头图注意力层通过多组相互独立的注意力机制,来发现中心节点与其所有邻接节点的多处相关特征,来为中心节点的邻居节点分配不同的注意力权重,从而学习到中心节点及其邻接节点间的多个相关特征;进一步优选的,假设中心节点为v
i
,则中心节点v
i
与其邻接节点v
j
的完整的注意力权重计算公式如式(Ⅰ)所示:式(Ⅰ)中,为第k层中心节点v
i
与其邻接节点v
j
的注意力权重系数,为节点v
i
在第k层所对应的特征向量,为节点v
j
的特征向量,W为权重矩阵,a
T
为权重参数,激活函数为LeakyReLU(
·
),N(v
i
)代表v
i
的邻接节点集,v
j
表示v
i
的邻接节点;节点v
i
...
【专利技术属性】
技术研发人员:魏学光,黄俊恒,魏玉良,王佰玲,刘红日,王巍,
申请(专利权)人:哈尔滨工业大学威海,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。