一种基于图神经网络的异常用户检测方法技术

技术编号:38947355 阅读:16 留言:0更新日期:2023-09-25 09:43
本申请提供了一种基于图神经网络的异常用户检测方法;其解决了现有的图神经网络不能用于不平衡的银行账户数据集检测的技术问题。主要包括:步骤一:对原始数据集进行数据预处理,构建金融交易网络G;步骤二:使用主动学习选择少数类节点,并生成合成节点;步骤三:对合成节点集和原有图节点进行边缘预测,形成增广图;步骤四:在增广图上进行节点分类器的训练,然后使用训练结束的节点分类器对测试集进行分类。本发明专利技术可广泛应用于异常用户检测技术领域。术领域。术领域。

【技术实现步骤摘要】
一种基于图神经网络的异常用户检测方法


[0001]本申请涉及一种异常用户检测方法,更具体地说,是涉及一种基于图神经网络的异常用户检测方法。

技术介绍

[0002]这些非法金融组织在进行资金吸纳和资金运作时,离不开银行账户间的资金交易。银行交易明细是司法实践中认定非法组织成员的重要证据种类之一。传统的异常组织用户检测方法主要包括两种方式:一种方式是采用人工分析检测的方式,这种方式不仅耗费人力物力,同时对于复杂、多样、海量的业务数据,也无法及时准确地得出检测结果。另一种方式是通过不同工具分别执行采集、分析、检测,对复杂事件进行处理时,响应速度慢,对检测结果存在一定的延时性。
[0003]目前,基于图神经网络的异常用户检测取得了很大进展。这类方法通常是通过账户的交易记录完成金融交易网络的构建,然后训练图神经网络学习图中节点的嵌入表示,最后基于节点嵌入向量和已有标签信息实现对异常用户的检测。然而,金融交易网络中大多数是正常用户,只有极少数是异常用户,属于类别不平衡问题。现有的图神经网络模型主要是基于不同类的节点样本大致平衡的假设,在不平衡数据集上性能不佳。
[0004]GraphSMOTE将SMOTE(Synthetic Minority Oversampling Technique)方法迁移到图结构数据上,在图神经网络的中间嵌入空间使用SMOTE技术进行采样。GraphMixup改进了GraphSMOTE框架,首先,使用解纠缠学习获取节点的高阶语义表示,其次,使用自监督学习改善边缘预测器的性能,最后,使用强化混合机制来确定上采样的尺度。GATSMOTE提出了一个基于注意力机制和图的同质性假设的边缘生成器以适应符合小世界组织的大脑神经网络。GraphSMOTE的两种变体GraphMixup和GATSMOTE,在不平衡数据集上都取得了不错的性能,但是在获取节点表示时都没有考虑复杂图上边的潜在关系,影响了节点嵌入的质量。在进行合成节点生成时随机选择少数类节点进行合成,影响合成节点的质量,进而影响下游分类任务的性能。
[0005]论文Exploring Edge Disentanglement for Node Classification着重于边缘层次的自动解缠,并设计了三个自监督任务来指导训练过程,提出了一个结合GNN(Graph Neural Network)模型的边缘解纠缠学习模块DisGNN,通过边缘解纠缠学习出节点表示,再对节点表示进行分类。该方法注重挖掘边的潜在意义,分类效果获得显著提升。

技术实现思路

[0006]为解决上述技术问题,本申请提出了一种不平衡数据集下基于图神经网络的异常用户检测方法,包括:步骤一:对原始数据集进行数据预处理,构建金融交易网络G,即原图;步骤二:使用主动学习选择少数类节点,并生成合成节点;步骤三:对合成节点集和原有图节点进行边缘预测,形成增广图;
步骤四:在增广图上进行节点分类器的训练,然后使用训练结束的节点分类器对测试集进行分类。
[0007]优选地,步骤一中,金融交易网络;其中,是金融交易网络的节点集合,是金融交易网络的邻接矩阵,是账户的特征向量矩阵。
[0008]优选地,步骤二中,选择少数类节点是指,在主动学习每次迭代时,选择b个异常账户,具体步骤:(1)计算增广图中异常账户的KL散度;(2)选取KL散度最大的前b个账户。
[0009]优选地,步骤二中,还包括使用边缘解纠缠学习在金融交易网络上训练,得到账户的嵌入向量矩阵。
[0010]优选地,步骤二中,将每次迭代选取的b个账户添加到中,进行合成节点生成:中,进行合成节点生成:其中,为从选择的异常账户,为的嵌入向量表示;是除以外的账户,即,为的嵌入向量表示;为最近的异常账户,为的嵌入向量表示;为生成的合成节点,为的嵌入向量表示;为随机变量,在[0,1]范围内服从均匀分布。
[0011]优选地,步骤三中,使用边缘预测器,预测合成节点与原有图节点之间的边,得到,表示第i次迭代时,合成节点与原有图节点之间存在的边;若合成节点与原有图节点之间无边,则为0;若合成节点之间与原有图节点之间存在边,则为1;若合成节点之间与原有图节点之间具有存在边的概率,则在(0,1)之间;表示第i次迭代时合成节点的数目,表示增广图中所有节点的数目。
[0012]优选地,步骤三中,边缘预测是通过基于注意力机制实现,还可以通过两个假设实现:(1)通过保持局部拓扑来进一步调节边缘生成器,(2)边缘生成器通过为合成节点引入新边来减小类内节点间平均最短路径的长度。
[0013]优选地,具体指,将金融交易网络作为DisGNN网络层的输入,得到一组解纠缠边分布;构建q+1个通道,获取解纠缠的邻接矩阵集;使用边缘恢复、标签一致性、通道差异性三个自监督任务指导训练过程,最终得到账户的嵌入向量矩阵。
[0014]优选地,基于注意力机制方法中,注意力系数计算公式为:
式中,节点v和u在第i次迭代时,第t步消息传递迭代中,第k步注意力机制时的加权连接;表示在第i次迭代时,第t步消息传递迭代中,第k步注意力机制时的权重矩阵;表示第t步消息传递时节点v的嵌入向量;表示第t步消息传递时节点u的嵌入向量;第i次迭代时,第t步消息传递迭代中,第k步注意力机制时单层前馈神经网络的权重矩阵。
[0015]优选地,步骤四,使用节点分类器对训练集中的账户进行标签预测,公式为:进行标签预测,公式为:其中,节点的嵌入向量,节点的嵌入向量,,表示第步消息传递时的参数矩阵,。
[0016]本专利技术的有益效果:能够用于不平衡的银行账户数据集中,进行异常用户检测,通过使用基于边缘解纠缠学习出高质量的节点特征表示,以及使用主动学习和合成采样技术改善数据集的不平衡性,提高异常用户的检测性能。
附图说明
[0017]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0018]图1为本专利技术基于图神经网络的异常用户检测方法的流程图。
具体实施方式
[0019]为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0020]现对本申请实施例提供的基于图神经网络的异常用户检测方法进行说明。
[0021]请参阅图1,本申请提出了一种不平衡数据集下基于图神经网络的异常用户检测方法,包括以下步骤:步骤一:对原始的银行账户信息进行数据预处理,构建金融交易网络,即原图。
[0022]首先,读取原始的银行账户信息作为原始数据集,原始数据集包括银行账户的开户信息表和账户交易明细表。其中,开户信息表中包括以下信息项:账户开户名称、开户人证件号码、交易本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的异常用户检测方法,其特征在于,包括:步骤一:对原始数据集进行数据预处理,构建金融交易网络G,即原图;步骤二:使用主动学习选择少数类节点,并生成合成节点;步骤三:对合成节点集和原有图节点进行边缘预测,形成增广图;步骤四:在增广图上进行节点分类器的训练,然后使用训练结束的节点分类器对测试集进行分类。2.如权利要求1所述的基于图神经网络的异常用户检测方法,其特征在于:所述步骤一中,所述金融交易网络;其中,是金融交易网络的节点集合,是金融交易网络的邻接矩阵,是账户的特征向量矩阵。3.如权利要求2所述的基于图神经网络的异常用户检测方法,其特征在于:所述步骤二中,所述选择少数类节点是指,在主动学习每次迭代时,选择b个异常账户,具体步骤:(1)计算增广图中异常账户的KL散度;(2)选取KL散度最大的前b个账户。4.如权利要求3所述的基于图神经网络的异常用户检测方法,其特征在于:所述步骤二中,还包括使用边缘解纠缠学习在金融交易网络上训练,得到账户的嵌入向量矩阵。5.如权利要求3所述的基于图神经网络的异常用户检测方法,其特征在于:所述步骤二中,将每次迭代选取的b个账户添加到中,进行合成节点生成:中,进行合成节点生成:其中,为从选择的异常账户,为的嵌入向量表示;是除以外的账户,即,为的嵌入向量表示;为最近的异常账户,为的嵌入向量表示;为生成的合成节点,为的嵌入向量表示;为随机变量,在[0,1]范围内服从均匀分布。6.如权利要求1所述的基于图神经网络的异常用户检测方法,其特征在于:所述步骤三中,使用边缘预测器,预测合成节点与原有图节点之间的边,得到,表示第i次迭代时,合成节点与原有图节点之间存在的边;若合成...

【专利技术属性】
技术研发人员:王巍孙紫文魏玉良王孝朋王佰玲
申请(专利权)人:威海天之卫网络空间安全科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1