一种图异常检测系统构建方法、图异常检测系统及方法技术方案

技术编号:39405736 阅读:12 留言:0更新日期:2023-11-19 15:57
本发明专利技术提供一种图异常检测系统构建方法,所述方法包括:S1、获取原始图,所述原始图包括节点集、边集、属性矩阵、邻接矩阵;S2、执行第一阶段训练,包括:S21、对所述原始图分别进行节点掩蔽处理、边掩蔽处理和/或子图掩蔽处理以得到节点掩蔽图、边掩蔽图和/或、子图掩蔽图;S22、分别采用节点掩蔽图、边掩蔽图和/或、子图掩蔽图训练图自编码器至收敛以获得节点级图编码器、边级编码器和/或、子图级编码器;S3、执行第二阶段训练,包括:以所述步骤S2中训练好的节点级图编码器、边级编码器和/或、子图级编码器以及聚合模块、属性解码器、结构解码器构建初始图异常检测系统,以原始图训练所述属性解码器和结构解码器至收敛。解码器和结构解码器至收敛。解码器和结构解码器至收敛。

【技术实现步骤摘要】
一种图异常检测系统构建方法、图异常检测系统及方法


[0001]本专利技术涉及图安全领域,具体来说,涉及无监督的属性图节点异常检测技术,更具体地说,涉及一种构建图异常检测系统的方法、图异常检测系统及方法。

技术介绍

[0002]近些年来,随着社交网络、物联网网络、金融交易网络等多媒体系统的兴起,属性图得到了越来越广泛的应用,这些图包含着丰富的信息,但也存在着异常节点的风险,这些异常节点可能会对整个系统的安全性和可靠性造成威胁,例如虚假账号、网络攻击、金融欺诈等。为了确保这些图的安全性和可靠性,无监督检测异常节点成为了一个重要的研究领域。比较典型的是基于图神经网络(GNN)图异常检测方法。
[0003]然而,现有的图异常检测方法在实际场景中仍然面临一些挑战。首先,真实世界中的图异常包含多种类型,如结构异常、上下文异常和全局异常,而且这些异常可能会共同出现,这使得图异常检测问题更为复杂。其次,大多数现有的图异常检测都基于同质性假设,即图中相同类型的节点倾向于相互连接,而这种假设对图异常检测任务中的异常节点不成立,因为他们往往表现出和周围节点不同的特征,事实上,它们在拓扑结构或属性方面可能与其他节点和边不同,这可能限制了GNN捕捉异常模式的能力,从而影响异常检测的准确性。对于这个问题,最近的研究表明,异常节点在频谱域中展现出与正常节点不同的属性,即正常节点倾向于和相似的节点连接,而异常节点倾向于和不相似的节点连接,因为高频信号体现了图中变化较大的结构,所以该性质与高频信号密切相关。基于此,一些研究者提出了使用不同带通滤波器的方法,但这类方案需要修改GNN的内部结构,并且通常设计用于带监督信号的异常检测,对于无监督信号的异常检测不适用。
[0004]另外,也有一种新出现的图掩蔽自编码器的方案,通过对图的节点、边等进行掩蔽处理来训练图自编码器,使其学习更为鲁棒的图表示。在掩蔽的干扰下,异常节点会表现得比正常节点更加敏感。具体来说,图掩蔽自编码器在用于图异常检测时,主要基于重构误差,即训练一个自编码器模型来对输入图进行重构,利用节点或边的重构误差来检测异常,当输入图的某个节点异常时,其重构误差会显著增加,从而将其标识为异常。然而,现有技术中,更关注出现模式更多的节点,即正常节点,而对异常节点关注较少,导致正常节点和异常节点之间的重构难度没有被明显区分,二者的重构误差也没有明显差异,使得异常检测变得困难。
[0005]综上所述,现有的图异常检测方法至少存在以下缺陷之一:(1)在图异常检测中没有很好的考虑异常节点的异质性;(2)缺乏对无监督情况下高低频信号与异常关系的探索。因此,急需一种更好的异常检测方案来进行无监督异常节点检测,即一种可以充分利用正常和异常节点信号高低频的差异,并考虑节点异质性的影响来对图异常进行检测的方案。

技术实现思路

[0006]因此,本专利技术的目的在于克服上述现有技术的缺陷,提供一种新的图异常检测系
统构建方法、图异常检测系统及方法。
[0007]根据本专利技术的第一方面,提供一种图异常检测系统构建方法,所述方法包括:S1、获取原始图,所述原始图包括节点集、边集、属性矩阵、邻接矩阵;S2、执行第一阶段训练,包括:S21、对所述原始图分别进行节点掩蔽处理、边掩蔽处理和/或子图掩蔽处理以得到节点掩蔽图、边掩蔽图和/或、子图掩蔽图;S22、分别采用节点掩蔽图、边掩蔽图和/或、子图掩蔽图训练图自编码器至收敛以获得节点级图编码器、边级编码器和/或、子图级编码器;S3、执行第二阶段训练,包括:以所述步骤S2中训练好的节点级图编码器、边级编码器和/或、子图级编码器以及聚合模块、属性解码器、结构解码器构建初始图异常检测系统,以原始图训练所述属性解码器和结构解码器至收敛。
[0008]优选的,所述步骤S21包括:对原始图按照如下方式进行节点掩蔽处理:随机将原始图中多个节点在属性矩阵中的属性值置零以得到节点掩蔽图;对原始图按照如下方式进行边掩蔽处理:从边集中随机采样获得子边集,并将采样得到的所述子边集对应的领接矩阵中的元素置零以得到边掩蔽图;和/或,对原始图按照如下方式进行子图掩蔽处理:对原始图中的子图随机进行掩蔽处理以得到子图掩蔽图。
[0009]优选的,所述步骤S22包括:以构建节点级图自编码器,其包括节点级编码器和节点级属性解码器,以节点掩蔽图训练所述节点级图自编码器至收敛并选取训练好的节点级编码器;以及构建边级图自编码器,其包括边级编码器和边级结构解码器,以边掩蔽图训练所述边级图自编码器至收敛并选取训练好的边级编码器;和/或构建子图级图自编码器,其包括子图级编码器、子图级属性解码器和子图级结构解码器,以子图掩蔽图训练所述子图级图自编码器至收敛并选取训练好的子图级编码器。
[0010]优选的,在所述步骤S22中:以节点掩蔽图为输入、图属性矩阵为输出,采用最小均方误差方式训练所述节点编解码模块至收敛;以及以边掩蔽图为输入、图邻接矩阵为输出,采用最小化均方误差方式训练所述边级编解码模块至收敛;和/或以子图掩蔽图为输入、图属性矩阵和图邻接矩阵为输出,采用最小化均方误差方式训练所述子图编解码模块至收敛。
[0011]优选的,所述聚合模块包括全连接网络,并被配置为采用注意力嵌合机制来对所述节点级编码器、边级编码器、子图级编码器对原始图的编码结果进行聚合处理以得到原始图的多层嵌入信息。
[0012]优选的,所述聚合模块通过如下方式获得原始图的多层嵌入信息:
[0013][0014]其中,
[0015][0016]其中,h表示多层嵌入信息,e
i
表示节点级编码器、边级编码器、子图级编码器中的第i个编码器对原始图进行编码得到的嵌入信息,a
i
表示e
i
对应的权重向量,fc(*)表示聚合模块对输入其的嵌入信息的注意力结果。
[0017]优选的,所述节点级编码器和节点级属性解码器、所述边级编码器和边级结构解码器以及所述子图级图编码器、子图级属性解码器和子图级结构解码器、属性解码器、结构解码器均为图神经网络。
[0018]优选的,所述图神经网络为图卷积神经网络或图注意力神经网络。
[0019]优选的,在所述步骤S3中,以原始图为输入、图的属性矩阵和领接矩阵为输出,采用预设的损失函数训练所述初始图异常检测系统至收敛。
[0020]优选的,所述预设的损失函数为:
[0021][0022]其中,为重构损失,为节点异常分布损失,α
s
为节点异常分布损失对应的权重超参数,且
[0023][0024][0025]其中,α是重构损失对应的权重超参数,A为原始图邻接矩阵,为所述结构解码器得到的预测邻接矩阵,X为原始图属性矩阵,所述属性解码器得到的预测属性矩阵,代表F范数,S
k
表示节点v
k
的异常分布熵,且
[0026]S
k


B
k
logB
k
[0027本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图异常检测系统构建方法,其特征在于,所述方法包括:S1、获取原始图,所述原始图包括节点集、边集、属性矩阵、邻接矩阵;S2、执行第一阶段训练,包括:S21、对所述原始图分别进行节点掩蔽处理、边掩蔽处理和/或子图掩蔽处理以得到节点掩蔽图、边掩蔽图和/或、子图掩蔽图;S22、分别采用节点掩蔽图、边掩蔽图和/或、子图掩蔽图训练图自编码器至收敛以获得节点级图编码器、边级编码器和/或、子图级编码器;S3、执行第二阶段训练,包括:以所述步骤S2中训练好的节点级图编码器、边级编码器和/或、子图级编码器以及聚合模块、属性解码器、结构解码器构建初始图异常检测系统,以原始图训练所述属性解码器和结构解码器至收敛。2.根据权利要求1所述的方法,其特征在于,所述步骤S21包括:对原始图按照如下方式进行节点掩蔽处理:随机将原始图中多个节点在属性矩阵中的属性值置零以得到节点掩蔽图;对原始图按照如下方式进行边掩蔽处理:从边集中随机采样获得子边集,并将采样得到的所述子边集对应的领接矩阵中的元素置零以得到边掩蔽图;和/或,对原始图按照如下方式进行子图掩蔽处理:对原始图中的子图随机进行掩蔽处理以得到子图掩蔽图。3.根据权利要求1所述的方法,其特征在于,所述步骤S22包括:以构建节点级图自编码器,其包括节点级编码器和节点级属性解码器,以节点掩蔽图训练所述节点级图自编码器至收敛并选取训练好的节点级编码器;以及构建边级图自编码器,其包括边级编码器和边级结构解码器,以边掩蔽图训练所述边级图自编码器至收敛并选取训练好的边级编码器;和/或构建子图级图自编码器,其包括子图级编码器、子图级属性解码器和子图级结构解码器,以子图掩蔽图训练所述子图级图自编码器至收敛并选取训练好的子图级编码器。4.根据权利要求3所述的方法,其特征在于,在所述步骤S22中:以节点掩蔽图为输入、图属性矩阵为输出,采用最小均方误差方式训练所述节点编解码模块至收敛;以及以边掩蔽图为输入、图邻接矩阵为输出,采用最小化均方误差方式训练所述边级编解码模块至收敛;和/或以子图掩蔽图为输入、图属性矩阵和图邻接矩阵为输出,采用最小化均方误差方式训练所述子图编解码模块至收敛。5.根据权利要求4所述的方法,其特征在于,所述聚合模块包括全连接网络,并被配置为采用注意力嵌合机制来对所述节点级编码器、边级编码器、子图级编码器对原始图的编码结果进行聚合处理以得到原始图的多层嵌入信息。6.根据权利要求5所述的方法,其特征在于,所述聚合模块通过如下方式获得原始图的多层嵌入信息:
其中,其中,h表示多层嵌入信息,e
i
表示节点级编码器、边级编码器、子图级编码器中的第i个编码器对原始图进行编码得到的嵌入信息,a
i
表示e
i
对应的权重向量,fc(*)表示聚合模块对输入其的嵌入信息的注意力结果。7.根据权利要求4所述的方法,其特征在于,所述节点级编码器和节点级属性解码器、所述边级编码器和边级结构解码器以及所述子图级图编码器、子图级属性解码器和子图级结构解码器、属性解码器、结构解码器均为图神经网络。8.根据权利要求7所述的方法,所述图神经网络为图卷积神经网络或图注意力神经网络。9.根据权利要求1

8任...

【专利技术属性】
技术研发人员:黄庆明何俊伟许倩倩姜阳邦彦王子泰
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1