一种图异常检测系统构建方法、图异常检测系统及方法技术方案

技术编号：39405736 阅读：12 留言：0更新日期：2023-11-19 15:57

本发明专利技术提供一种图异常检测系统构建方法，所述方法包括：S1、获取原始图，所述原始图包括节点集、边集、属性矩阵、邻接矩阵；S2、执行第一阶段训练，包括：S21、对所述原始图分别进行节点掩蔽处理、边掩蔽处理和/或子图掩蔽处理以得到节点掩蔽图、边掩蔽图和/或、子图掩蔽图；S22、分别采用节点掩蔽图、边掩蔽图和/或、子图掩蔽图训练图自编码器至收敛以获得节点级图编码器、边级编码器和/或、子图级编码器；S3、执行第二阶段训练，包括：以所述步骤S2中训练好的节点级图编码器、边级编码器和/或、子图级编码器以及聚合模块、属性解码器、结构解码器构建初始图异常检测系统，以原始图训练所述属性解码器和结构解码器至收敛。解码器和结构解码器至收敛。解码器和结构解码器至收敛。

全部详细技术资料下载

【技术实现步骤摘要】
一种图异常检测系统构建方法、图异常检测系统及方法

[0001]本专利技术涉及图安全领域，具体来说，涉及无监督的属性图节点异常检测技术，更具体地说，涉及一种构建图异常检测系统的方法、图异常检测系统及方法。

技术介绍

[0002]近些年来，随着社交网络、物联网网络、金融交易网络等多媒体系统的兴起，属性图得到了越来越广泛的应用，这些图包含着丰富的信息，但也存在着异常节点的风险，这些异常节点可能会对整个系统的安全性和可靠性造成威胁，例如虚假账号、网络攻击、金融欺诈等。为了确保这些图的安全性和可靠性，无监督检测异常节点成为了一个重要的研究领域。比较典型的是基于图神经网络(GNN)图异常检测方法。
[0003]然而，现有的图异常检测方法在实际场景中仍然面临一些挑战。首先，真实世界中的图异常包含多种类型，如结构异常、上下文异常和全局异常，而且这些异常可能会共同出现，这使得图异常检测问题更为复杂。其次，大多数现有的图异常检测都基于同质性假设，即图中相同类型的节点倾向于相互连接，而这种假设对图异常检测任务中的异常节点不成立，因为他们往往表现出和周围节点不同的特征，事实上，它们在拓扑结构或属性方面可能与其他节点和边不同，这可能限制了GNN捕捉异常模式的能力，从而影响异常检测的准确性。对于这个问题，最近的研究表明，异常节点在频谱域中展现出与正常节点不同的属性，即正常节点倾向于和相似的节点连接，而异常节点倾向于和不相似的节点连接，因为高频信号体现了图中变化较大的结构，所以该性质与高频信号密切相关。基于此，一些研究者提出了使用不同带通...

【技术保护点】

【技术特征摘要】
1.一种图异常检测系统构建方法，其特征在于，所述方法包括：S1、获取原始图，所述原始图包括节点集、边集、属性矩阵、邻接矩阵；S2、执行第一阶段训练，包括：S21、对所述原始图分别进行节点掩蔽处理、边掩蔽处理和/或子图掩蔽处理以得到节点掩蔽图、边掩蔽图和/或、子图掩蔽图；S22、分别采用节点掩蔽图、边掩蔽图和/或、子图掩蔽图训练图自编码器至收敛以获得节点级图编码器、边级编码器和/或、子图级编码器；S3、执行第二阶段训练，包括：以所述步骤S2中训练好的节点级图编码器、边级编码器和/或、子图级编码器以及聚合模块、属性解码器、结构解码器构建初始图异常检测系统，以原始图训练所述属性解码器和结构解码器至收敛。2.根据权利要求1所述的方法，其特征在于，所述步骤S21包括：对原始图按照如下方式进行节点掩蔽处理：随机将原始图中多个节点在属性矩阵中的属性值置零以得到节点掩蔽图；对原始图按照如下方式进行边掩蔽处理：从边集中随机采样获得子边集，并将采样得到的所述子边集对应的领接矩阵中的元素置零以得到边掩蔽图；和/或，对原始图按照如下方式进行子图掩蔽处理：对原始图中的子图随机进行掩蔽处理以得到子图掩蔽图。3.根据权利要求1所述的方法，其特征在于，所述步骤S22包括：以构建节点级图自编码器，其包括节点级编码器和节点级属性解码器，以节点掩蔽图训练所述节点级图自编码器至收敛并选取训练好的节点级编码器；以及构建边级图自编码器，其包括边级编码器和边级结构解码器，以边掩蔽图训练所述边级图自编码器至收敛并选取训练好的边级编码器；和/或构建子图级图自编码器，其包括子图级编码器、子图级属性解码器和子图级结构解码器，以子图掩蔽图训练所述子图级图自编码器至收敛并选取训练好的子图级编码器。4.根据权利要求3所述的方法，其特征在于，在所述步骤S22中：以节点掩蔽图为输入、图属性矩阵为输出，采用最小均方误差方式训练所述节点编解码模块至收敛；以及以边掩蔽图为输入、图邻接矩阵为输出，采用最小化均方误差方式训练所述边级编解码模块至收敛；和/或以子图掩蔽图为输入、图属性矩阵和图邻接矩阵为输出，采用最小化均方误差方式训练所述子图编解码模块至收敛。5.根据权利要求4所述的方法，其特征在于，所述聚合模块包括全连接网络，并被配置为采用注意力嵌合机制来对所述节点级编码器、边级编码器、子图级编码器对原始图的编码结果进行聚合处理以得到原始图的多层嵌入信息。6.根据权利要求5所述的方法，其特征在于，所述聚合模块通过如下方式获得原始图的多层嵌入信息：
其中，其中，h表示多层嵌入信息，e
i
表示节点级编码器、边级编码器、子图级编码器中的第i个编码器对原始图进行编码得到的嵌入信息，a
i
表示e
i
对应的权重向量，fc(*)表示聚合模块对输入其的嵌入信息的注意力结果。7.根据权利要求4所述的方法，其特征在于，所述节点级编码器和节点级属性解码器、所述边级编码器和边级结构解码器以及所述子图级图编码器、子图级属性解码器和子图级结构解码器、属性解码器、结构解码器均为图神经网络。8.根据权利要求7所述的方法，所述图神经网络为图卷积神经网络或图注意力神经网络。9.根据权利要求1
‑
8任...

【专利技术属性】
技术研发人员：黄庆明，何俊伟，许倩倩，姜阳邦彦，王子泰，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人