用于图上的异常检测的方法和装置制造方法及图纸

技术编号：41321730 阅读：8 留言：0更新日期：2024-05-13 15:00

公开了一种用于训练具有多个层的图神经网络(GNN)进行异常检测的方法。该方法包括：获得针对图的每个节点的嵌入和针对整个图的嵌入；将针对每个节点的嵌入和针对整个图的嵌入输入到GNN，其中，针对每个节点的嵌入和针对整个图的嵌入在GNN的每个层处被连续地更新；以及基于损失函数来更新GNN。该方法还包括：在更新针对每个节点的嵌入和针对整个图的嵌入之前，在GNN的每个层处更新图的边。提供了众多其它方面。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

概括而言，本公开内容的各方面涉及人工智能，并且更具体地，涉及提供用于图上的异常检测的方法和装置。

技术介绍

1、异常检测对防止在各种应用中的恶意活动(诸如在线评论垃圾邮件、金融欺诈、虚假用户和错误信息的检测)具有深远的影响。最有前景的发展已经是在机器学习模型中对图结构的利用，因为图可以用于自然地对数据下层的结构依赖性进行建模。

2、大量的工作已经集中在发现异常的结构模式并将其并入到学习模型中。最近，图神经网络(gnn)的进步已经启发和允许将gnn用于检测异常的各种尝试。用于解决基于图的异常检测的现有尝试集中于结构特征工程或学习。基于gnn的异常检测的主要思想是利用gnn的能力来学习表达节点表示，目的是在嵌入空间中区分异常节点和正常节点，从而产生有前景的结果。

3、对比学习是一种用于训练编码器以学习产生输入的向量表示的广泛使用的方法，使得与不同类别中的输入的表示相比，相同类别中的输入的表示将更相似。已经验证了对于下游分类任务非常有用，但其还没有特别提出来解决异常检测问题。

4、然而，仅使相同类别中的输入更相似可能是不够的，使不同类别中的输入同时更有区别可能更有效。在具有精细设计的目标的情况下，将gnn和对比学习结合用于异常检测是有前景的。

技术实现思路

1、以下给出了一个或多个方面的简化概述，以便提供对这些方面的基本理解。该概述不是所有预期方面的广泛概述，并且旨在既不标识所有方面的关键或重要元素，也不旨在标识任何或所有方面的范围。其唯一目的是以简化

2、鉴于对比学习，在本公开内容中提出将每个节点与输入图的全局上下文进行对比。出于根据它们与全局上下文的距离来将异常节点与正常节点进行对比的目的，基于图对比学习和gnn来公开上下文感知图对比学习(cogcl)模型。底层假设是异常节点倾向于比正常节点离节点中的大部分节点更远。

3、本公开内容以监督方式提供上下文感知图对比损失函数，即，将正常节点和异常节点分别标记为正密钥和负密钥。为了实现对比目标，公开了图神经网络编码器以在消息传递期间学习节点的表示和学习输入图的全局上下文。图神经网络编码器还被公开为在学习节点的表示和学习输入图的全局上下文之前推断和移除可疑链接。所公开的编码器具有用于边更新、节点更新和图更新的对应模块。

4、除了监督模型之外，还扩展到无监督模型以用于处理具有稀缺性标签的情况。直接地，需要合成可以直接用于替换cogcl的监督对比损失函数中的地面真值标签的节点标签。

5、根据一方面，公开了一种用于训练具有多个层的图神经网络(gnn)进行异常检测的方法。所述方法包括：获得针对图的每个节点的嵌入和针对整个图的嵌入；将所述针对每个节点的嵌入和所述针对整个图的嵌入输入到所述gnn，其中，所述针对每个节点的嵌入和所述针对整个图的嵌入在所述gnn的每个层处被连续地更新；以及基于损失函数来更新所述gnn。

6、根据进一步的方面，节点的一部分在被输入到所述gnn之前至少基于地面真值节点标签而被识别为异常节点。

7、根据进一步的方面，节点的一部分在被输入到所述gnn之前至少基于通过以下操作生成所述图而被识别为异常节点：将第一图分解为多个子图；以及将来自除了将被用作用于输入到所述gnn中的所述图的子图之外的子图的节点集合注入到所述子图中作为异常节点。

8、根据进一步的方面，所述损失函数要使与所述图的异常节点的嵌入与所述整个图的嵌入之间的一致性相比，强制在所述图的正常节点的嵌入与所述整个图的嵌入之间的一致性最大化。

9、根据进一步的方面，在更新所述针对每个节点的嵌入和所述针对整个图的嵌入之前，在所述gnn的每个层处更新所述图的边。

10、根据进一步的方面，通过以下操作来在每个层处更新所述图的所述边：估计两个节点之间的边的可疑概率；以及至少部分地基于所述边的所述可疑概率来移除所述边。

11、根据进一步的方面，通过以下操作来在每个层处更新针对每个节点的嵌入：至少基于当前层的边来针对节点聚合上一层的所有相邻节点的嵌入；以及将经聚合的嵌入与所述上一层的针对所述节点的嵌入进行组合。

12、根据进一步的方面，通过以下操作来在每个层处更新所述针对整个图的嵌入：计算当前层的针对每个节点的嵌入与上一层的针对整个图的嵌入之间的相似性；以及通过基于对应相似性来对所述当前层的针对每个节点的嵌入进行加权聚合来计算所述当前层的针对整个图的嵌入。

13、公开了一种用于使用利用本公开内容中的方法训练的图神经网络(gnn)进行异常检测的方法。所述方法包括：获得针对图的每个节点的嵌入和针对整个图的嵌入；将所述针对每个节点的嵌入和所述针对整个图的嵌入输入到所述gnn，其中，至少所述针对每个节点的嵌入和所述针对整个图的嵌入在所述gnn的每个层处被连续地更新；以及在所述gnn的最终层之后，输出作为异常程度的在经更新的针对节点的嵌入与经更新的针对整个图的嵌入之间的余弦相似性。

14、根据另外的方面，在更新所述针对每个节点的嵌入和所述整个图的嵌入之前，在gnn的每个层处更新所述图的边。

15、根据一方面，公开了一种用于训练包括具有多个层的图神经网络(gnn)的在线学术系统进行错误指派的发布检测的方法。所述方法包括：获得针对图的每个节点的嵌入和针对整个图的嵌入；将所述针对每个节点的嵌入和所述针对整个图的嵌入输入到所述gnn，其中，所述针对每个节点的嵌入和所述针对整个图的嵌入在所述gnn的每个层处被连续地更新；以及基于损失函数来更新所述gnn。

16、根据另外的方面，所述图是基于在线学术系统的数据来构建的，并且其中，所述图的每个节点表示所述在线学术系统的研究者，并且如果两个出版物具有某个共同属性，诸如共同作者、场所或组织，则存在边。

17、根据另外的方面，公开了一种用于训练包括具有多个层的图神经网络(gnn)的在线垃圾邮件识别系统进行垃圾邮件检测的方法。所述方法包括：获得针对图的每个节点的嵌入和针对整个图的嵌入；将所述针对每个节点的嵌入和所述针对整个图的嵌入输入到所述gnn，其中，所述针对每个节点的嵌入和所述针对整个图的嵌入在所述gnn的每个层处被连续地更新；以及基于损失函数来更新所述gnn。

18、根据另外的方面，所述图是基于在线电子邮件系统的数据来构建的，并且其中，所述图的每个节点表示所述在线电子邮件系统的帐户，并且如果在两个帐户之间发生任何电子邮件交换，则存在边。

19、根据一方面，公开了一种用于训练包括具有多个层的图神经网络(gnn)的欺诈识别系统进行异常检测的方法。所述方法包括：获得针对图的每个节点的嵌入和针对整个图的嵌入；将所述针对每个节点的嵌入和所述针对整个图的嵌入输入到所述gnn，其中，所述针对每个节点的嵌入和所述针对整个图的嵌入在所述gnn的每个层处被连续地更新；以及基于损失函数来更新所述gnn。<本文档来自技高网...

【技术保护点】

1.一种用于训练具有多个层的图神经网络(GNN)进行异常检测的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，节点的一部分在被输入到所述GNN之前至少基于地面真值节点标签而被识别为异常节点。

3.根据权利要求1所述的方法，其中，节点的一部分在被输入到所述GNN之前至少基于通过以下操作生成所述图而被识别为异常节点：

4.根据权利要求2或3所述的方法，其中，所述损失函数要使与所述图的异常节点的嵌入与所述针对整个图的嵌入之间的一致性相比，强制在所述图的正常节点的嵌入与所述针对整个图的嵌入之间的一致性最大化。

5.根据权利要求1所述的方法，所述方法还包括：

6.根据权利要求5所述的方法，其中，通过以下操作来在每个层处更新所述图的所述边：

7.根据权利要求6所述的方法，其中，估计两个节点之间的所述边的所述可疑概率包括：

8.根据权利要求5所述的方法，其中，通过以下操作来在每个层处更新针对所述每个节点的嵌入：

9.根据权利要求8所述的方法，其中，所述聚合操作包括求和，并且所述组合操作包括级联。

10.根据权利要求5所述的方法，其中，通过执行对所述图中的所有节点的求和池化、最大池化或平均池化中的一者来获得所述针对整个图的嵌入。

11.根据权利要求5所述的方法，其中，通过以下操作来在每个层处更新所述针对整个图的嵌入：

12.根据权利要求1所述的方法，其中，所述图是基于在线电子邮件系统的数据来构建的，并且其中，所述图的每个节点表示所述在线电子邮件系统的帐户，并且如果在两个帐户之间发生任何电子邮件交换，则存在边。

13.根据权利要求1所述的方法，其中，所述图是基于在线学术系统的数据来构建的，并且其中，所述图的每个节点表示研究者的出版物，并且如果两个出版物具有特定共同属性，则存在边。

14.一种用于使用利用权利要求1-13中的一项来训练的图神经网络(GNN)进行异常检测的方法，包括：

15.一种计算机系统，包括：

16.一种或多种存储计算机可执行指令的计算机可读存储介质，所述计算机可执行指令在被执行时使得一个或多个处理器执行根据权利要求1-12中的一项所述的方法的操作。

17.一种包括计算机可执行指令的计算机程序产品，所述计算机可执行指令在被执行时使得一个或多个处理器执行根据权利要求1-14中的一项所述的方法的操作。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于训练具有多个层的图神经网络(gnn)进行异常检测的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，节点的一部分在被输入到所述gnn之前至少基于地面真值节点标签而被识别为异常节点。

3.根据权利要求1所述的方法，其中，节点的一部分在被输入到所述gnn之前至少基于通过以下操作生成所述图而被识别为异常节点：

5.根据权利要求1所述的方法，所述方法还包括：

6.根据权利要求5所述的方法，其中，通过以下操作来在每个层处更新所述图的所述边：

7.根据权利要求6所述的方法，其中，估计两个节点之间的所述边的所述可疑概率包括：

8.根据权利要求5所述的方法，其中，通过以下操作来在每个层处更新针对所述每个节点的嵌入：

9.根据权利要求8所述的方法，其中，所述聚合操作包括求和，并且所述组合操作包括级联。

10.根据权利要求5所述的方法，其中，通过执行对所述...

【专利技术属性】
技术研发人员：E·哈特拉莫诺夫，唐杰，陈波，
申请(专利权)人：罗伯特·博世有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人