一种基于图结构学习的用户网络行为数据异常检测方法技术

技术编号：40955750 阅读：2 留言：0更新日期：2024-04-18 20:32

一种基于图结构学习的用户网络行为数据异常检测方法，包括如下步骤：S1、使用用户网络行为历史数据对图注意力网络GAT进行训练以构建图结构，将每个用户网络行为作为一个节点并提取其特征，计算节点之间的注意力权重，并利用所述注意力权重聚合邻居节点的特征，对节点特征进行更新；S2、对于步骤S1得到的图结构，过滤掉所述注意力权重小于设定阈值的边，并对每个节点的邻居节点进行排序，选择相似度最靠前的多个邻居节点并与其相连而生成新边，生成具有增强结构特性的精炼图；S3、使用基于所述精炼图的图注意力网络GAT，对输入待测的用户网络行为数据执行图异常检测算法，识别出异常的用户网络行为数据。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及异常现象检测，特别是涉及一种基于图结构学习（gsl）的用户网络行为数据异常检测方法。

技术介绍

1、图异常检测（gad）聚焦于图数据，不仅考虑数据特征的异常，还关注结构的异常，是一种高效的异常检测算法图异常检测是图神经网络（gnn）的一个重要应用，旨在通过考虑节点特征和图的结构信息来识别图中的异常。这些异常可以代表现实场景中的各种实体，例如机器人用户。异常通常可以通过其在全球范围内拥有独特的特征、与社区内其他节点的偏差或异常连接来识别。在没有结构信息的情况下，检测后两种类型的异常尤其具有挑战性。考虑一个社交网络图，其中节点代表个人，边代表他们之间的关系。在此图中，大多数人都与他们的朋友、同事或家人有联系。但是，假设有一个节点连接到异常多的其他节点。这可能表明该帐户属于社交媒体影响者或机器人。这种异常是通过观察连接模式（图形结构）来检测的。通过仅检查年龄或职业等个人属性，而忽略网络中个人之间的相互关联性，这种特殊的异常现象很容易逃避检测。

2、近年来，图异常检测算法有了显著改进，但由于异常节点通过与良性节点连接来伪装自己，图中的某些边对异常检测无益甚至有害。这导致在采用图异常检测算法时引入噪声。

3、图异常检测面临的挑战包括图的异构性、异常节点的伪装以及极端的类不平衡。图异常检测中，图的异配性导致精度受限。图异常检测中通常被忽视的一个主要问题是数据集中拓扑结构的可靠性。

4、当前的图数据集构建方法是基于规则的。例如，亚马逊数据集中的图结构展示了三种不同的关系类型：u-p-u，表示至

5、需要说明的是，在上述
技术介绍
部分公开的信息仅用于对本申请的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

1、本专利技术的主要目的在于克服上述
技术介绍
的缺陷，提供一种基于图结构学习的用户网络行为数据异常检测方法。

2、为实现上述目的，本专利技术采用以下技术方案：

3、一种基于图结构学习的用户网络行为数据异常检测方法，包括如下步骤：

4、s1、使用用户网络行为历史数据对图注意力网络gat进行训练以构建图结构，将每个用户网络行为作为一个节点并提取其特征，计算节点之间的注意力权重，并利用所述注意力权重聚合邻居节点的特征，对节点特征进行更新；

5、s2、对于步骤s1得到的图结构，过滤掉所述注意力权重小于设定阈值的边，并对每个节点的邻居节点进行排序，选择相似度最靠前的多个邻居节点并与其相连而生成新边，生成具有增强结构特性的精炼图；

6、s3、使用基于所述精炼图的图注意力网络gat，对输入待测的用户网络行为数据执行图异常检测算法，识别出异常的用户网络行为数据。

7、进一步地：

8、步骤s1中，在所述图注意力网络gat的每个训练迭代中，使用可学习的权重矩阵来转换节点的特征向量；根据转换后的特征向量和邻接矩阵计算注意力权重；使用所述注意力权重对邻居节点的特征进行加权求和，聚合邻居节点的特征，对节点的特征进行更新。

9、步骤s1中，将节点的原始特征向量通过乘以所述权重矩阵得到转换后的所述特征向量，计算公式如下：

10、；

11、其中，是节点i的原始特征向量，是一个可学习的权重矩阵，而是转换后的特征向量。

12、步骤s1中，所述注意力权重的计算具体包括：将邻居节点的特征向量进行拼接，形成组合特征向量；使用激活函数对拼接后的组合特征向量进行处理，以引入非线性特性，并通过计算从所述激活函数中提取出节点间的注意力权重：对计算出的注意力权重进行指数化和归一化处理，得出每个节点对目标节点的注意力权重。

13、步骤s1中，使用所述注意力权重对邻居节点的特征进行加权求和，聚合邻居节点的特征，是根据所述注意力权重聚合邻居节点的特征信息以更新自身的特征，使更新后的特征向量整合了邻居节点的特征信息，同时考虑到了节点之间的由所述注意力权重决定的相关性。

14、步骤s1中，通过激活函数对加权求和的结果进行非线性转换，将线性组合的输出转换为具有非线性特性的特征表示，以增加模型的非线性表达能力。

15、步骤s1中，训练过程中，所述图注意力网络gat使用二元交叉熵损失函数，对节点类别的预测结果与真实标签之间的差异来计算损失，并指导图的迭代更新。

16、步骤s2中，过滤掉原始图中注意力权重小于设定阈值的边，并且，对于每个节点，连接与其相似性度量值最高的多个节点而生成新的边，将原始图保留的边和生成的边整合到新的图中，得到所述精炼图。

17、还包括如下步骤：对于不是图结构的数据，先通过特征工程进行预处理，处理后的特征使用k-最近邻算法knn构建成初始图；然后再执行步骤s1至s3。

18、一种计算机可读存储介质，存储有计算机程序，所述计算机程序由处理器执行时，实现所述的基于图结构学习的用户网络行为数据异常检测方法。

19、本专利技术具有如下有益效果：

20、本专利技术提出了一种基于图结构学习的用户网络行为数据异常检测方法，可应用于在电商、社交网络上发现异常用户的虚假评论等用户网络异常行为，提供了一种具有图结构学习gsl的新型异常检测管道。在本专利技术提出的方法中，基于历史数据，通过充分利用图注意力网络的特性，能够有效学习最适合图异常检测的图结构。本专利技术可图异常检测之前对图结构进行修正，也可对非图数据部署图异常监测算法进行预处理。对于具有原始图结构的数据集，在部署gad算法之前使用gsl方法细化图数据；对于没有原始图结构的数据集，使用gsl来学习合适的图结构以进行有效的异常检测，从而使得 gad在非图数据集上的应用。简而言之，本专利技术的方法不仅增强了图异常检测算法的性能，而且还能够处理非图数据，例如表格数据。这不仅在异常检测性能方面取得了进步，而且还将 gad 算法的应用扩展到传统的基于图的数据集之外。本专利技术在三个公共数据集上展示了改进的性能，并且在应用于表格数据时也取得了出色的结果。

21、本专利技术实施例中的其他有益效果将在下文中进一步述及。

本文档来自技高网...

【技术保护点】

1.一种基于图结构学习的用户网络行为数据异常检测方法，其特征在于，包括如下步骤：

2.如权利要求1所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，步骤S1中，在所述图注意力网络GAT的每个训练迭代中，使用可学习的权重矩阵来转换节点的特征向量；根据转换后的特征向量和邻接矩阵计算注意力权重；使用所述注意力权重对邻居节点的特征进行加权求和，聚合邻居节点的特征，对节点的特征进行更新。

3.如权利要求2所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，步骤S1中，将节点的原始特征向量通过乘以所述权重矩阵得到转换后的所述特征向量，计算公式如下：

4.如权利要求2所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，步骤S1中，所述注意力权重的计算具体包括：将邻居节点的特征向量进行拼接，形成组合特征向量；使用激活函数对拼接后的组合特征向量进行处理，以引入非线性特性，并通过计算从所述激活函数中提取出节点间的注意力权重：对计算出的注意力权重进行指数化和归一化处理，得出每个节点对目标节点的注意力权重。

5.如权利

6.如权利要求5所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，步骤S1中，通过激活函数对加权求和的结果进行非线性转换，将线性组合的输出转换为具有非线性特性的特征表示，以增加模型的非线性表达能力。

7.如权利要求1所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，步骤S1中，训练过程中，所述图注意力网络GAT使用二元交叉熵损失函数，对节点类别的预测结果与真实标签之间的差异来计算损失，并指导图的迭代更新。

8.如权利要求1至7任一项所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，步骤S2中，过滤掉原始图G中注意力权重小于设定阈值的边，并且，对于每个节点，连接与其相似性度量值最高的多个节点而生成新的边，将原始图保留的边和生成的边整合到新的图中，得到所述精炼图。

9.如权利要求1至7任一项所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，还包括如下步骤：对于不是图结构的数据，先通过特征工程进行预处理，处理后的特征使用k-最近邻算法kNN构建成初始图；然后再执行步骤S1至S3。

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序由处理器执行时，实现如权利要求1至9任一项所述的基于图结构学习的用户网络行为数据异常检测方法。

...

【技术特征摘要】

1.一种基于图结构学习的用户网络行为数据异常检测方法，其特征在于，包括如下步骤：

2.如权利要求1所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，步骤s1中，在所述图注意力网络gat的每个训练迭代中，使用可学习的权重矩阵来转换节点的特征向量；根据转换后的特征向量和邻接矩阵计算注意力权重；使用所述注意力权重对邻居节点的特征进行加权求和，聚合邻居节点的特征，对节点的特征进行更新。

3.如权利要求2所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，步骤s1中，将节点的原始特征向量通过乘以所述权重矩阵得到转换后的所述特征向量，计算公式如下：

4.如权利要求2所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，步骤s1中，所述注意力权重的计算具体包括：将邻居节点的特征向量进行拼接，形成组合特征向量；使用激活函数对拼接后的组合特征向量进行处理，以引入非线性特性，并通过计算从所述激活函数中提取出节点间的注意力权重：对计算出的注意力权重进行指数化和归一化处理，得出每个节点对目标节点的注意力权重。

5.如权利要求2所述的基于图结构学习的用户网络行为数据异常检测方法，其特征在于，步骤s1中，使用所述注意力权重对邻居节点的特征进行加权求和，聚合邻居节点的特征，是根据所述注意力权重聚合邻居节点的特征信息以更新自身的特征，使更新后的特征向量整合了邻居节点...

【专利技术属性】
技术研发人员：陈伟坚，王沛松，陈博奎，袁凤池，张永豪，刘菲雪，陈思琪，
申请(专利权)人：清华大学深圳国际研究生院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人