基于深度无监督自动编码器的图异常检测方法技术

技术编号：33857114 阅读：47 留言：0更新日期：2022-06-18 10:45

本发明专利技术提出一种基于深度无监督自动编码器的图异常检测方法，属于无监督异常检测领域。由于使用半监督图异常检测算法来检测离群值时，获取有标签的网络节点数据既困难又昂贵，而现有的无监督图异常检测算法也普遍存在两个局限性，首先是现实世界的复杂网络表现出的高度非线性的特征很难用矩阵分解捕捉到，其次矩阵分解技术在更大的网络中不能很好的使用。针对以上问题，为了能够更合理地提取网络表示中的特征信息，本发明专利技术提出了一种基于深度无监督自动编码器的图异常检测方法，在生成网络嵌入时，使用随机梯度下降和封闭形式来更新网络，以更快地优化网络参数。其次通过识别网络的结构和属性以及联合结构和属性的嵌入来学习，以最大限度地减少离群值的影响。最终将本发明专利技术所提的网络模型应用于无监督异常检测领域，能达到提升检测异常的准确率的效果。能达到提升检测异常的准确率的效果。能达到提升检测异常的准确率的效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度无监督自动编码器的图异常检测方法

：
[0001]本专利技术涉及一种基于深度无监督自动编码器的图异常检测方法，属于无监督异常检测领域。

技术介绍
：
[0002]现实世界中图结构数据无处不在，图作为一种复杂的结构化数据，相对于其他数据结构能够更好地存储和表达实体属性之间的联系，在社交网络分析、交通路网分析和知识图谱构建等领域均有广泛的应用。图异常检测是指在一个图或海量的图数据中寻找不正常的结构，包括节点结构异常，属性异常以及结构和属性联合异常三种类别，目前被广泛应用于网络攻击检测、社交网络中的突发事件检测、交通路网异常检测等应用场景。相较于传统的异常检测方法，由于图具有更强大的表达能力，基于图的异常检测方法不仅可以将复杂的数据更加直观的呈现，同时也能将数据中隐含的相关性融入到异常检测过程中。
[0003]网络中的节点具有社团结构，当节点的结构及其属性符合网络的社团结构时，大多数网络嵌入算法都能很好地工作。但是现实生活中的网络有社区离群节点，这些离群节点在其结构或属性上的相似性方面与它们所属社区的其他节点有很大的差异。如果不仔细处理这些离群节点，甚至会影响网络中其他节点的嵌入。因此，选择一个合适的节点嵌入方法在无监督异常检测任务中处理异常值的结构和属性是非常重要的。为了更合理地提取网络表示中的特征信息，本专利技术提出了一种基于深度无监督自动编码器的图异常检测方法，在生成网络嵌入时，使用随机梯度下降和封闭形式更新网络，以更快地优化网络参数。同时通过识别网络的结构和属性以及联合结构和属性的嵌入来学习，以最大限度...

【技术保护点】

【技术特征摘要】
1.基于深度无监督自动编码器的图异常检测方法，其特征在于，该方法包括以下步骤：步骤1：模型预处理，包括对数据集的划分和对原始数据的预处理。步骤2：模型训练和优化，使用基于深度无监督自动编码器的图异常检测方法进行训练。步骤3：模型测试，使用训练好的模型对测试集的数据测试，计算测试数据的异常分数。2.根据权利要求1所述的基于深度无监督自动编码器的图异常检测方法，其特征在于，所述步骤1中的模型预处理模块的具体步骤为：步骤1_1加载原始数据集中的图节点文件和图边文件。步骤1_2将原始数据集按不同的比例划分成训练集和测试集。分别取数据集中的10％、20％、30％、40％和50％的数据作为训练集训练，剩余数据作为测试集进行测试使用。步骤1_3计算转移矩阵。通过网络的邻接矩阵A得到转移矩阵D
‑1A，其中D是对角矩阵。步骤1_4计算节点之间的高阶近似。表示概率矩阵，取所有概率矩阵P1,
…
,P
T
的平均值来获取节点之间的高阶近似。步骤1_5计算模型的最终输入。最终使用矩阵的行作为模型的最终输入。3.根据权利要求1所述的基于深度无监督自动编码器的图异常检测方法，其特征在于，所述步骤2中的模型训练和优化模块的具体步骤为：步骤2_1计算邻近节点的结构损失使用结构自动编码器的输入捕获节点的局部邻域，进而通过最小化重构损失保持网络中的高阶邻近性。步骤2_2计算邻近节点的结构同质性损失由于网络中的离群节点随机地与多个社区的节点连接，因此...

【专利技术属性】
技术研发人员：席亮，梁晨晨，梁钰佳，
申请(专利权)人：哈尔滨理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人