基于异构信息网络元学习架构的异常检测方法技术

技术编号:32829008 阅读:12 留言:0更新日期:2022-03-26 20:36
本发明专利技术公开了基于异构信息网络元学习架构的异常检测方法,包括步骤:从原始图中对子图进行采样;对支持集中多个支持图实例采样;对采样图进行迭代,在每个子图中生成结构节点嵌入,输入异构图神经网络模块进行训练更新;根据节点嵌入获得任务嵌入;计算支持损失函数并更新参数;对多个查询图实例进行采样,并按与支持集相同的训练过程来学习节点嵌入和查询损失函数;计算任务权重,进行异常检测并对原始图相应的产品或节点进行异常标注。本发明专利技术可以在不同的异构信息网络之间迁移;采用结构模块、异构模块和对比模块分别捕获子图的结构信息、异构特征和未标记信息,在多个异构信息网络上均显著优于最新技术。网络上均显著优于最新技术。网络上均显著优于最新技术。

【技术实现步骤摘要】
基于异构信息网络元学习架构的异常检测方法


[0001]本专利技术属于人工智能
,尤其涉及基于异构信息网络元学习架构的异常检测方法。

技术介绍

[0002]异构信息网络(HIN)无处不在。众所周知的例子有,社交网络、知识图谱和推荐系统,这些都是由多种类型的节点和边构成的。与假设每个节点都是单一类型的同构网络不同,异构信息网络具有更多的方法来描述网络。这为数据挖掘和知识发现任务,例如节点分类、链路预测和异常检测提供了更有效的解决方案。
[0003]表示学习是挖掘异构信息网络的必要前提。最近的研究利用图神经网络(GNN)取得了比较好的结果。在异构信息网络表示中,本专利技术想当然地认为网络中的大多数标签都是可用的,并以有监督的方式训练图神经网络。然而,在实际情况下,通常只有少数标签被给出,对保持模型的性能形成了严峻的挑战。为了有效地用少量标签挖掘异构信息网络,本文研究了异构信息网络上的少样本学习问题。
[0004]受到计算机视觉中广泛研究的元学习方法的启发,出现了一个新的研究方向,即将元学习应用于图数据的少样本学习。该研究思路为,首先学习一个基础的图神经网络初始参数,然后按照标准的模型不可知的元学习(MAML)框架,使已学习的基础学习器适应新的任务。
[0005]然而,很多方面的缺点阻碍了这些方法的进一步应用。第一个限制是,这些方法通常是为同构网络设计的,之前还没有研究试图解决异构信息网络上的少样本学习问题。第二个限制是,它们大多只能处理单个图上的一个任务。第三个限制是以前的方法大多忽略了图的未标记信息。最后,除了有监督信息和无监督信息之外,第四个是如何巧妙地利用现有方法未充分利用的异构信息网络的结构信息。

技术实现思路

[0006]针对这些不足,本专利技术提出了(1)一个异构图神经网络模块作为基础模型来完全捕获异构信息,(2)一个可以应用于不同任务和不同图的通用框架,(3)一个利用无监督信息的对比模块,以及(4)一个利用图结构信息的结构模块。本专利技术把上述针对异构信息网络上的少样本学习问题的元学习框架称为META

HIN。
[0007]具体来说,首先从原始图中对子图进行采样,以形成元训练和元测试数据集的支持集和查询集。在采样前,首先根据三个重要性评估指标对特定邻域的节点进行排序,即介数中心性、特征中心性和接近中心性。以经过某个节点的最短路径的数目来刻画节点重要性的指标为介数中心性;特征向量中心性的基本想法是:一个节点的重要性既取决于其邻居节点的数量(即该节点的度),也取决于其邻居节点的重要性。接近中心性算法用于发现可通过图高效传播信息的节点,对于每个节点,接近中心性算法在计算所有节点对之间的最短路径的基础上,还要计算它到其他各节点的距离之和,然后对得到的和求倒数,以确定
该节点的接近中心性得分。
[0008]然后,采用排序引导的异构游走对影响节点和各种类型节点的样本子图进行采样。接着,在子图上应用一个结构模块来学习结构嵌入。具体来说,基于具有相似结构的节点将共享相似嵌入的直觉,采用自动编码器对结构信息进行编码。然后应用异构图神经网络模块对输入子图进行编码。首先根据节点的类型对节点进行分组,并对每个组应用双向长短期记忆网络。然后,通过自注意力机制聚合不同类型的嵌入,生成最终的节点嵌入。为了充分利用无监督信息,在计算支持损失和查询损失之前进一步加入了一个对比模块。在训练期间,正样本是来自给定子图的节点,而负样本是来自其他子图的节点。然后最大化节点嵌入和子图嵌入之间的互信息。
[0009]在实验中,为了证明META

HIN可在异构信息网络之间迁移,除了数据集开放学术图(OAG)之外,本专利技术还结合OAG、DBLP和Aminer构建了一个新数据集ODA。这三个数据集都是书目网络;本专利技术进一步引入了两个来自不同领域的数据集:YELP和YAGO。META

HIN在不同数据集上进行三个任务均显著优于最先进的模型。
[0010]本专利技术公开的基于异构信息网络元学习架构的异常检测方法,包括以下步骤:
[0011]获取餐厅评论网络的原始图;
[0012]使用异构子图采样策略从原始图中对子图进行采样,以形成元训练和元测试数据集的支持集和查询集;
[0013]对支持集中多个支持图实例采样;
[0014]对采样图进行迭代,在每个子图中应用具有自动编码器机制的结构模块来生成结构节点嵌入,然后将所述节点嵌入输入异构图神经网络模块进行训练更新,在计算支持损失函数之前使用对比模块以利用无监督信息;
[0015]根据节点嵌入获得任务嵌入;
[0016]计算支持损失函数并根据支持损失更新参数;
[0017]对多个查询图实例进行采样,并按照与支持集相同的训练过程来学习节点嵌入和查询损失函数;
[0018]计算任务权重以更新最终的适应参数θ,进行异常检测;
[0019]根据异常检测结果对原始图相应的产品或节点进行异常标注。
[0020]进一步的,所述使用异构子图采样策略从原始图中对子图进行采样,以形成元训练和元测试数据集的支持集和查询集包括:
[0021]为了形成子图,根据给定标记节点的相邻节点的结构重要性对相邻节点进行排序;
[0022]采用由排序引导的异构游走来构建子图,从而捕获相邻节点的异构和结构特征;所述异构游走迭代地从一个节点移动到其相邻节点,该过程从给定的节点开始,首先到达具有更高优先级的节点,收集到预定数量的节点后,游走才会停止,在游走过程中限制序列中收集不同类型节点的数量,使每一种类型的节点都能包含在内。
[0023]进一步的,所述给定标记节点的相邻节点的结构重要性的衡量指标为节点中心性度量,所述节点中心性度量包括介数中心性、特征向量中心性和接近中心性,并为所述介数中心性、特征向量中心性和接近中心性分配可学习的权重;所述介数中心性用来衡量通过给定节点的最短路径的比例,所述特征向量中心性计算节点对其相邻节点的影响,所述接
近中心性用于计算给定节点与其他节点之间的最短路径的总长度。
[0024]进一步的,所述在每个子图中应用具有自动编码器机制的结构模块来生成结构节点嵌入包括:
[0025]采用自动编码器对结构信息进行编码;
[0026]应用异构图神经网络模块对输入子图进行编码,生成最终的节点嵌入。
[0027]进一步的,所述采用自动编码器对结构信息进行编码包括:
[0028]对于每个子图,其邻接矩阵为A={a1,a2,...,a
n
},其中a
i
是A中的一行,代表与节点i相邻的节点,将所述邻接矩阵输入编码器,得到节点i的潜在表示如下:
[0029]h
i(1)
=δ(W
(1)
a
i
+b
(1)
),
[0030]h
i(k)
=δ(W
(k)
h
i本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于异构信息网络元学习架构的异常检测方法,其特征在于,包括以下步骤:获取餐厅评论网络的原始图;使用异构子图采样策略从原始图中对子图进行采样,以形成元训练和元测试数据集的支持集和查询集;对支持集中多个支持图实例采样;对采样图进行迭代,在每个子图中应用具有自动编码器机制的结构模块来生成结构节点嵌入,然后将所述节点嵌入输入异构图神经网络模块进行训练更新,在计算支持损失函数之前使用对比模块以利用无监督信息;根据节点嵌入获得任务嵌入;计算支持损失函数并根据支持损失更新参数;对多个查询图实例进行采样,并按照与支持集相同的训练过程来学习节点嵌入和查询损失函数;计算任务权重以更新最终的适应参数θ,进行异常检测;根据异常检测结果对原始图相应的产品或节点进行异常标注。2.根据权利要求1所述的基于异构信息网络元学习架构的异常检测方法,其特征在于,所述使用异构子图采样策略从原始图中对子图进行采样,以形成元训练和元测试数据集的支持集和查询集包括:为了形成子图,根据给定标记节点的相邻节点的结构重要性对相邻节点进行排序;采用由排序引导的异构游走来构建子图,从而捕获相邻节点的异构和结构特征;所述异构游走迭代地从一个节点移动到其相邻节点,该过程从给定的节点开始,首先到达具有更高优先级的节点,收集到预定数量的节点后,游走才会停止,在游走过程中限制序列中收集不同类型节点的数量,使每一种类型的节点都能包含在内。3.根据权利要求2所述的基于异构信息网络元学习架构的异常检测方法,其特征在于,所述给定标记节点的相邻节点的结构重要性的衡量指标为节点中心性度量,所述节点中心性度量包括介数中心性、特征向量中心性和接近中心性,并为所述介数中心性、特征向量中心性和接近中心性分配可学习的权重;所述介数中心性用来衡量通过给定节点的最短路径的比例,所述特征向量中心性计算节点对其相邻节点的影响,所述接近中心性用于计算给定节点与其他节点之间的最短路径的总长度。4.根据权利要求1所述的基于异构信息网络元学习架构的异常检测方法,其特征在于,所述在每个子图中应用具有自动编码器机制的结构模块来生成结构节点嵌入包括:采用自动编码器对结构信息进行编码;应用异构图神经网络模块对输入子图进行编码,生成最终的节点嵌入。5.根据权利要求4所述的基于异构信息网络元学习架构的异常检测方法,其特征在于,所述采用自动编码器对结构信息进行编码包括:对于每个子图,其邻接矩阵为A={a1,a2,...,a
n
},其中a
i
是A中的一行,代表与节点i相邻的节点,将所述邻接矩阵输入编码器,得到节点i的潜在表示如下:h
i(1)
=δ(W
(1)
a
i
+b
(1)
),h
i(k)
=δ(W
(k)
h
i(k

1)
+b
(k)
),其中k为编码器层,W
(k)
∈R
d
为第k层的参数矩阵,b
(k)
∈R
d
为偏差,δ为激活函数;
自编码器的目标函数是最小化输入和输出的重构误差,所述自编码器的目标函数数学表示如下:表示如下:其中,如果节点i和节点j之间不存在边,则且b
i,j
=1;否则b
i,j
=β>1;

为元素对应乘积。6.根据权利要求4所述的基于异构信息网络元学习架构的异常检测方法,其特征在于,所述应用异构图神经网络模块对输入子图进行编码...

【专利技术属性】
技术研发人员:赵翔谭真方阳陈盈果黄魁华唐九阳肖卫东葛斌
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1