System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于自监督学习的异质信息网络社区发现方法技术_技高网

一种基于自监督学习的异质信息网络社区发现方法技术

技术编号:40705151 阅读:5 留言:0更新日期:2024-03-22 11:04
本发明专利技术公开了一种基于自监督学习的异质信息网络社区发现方法,该方法为:首先将不同类型节点特征转化到相同特征空间;然后计算节点重要性,设计权重系数,通过多头注意力计算元路径内信息的融合;接着计算不同语义的重要性,进行元路径间的融合,得到节点嵌入表示;再对拓扑结构进行重构,减小前述操作后带来的误差,得到最终的节点嵌入表示;最后利用自监督机制对最终的嵌入表达进行优化和聚类,得到最终的社区结果。本发明专利技术能够充分利用图神经网络结合自监督学习的优势,更好的捕获节点信息之间的相似性,提高了异质信息网络社区划分结果的精确度。

【技术实现步骤摘要】

本专利技术涉及社交网络信息分类,特别是一种基于自监督学习的异质信息网络社区发现方法


技术介绍

1、随着互联网和科技的快速发展,网络的规模不断扩大,互联网的数据也在飞速增长。在现实生活中,用户的好友关系可以视为社交网络,论文之间的引用关系可以视为引用网络,生物分子之间的联系可以视为生物网络,而这些网络都是同种类型节点构成,称为同质网络。但在生活中更常见的是不同类型的信息互相联系形成的网络,这种网络称为异质网络。最常见的异质网络如论文网络,它是由作者、论文、会议、术语不同类型节点组成的,购物网络则是由用户和商品这些类型节点联系构成的,这些丰富的信息构成了庞大的异质信息网络。

2、由于现实世界中大多数的图是位于不同特征空间中带有属性的多种类型的节点及连边关系构成的,尽管基于随机游走得到元路径的嵌入方法在节点分类和节点聚类、链接预测、社区发现等各种任务上优于传统的网络嵌入方法,但是这些方法还存在一些局限性,要么忽略节点内容特征,要么丢弃元路径上的所有中间节点,要么只利用单个元路径。针对这些问题,如何高效利用所忽略的信息也越来越受到工业界和学术界的重视。

3、虽然上述嵌入方法在一些异质信息数据集上比在同质信息数据集得到的结果有所提升,但是一些同质模型会忽略掉很多网络中的必要的信息,近些年提出的图卷积神经网络、图注意力神经网络等针对捕获图中信息展现出了卓越的性能,所以通过神经网络设计出全面利用异构图信息的建模,仍有很大的潜在空间。然而,现有提出的很多算法仅利用图神经网络建立异质信息网络模型,使得对节点信息的捕获很局限,它只能在单一元路径上对信息进行聚合来得到节点嵌入。


技术实现思路

1、本专利技术的目的在于提供一种能够充分利用图神经网络结合自监督学习的优势,更好的捕获节点信息之间的相似性,提高异质信息网络社区划分结果精确度的异质信息网络社区发现方法。

2、实现本专利技术目的的技术解决方案为:一种基于自监督学习的异质信息网络社区发现方法,步骤如下:

3、步骤1、将异构图中不同类型节点特征转化到相同的特征空间;

4、步骤2、计算节点重要性,设计权重系数,通过多头注意力计算元路径内信息的融合;

5、步骤3、计算不同语义的重要性,进行元路径间的融合,得到节点嵌入表示;

6、步骤4、对拓扑结构进行重构,重复步骤2~步骤3,减小前述操作后带来的误差,得到最终的节点嵌入表示;

7、步骤5、利用自监督机制对最终的嵌入表示进行优化和聚类,得到最终的社区结果。

8、本专利技术与现有技术相比,其显著优点在于:(1)本专利技术充分发挥机器学习和深度学习技术的优点,利用图神经网络解决异质网络社区发现问题,在元路径内进行节点相似计算,并且在元路径间利用权重系数对特定语义节点进行重要性划分,以此得到异质网络下的节点表示,提高了异质信息网络社区划分结果的精确度;(2)引入自监督机制,对嵌入节点的表示通过软分配,使得对相似节点的聚合、非相似节点的离间更加准确,对社区划分产生良好的效果。

本文档来自技高网...

【技术保护点】

1.一种基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤如下:

2.根据权利要求1所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤1中将异构图中不同类型节点特征转化到相同的特征空间,具体如下:

3.根据权利要求2所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤2中计算节点重要性,设计权重系数,通过多头注意力计算元路径内信息的融合,具体如下:

4.根据权利要求3所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤2.2中通过图注意力机制,加权与目标节点i相关的元路径P,完成目标节点的节点特征向量表示,具体如下:

5.根据权利要求4所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤3中计算不同语义的重要性,进行元路径间的融合,得到节点嵌入表示,具体如下:

6.根据权利要求5所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤4中对拓扑结构进行重构,具体如下:

7.根据权利要求6所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤5中利用自监督机制对最终的嵌入表示进行优化和聚类,得到最终的社区结果,具体如下:

8.根据权利要求7所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤5.1中计算每个节点被分配到每个聚类的概率,称为软分配Q,并生成一个理想的节点分配的目标分布S,自训练聚类方法通过最小化KL散度来调整软分配Q,以使软分配Q与目标分布S匹配,具体如下:

9.根据权利要求8所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤5.2中针对单一类型节点通过最小化目标损失函数Lo进行训练,达到优化模型的目的,具体如下:

10.根据权利要求9所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤5.3中选择分布Z中的软分配Qic作为最终的聚类结果,通过聚类所属簇的所选类型节点,使相似特征节点聚合,非相似特征节点间离散,得到社区的最终划分结果,具体如下:

...

【技术特征摘要】

1.一种基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤如下:

2.根据权利要求1所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤1中将异构图中不同类型节点特征转化到相同的特征空间,具体如下:

3.根据权利要求2所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤2中计算节点重要性,设计权重系数,通过多头注意力计算元路径内信息的融合,具体如下:

4.根据权利要求3所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤2.2中通过图注意力机制,加权与目标节点i相关的元路径p,完成目标节点的节点特征向量表示,具体如下:

5.根据权利要求4所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤3中计算不同语义的重要性,进行元路径间的融合,得到节点嵌入表示,具体如下:

6.根据权利要求5所述的基于自监督学习的异质信息网络社区发现方法,其特征在于,步骤4中对拓扑结构进行重构,具体如下...

【专利技术属性】
技术研发人员:刘井莲
申请(专利权)人:常熟理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1