System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及图数据挖掘,尤其是指一种基于关系挖掘的异构图嵌入方法及系统。
技术介绍
1、在计算机科学中,图结构是一种基本的数据结构,相对于其他结构更加灵活。图不仅包含个体的属性,还能够捕捉个体之间的相互关系,因此常被用于描述和建模较为复杂的系统。通过多层次分析图结构,用户能够更深入地了解数据背后隐含的信息,从而为各种业务场景的后续任务(如节点分类、链接预测、节点推荐等)提供支持。
2、图嵌入是一种解决图分析问题的有效方法,其将原始图数据转换到低维空间,并保留重要的数据,有助于理解节点之间的关联性,并提高下游任务的性能。
3、为了解决这些挑战,有学者引入了元路径的概念,用于解析不同类型节点之间的语义关系。例如,当一篇论文涉及两位作者时,可以使用元路径p=apa来表示。随后,研究者们提出了多种方法。metapath2vec基于用户定义的元路径进行随机游走,使用异构的skip-gram方法学习节点嵌入。magnn则手动采样元路径实例,并对节点所在的元路径上的其他节点的语义特征进行融合,将多个元路径的潜在向量聚合到目标节点嵌入中。han模型采用将异构图转化为多个子图方式,解决了异构性,提出了分层注意力机制来学习节点嵌入。hhne模型首次研究双曲空间中hin嵌入问题,使用元路径引导随机游走来保留hin结构和语义相关性。mhgcn针对属性复用异构网络进行表示学习,通过多层卷积聚合自动学习hin中不同长度的元路径,并将多关系结构和属性语义集成到学习的节点嵌入中。考虑到元路径实例之间的依赖关系,migtnet对从嵌入目
4、这些模型在异构图嵌入领域取得了一些进展,但仍然存在一些局限性:
5、第一、大多数模型需要特定领域知识来设计异构图的元路径;
6、第二、许多方法依赖一个基本假设,即原始异构图结构是完整的,然而,在数据集预处理过程中,通常会按一定规则对数据进行处理,导致输入模型的图结构可能不是最优的。因此,忽视了数据集的预处理对图的影响。
7、第三、在聚合元路径节点数据时,一些模型仅关注首尾节点,忽略了中间节点携带的语义信息,导致消息传递不全面。
技术实现思路
1、为解决上述技术问题,本专利技术提供了一种基于关系挖掘的异构图嵌入方法,所述方法具体步骤包括:
2、步骤s1:提取异构图中所有节点的特征向量;
3、步骤s2:基于所有节点的特征向量,学习节点之间的相似度,补全异构图中隐藏的关系,生成关系邻接矩阵;
4、步骤s3:基于所述关系邻接矩阵,计算邻居节点对目标节点的注意力权重,将加权后的邻居节点信息聚合到邻居节点中,得到更新后的邻居节点特征向量;
5、步骤s4:计算节点之间的关系强度,根据所述关系强度将所述更新后的邻居节点特征向量包含的信息聚合到对应的目标节点中,得到最终的节点嵌入值。
6、在本专利技术的一个实施例中,步骤s2中,所述关系邻接矩阵的的构建方法包括:
7、步骤s21:将异构图中的所有节点的特征向量fv映射到统一的共享语义空间f'v:
8、f'v=σ(fv·wφ(v)+bφ(v))
9、其中,v表示节点,φ(v)表示节点v的类型,表示φ(v)类型节点对应的投影矩阵,bτ表示偏置参数,bτ∈r1×d,σ(·)是非线性激活函数;
10、步骤s22:对于异构图中的一种关系通过度量学习,学习不同类型节点特征之间的一阶特征相似度
11、步骤s23:基于一阶特征相似度得到相似度图
12、
13、其中,εf表示控制相似度图的稀疏度的参数;
14、同理计算相同类型的节点之间的特征相似度图:
15、
16、
17、其中,是源节点si和sj之间的特征相似度图,是尾节点tm和tn之间的特征相似度图;表示源节点si和sj之间的一阶特征相似度,表示尾节点tm和tn之间的一阶特征相似度;f'i、f'j分别表示源节点si和sj的特征向量;f'm、f'n分别表示尾节点tm和tn的特征向量;εfs、εft分别表示控制特征相似度图的稀疏度的参数,εf∈[0,1];
18、步骤s24:将源节点之间的相似度和尾节点之间的相似度通过所述初始关系图矩阵的拓扑结构传播,生成传播图:
19、
20、
21、步骤s25:采用通道注意力对特征相似度图和传播图进行融合,生成关系邻接图
22、
23、其中,为每个关系r分配不同的权重;
24、步骤s26:将关系邻接图和同一类型的关系向量ar进行聚合,得到关系邻接矩阵a'r:
25、
26、其中,softmax(·)表示将权重wψ,r进行归一化。
27、在本专利技术的一个实施例中,所述节点特征之间的一阶特征相似度的获取方法包括:
28、通过度量学习,利用节点之间的关系来学习节点特征之间的一阶特征相似度
29、
30、其中,f'i、f'j均表示经过特征映射之后的节点vi和vj的特征向量;代表哈达玛积;是可学习权重矩阵,用于加权节点特征;r表示一种节点之间的关系类型,e表示节点vi和vj的关系边,表示映射函数,表示关系边e的类型。
31、在本专利技术的一个实施例中,步骤s3中,得到更新后的邻居节点特征向量的方法为:设计行归一化矩阵,根据所述行归一化矩阵计算更新后的节点邻居特征向量fγ:
32、
33、其中,表示行归一化矩阵;f'γ表示在同类型关系r中的节点邻居nγ的特征向量。
34、在本专利技术的一个实施例中,所述行归一化矩阵的表达式为:
35、
36、其中,dr是a'r的度矩阵,
37、在本专利技术的一个实施例中,得到最终的节点嵌入值的步骤包括:
38、步骤s41:利用元关系三元组计算节点的关系强度,得到关系的注意力值:
39、k(s)=k-linearφ(s)(f[s])
40、q(t)=q-linearφ(t)(f[t])
41、
42、其中,φ(s)表示节点s的类型,φ(t)表示节点t的类型,表示节点s和节点t的连接关系类型;k(s)表示源节点s之间的关系强度;q(t)表示尾节点t之间的关系强度;f(s)表示源节点s的特征表示;f(t)表示尾节点t的特征表示;线性投影linearφ(v)用于调整节点s或t的维度,将节点维度从rd变成h是注意力头的数量,是每个头的向量维度;表示调整注意力值的参数;
43、步骤s42:将h个注意力头连接在一起,得到每个节点对的注意力向量attention(s,e,t):
44、
45、其中,softmax函数用于对邻居节点s的注意力分本文档来自技高网...
【技术保护点】
1.一种基于关系挖掘的异构图嵌入方法,其特征在于,包括:
2.根据权利要求1所述的基于关系挖掘的异构图嵌入方法,其特征在于:步骤S2中,所述关系邻接矩阵的的构建方法包括:
3.根据权利要求2所述的基于关系挖掘的异构图嵌入方法,其特征在于:所述节点特征之间的一阶特征相似度的获取方法包括:
4.根据权利要求1所述的基于关系挖掘的异构图嵌入方法,其特征在于:步骤S3中,得到更新后的邻居节点特征向量的方法为:设计行归一化矩阵,根据所述行归一化矩阵计算更新后的节点邻居特征向量FΓ:
5.根据权利要求4所述的基于关系挖掘的异构图嵌入方法,其特征在于:所述行归一化矩阵的表达式为:
6.根据权利要求1所述的基于关系挖掘的异构图嵌入方法,其特征在于:得到最终的节点嵌入值的步骤包括:
7.根据权利要求6所述的基于关系挖掘的异构图嵌入方法,其特征在于:每个目标节点t的上下文表示
8.根据权利要求7所述的基于关系挖掘的异构图嵌入方法,其特征在于:所述来自相邻节点的消息向量Message(s,e,t):
9.根
10.一种基于关系挖掘的异构图嵌入系统,其特征在于,包括以下模块:
...【技术特征摘要】
1.一种基于关系挖掘的异构图嵌入方法,其特征在于,包括:
2.根据权利要求1所述的基于关系挖掘的异构图嵌入方法,其特征在于:步骤s2中,所述关系邻接矩阵的的构建方法包括:
3.根据权利要求2所述的基于关系挖掘的异构图嵌入方法,其特征在于:所述节点特征之间的一阶特征相似度的获取方法包括:
4.根据权利要求1所述的基于关系挖掘的异构图嵌入方法,其特征在于:步骤s3中,得到更新后的邻居节点特征向量的方法为:设计行归一化矩阵,根据所述行归一化矩阵计算更新后的节点邻居特征向量fγ:
5.根据权利要求4所述的基于关系挖掘的异构图嵌入方法,其特征在于:...
【专利技术属性】
技术研发人员:詹千熠,王婧,陆恒杨,谢振平,刘渊,
申请(专利权)人:江南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。