一种基于多阶邻域匹配一致性的图对齐方法技术

技术编号:38534848 阅读:12 留言:0更新日期:2023-08-19 17:06
一种基于多阶邻域匹配一致性的图对齐方法,包括:获取需要对齐的图G1、G2;通过随机游走的方法,从图G1、G2学习节点表征Y1、Y2;计算图G1、G2中每个节点的度特征,然后计算节点相似度矩阵,选择K

【技术实现步骤摘要】
一种基于多阶邻域匹配一致性的图对齐方法


[0001]本专利技术涉及一种基于多阶邻域匹配一致性的图对齐方法,涉及计算机领域。

技术介绍

[0002]图对齐(GA)作为一种基本的图任务,旨在揭示不同图之间的节点对应关系,这是许多下游任务的预处理步骤。例如,用户经常在多个社交平台上拥有不同的帐户以享受更多服务,因此跨不同的社交网络对齐用户可以帮助整合多源信息。在生物信息学中,不同的物种通常共享共同的功能组件,因此找到不同生物网络之间的最佳映射可以帮助理解跨物种转移生物学。由于其广泛的应用,GA已经吸引了越来越多的研究。然而,由于其NP

hard的特性,GA是十分具有挑战性的。大多数现有工作依赖于额外信息(例如节点属性,边属性)来帮助找到节点对应关系。尽管这些方法在实践中取得了成功,但在许多实际情况下,由于隐私问题,这些额外信息可能不可用。没有额外信息和对齐种子的GA问题通常称为无监督平凡图对齐(UPGA)。在先前的研究中,谱方法在解决UPGA问题时占主导地位,这是基于一种自定义的启发式推断最终的对齐矩阵。然而,谱方法通常无法适用于非常大的图,因为它们所需的计算成本随着图的大小而快速增长。
[0003]随着节点表征学习(NRL)的快速发展,解决UPGA的另一种有前景的方向是生成对齐感知的跨图表征,使得两个对齐节点的节点表征在向量空间中更接近。与谱方法相比,基于NRL的方法可以捕获图中的拓扑特征、结构特征和节点之间的相似性,从不同方面捕捉节点间的相似性。然而,基于NRL的UPGA方法通常从全局视角对子空间进行对齐,但忽略了邻域的局部对齐,这可能导致严重的对齐冲突。例如一个基本的基于NRL的UPGA框架,包括两种常见的子空间对齐学习方法:结构感知对齐学习(SAL)和锚点对齐学习(AAL)。通过任何NRL方法获得两个图的节点表征后,SAL可以很容易地对具有独特结构特征的节点进行对齐,而AAL则试图拟合对齐种子以学习其余未标记节点的对应关系。在SAL中,具有相似结构的节点通常会被错位对齐,导致对齐混乱。对于AAL,对齐模型经常过度拟合有限的对齐种子。SAL和AAL背后的问题是子空间对齐学习中没有严格遵守匹配邻域一致性(MNC)。也就是说,一个节点的邻域没有严格地映射到另一个图中相应节点的邻域。举个例子,给定一组对齐的节点对l 1,l2,则r1(l 1的一个邻居节点)的对齐候选节点应至少限制为(r2、o2、k2)(l2的邻居节点集合)。
[0004]因此,如何在向量空间中有效度量多阶邻域的匹配程度,从而解决UPGA,已成为技术人员重点关注的技术问题。

技术实现思路

[0005]有鉴于此,本专利技术的目的是提供一种基于多阶邻域匹配一致性的图对齐方法,能在向量空间中有效度量多阶邻域的匹配程度,从而解决UPGA。
[0006]为了达到上述目的,本专利技术提供了一种基于多阶邻域匹配一致性的图对齐方法,包括有:
[0007]步骤一、获取需要对齐的两个图:G1=(V1,E1),G2=(V2,E2),其中,G1、G2是需要对齐的图,V1、V2分别是G1、G2的节点集,E1、E2分别是G1、G2的边集;
[0008]步骤二、通过随机游走的方法,分别从图G1、G2学习得到对应的节点表征Y1、Y2;
[0009]步骤三、计算图G1、G2中每个节点的度特征,每个节点的度特征由其1、2、

、K
de
阶邻居节点的度特征拼接而成,K
de
是最大阶数,然后计算图G1、G2的节点相似度矩阵,再基于相似度矩阵选择K
num
个相似性分数大的节点对作为伪对齐种子,并由所有伪对齐种子构成伪对齐种子集
[0010]步骤四、计算伪对齐种子集中每对伪对齐种子的1、2、

、Kne阶邻居嵌入聚合向量,即通过迭代聚合低阶邻居嵌入聚合向量来获得高阶邻居嵌入聚合向量,并根据计算得到的多阶邻居嵌入聚合向量计算基于嵌入的匹配邻域一致性EMNC,然后以EMNC为优化目标,采用奇异值分解方法,计算最优变换矩阵Q

,其中,EMNC用于在向量空间中度量1、2、

、K
ne
各阶邻域的匹配程度,K
ne
是要度量的邻域的最大阶数;
[0011]步骤五、基于欧式距离将G1的投影节点表征Y1Q

与G2的节点表征Y2进行匹配,从而获得图G1、G2的节点对应关系。
[0012]与现有技术相比,本专利技术的有益效果是:本专利技术提出了一种基于多阶邻域匹配一致性的图对齐方法来解决UPGA,为了使MNC在向量空间中使用,定义了基于嵌入的匹配邻域一致性(即EMNC),将EMNC量化为在度加权方案下邻域嵌入聚合的Frobenius范数之差,相对于MNC,EMNC能够在向量空间中更准确度量邻域的匹配程度,MNC仅考虑直接邻域的一致性,而本专利技术可以通过迭代聚合邻域嵌入来扩展EMNC到高阶,从而可以度量更高阶邻域的一致性;本专利技术在获取给定两个图的节点表征向量组后,使用仅选择的少量伪对齐种子来计算估计它们之间的最优正交变换矩阵,为了将MNC应用到子空间对齐学习中,将与伪对齐种子相关的不同阶数的EMNC分数的平均值作为优化目标;本专利技术还可以通过迭代的方式不断提高最优变换矩阵的精确度,并在每次迭代中选择更高质量的伪对齐种子,从而平衡可靠性和数量;通过在真实和模拟的无监督平凡图对齐数据集上进行的大量实验,结果表明本专利技术在准确性和效率方面都取得了良好的平衡。
附图说明
[0013]图1是本专利技术一种基于多阶邻域匹配一致性的图对齐方法的流程图。
[0014]图2是图1步骤三中,计算图G1、G2中每个节点的度特征,每个节点的度特征由其1、2、

、K
de
阶邻居节点的度特征拼接而成的具体步骤流程图。
[0015]图3是图1步骤四的具体步骤流程图。
[0016]图4是在不考虑节点属性特征的情况下,本专利技术方法利用不同跳跃策略在三个数据集上以及不同缺失边比例下的对齐精度图。
[0017]图5是本专利技术方法基于三种数据集上不同度数节点、结构相似性的跳跃概率分布图。
具体实施方式
[0018]为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步
的详细描述。
[0019]如图1所示,本专利技术一种基于多阶邻域匹配一致性的图对齐方法(简称为MMNC),包括有:
[0020]步骤一、获取需要对齐的两个图:G1=(V1,E1),G2=(V2,E2),其中,G1、G2是需要对齐的图,V1、V2分别是G1、G2的节点集,E1、E2分别是G1、G2的边集;
[0021]步骤二、通过随机游走的方法,分别从图G1、G2学习得到对应的节点表征Y1、Y2;
[0022]步骤三、计算图G1、G2中每个节点的度特征,每个节点的度特征由其1、2、

、K
de...

【技术保护点】

【技术特征摘要】
1.一种基于多阶邻域匹配一致性的图对齐方法,其特征在于,包括有:步骤一、获取需要对齐的两个图:G1=(V1,E1),G2=(V2,E2),其中,G1、G2是需要对齐的图,V1、V2分别是G1、G2的节点集,E1、E2分别是G1、G2的边集;步骤二、通过随机游走的方法,分别从图G1、G2学习得到对应的节点表征Y1、Y2;步骤三、计算图G1、G2中每个节点的度特征,每个节点的度特征由其1、2、

、K
de
阶邻居节点的度特征拼接而成,K
de
是最大阶数,然后计算图G1、G2的节点相似度矩阵,再基于相似度矩阵选择K
num
个相似性分数大的节点对作为伪对齐种子,并由所有伪对齐种子构成伪对齐种子集步骤四、计算伪对齐种子集中每对伪对齐种子的1、2、

、K
ne
阶邻居嵌入聚合向量,即通过迭代聚合低阶邻居嵌入聚合向量来获得高阶邻居嵌入聚合向量,并根据计算得到的多阶邻居嵌入聚合向量计算基于嵌入的匹配邻域一致性EMNC,然后以EMNC为优化目标,采用奇异值分解方法,计算最优变换矩阵Q

,其中,EMNC用于在向量空间中度量1、2、

、K
ne
各阶邻域的匹配程度,K
ne
是要度量的邻域的最大阶数;步骤五、基于欧式距离将G1的投影节点表征Y1Q

与G2的节点表征Y2进行匹配,从而获得图G1、G2的节点对应关系。2.根据权利要求1所述的方法,其特征在于,步骤五采用k

d树用于加速最近邻搜索。3.根据权利要求1所述的方法,其特征在于,步骤三中,计算图G1、G2中每个节点的度特征,每个节点的度特征由其1、2、

、K
de
阶邻居节点的度特征拼接而成,进一步包括有:步骤31、为每个节点分别构建1、2、

、K
de
阶邻居集,其中,1、2、

、K
de
阶邻居集分别由与节点的阶数为1、2、

、K
de
的邻居节点组成;步骤32、计算每个节点的度序列,然后计算每个节点的1、2、

、K
de
阶邻居节点的度特征:其中,k∈[1,K
de
],g
dek
(z)是节点z的k阶邻居节点的度特征,表示z的k阶邻居集中,以线性插值的方式计算出的第α个百分位度数值,即在已排序的k阶邻居集的数值范围中,α/100对应的值,且α=0、25、50、75或100,节点的k阶度序列即是节点的k阶邻居集;步骤33、将每个节点的1、2、

、K
de
阶邻居节点的度特征拼接成节点的度特征:X
de
[z]是节点z的度特征,concat()表示拼接函数。4.根据权利要求1所述的方法,其特征在于,步骤三中,...

【专利技术属性】
技术研发人员:孙海峰王敬宇唐伟戚琦张乐剑王纯
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1