【技术实现步骤摘要】
一种基于多阶邻域匹配一致性的图对齐方法
[0001]本专利技术涉及一种基于多阶邻域匹配一致性的图对齐方法,涉及计算机领域。
技术介绍
[0002]图对齐(GA)作为一种基本的图任务,旨在揭示不同图之间的节点对应关系,这是许多下游任务的预处理步骤。例如,用户经常在多个社交平台上拥有不同的帐户以享受更多服务,因此跨不同的社交网络对齐用户可以帮助整合多源信息。在生物信息学中,不同的物种通常共享共同的功能组件,因此找到不同生物网络之间的最佳映射可以帮助理解跨物种转移生物学。由于其广泛的应用,GA已经吸引了越来越多的研究。然而,由于其NP
‑
hard的特性,GA是十分具有挑战性的。大多数现有工作依赖于额外信息(例如节点属性,边属性)来帮助找到节点对应关系。尽管这些方法在实践中取得了成功,但在许多实际情况下,由于隐私问题,这些额外信息可能不可用。没有额外信息和对齐种子的GA问题通常称为无监督平凡图对齐(UPGA)。在先前的研究中,谱方法在解决UPGA问题时占主导地位,这是基于一种自定义的启发式推断最终的对齐矩阵。然而,谱方法通常无法适用于非常大的图,因为它们所需的计算成本随着图的大小而快速增长。
[0003]随着节点表征学习(NRL)的快速发展,解决UPGA的另一种有前景的方向是生成对齐感知的跨图表征,使得两个对齐节点的节点表征在向量空间中更接近。与谱方法相比,基于NRL的方法可以捕获图中的拓扑特征、结构特征和节点之间的相似性,从不同方面捕捉节点间的相似性。然而,基于NRL的UPGA方法通常从全局视角对
【技术保护点】
【技术特征摘要】
1.一种基于多阶邻域匹配一致性的图对齐方法,其特征在于,包括有:步骤一、获取需要对齐的两个图:G1=(V1,E1),G2=(V2,E2),其中,G1、G2是需要对齐的图,V1、V2分别是G1、G2的节点集,E1、E2分别是G1、G2的边集;步骤二、通过随机游走的方法,分别从图G1、G2学习得到对应的节点表征Y1、Y2;步骤三、计算图G1、G2中每个节点的度特征,每个节点的度特征由其1、2、
…
、K
de
阶邻居节点的度特征拼接而成,K
de
是最大阶数,然后计算图G1、G2的节点相似度矩阵,再基于相似度矩阵选择K
num
个相似性分数大的节点对作为伪对齐种子,并由所有伪对齐种子构成伪对齐种子集步骤四、计算伪对齐种子集中每对伪对齐种子的1、2、
…
、K
ne
阶邻居嵌入聚合向量,即通过迭代聚合低阶邻居嵌入聚合向量来获得高阶邻居嵌入聚合向量,并根据计算得到的多阶邻居嵌入聚合向量计算基于嵌入的匹配邻域一致性EMNC,然后以EMNC为优化目标,采用奇异值分解方法,计算最优变换矩阵Q
*
,其中,EMNC用于在向量空间中度量1、2、
…
、K
ne
各阶邻域的匹配程度,K
ne
是要度量的邻域的最大阶数;步骤五、基于欧式距离将G1的投影节点表征Y1Q
★
与G2的节点表征Y2进行匹配,从而获得图G1、G2的节点对应关系。2.根据权利要求1所述的方法,其特征在于,步骤五采用k
‑
d树用于加速最近邻搜索。3.根据权利要求1所述的方法,其特征在于,步骤三中,计算图G1、G2中每个节点的度特征,每个节点的度特征由其1、2、
…
、K
de
阶邻居节点的度特征拼接而成,进一步包括有:步骤31、为每个节点分别构建1、2、
…
、K
de
阶邻居集,其中,1、2、
…
、K
de
阶邻居集分别由与节点的阶数为1、2、
…
、K
de
的邻居节点组成;步骤32、计算每个节点的度序列,然后计算每个节点的1、2、
…
、K
de
阶邻居节点的度特征:其中,k∈[1,K
de
],g
dek
(z)是节点z的k阶邻居节点的度特征,表示z的k阶邻居集中,以线性插值的方式计算出的第α个百分位度数值,即在已排序的k阶邻居集的数值范围中,α/100对应的值,且α=0、25、50、75或100,节点的k阶度序列即是节点的k阶邻居集;步骤33、将每个节点的1、2、
…
、K
de
阶邻居节点的度特征拼接成节点的度特征:X
de
[z]是节点z的度特征,concat()表示拼接函数。4.根据权利要求1所述的方法,其特征在于,步骤三中,...
【专利技术属性】
技术研发人员:孙海峰,王敬宇,唐伟,戚琦,张乐剑,王纯,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。