一种基于双层图注意力神经网络的网络对齐方法技术

技术编号:26343578 阅读:35 留言:0更新日期:2020-11-13 20:47
本发明专利技术提供一种基于双层图注意力神经网络的网络对齐方法,包括网络嵌入表示和嵌入向量空间对齐两个阶段。在网络嵌入表示阶段,提出了双层图注意力神经网络进行网络表示学习,以提取用户在社交网络中的嵌入向量;在嵌入向量空间对齐阶段,利用得到的社交网络用户节点嵌入向量和部分已知的锚链接集合构建分类模型来预测不同社交网络之间的锚链接,并提出了一种双向嵌入向量空间对齐策略来满足不同社交网络间的用户实体一对一的匹配约束。通过上述设置,本方法能有效地捕捉到用户在社交网络中与邻居用户间和各特征之间的不同影响权重,从而学习到用户在社交网络中的精确表示,提高不同社交网络之间的锚链接预测的准确性。

【技术实现步骤摘要】
一种基于双层图注意力神经网络的网络对齐方法
本专利技术涉及数据挖掘和机器学习
,尤其涉及一种基于双层图注意力神经网络的网络对齐方法。
技术介绍
伴随着互联网和移动设备的快速发展,在线社交网络已经成为人们不可或缺的分享和交流信息的热门平台。由于不同的社交平台提供的服务不同,一个人通常会同时在多个社交网络平台注册账户,以满足其不同的需求。这些由不同的社交网络平台共享的用户自然地形成了连接不同社交网络的锚链接,促进了不同社交网络间的信息交互。挖掘跨多个社交领域的信息交互可以有效应用于跨域链接预测、跨域推荐以及跨域信息扩散等多种下游社交网络应用。然而,当今社会中,这些社交网络平台通常是由不同的公司来单独维护,且彼此之间存在一定的信息隔离。因此,将不同社交平台中的属于同一用户的账户进行对齐已经成为一个亟待解决的研究课题。当前针对网络对齐方法的研究主要可以分为两类:基于无监督的网络对齐方法和基于有监督的网络对齐方法。其中:(1)基于无监督的网络对齐方法:基于无监督的网络对齐模型尝试在没有已知的锚链接的前提下来对齐不同社交网络间的用户账户。在该类方法中,研究者们通常根据用户在社交网络中的用户名的稀有性以及邻域结构的一致性来度量不同社交网络间的用户相似性,然后采用贪心的方法或者最小化两个社交网络的结构一致性的方法来预测锚链接。(2)基于有监督的网络对齐方法:基于有监督的网络对齐模型的普遍思想是将不同社交网络间的对齐问题转化为一个关于锚链接的分类问题,即判断不同社交网络间的任意两个用户之间是否具有锚链接关系。早期的研究通过人工提取用户在社交网络中的某些特征来构建分类模型,这类方法虽然能一定程度上解决部分社交网络场景下的部分用户的对齐问题,但是仍然存在很大的局限性。首先,人工提取用户特征的方法十分繁琐,我们通常无法直接判定哪些特征是有效的,而且不同的社交网络场景的有效特征也有可能不同;其次,社交网络平台出于保护用户隐私的目的,往往会隐藏用户的部分真实信息,因此人工提取用户特征往往会存在部分的信息缺失,从而影响到锚链接预测任务的准确性。近年来,受到网络表示学习在单一社交网络分析任务中被广泛成功应用的鼓舞,一些研究人员开始将网络表示学习应用于多个社交网络之间的网络对齐任务中,该类方法尝试为不同社交网络中的用户学习一个公共的嵌入向量空间,而不再需要人工提取用户在社交网络中的有效特征。这些方法虽然尝试了从用户的社交结构和资料信息等多个方面来建模用户在社交网络中的行为,但是却忽略了在捕捉用户节点表示时其不同邻居用户节点影响权重的不同,以及不同属性信息对用户信息交互的不同影响权重。综上所述,鉴于网络对齐研究对于多社交网络分析任务的重要性以及现有研究存在的一些局限性,本专利技术旨在提出一种基于双层图注意力神经网络的网络对齐方法,通过结合用户级别的注意力机制和特征级别的注意力机制,使得模型能够学习到用户在社交网络中的精确表示,提高锚链接的预测准确性。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种基于双层图注意力神经网络的网络对齐方法,在利用用户在社交网络中的属性、局部社交结构以及全局社交结构等信息建模用户社交行为的同时,能有效地捕捉到用户在社交网络中与邻居用户间和各特征之间的不同影响权重,从而学习到用户在社交网络中的精确表示,提高不同社交网络之间的锚链接预测的准确性。基于上述目的,本专利技术提供了一种基于双层图注意力神经网络的网络对齐方法,其特征在于,包括:基本定义:社交网络抽象为一个有向图G=(V,E,X),其中V={vi|i=1,…,N}表示社交网络中的用户节点集合,N为社交网络中用户节点的数目;E={ei,j=(vi,vj)|vi∈V,vj∈V}表示社交网络中用户之间的关系集合,ei,j=(vi,vj)表示用户vi和用户vj之间存在关联关系;X={xi|i=1,…,N}表示所有用户的特征向量集合,对于每一个用户节点vi,都有一个节点特征向量xi与之对应,特征向量可以从用户节点的个人资料、行为和网络社交结构信息方面提取,不失一般性,我们将要对齐的两个网络命名为源社交网络和目标社交网络,并分别用Gs和Gt表示;对于来自不同的社交网络的任意两个用户和我们用表示源社交网络和目标社交网络之间的一条锚链接关系,其中和是同一个用户分别在不同的社交网络Gs和Gt中的账户;锚链接是不同社交网络中的两个用户之间的一对一的链接关系,不存在两条锚链接共享同一个社交网络的相同用户账户的情况;两个不同的社交网络Gs和Gt之间的所有锚链接关系构成的集合,我们称之为锚链接集合,并用表示,其中表示源社交网络中的用户账户,表示目标社交网络中的用户账户;对于两个不同社交网络Gs=(Vs,Es,Xs)和Gt=(Vt,Et,Xt),网络对齐旨在发现两个社交网络之间的一组锚链接集合T,其中集合T中的任意元素e′ij∈T表示不同社交网络中的两个用户账户和之间的锚链接;S1、网络预处理模块:根据输入的网络类型和包含的用户属性信息来对社交网络进行预处理,构建初始化的用户节点特征向量矩阵;S2、网络嵌入表示模块:将网络预处理模块得到的初始化用户节点特征向量矩阵和社交网络的邻接矩阵作为输入,通过双层图注意力神经网络来捕捉用户在社交网络中复杂的信息交互关系,以学习到社交网络中用户节点的潜在信息,获得精准的用户节点嵌入向量;S3、嵌入向量空间对齐模块:根据S2中学习到的源社交网络和目标社交网络的用户节点嵌入向量来构建分类模型进行锚链接的预测,并采用双向嵌入向量空间对齐策略来满足不同社交网络间的用户账户的一对一匹配的约束;S4、求交集,完成网络对齐。优选的,S2步骤包括以下内容:用户vi的特征向量表示为xi,根据网络类型,提取用户的多种特征向量,并将其横向堆叠来生成用户的初始化特征向量表示其中d表示用户初始化特征向量的维度,下文中出现的d′、d″、d″′分别表示不同的维度,将社交网络中的所有用户的初始化特征向量构建状态矩阵X,其中每一行是特定用户节点的特征向量:X=(x1,x2,…xN)T。优选的,网络类型为拓扑网络,则采用随机矩阵的方式来随机初始化用户的特征向量,并通过双层图注意力神经网络模型的训练阶段来学习随机矩阵的权重参数。优选的,网络类型为属性网络,则采用以下方式对用户属性进行向量化:采用词嵌入方式对用户名等用户资料信息进行随机初始化,得到用户名特征向量;采用Doc2Vec模型从用户长文本信息中挖掘用户的语言风格,并学习到用户的文本特征向量;通过空间聚类对用户轨迹信息进行向量初始化,得到用户的空间特征向量;将用户打分和签到次数直接作为用户的一个特征维度,并进行向量初始化。优选的,S2步骤包括以下内容:S2.1、用户层节点嵌入表示子模块:负责捕捉用户之间不同的影响权重来对用户在社交网络中的局部邻域信息进行加权聚合,从而学习到用户级别的节点嵌入向量;S2.2、特征层节点嵌入表示子模块:负责学习用户的不同特征之间的影响权重,以捕捉更细粒度的特征之间的交互关系,从而学习到用户在本文档来自技高网
...

【技术保护点】
1.一种基于双层图注意力神经网络的网络对齐方法,其特征在于,包括:/n基本定义:社交网络抽象为一个有向图G=(V,E,X),其中V={v

【技术特征摘要】
1.一种基于双层图注意力神经网络的网络对齐方法,其特征在于,包括:
基本定义:社交网络抽象为一个有向图G=(V,E,X),其中V={vi|i=1,...,N}表示社交网络中的用户节点集合,N为社交网络中用户节点的数目;E={ei,j=(vi,vj)|vi∈V,vj∈V}表示社交网络中用户之间的关系集合,ei,j=(vi,vj)表示用户vi和用户vj之间存在关联关系;X={xi|i=1,...,N}表示所有用户的特征向量集合,对于每一个用户节点vi,都有一个节点特征向量xi与之对应,特征向量可以从用户节点的个人资料、行为和网络社交结构信息方面提取,不失一般性,我们将要对齐的两个网络命名为源社交网络和目标社交网络,并分别用Gs和Gt表示;
对于来自不同的社交网络的任意两个用户和我们用表示源社交网络和目标社交网络之间的一条锚链接关系,其中和是同一个用户分别在不同的社交网络Gs和Gt中的账户;锚链接是不同社交网络中的两个用户之间的一对一的链接关系,不存在两条锚链接共享同一个社交网络的相同用户账户的情况;
两个不同的社交网络Gs和Gt之间的所有锚链接关系构成的集合,我们称之为锚链接集合,并用表示,其中表示源社交网络中的用户账户,表示目标社交网络中的用户账户;对于两个不同社交网络Gs=(Vs,Es,Xs)和Gt=(Vt,Et,Xt),网络对齐旨在发现两个社交网络之间的一组锚链接集合T,其中集合T中的任意元素e′ij∈T表示不同社交网络中的两个用户账户和之间的锚链接;
S1、网络预处理模块:根据输入的网络类型和包含的用户属性信息来对社交网络进行预处理,构建初始化的用户节点特征向量矩阵;
S2、网络嵌入表示模块:将网络预处理模块得到的初始化用户节点特征向量矩阵和社交网络的邻接矩阵作为输入,通过双层图注意力神经网络来捕捉用户在社交网络中复杂的信息交互关系,以学习到社交网络中用户节点的潜在信息,获得精准的用户节点嵌入向量;
S3、嵌入向量空间对齐模块:根据S2中学习到的源社交网络和目标社交网络的用户节点嵌入向量来构建分类模型进行锚链接的预测,并采用双向嵌入向量空间对齐策略来满足不同社交网络间的用户账户的一对一匹配的约束;
S4、求交集,完成网络对齐。


2.根据权利要求1所述的一种基于双层图注意力神经网络的网络对齐方法,其特征在于,S2步骤包括以下内容:用户vi的特征向量表示为xi,根据网络类型,提取用户的多种特征向量,并将其横向堆叠来生成用户的初始化特征向量表示其中d表示用户初始化特征向量的维度,下文中出现的d′、d″、d″′分别表示不同的维度,将社交网络中的所有用户的初始化特征向量构建状态矩阵X,其中每一行是特定用户节点的特征向量:X=(x1,x2,...xN)T。


3.根据权利要求2所述的一种基于双层图注意力神经网络的网络对齐方法,其特征在于,网络类型为拓扑网络,则采用随机矩阵的方式来随机初始化用户的特征向量,并通过双层图注意力神经网络模型的训练阶段来学习随机矩阵的权重参数。


4.根据权利要求2所述的一种基于双层图注意力神经网络的网络对齐方法,其特征在于,网络类型为属性网络,则采用以下方式对用户属性进行向量化:采用词嵌入方式对用户名等用户资料信息进行随机初始化,得到用户名特征向量;采用Doc2Vec模型从用户长文本信息中挖掘用户的语言风格,并学习到用户的文本特征向量;通过空间聚类对用户轨迹信息进行向量初始化,得到用户的空间特征向量;将用户打分和签到次数直接作为用户的一个特征维度,并进行向量初始化。


5.根据权利要求2所述的一种基于双层图注意力神经网络的网络对齐方法,其特征在于,S2步骤包括以下内容:
S2.1、用户层节点嵌入表示子模块:负责捕捉用户之间不同的影响权重来对用户在社交网络中的局部邻域信息进行加权聚合,从而学习到用户级别的节点嵌入向量;
S2.2、特征层节点嵌入表示子模块:负责学习用户的不同特征之间的影响权重,以捕捉更细粒度的特征之间的交互关系,从而学习到用户在特征级别的节点嵌入向量;
S2.3、嵌入向量融合子模块:负责对来自用户级别和特征级别的不同层面的用户嵌入向量进行保留和重置,以融合多个视角的节点嵌入向量,提高网络对齐任务的准确性。


6.根据权利要求5所述的一种基于双层图注意力神经网络的网络对齐方法,其特征在于,S2.1包括以下内容:利用一个可学习的变换矩阵将输入向量转化为一个高维向量,即:



根据图注意力神经网络相关知识,对于任意两个用户节点vi和vj,首先计算这两个用户节点间的关系强度eij:



其中和表示用户节点vi和vj在第l层的嵌入向量,W2(l)表示第l层的权重参数,“||”是串联运算符,表示将两个向量进行横向的拼接,LeakyReLU(·)为神经元的激活函数,为了计算对用户节点vi的邻域信息进行聚合时来自不同邻居的信息贡献比例,采用softmax(·)函数来归一化用户节点和其所有邻居用户节点vk∈N(vi)间的关系强度,计算方式如下:



aij就被称为用户节点vi和vj之间的注意力系数,aij的值越大,表示这两个用户之间的关系越密切,根据计算得到的用户节点vi与其所有邻居节点用户(包括其本身)的注意力系数,每个用户节点vi的新的嵌入向量可以定义如下:



其中δ(·)为神经元的激活函数,根据对用户的邻域信息进行不同影响权重的线性聚合,可以得到每个用户在社交网络中的用户级别的节点嵌入向量hi,组成用户级别向量矩阵M=(h1,h2,...,hN)T。


7.根据权利要求6所述的一种基于双层...

【专利技术属性】
技术研发人员:卢美莲戴银龙
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1