一种基于图卷积的社交网络对齐方法技术

技术编号:20869442 阅读:25 留言:0更新日期:2019-04-17 09:56
本发明专利技术公开了一种基于图卷积的社交网络对齐方法,首先利用图卷积神经网络对社交网络中的用户关系进行网络嵌入,然后利用高斯核函数将嵌入空间升维,得到高维空间中节点的相似度矩阵,利用锚节点来表示非锚节点,得到两个社交网络最终的网络嵌入,再利用已知的锚节点信息来学习一个网络映射函数,最后利用该函数将两个社交网络中的节点进行对齐。本发明专利技术不需要提取大量的用户隐私信息,利用图形就能够很好地表示社交网络用户之间的社交关系。通过引入高斯核函数将嵌入空间升维,可以分离原始低维嵌入空间中不可分离的节点。利用已知锚节点来学习网络映射函数,可以大大地提高社交网络对齐的准确率,从而实现了一种优于现有方法的社交网络对齐方法。

【技术实现步骤摘要】
一种基于图卷积的社交网络对齐方法
本专利技术属于机器学习中的神经网络领域,是一种基于深度学习的方法,主要利用图卷积神经网络(GraphConvolutionalNeuralNetworks,GCN)对社交网络中的用户进行网络嵌入(NetworkEmbedding,NE)从而将网络中的用户节点用嵌入向量表示,并在此基础上利用高斯核函数对嵌入空间进行维度提升从而分离在低维空间难于区分的用户节点,最后利用锚节点信息进行神经网络训练得到两个社交网络中用户节点的映射函数,达到将两个社交网络中的用户对齐的目的。
技术介绍
社交网络对齐的主要目的是在两个社交网络之间找到对应用户,即在不同社交网络中对应真实世界中的同一个自然人的用户。由于社交网络对齐在用户行为预测、身份验证和隐私保护等各种应用程序设置方面的重要影响,最近引起了越来越多的关注。随着社交网络服务(SocialNetworkService,SNS)的普及,网络数据无处不在。社交网络可以通过社交网络图(SocialNetworkGraph,SNG)来表示。该图是未加权的无向图,图的每个顶点都代表一个用户,两点之间的边代表两个用户之间的关系。在现实中,因为社交网络服务商会对用户隐私进行保护,往往不能知道两个社交网络所有的对应用户,但是可能通过其它途径获知两个社交网络一部分的对应用户。这种两个不同的社交网络中已知的对应节点被称为锚节点。本专利技术根据社交网络图以及锚节点信息来进行两个社交网络的对齐。传统的网络嵌入方法可以分为两种,一种方法通常从账户配置文件或活动(如用户名、性别、写作风格等)中提取出一组特征来代表用户;另一种方法是通过利用网络结构信息来进行网络嵌入。随着图形表示技术的发展,本专利技术利用图卷积方法来进行网络嵌入,利用锚节点来训练两个社交网络间节点的映射函数,仅仅依据社交网络图的结构信息及少量的锚节点信息,就能够实现优于现有方法的社交网络对齐。
技术实现思路
本专利技术的目的是依据社交网络图的结构信息及少量的锚节点信息而不需要利用用户的其它特征信息来解决社交网络对齐问题,即在两个不同的社交网络中找到对应用户。本专利技术的思路为,利用图卷积神经网络来对社交网络中的用户关系进行网络嵌入,得到能代表用户社交关系的网络嵌入,在此基础上引入高斯核函数来优化网络嵌入从而帮助识别原始嵌入空间中不可分离的节点,最后利用锚节点来训练两个社交网络间节点的映射函数进一步提高社交对齐的准确率。基于上述专利技术思路,本专利技术提出一种基于图卷积的社交网络对齐方法,其具体包括以下步骤:S1,利用图卷积神经网络来对社交网络中的用户关系进行网络嵌入,得到能代表用户社交关系的网络嵌入,即为每一个用户节点生成包含用户社交关系信息的一个嵌入向量;S2,利用高斯核函数将嵌入空间映射到更高的维度,从而分离原始低维嵌入空间中不可分离的节点,计算升维后节点嵌入向量间的距离,并对嵌入向量的距离进行归一化处理得到高维空间中节点的相似度矩阵;S3,利用高维空间中节点的相似度矩阵,得到两个社交网络用已知锚节点表示非锚节点的网络嵌入,再利用已知的锚节点信息来学习一个网络映射函数;S4,得到网络映射函数之后,利用该函数将两个社交网络中的节点进行对齐。基于图卷积的社交网络对齐方法,所述步骤S1的目的在于,对于给定的两个社交网络Gs和Gt,利用图卷积神经网络来对社交网络中的用户关系进行网络嵌入,得到能代表用户社交关系的网络嵌入Us和Ut,即为每一个用户节点生成包含用户社交关系信息的一个嵌入向量。该步骤S1具体包括以下分步骤:S11,利用图卷积神经网络将社交网络Gs进行网络嵌入。定义社交网络图为Gs=(Vs,Es),其中,Vs={ui|i∈[1,2,...,N]}是图Gs所有顶点的集合,每个顶点代表一个用户,N为图中的顶点数,也就是用户的数量,小写字母u代表用户;Es={eij|i,j[1,2,...,N]}是图Gs边的集合,图Gs中的每条边eij∈Es表示用户ui和用户uj存在社交关系。根据图卷积神经网络相关知识,做出如下定义:定义图的邻接矩阵为一个表示节点之间关系的矩阵,记为其中表示N×N维的向量空间,矩阵元素定义为:若eij∈Es,则Wij=1,若则Wij=0;为对角矩阵,称为图Gs的对角度矩阵,对角线元素为Dii=ΣjWij;定义矩阵由此定义一个对角矩阵其对角线元素为令定义两层神经网络如下:其中σ(·)是ReLU激活函数(ReLU(*)=max(0,*)),是第一层学习的参数矩阵,是第二层学习的参数矩阵,其中F0是第一层输出的维数,F1是第二层输出的维数。令定义交叉熵损失函数如下:其中通过不断的训练将L的值降到最小,我们就得到了社交网络Gs的一个基于GCN的图表示模型Us。Us的第i行ui是社交网络Gs中第i个用户的网络嵌入表示,其维度为F1;S12,利用图卷积神经网络将社交网络Gt=(Vt,Et)进行网络嵌入。该过程与步骤S11相同,最后得到社交网络Gt的网络嵌入Ut。Ut的第i行vi是社交网络Gt中第i个用户的网络嵌入表示,其维度为F1。基于图卷积的社交网络对齐方法,所述步骤S2的目的在于,将步骤S1得到的网络嵌入Us和Ut利用高斯核函数映射到更高维度的空间,从而分离原始低维嵌入空间中不可分离的节点,计算升维后节点嵌入向量间的距离,并由此计算高维空间中节点的相似度矩阵Ss和St。该步骤S2具体包括以下分步骤:S21,计算网络嵌入Us映射到高维空间之后节点之间的相似度矩阵Ss。定义由步骤S1得到的社交网络嵌入u构成的空间为通过一个函数φ将u投影到更高维特征空间中,即性质优良的升维函数φ往往比较复杂不易求取。求解相似度矩阵并不需要知道函数φ的具体形式,而只需能计算φ(ui)和(uj)的点积,并由此计算出φ(ui)和φ(uj)的距离并进行归一化处理即可得到相似度矩阵。用非线性函数κ来表示向量φ(ui)和φuj)之间的点积:κ(ui,uj)=<φ(ui),φ(uj)>。采用机器学习中常用的高斯核函数进行升维,即定义其中σ>0为高斯核的带宽,它是一个超参数,我们实验中将其设置为3。由此就可以直接通过该核函数计算φ(ui)和φ(uj)之间的距离:D(φ(ui),φ(uj))=||φ(ui)-φ(uj)||2=κ(ui,ui)+κ(uj,uj)-2κ(ui,uj)(3)然后,构造一个相似矩阵其中元素sij∈Ss为公式(3)定义的φ(ui)和φ(uj)之间的距离的归一化表示,即sij(φ(ui),φ(uj))=1/exp{D(φ(ui),φ(uj))}(4)上述sij的值被标准化到(0,1]区间内。sij的值越大,表示用户ui和uj的网络嵌入表示越接近;S22,计算网络嵌入Ut映射到高维空间之后节点之间的相似度矩阵St。该过程与步骤S21相同,最后得到相似度矩阵St。基于图卷积的社交网络对齐方法,所述步骤S3的目的在于,利用已知锚节点来表示非锚节点,通过步骤S1得到的网络嵌入Us和Ut以及步骤S2得到的相似度矩阵Ss和St,得到两个社交网络升维之后的网络嵌入U′s和U′t利用已知的锚节点来学习一个网络映射函数Φ。该步骤S3具体包括以下分步骤:S31,通过步骤S11得到的网络嵌入Us和步骤S21得到的相似度矩阵Ss,得到社本文档来自技高网
...

【技术保护点】
1.一种基于图卷积的社交网络对齐方法,其特征在于包括以下步骤:S1,利用图卷积神经网络来对社交网络中的用户关系进行网络嵌入,得到能代表用户社交关系的网络嵌入,即为每一个用户节点生成包含用户社交关系信息的一个嵌入向量;S2,利用高斯核函数将嵌入空间映射到更高的维度,从而分离原始低维嵌入空间中不可分离的节点,计算升维后节点嵌入向量间的距离,并对嵌入向量的距离进行归一化处理得到高维空间中节点的相似度矩阵;S3,利用高维空间中节点的相似度矩阵,得到两个社交网络用已知锚节点表示非锚节点的网络嵌入,再利用已知的锚节点信息来学习一个网络映射函数;S4,得到网络映射函数之后,利用该函数将两个社交网络中的节点进行对齐。

【技术特征摘要】
1.一种基于图卷积的社交网络对齐方法,其特征在于包括以下步骤:S1,利用图卷积神经网络来对社交网络中的用户关系进行网络嵌入,得到能代表用户社交关系的网络嵌入,即为每一个用户节点生成包含用户社交关系信息的一个嵌入向量;S2,利用高斯核函数将嵌入空间映射到更高的维度,从而分离原始低维嵌入空间中不可分离的节点,计算升维后节点嵌入向量间的距离,并对嵌入向量的距离进行归一化处理得到高维空间中节点的相似度矩阵;S3,利用高维空间中节点的相似度矩阵,得到两个社交网络用已知锚节点表示非锚节点的网络嵌入,再利用已知的锚节点信息来学习一个网络映射函数;S4,得到网络映射函数之后,利用该函数将两个社交网络中的节点进行对齐。2.根据权利要求1所述基于图卷积的社交网络对齐方法,其特征在于所述步骤S1包括以下分步骤:S11,利用图卷积神经网络将社交网络Gs进行网络嵌入;定义社交网络图为Gs=(Vs,Es),Vs={ui|i∈[1,2,...,N]}是图Gs所有顶点的集合,每个顶点代表一个用户,N为图中的顶点数,也就是用户的数量,小写字母u代表用户;Es={eij|i,j∈[1,2,...,N]}是图Gs边的集合,图Gs中的每条边eij∈Es表示用户ui和用户uj存在社交关系;做如下定义:定义图的邻接矩阵为一个表示节点之间关系的矩阵,记为其中表示N×N维的向量空间,矩阵元素定义为:若eij∈Es,则Wij=1,若则Wij=0;为对角矩阵,称为图Gs的对角度矩阵,对角线元素为Dii=∑jWij;定义矩阵由此定义一个对角矩阵其对角线元素为令定义两层神经网络如下:其中σ(·)是ReLU激活函数(ReLU(*)=max(0,*)),是第一层学习的参数矩阵,是第二层学习的参数矩阵,其中F0是第一层输出的维数,F1是第二层输出的维数;令定义交叉熵损失函数如下:其中通过不断的训练将L的值降到最小,我们就得到了社交网络Gs的一个基于GCN的图表示模型Us;Us的第i行ui是社交网络Gs中第i个用户的网络嵌入表示,其维度为F1;S12,利用图卷积神经网络将社交网络Gt=(Vt,Et)进行网络嵌入;该过程与步骤S11相同,最后得到社交网络Gt的网络嵌入Ut;Ut的第i行vi是社交网络Gt中第i个用户的网络嵌入表示,其维度为F1。3.根据权利要求1所述基于图卷积的社交网络对齐方法,其特征在于所述步骤S2包括以下分步骤:S21,计算网络嵌入Us映射到高维空间之后节点之间的相似度矩阵Ss;定义由步骤S1得到的社交网络嵌入u构成的空间为通过一个函数φ将u投影到更高维特征空间中,即性质优良的升维函数φ往往比较复杂不易求取;求解相似度矩阵并不需要知道函数φ的具体形式,而只需能计算φ(ui)和φ(uj)的点积,并由此计算出φ(ui)和φ(uj)的距离并进行归一化处理即可得到相似度矩阵;用非线性函数κ来表示向量φ(ui)和φ(uj)之间的点积:κ(ui,uj)=〈φ(ui),φ(uj)>;采用机器学习中常用的高斯核函数进行升维,即定义其中σ>0为高斯核的带宽,它是一个超参数,我们实验中将其设置为3;由此就可以直接通过该核函数计算φ(ui)和φ(uj)之间的距离:D(φ(ui),φ(uj))=||φ(ui)-φ(uj)||2=κ(ui,ui)+κ(uj,uj)-2κ(ui,uj)(3)然后,构造一个相似矩阵其中元素sij∈Ss为公式(3)定义的φ(ui)和φ(uj)之间的距离的归一化表示,即sij(...

【专利技术属性】
技术研发人员:钟婷李小妍温子敬周帆
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1