一种基于风格迁移的社交网络用户节点匹配方法组成比例

技术编号:24252702 阅读:26 留言:0更新日期:2020-05-23 00:10
本发明专利技术公开了一种基于风格迁移的跨平台用户节点匹配方法,(1)通过auto‑encoder学习目标网络节点低维表征的训练以及从GCN中提取目标网络的风格信息;(2)通过将(1)中得到的风格信息与源网络内容信息融合得到符合目标网络风格的源网络节点表征向量;(3)计算(1)与(2)中分别得到的节点表征之间的相似度从而得到相似度矩阵,并利用拓扑一致性优化相似度矩阵,以提高匹配准确率。

A user node matching method of social network based on style migration

【技术实现步骤摘要】
一种基于风格迁移的社交网络用户节点匹配方法
本专利技术属于网络分析领域,特别涉及一种基于风格迁移的社交网络用户节点匹配方法。
技术介绍
如今的现实生活中,很多用户为了满足自己对于信息的不同需求,会在多个社交网络平台注册自己的账户,从而从不同渠道获得足够的信息。因此在当今的互联网环境中,每一个用户都可能在不同的社交网络平台中拥有自己的账户,从而作为一个节点存在于各个社交网络中。如今,不同功能的社交网络平台数量迅速增长,如:新浪微博、facebook、豆瓣等,如何找到这些平台中属于同一用户的账号(节点),成为近年来复杂网络分析的热门话题之一。通过实现跨平台的用户节点匹配,可以将得到的匹配关系应用到用户推荐、链路预测等诸多应用中。因此针对这种现象,本专利技术提出了基于风格迁移的社交网络用户节点匹配方法。现有技术1提出了一种基于图卷积的社交网络对齐方法,首先利用图卷积神经网络得到社交网络节点的低维表征,然后利用高斯核函数将低维表征升维,进而得到高维空间中的相似度矩阵。通过锚节点来表示非锚节点,从而得到两个社交网络最终的节点表征。之后利用已知的锚节点信息来学习一个网络映射函数,最后利用该函数将两个社交网络中的节点进行匹配。现有技术2提出一种适用于DBLP与arXiv网络间用户节点匹配方法。该方法包括(1)在DBLP与arXiv网络中采用基于结构特征的方法得到节点的低维表征;(2)通过局部敏感哈希构建一个锚节点的稀疏加权二分图;(3)通过修建冗余链接预测最终的锚链接集合。现有技术3提出一种基于全局和局部特征的社交网络用户匹配方法,包括种子发掘和种子扩张两个截断,该方法还提出了将社交网络构建成有权图,用来体现用户节点之间的相关程度,从而进一步提高了用户匹配的效果。上述网络社团发现方法的专利技术方案在社交网络用户节点匹配的过程中,现有技术1必须在已知部分锚链的前提下实现,然而锚链信息的获取通常是十分困难的;而现有技术2与现有技术3仅利用了网络的结构信息进行节点匹配,很容易陷入局部最优解。
技术实现思路
本专利技术的目的在于提供一种基于风格迁移的社交网络用户节点匹配方法,以解决上述问题。为实现上述目的,本专利技术采用以下技术方案:一种基于风格迁移的社交网络用户节点匹配方法,其特征在于,包括以下步骤:步骤1,目标网络节点低维表征的训练以及风格提取;利用自动编码器Auto-encoder训练得到目标网络的节点表征,解码器则利用表征重构属性与结构信息,通过减小重构信息与目标网络初始信息的误差,引导网络节点表征的训练;同时,将编码器中训练好的权重矩阵提取出来,作为目标网络的风格信息;步骤2,源网络内容信息与目标网络风格信息的融合;融合步骤1中得到的目标网络风格信息以及源网络的内容信息,同样利用自动编码器训练网络得到具有目标网络风格的源网络节点表征;步骤3,相似度矩阵的计算与修正;利用步骤1与步骤2得到的源网络和目标网络的节点表征,计算两两之间的余弦相似度得到相似度矩阵,并利用拓扑一致性修正相似度矩阵,最终利用相似度矩阵得到匹配结果。进一步的,目标网络节点低维表征的训练以及风格提取具体包括:1)设源网络GS(VS,ES)与目标网络GT(VT,ET),其中VS,VT代表网络的节点集合,ES,ET代表网络边的集合;邻接矩阵AS∈Rm×m,AT∈Rn×n代表网络拓扑结构信息,其中m,n分别为两个网络的节点数,邻接矩阵中不为零的元素代表,当前元素行列号对应的两个节点之间存在相连关系,否则不相连;网络节点的属性则通过XS∈Rm×d,XS∈Rn×d矩阵来表示,其中d为属性的维度;2)编码器为Graphconvolutionalnetworks,简称GCN,GCN作为本算法中的encoder,将目标网络的节点与结构信息编码得到每个节点的低维表征,该部分形式化定义为:其中为源网络编码器第l层卷积层的输入,为第l层卷积层的输出,对于第一层卷积层,用属性矩阵XS来代替是GCN中需要训练的权重矩阵,在训练GCN网络的过程中,其权重矩阵将网络更深层次的信息提取出来,而该信息被称为风格信息;其中卷积函数定义如下:其中σ(·)是非线性激活函数,另外而而是一个对角矩阵,其对角线上的元素通过构造多层这样的卷积层,得到最终的编码器:3)通过encoder编码得到的节点低维表征,通过decoder重构目标网络的结构信息和属性信息(AT与XT),结构信息重构的形式化定义如下:属性信息重构的形式化定义如下:其中FCT为两层全连接层;得到重构后的结构信息与属性信息后,通过计算重构误差,更新网络权重参数,这两部分的Loss函数分别为:最终该部分的重构Loss为:通过训练使重构Loss达到最小,GCN中的权重矩阵中将包含目标网络更加深层的特征信息,将这部分信息视作风格信息。进一步的,源网络内容信息与目标网络风格信息的融合具体包括:通过将源网络的内容信息(AS与XS)与步骤1得到的目标网络风格信息矩阵融合,组成新的混合卷积层,生成具有目标网络风格的源网络节点表征,该步骤与步骤1中卷积过程相似,形式化为:其中为融合目标网络风格信息与源网络内容信息的节点表征,利用该风格迁移的思想,将源网络中的节点表征映射到目标网络的空间中。进一步的,相似度矩阵的计算与修正包括:1)利用步骤1中得到的目标网络节点的低维表征ZT以及步骤2中通过风格迁移得到的源网络节点低维表征根据余弦相似度计算得到从目标网络到源网络任意节点对之间的相似度,形式化定义如下:2)根据拓扑一致性,对计算得到的相似度矩阵进行优化,对于目标网络中的每一个节点vi,取出当前相似度矩阵中于其最相似的前top-k个点并找到k个候选节点中每一个点的邻居节点计算与N(vi)之间存在的匹配节点对数Δij,其形式化定义如下:其中f(p,q)其用来判断两个节点之间是否存在匹配关系,若匹配,则值为1,否则为0;当得到目标网络每个节点的Δ值后,通过softmax将所有Δ值进行归一化处理,最后与相似度矩阵对应位置的元素相加,完成修正:Sij=Sij+Δij3)相似度矩阵经过优化后,进行进一步的节点匹配,对于每一个目标网络的节点vi,仅考虑源网络中前k个与其最相近的节点,作为vi在源网络中的候选对齐节点。与现有技术相比,本专利技术有以下技术效果:附图说明图1是本专利技术社交网络用户匹配方法过程图;图2是本专利技术在Flickr数据集上的对比结果折线图;图3是本专利技术在Wiki数据集上的对比结果折线图;具体实施方式以下结合附图对本专利技术作进一步的详细说明。请参阅图1至图3,一种基于风格迁移的社交网络用户节点匹配方法,包括以下步骤:步骤1,目标网络节点低维表征的训练以及风格提取;利用自动编码器Au本文档来自技高网
...

【技术保护点】
1.一种基于风格迁移的社交网络用户节点匹配方法,其特征在于,包括以下步骤:/n步骤1,目标网络节点低维表征的训练以及风格提取;利用自动编码器Auto-encoder训练得到目标网络的节点表征,解码器则利用表征重构属性与结构信息,通过减小重构信息与目标网络初始信息的误差,引导网络节点表征的训练;同时,将编码器中训练好的权重矩阵提取出来,作为目标网络的风格信息;/n步骤2,源网络内容信息与目标网络风格信息的融合;融合步骤1中得到的目标网络风格信息以及源网络的内容信息,同样利用自动编码器训练网络得到具有目标网络风格的源网络节点表征;/n步骤3,相似度矩阵的计算与修正;利用步骤1与步骤2得到的源网络和目标网络的节点表征,计算两两之间的余弦相似度得到相似度矩阵,并利用拓扑一致性修正相似度矩阵,最终利用相似度矩阵得到匹配结果。/n

【技术特征摘要】
1.一种基于风格迁移的社交网络用户节点匹配方法,其特征在于,包括以下步骤:
步骤1,目标网络节点低维表征的训练以及风格提取;利用自动编码器Auto-encoder训练得到目标网络的节点表征,解码器则利用表征重构属性与结构信息,通过减小重构信息与目标网络初始信息的误差,引导网络节点表征的训练;同时,将编码器中训练好的权重矩阵提取出来,作为目标网络的风格信息;
步骤2,源网络内容信息与目标网络风格信息的融合;融合步骤1中得到的目标网络风格信息以及源网络的内容信息,同样利用自动编码器训练网络得到具有目标网络风格的源网络节点表征;
步骤3,相似度矩阵的计算与修正;利用步骤1与步骤2得到的源网络和目标网络的节点表征,计算两两之间的余弦相似度得到相似度矩阵,并利用拓扑一致性修正相似度矩阵,最终利用相似度矩阵得到匹配结果。


2.根据权利要求1所述的一种基于风格迁移的社交网络用户节点匹配方法,其特征在于,目标网络节点低维表征的训练以及风格提取具体包括:
1)设源网络GS(VS,ES)与目标网络GT(VT,ET),其中VS,VT代表网络的节点集合,ES,ET代表网络边的集合;邻接矩阵AS∈Rm×m,AT∈Rn×n代表网络拓扑结构信息,其中m,n分别为两个网络的节点数,邻接矩阵中不为零的元素代表,当前元素行列号对应的两个节点之间存在相连关系,否则不相连;网络节点的属性则通过XS∈Rm×d,XS∈Rn×d矩阵来表示,其中d为属性的维度;
2)编码器为Graphconvolutionalnetworks,简称GCN,GCN作为本算法中的encoder,将目标网络的节点与结构信息编码得到每个节点的低维表征,该部分形式化定义为:



其中为源网络编码器第l层卷积层的输入,为第l层卷积层的输出,对于第一层卷积层,用属性矩阵XS来代替是GCN中需要训练的权重矩阵,在训练GCN网络的过程中,其权重矩阵将网络更深层次的信息提取出来,而该信息被称为风格信息;其中卷积函数定义如下:



其中σ(·)是非线性激活函数,另外而而是一个对角矩阵,其对角线上的元素通过构造多层这样的卷积层,得到最终的编码器:



3)通过encoder编码得到的节点低维表征,通过decoder重构目标网...

【专利技术属性】
技术研发人员:罗敏楠王伟帆郑庆华秦涛张玉哲王浩年王熙凤
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1