【技术实现步骤摘要】
一种联合学习表示和对齐的弱监督用户身份链接方法
[0001]本专利技术涉及社交网络
,尤其是涉及一种联合学习表示和对齐的弱监督用户身份链接方法。
技术介绍
[0002]随着社交网络的发展,人们通常在多个社交平台上拥有账号并进行相应的社交活动,例如添加好友、发布内容等等,将不同社交平台上对应于同一个自然人的用户身份进行对齐,对于多种社交网络分析任务具有重要作用。一方面,跨网络的用户身份对齐能够将不同网络的用户信息联系起来,缓解各个网络信息不足的问题,帮助更好地进行用户分析;另一方面,用户身份对齐的工作能够实现跨网络的用户追踪,能够帮助检测恶意用户,同时也有助于意见领袖跟踪,对于经济发展、社会稳定和国家安全等都有重大意义。
[0003]经对现有技术的文献检索发现,早期的技术大多基于简单的符号特征之间的相似性来寻找跨网络的相似用户,这种思路常常受限于不同网络之间的信息异质性,难以直接计算异质信息的相似性,网络嵌入技术能够学习网络中用户节点的有效低维表示向量,为用户身份对齐提供了新思路,可以通过计算表示向量的相似性来简 ...
【技术保护点】
【技术特征摘要】
1.一种联合学习表示和对齐的弱监督用户身份链接方法,其特征在于,该方法包括以下步骤:1)分别采集源网络G
s
=(U
s
,A
s
,E
s
)与目标网络G
t
=(U
t
,A
t
,E
t
)的社交平台用户数据,并且同时获取部分跨网络用户已知的对应关系集合T={(u
i
,u
j
)|u
i
∈U
s
,u
j
∈U
t
},其中,U
s
,U
t
分别为源网络和目标网络的用户节点集合,A
s
,A
t
分别为源网络和目标网络的属性矩阵,E
s
,E
t
分别为源网络和目标网络的邻接矩阵;2)设定表示向量的维度d和卷积层数L;3)分别对源网络和目标网络进行嵌入学习,得到源网络用户表示Z
s
和目标网络用户表示Z
t
;4)基于跨表示空间的映射函数Φ将源网络的用户表示Z
s
映射到目标网络的表示空间中,分别获得源网络和目标网络在同一空间中的用户表示Z
′
s
=Φ(Z
s
),Z
t
;5)根据已知的对应关系集合T={(u
i
,u
j
)|u
i
∈U
s
,u
j
∈U
t
}进行跨网络强对齐训练,则对应的强对齐损失函数的表达式为:其中,d(
·
)为依据实际网络情况定义的距离函数;6)获取已知的对应关系集合T={(u
i
,u
j
)|u
i
∈U
s
,u
j
∈U
t
}中的每对用户的潜在对齐用户对记为集合N(u
i
,u
j
)={(u
ip
,u
jq
)|u
ip
∈N(u
i
),u
jq
∈N(u
j
)};7)对集合N(u
i
,u
j
)中的每对用户基于注意力机制计算对应的权重α
pq
;8)基于已知的对应关系集合T、潜在对齐用户对集合N(u
i
,u
j
)以及权重α
pq
进行跨网络弱对齐训练,则对应的弱对齐损失函数的表达式为:9)联合源网络和目标网络的嵌入损失函数、强对齐损失函数和弱对齐损失函数,更新聚合操作、连结操作以及映射函数中神经网络的权重矩阵和偏置参数,则更新公式为:L
joint
=L
emb
(G
s
)+L
emb
(G
t
)+λ(L
hard
+L
soft
);10)更新参数直至收敛,得到最终属于同一表示空间的源网络和目标网络用户表示Z
′
s
=Φ(Z
s
),Z
t
;11)计算u
s
∈U
s
的z'
s
(u)∈Z
′
s
与目标网络中每个节点向量z
t
(u)∈Z
t
的余弦相似度,并按照降序进行排序,并根据排序结合用户名属性获取源网络用户u
s
在目标网络中的对应锚用户,完成身份链接。2.根据权利要求1所述的一种联合学习表示和对齐的弱监督用户身份链接方法,其特征在于,所述的步骤1)具体包括以下步骤:11)建立描述网络原始结构信息的邻接矩阵n为网络中用户节点数量,邻接矩阵中的向量代表用户i对应的邻接向量,邻接向量中元素e
i,j
代表用户i和用户j的连接情况,1代表存在边相连,0代表不存在边相连;12)建立描述网络原始属性信息的属性矩阵m代表网络中属性的种类数量,属性矩阵中向量代表用户i的属性向量,属性向量中元素a
i,j
代表用户i对应的属
性j情况,1代表具有对应属性,0代表不具有对应属性。3.根据权利要求1所述的一种联合学习表示和对齐的弱监督用户身份链接方法,其特征在于,所述的步骤3)具体包括以下步骤:31)设置属性矩阵中对应的属性向量为网络用户的初始表示向量,即第0层的用户表示h0(u),基于图卷积模型逐层作卷积操作获得每层的用户表示h
l
(u),l=1,...,L;32)以第L层的用户表示作为学习到的网络用户表示z(u)=h
L
(u),即对应整个网络的用户表示Z;33)对网络做表示学习,计算如下的嵌入损失函数:其中,(z(u
i
),z(u
j
))为根据网络中所有边所取得的正样本用户对,σ为sigmoid函数,z(u
k
)为按照P
n
(u)
∝
d
u3/4
分布所取得的负样本,d
u
为用户节点的度数,Q为对于每个正样本取负样本的数量,为基于负样本所计算的期望。4.根据权利要求3所述的一种联合学习表示和对齐的弱监督用户身份链接方法,其特征在于,所述的步骤31)中,实现每一层的卷积操作具体包括以下步骤:311)对于源网络和目标网络中的每个用户u∈U,在其邻居用户节点中均匀采样p个用户节点,记作集合N(u);312)对集合N(u)中的用户节点的第l
‑
1层表示做聚合操作F
aggrel
,得到邻居聚合表示向量313)对邻居聚合向量和用户节点自身的第l
‑
1层表示向量h
l
‑1(u)进行连结操作得到用户节点自身的第l层表示向量h
l
(u);314)对用户节点自身的第l层表示向量h
l
(u)做归一化操作,得到归一化后的第l层的用户表示向量则有:其中,||
·
||2...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。