基于多模态融合与表示对齐的跨社交网络虚拟身份关联方法及装置制造方法及图纸

技术编号：36955573 阅读：13 留言：0更新日期：2023-03-22 19:16

本发明专利技术公开了一种基于多模态融合与表示对齐的跨社交网络虚拟身份关联方法及装置，方法包括：对不同平台的社交网络的用户名、用户发表的文本以及用户社交关系进行特征提取，分别得到用户不同模态的特征信息；根据所述的特征信息，利用注意力机制进行多模态融合，得到一个融合多维度特征的第一用户表示；将所述的第一用户表示通过表示对齐加强用户表示，最终得到不同平台具有同一分布的第二用户表示；计算所述的第二用户表示之间的余弦相似性，得到用户之间的相似性得分，并将得分最高的用户对作为身份关联结果。本发明专利技术通过多模态融合与表示对齐的方法解决单一模态模型不能完整地描述用户问题以及不同社交平台存在分布差异的问题。问题。问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于多模态融合与表示对齐的跨社交网络虚拟身份关联方法及装置

[0001]本专利技术属于社交网络虚拟身份关联
，具体涉及一种多模态融合与表示对齐的跨社交网络虚拟身份关联方法及装置。

技术介绍

[0002]如今，社交网络以其高度的便捷性成为了人们生活中不可或缺的一部分。通常，人们喜欢加入多个社交平台享受不同的服务，如使用微信进行交流，使用微博看新闻或者是打卡。因此，有不少学者致力于社交网络相关的研究，而跨社交网络虚拟身份关联作为其中重要部分，目的是识别出同一自然人在不同平台的社交账号，已经在推荐系统、用户行为分析、信息传播等领域引起了高度重视。
[0003]事实上，已经有不少的方法被提出应用在用户身份链接上，现阶段的方法可以分为大三类：基于用户属性的方法、基于用户生成内容的方法以及基于用户社交关系的方法。但这些方法都存在一定的缺陷。对于用户属性，出于隐私的原因，用户有选择地公开个人资料属性，并将一些敏感信息(如年龄或联系方式)保密，甚至可能会伪造或模仿信息，增加了信息的不确定性和模糊性。由于社交网络的丰富性，用户发表的帖子会存在多种多样的形式(文字、图片等)，若只使用单一的内容会造成信息损失。基于用户之间的社交关系进行研究，现有方法太过强调结构化的信息，但在社交网络中用户好友的特征对于识别用户也是有很大帮助的，毕竟有时好友的特征可能比用户本身的特征更具独特性，要是把其好友的特征考虑进来，那准确率将大大提高。因此，应该利用多模态的用户信息，而不局限于单一模态信息。另一方面，模态与模态之间刻画用户的置信度是不一...

【技术保护点】

【技术特征摘要】
1.基于多模态融合与表示对齐的跨社交网络虚拟身份关联方法，其特征在于，包括下述步骤：对不同社交网络用户的用户名、用户发表的文本以及用户社交关系进行特征提取，分别得到用户名特征信息、用户发表的文本特征信息以及用户社交关系特征信息；根据所述得到的用户名特征信息、用户发表的文本特征信息以及用户社交关系特征信息，利用注意力机制进行多模态融合，得到一个融合多维度特征的第一用户表示；将所述的第一用户表示通过表示对齐方法进行用户表示加强处理，最终得到不同平台具有同一分布空间的第二用户表示；计算所述的第二用户表示之间的余弦相似性，得到用户之间的相似性得分，并将得分最高的用户对作为身份关联结果。2.根据权利要求1所述基于多模态融合与表示对齐的跨社交网络虚拟身份关联方法，其特征在于，所述用户名的特征提取，具体为：对于给定用户的用户名，利用字符级Bag
‑
of
‑
Words模型进行特征提取，统计每个用户名中每个字符出现的次数，得到向量将得到的所有用户名向量依次拼接得到用户名计数矩阵由于C0是一个稀疏矩阵，为此使用一个自动编码器将其进行转换，转换的公式的具体为：其中，W
e
，b
e
为编码器的权重和偏置，W
d
，b
d
为解码器的权重和偏置，C1为解码器用户名向量矩阵，和分别为用户名向量，通过梯度下降不断训练损失函数L
c
，得到最优的W
e
和b
e
，最终得到维度为d的用户名嵌入矩阵3.根据权利要求1所述基于多模态融合与表示对齐的跨社交网络虚拟身份关联方法，其特征在于，所述用户发表的文本的特征提取，具体为：将用户发表的文本输入到Word2Vec模型中，得到每条文本的嵌入向量，然后将每个用户所发表文本的嵌入向量取平均作为该用户发表文本的表示，将所有用户的文本嵌入向量依次拼接，得到维度为d的文本嵌入矩阵4.根据权利要求1所述基于多模态融合与表示对齐的跨社交网络虚拟身份关联方法，其特征在于，所述用户社交关系的特征提取，具体为：将由平台N1的n个用户和平台N2的m个用户组成的社交关系得到的n
×
m邻接矩阵通过DeepWalk模型得到每个用户社交关系的嵌入向量，将所有用户的社交关系嵌入向量依次拼接，得到维度为d的用户社交关系嵌入矩阵5.根据权利要求1所述基于多模态融合与表示对齐的跨社交网络虚拟身份关联方法，其特征在于，所述多模态融合是将得到的三种用户特征信息的嵌入矩阵，利用注意力机制进行多模态融合，为每个模态赋予不同权重以反映不同模态之间的重要性，经过多模态融合后，得到第一用户表示矩阵Z
f
；计算公式为：
其中，α
C
，α
T
，α
V
分别用户名、文本、社交关系嵌入矩阵的权重；f(.)为注意力网络。6.根据权利要求1所述基于多模态融合与表示对齐的跨社交网络虚拟身份关联方法，其特征在于，所述表示对齐加强用户表示的具体步骤为：首先，将第一用户表示放入一个全连接层，以将两平台的用户表示映射到同一空间当中，得到第二用户表示，所述第二用户表示的计算公式为...

【专利技术属性】
技术研发人员：李树栋，卢丹娜，吴晓波，韩伟红，黄倩岚，骆小静，唐可可，
申请(专利权)人：广州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人