【技术实现步骤摘要】
一种基于社交网络拓扑图的关联用户身份识别方法
[0001]本专利技术涉及多交网络数据分析及挖掘
,尤其涉及一种基于社交网络拓扑图的关联用户身份识别方法。
技术介绍
[0002]关联用户身份识别,旨在发现同一个用户在多个社交网络平台中的不同身份之间的对应关系,是多个社交网络数据分析及挖掘领域的关键技术,具有广泛的商业应用需求,在网络安全和个性推荐方面有着重要的应用。
[0003]目前大多数方法都是基于DeepWalk(Perozzi B.,AI
‑
Rfou R.,Skiena S.DeepWalk:Online learning of social representations[C]//Proceedings of the 20th ACM SIGKDD International Conference on Knowledge discovery and data mining.New York:ACM Press,2014:701
‑
710.)的方法,该方法借鉴了Word2vec(Mikolov T.,Sutskever I.,Chen Kai,et al.Distributed representations of words and phrases and their compositionality[C]//Proceedings of the 26th International Conference on Neural Information Proce ...
【技术保护点】
【技术特征摘要】
1.一种基于社交网络拓扑图的关联用户身份识别方法,其特征在于,包括:S1:获取已知的两个社交网络数据集,其中,已知的社交网络数据集包括用户和用户之间的好友关系,两个社交网络数据集具有关联用户;S2:根据社交网络数据集中的用户以及好友关系分别构建社交网络G1和G2的拓扑图,其中,社交网络拓扑图中包括节点和连边,节点表示用户,连边表示具有好友关系;分别根据社交网络G1和G2形成每个节点的一阶ego网络,其中,G1网络中每个节点的一阶ego网络图组合形成一个ego拓扑图集合,G2网络中每个节点的一阶ego网络图组合形成一个ego拓扑图集合;S3:分别将两个社交网络G1和G2中每个节点的ego拓扑图集合依据每个节点的ego网络形成s个节点序列,其中,节点序列提取采用随机游走的方法,形成两个社交网络的节点序列集合;S4:利用skip
‑
gram模型将形成的两个社交网络的节点序列集合分别映射成两个特征空间,并在映射的特征空间中学习节点的低维向量表示,得到每个节点的特征向量表示;S5:根据两个社交网络数据集的关联用户训练得到一个目标特征映射矩阵,将两个特征空间映射成同一个的特征空间,然后计算社交网络G1中的新节点与社交网络G2中每一个节点之间的相似度,并根据计算出的相似度,进行关联用户身份识别,其中,社交网络G1中的新节点为G1中的原有节点根据训练得到的目标特征映射矩阵进行映射后得到的节点。2.如权利要求1所述的基于社交网络拓扑图的关联用户身份识别方法,其特征在于,两个社交网络数据集包括数据集一和数据集二,步骤S2包括:S2.1:根据数据集一构建社交网络G1的拓扑图,其中,G1中包括n个节点,分别为v1,v2…
v
n
,从G1中的节点v1出发,提取该节点和它的所有一阶邻居,然后根据G1中的边补充所提取的节点和一阶邻居之间的连边以及各个一阶邻居之间的连边,形成节点v1的ego网络图Gv1,v2‑
v
n
重复此过程直到形成n个节点的ego网络图,最后形成一个ego网络集合S2.2:根据数据集二构建社交网络G2的拓扑图,其中,G2中包括m个节点,分别为v
′1,v
′2…
v
′
m
,从G2中的节点v
′1出发,提取该节点和它的所有一阶邻居,然后根据G2中的边补充所提取的节点和一阶邻居之间的连边以及各个一阶邻居之间的连边,形成节点v
′1的ego网络图Gv1',v
′2‑
v
′
m
重复此过程直到形成m个节点的ego网络图,最后形成一个ego网络集合3.如权利要求1所述的基于社交网络拓扑图的关联用户身份识别方法,其特征在于,步骤S3包括:S3.1:根据G1形成的ego网络集合,从节点v1开始,在对应的ego网络中利用随机游走的方式提取出s条节点序列,其中,每条序列开头为节点v1,序列长度为t,剩余节点重复此过程,最终,每个节点的ego网络提取s条节点序列,共可获得n*s条节点序列,...
【专利技术属性】
技术研发人员:胡瑞敏,甄宇,任灵飞,吴俊杭,胡文怡,李登实,
申请(专利权)人:武汉大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。