The invention belongs to the technical field of social network user identification, and discloses a cross social network user identification method based on community structure, which includes: step a, map the source network and the target network to the low-dimensional vector space respectively by the way of network embedding; step B, train the BP neural network in a supervised way based on the vector space, and achieve the realization of from the source network to the In the target network, the user identity of the source network is identified by the BP neural network model mapped by the target network. In the process of learning the feature vector representation of social network nodes, the invention integrates the proximity features and community structure features of nodes, retains the structure features of social network to the greatest extent, and improves the accuracy of user identity recognition.
【技术实现步骤摘要】
基于社区结构的跨社交网络用户身份识别方法
本专利技术属于社交网络用户识别
,尤其涉及基于社区结构的跨社交网络用户身份识别方法。
技术介绍
随着互联网的快速发展和移动设备的逐渐普及,在线社交网络已经变得越来越流行,给人们之间的交流带来了极大的便利。不同的社交网络提供不同类型的服务,人们通常根据工作与生活的需要加入到不同的社交网络中,社交网络已经成为连接虚拟网络空间和现实物理世界的桥梁。例如,人们通常在Foursquare上与朋友分享当前所处的地理位置;在Twitter或者Facebook上分享图片或文章等。因此,通常情况下每一个用户在多个不同的社交网络中拥有账户,但是这些账户之间常常是相互独立的。用户身份识别旨在发现同一个用户的多个不同账户之间的对应关系,也称为锚链接预测问题(anchorlinking)、网络对齐问题(networkalignment)。用户身份识别问题的研究是许多有趣互联网应用的前提,例如跨平台好友推荐、用户行为预测、跨网络信息传播等。用户身份识别问题一出现就引起了研究人员的高度重视。早期的研究通过利用网络用户自身的属性特征和统计特征来解决该问题,例如账户名、性别、年龄等,或者从用户产生的内容中抽取特征,例如推文、博客、帖子、评论等。Gona等人(O.Goga,D.Perito,H.Lei,R.Teixeira,andR.Sommer,″Large-scaleCorrelationofAccountsacrossSocialNetworks,″Technicalreport,2 ...
【技术保护点】
1.一种基于社区结构的跨社交网络用户身份识别方法,其特征在于,包括:/n步骤a、采用网络嵌入的方式分别将源网络和目标网络映射到低维向量空间;/n步骤b、基于所述向量空间,通过有监督的方式训练BP神经网络,得到实现从源网络到目标网络映射的BP神经网络模型,在目标网络中通过所述BP神经网络模型对源网络用户身份进行识别。/n
【技术特征摘要】
1.一种基于社区结构的跨社交网络用户身份识别方法,其特征在于,包括:
步骤a、采用网络嵌入的方式分别将源网络和目标网络映射到低维向量空间;
步骤b、基于所述向量空间,通过有监督的方式训练BP神经网络,得到实现从源网络到目标网络映射的BP神经网络模型,在目标网络中通过所述BP神经网络模型对源网络用户身份进行识别。
2.根据权利要求1所述的基于社区结构的跨社交网络用户身份识别方法,其特征在于,在所述步骤a之前,还包括:
步骤c、对源网络和目标网络进行扩展。
3.根据权利要求2所述的基于社区结构的跨社交网络用户身份识别方法,其特征在于,所述步骤c包括:
给定源网络Gs=(Vs,Es)和目标网络Gt=(Vt,Et),锚链接的集合T,源网络Gs的扩展网络表示为:
其中,和分别为的节点和边的集合,Vs和Es分别为Gs的节点和边的集合,EsU中U表示并集,所述节点与用户一一照应;
用同样的方法,对目标网络Gt进行扩展,得到和分别为的节点和边的集合。
4.根据权利要求1所述的基于社区结构的跨社交网络用户身份识别方法,其特征在于,所述步骤b还包括:
基于所述向量空间,通过有监督的方式训练BP神经网络,得到实现从目标网络到源网络映射的BP神经网络模型,在源网络中通过所述BP神经网络模型对目标网络用户身份进行识别。
5.根据权利要求1所述的基于社区结构的跨社交网络用户身份识别方法,其特征在于,所述网络嵌入的方式包括:M-NMF算法。
6.根据权利要求5所述的基于社区结构的跨社交网络用户身份识别方法,其特征在于,所述步骤a包括:
步骤a1、社区结构建模,包括:
构造第一目标函数:
Q=tr(HTBH),s.t.tr(HTH)=n(3)
其中Q为模块度,表示节点所属的社团,K(>2)表示划分的社团数目,为模块度矩阵,其中Aij表示网络G的邻接矩阵A中第i行和第j列的元素,ki、kj分别表示vi与vj的度,表示网络G的边数目,表示在随机情况下节点vi与vj之间存在...
【专利技术属性】
技术研发人员:刘琰,郭晓宇,左青松,王煦中,赵媛,李永林,
申请(专利权)人:中国人民解放军战略支援部队信息工程大学,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。