基于社区结构的跨社交网络用户身份识别方法技术

技术编号:22722576 阅读:18 留言:0更新日期:2019-12-04 05:32
本发明专利技术属于社交网络用户识别技术领域,公开一种基于社区结构的跨社交网络用户身份识别方法,包括:步骤a、采用网络嵌入的方式分别将源网络和目标网络映射到低维向量空间;步骤b、基于所述向量空间,通过有监督的方式训练BP神经网络,得到实现从源网络到目标网络映射的BP神经网络模型,在目标网络中通过所述BP神经网络模型对源网络用户身份进行识别。本发明专利技术在学习社交网络节点的特征向量表示的过程中,融合节点的邻近性特征和社区结构特征,最大程度的保留社交网络的结构特征,提高了用户身份识别准确度。

Cross social network user identification method based on community structure

The invention belongs to the technical field of social network user identification, and discloses a cross social network user identification method based on community structure, which includes: step a, map the source network and the target network to the low-dimensional vector space respectively by the way of network embedding; step B, train the BP neural network in a supervised way based on the vector space, and achieve the realization of from the source network to the In the target network, the user identity of the source network is identified by the BP neural network model mapped by the target network. In the process of learning the feature vector representation of social network nodes, the invention integrates the proximity features and community structure features of nodes, retains the structure features of social network to the greatest extent, and improves the accuracy of user identity recognition.

【技术实现步骤摘要】
基于社区结构的跨社交网络用户身份识别方法
本专利技术属于社交网络用户识别
,尤其涉及基于社区结构的跨社交网络用户身份识别方法。
技术介绍
随着互联网的快速发展和移动设备的逐渐普及,在线社交网络已经变得越来越流行,给人们之间的交流带来了极大的便利。不同的社交网络提供不同类型的服务,人们通常根据工作与生活的需要加入到不同的社交网络中,社交网络已经成为连接虚拟网络空间和现实物理世界的桥梁。例如,人们通常在Foursquare上与朋友分享当前所处的地理位置;在Twitter或者Facebook上分享图片或文章等。因此,通常情况下每一个用户在多个不同的社交网络中拥有账户,但是这些账户之间常常是相互独立的。用户身份识别旨在发现同一个用户的多个不同账户之间的对应关系,也称为锚链接预测问题(anchorlinking)、网络对齐问题(networkalignment)。用户身份识别问题的研究是许多有趣互联网应用的前提,例如跨平台好友推荐、用户行为预测、跨网络信息传播等。用户身份识别问题一出现就引起了研究人员的高度重视。早期的研究通过利用网络用户自身的属性特征和统计特征来解决该问题,例如账户名、性别、年龄等,或者从用户产生的内容中抽取特征,例如推文、博客、帖子、评论等。Gona等人(O.Goga,D.Perito,H.Lei,R.Teixeira,andR.Sommer,″Large-scaleCorrelationofAccountsacrossSocialNetworks,″Technicalreport,2013)仅根据用户公开资料信息将属于同一用户的账户联系在一起。Zafarani等人(R.ZafaraniandH.Liu,“Connectingusersacrosssocialmediasites:Abehavioral-modelingapproach,”inProceedingsofthe19thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining,2013)将社会学和心理学理论应用于模拟用户行为模式,并在此基础上实现跨社交网络的用户身份识别。然而,社交网络中存在大量在不同社交网站使用不同用户名的用户。此外,不同社交网站的用户统计信息很可能是不平衡的,不能保证用户信息的丰富性和正确性。因此仅仅依靠用户的属性信息解决身份识别问题的方法的应用范围十分有限。相反的是,社交网络用户之间的连接关系是相对可靠且丰富的,并且网络的结构信息可以直接用于解决用户身份识别问题,于是基于网络结构的用户身份识别问题受到越来越多的关注。COSNET(Y.T.Zhang,J.Tang,Z.L.Yang,J.Pei,andP.S.Yu,“Cosnet:Connectingheterogeneoussocialnetworkswithlocalandglobalconsistency,”inKDD,2015,pp.1485-1494)综合考虑社交网络的局部一致性和全局一致性,基于频率加权的共同邻居特征计算Adamic/Adar指数,衡量邻域的相似性。Man等人(T.Man,H.W.Shen,S.H.Liu,X.L.Jin,andX.Q.Cheng,“Predictanchorlinksacrosssocialnetworksviaanembeddingapproach,”inIJCAI,2016,pp.1823-1829)基于社交网络的潜在特征,开发了基于网络嵌入的锚链接预测模型PALE。Liu等人(L.Liu,W.K.Cheung,X.Li,andL.J.Liao,“Aligningusersacrosssocialnetworksusingnetworkembedding,”inIJCAI,2016)针对有向社交网络提出IONE模型,基于网络嵌入从用户的关注关系和被关注关系抽取特征,从而实现用户身份识别。基于网络结构的现有方法都是从网络中单个用户节点的角度出发,基于节点的上下文信息,提取节点的邻近性特征用于解决用户身份识别问题。但是仅考虑节点的邻近结构,提取的网络特征是十分有限。我们知道,社交网络并不是随机网络,而是具有一定组织特性的结构,社交网络中节点也呈现出集群特性,这被称为社区结构特性。社区结构广泛存在于社交网络中,一个社区可能代表具有共同兴趣、爱好、目标的群体。不妨可以这样理解,Facebook中的两个用户由于共同的兴趣,联系紧密,存在于同一个网络社区中,如果他们也都使用Twitter,那么他们也很可能通过Twitter中的某个社区联系在一起。
技术实现思路
本专利技术针对基于网络结构的现有方法从网络中单个用户节点的角度出发,仅考虑节点的邻近结构,提取的网络特征十分有限的问题,提出一种基于社区结构的跨社交网络用户身份识别方法,融合节点的邻近性特征和社区结构特征,最大程度的保留社交网络的结构特征,提高了用户身份识别准确度。为了实现上述目的,本专利技术采用以下技术方案:与现有技术相比,本专利技术具有的有益效果:一种基于社区结构的跨社交网络用户身份识别方法,包括:步骤a、采用网络嵌入的方式分别将源网络和目标网络映射到低维向量空间;步骤b、基于所述向量空间,通过有监督的方式训练BP神经网络,得到实现从源网络到目标网络映射的BP神经网络模型,在目标网络中通过所述BP神经网络模型对源网络用户身份进行识别。进一步地,在所述步骤a之前,还包括:步骤c、对源网络和目标网络进行扩展。进一步地,所述步骤c包括:给定源网络Gs=(Vs,Es)和目标网络Gt=(Vt,Et),锚链接的集合T,源网络Gs的扩展网络表示为.其中,和分别为的节点和边的集合,Vs和Es分别为Gs的节点和边的集合,EsU中U表示并集,所述节点与用户一一照应;用同样的方法,对目标网络Gt进行扩展,得到和分别为的节点和边的集合。进一步地,所述步骤b还包括:基于所述向量空间,通过有监督的方式训练BP神经网络,得到实现从目标网络到源网络映射的BP神经网络模型,在源网络中通过所述BP神经网络模型对目标网络用户身份进行识别。进一步地,所述网络嵌入的方式包括:M-NMF算法。进一步地,所述步骤a包括:步骤a1、社区结构建模,包括:构造第一目标函数:Q=tr(HTBH),s.t.tr(HTH)=n(3)其中Q为模块度,表示节点所属的社团,K(>2)表示划分的社团数目,为模块度矩阵,其中Aij表示网络G的邻接矩阵A中第i行和第j列的元素,ki、kj分别表示vi与vj的度,定示网络G的边数目,表示在随机情况下节点vi与vj之间存在边的期望值,tr(HTH)表示矩阵HTH的迹;步骤a2、邻近性结构建模,包括:构造第二目标函数:其中,表示矩阵的F范数的平方,S为相似性矩阵,S=S(1)+ηS(2),S(1)表示节点vi和节点v本文档来自技高网
...

【技术保护点】
1.一种基于社区结构的跨社交网络用户身份识别方法,其特征在于,包括:/n步骤a、采用网络嵌入的方式分别将源网络和目标网络映射到低维向量空间;/n步骤b、基于所述向量空间,通过有监督的方式训练BP神经网络,得到实现从源网络到目标网络映射的BP神经网络模型,在目标网络中通过所述BP神经网络模型对源网络用户身份进行识别。/n

【技术特征摘要】
1.一种基于社区结构的跨社交网络用户身份识别方法,其特征在于,包括:
步骤a、采用网络嵌入的方式分别将源网络和目标网络映射到低维向量空间;
步骤b、基于所述向量空间,通过有监督的方式训练BP神经网络,得到实现从源网络到目标网络映射的BP神经网络模型,在目标网络中通过所述BP神经网络模型对源网络用户身份进行识别。


2.根据权利要求1所述的基于社区结构的跨社交网络用户身份识别方法,其特征在于,在所述步骤a之前,还包括:
步骤c、对源网络和目标网络进行扩展。


3.根据权利要求2所述的基于社区结构的跨社交网络用户身份识别方法,其特征在于,所述步骤c包括:
给定源网络Gs=(Vs,Es)和目标网络Gt=(Vt,Et),锚链接的集合T,源网络Gs的扩展网络表示为:






其中,和分别为的节点和边的集合,Vs和Es分别为Gs的节点和边的集合,EsU中U表示并集,所述节点与用户一一照应;
用同样的方法,对目标网络Gt进行扩展,得到和分别为的节点和边的集合。


4.根据权利要求1所述的基于社区结构的跨社交网络用户身份识别方法,其特征在于,所述步骤b还包括:
基于所述向量空间,通过有监督的方式训练BP神经网络,得到实现从目标网络到源网络映射的BP神经网络模型,在源网络中通过所述BP神经网络模型对目标网络用户身份进行识别。


5.根据权利要求1所述的基于社区结构的跨社交网络用户身份识别方法,其特征在于,所述网络嵌入的方式包括:M-NMF算法。


6.根据权利要求5所述的基于社区结构的跨社交网络用户身份识别方法,其特征在于,所述步骤a包括:
步骤a1、社区结构建模,包括:
构造第一目标函数:
Q=tr(HTBH),s.t.tr(HTH)=n(3)
其中Q为模块度,表示节点所属的社团,K(>2)表示划分的社团数目,为模块度矩阵,其中Aij表示网络G的邻接矩阵A中第i行和第j列的元素,ki、kj分别表示vi与vj的度,表示网络G的边数目,表示在随机情况下节点vi与vj之间存在...

【专利技术属性】
技术研发人员:刘琰郭晓宇左青松王煦中赵媛李永林
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1