The invention relates to a link prediction system and a method for a social network, which belongs to the field of data mining and social network analysis. Based on the online user and the user's friend relationship network, this paper constructs the social network link prediction model from three aspects of the user's interest, information interaction and common neighbor. First of all, according to the characteristics of a plurality of interest label users in a social network, modeling the user behavior using the LDA topic model, a user behavior subject distribution; secondly, the standard of LDA was improved by using weighted Gauss, improve the subject expression ability; finally, through the introduction of hidden Naive Bayesian definition of common neighbors' contribution to algorithm. The comprehensive characteristics of user behavior and network structure of link prediction. More fully consider the interdependence between the neighboring users, the user behavior characteristics and network structure characteristics of the link prediction, and found that the key factors of link establishment.
【技术实现步骤摘要】
本专利技术涉及数据挖掘、社交网络分析领域,涉及用户关系分析,尤其是一种面向社交网络的链接预测方法。
技术介绍
随着计算机信息技术的不断发展和互联网的迅速普及,社交网络得到了越来越多人的参与和关注。近几年来,社交网站已逐渐成为信息传播与分享的重要途径,用户留下的相关信息让社交网络成为一个巨大的信息平台,对这些海量数据的挖掘成为了研究热点。其中,对于社交网络中的用户关系分析的研究,可以帮助人们更好地解释网络结构的演化与发现。现阶段,对于社交网络中的用户关系分析有着不同方面的研究,主要包括用户关系预测以及用户关系强度等方面的研究,所使用的方法包括基于节点相似度的分析,基于概率模型的分析以及基于最大似然估计的分析。其中,基于节点相似度的分析,它存在一个假设前提,即任意两个不相连的节点越相似,越可能产生链接。例如:共同邻居指标(CN)、节点邻居类型的优先链接指标(PA)、Adamic/Adar指标(AA)、Jaccard系数、Katz等;基于概率模型的分析,主要是通过构建一个含一组可调参数的模型,然后采用优化策略找到最优的参数值,从而使得所得到的模型能够很好地重现网络结构和关系特征。例如:Sarukkai等人在《基于马尔可夫链的链接预测和路径分析》(LinkPredictionandPathanalysisusingMarkovchains)中应用马尔科夫链对网络进行路径分析和链路预测;基于最大似然估计的分析,它比较适用于有层次结构的网络中进行计算,例如:Clauset等人在《网络的层次结构和缺失链接预测》(HierarchicalStructureandtheP ...
【技术保护点】
一种面向社交网络的链接预测系统,其特征在于,包括数据源获取模块、属性解析模块、模型构建模块以及预测分析模块;其中数据源获取模块,用于获取社交网络中用户行为以及用户关系数据;属性解析模块,用于分别从用户的兴趣关注属性、信息交互属性以及共邻用户属性中解析出上述三部分的相关属性向量;模型构建模块,用于构建改进的LDA链接预测模型,通过获取用户兴趣关注特征、信息交互特征和网络结构特征,并训练前述三种特征的权值参数;预测分析模块,用训练好的改进的LDA链接预测模型来预测社交网络中用户链接关系并发现链接建立的关键因素。
【技术特征摘要】
1.一种面向社交网络的链接预测系统,其特征在于,包括数据源获取模块、属性解析模块、模型构建模块以及预测分析模块;其中数据源获取模块,用于获取社交网络中用户行为以及用户关系数据;属性解析模块,用于分别从用户的兴趣关注属性、信息交互属性以及共邻用户属性中解析出上述三部分的相关属性向量;模型构建模块,用于构建改进的LDA链接预测模型,通过获取用户兴趣关注特征、信息交互特征和网络结构特征,并训练前述三种特征的权值参数;预测分析模块,用训练好的改进的LDA链接预测模型来预测社交网络中用户链接关系并发现链接建立的关键因素。2.根据权利要求1所述的面向社交网络的链接预测系统,其特征在于,所述数据源获取模块获取的数据内容主要包括用户基本信息、用户关注者基本信息、用户粉丝基本信息、用户间好友关系以及用户过往行为数据。3.根据权利要求1所述的面向社交网络的链接预测系统,其特征在于,所述兴趣关注属性包括:用户对感兴趣的用户关注,即用户的关注列表,定义用户ux的兴趣关注向量为其中,wx,n表示用户ux关注列表中的有效用户,Nx表示用户ux关注列表的有效用户的个数;信息交互属性包括:用户对感兴趣的微博转发,即用户与微博博主间发生了一次信息交互,定义用户ux的信息交互向量为其中,w'x,n表示与用户ux发生交互关系的用户,N'x表示与用户ux发生交互关系的用户个数;共邻用户属性包括:用户间的共同好友,这里的好友指的是相互关注关系,定义用户ux与用户uy的共邻用户向量为其中,cq表示用户ux与用户uy的共同好友,也称为共邻用户,Qxy表示用户ux与用户uy的共邻用户个数。4.根据权利要求1或2或3所述的面向社交网络的链接预测系统,其特征在于,所述模型构建模块:用于针对网络中所有用户的兴趣关注向量,采用高斯加权对用户关注的每个用户加权,利用改进的LDA主题模型训练所有用户,得到用户兴趣关注的主题分布;采用余弦相似度计算得到用户兴趣关注的相似度矩阵,并作为用户兴趣关注特征;利用LDA主题模型训练所有用户,得到用户信息交互的主题分布,采用余弦相似度计算得到用户信息交互的相似度矩阵,并作为用户信息交互特征;针对网络中所有用户的共邻用户向量,利用隐朴素贝叶斯定义的共邻用户贡献算法,量化共邻用户间的依赖关系,计算得到网络结构的相似度矩阵,并作为网络结构特征;将上述三种特征一起流入分类器,通过训练分...
【专利技术属性】
技术研发人员:肖云鹏,李茜曦,刘宴兵,柳靓云,李晓娟,张克毅,赵金哲,孙华超,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。