The invention claims to protect a dynamic micro-blog forwarding behavior prediction system and method based on the circle of friends, belonging to the field of social network information analysis. The users in the social network and based on user behavior data, considering the interest difference, user behavior and network structure in the network to promote the role of information transmission, starting from the three aspects of user interest, activity and influence, basic thoughts and methods of using the LDA model, modeling and analysis of user behavior, a user the behavior of subject distribution; using Gauss distribution to improve LDA, to find the user's activity and influence; at the same time, the changes with time of the activity of users, using the time discretization and time slicing method, put forward a kind of improved micro-blog LDA dynamic forwarding behavior prediction model and the model is fit to the prediction of the input data dynamic monitoring of user model can predict the user's activity, the more accurate the forwarding behavior and find the effect of forwarding for key users Su.
【技术实现步骤摘要】
一种基于好友圈子的动态微博转发行为预测系统及方法
本专利技术涉及社交网络信息分析领域,主要涉及根据社交网络用户行为分析,构建一种动态微博转发行为预测模型。
技术介绍
随着WEB2.0理念的普及与相关技术的日益成熟,社交网站如Twitter、Facebook、新浪微博等对人们的生活产生了巨大影响。人们在社交网站中更新状态或发送广播,以此来展现自己的生活状态、发表感想或与朋友们分享信息。社交网站为用户相互交流、发表意见和观点提供了非常便利的平台。对社交网站的用户行为进行建模和预测对于安全、商业等多个领域具有十分重要的社会意义和应用价值,近年来逐渐得到研究者的重视。新浪微博是一款为大众提供娱乐休闲生活服务的信息分享和交流平台,于2009年8月14日开始内测。截至2014年6月底,我国微博用户规模为2.75亿,用户之间组成复杂的关注网络,平均每天发送微博近1亿条,信息沿着用户间的关注关系传播,形成传播扩散网络。用户转发是微博中最有效的信息传播机制,当前转发预测的研究主要集中在兴趣特征、用户影响力以及用户属性等对转发行为预测结果的影响。所使用的方法包括基于文本的分析、基于用户影响力的分析和基于网络结构的分析等。其中,基于文本的分析主要利用概率主题模型分析文本,根据文本主题与用户兴趣的相似度预测用户的转发行为。例如:XuningTang等人在《接下来谁将参与?预测黑色网络社区的参与》(WhowillbeParticipatingNext?PredictingtheParticipationofDarkWebCommunity)中构建了一个用户兴趣和话题检测模型(UTD ...
【技术保护点】
一种基于好友圈子的动态微博转发行为预测系统,包括用户行为数据源获取模块,用于获取社交网络中的用户关系和用户行为数据,将发文用户的粉丝作为备选用户,其特征在于,还包括属性提取模块、模型构建模块及预测分析模块,其中,所述属性提取模块分别从用户间兴趣差异、备选用户的活跃度以及发文用户的影响力三方面提取相关属性向量作为预测模型的输入;微博转发行为预测模型构建模块,用于对备选用户构建微博转发行为预测模型,转发行为主要受备选用户与其好友的兴趣差异τ、备选用户在文章发布时段的活跃度s和其好友的网络影响力r参数决定,并对以上模型参数进行拟合;预测分析模块用于将拟合后获得的参数和任一时刻t的用户发文情况进行备选用户是否会转发该条微博的预测。
【技术特征摘要】
1.一种基于好友圈子的动态微博转发行为预测系统,包括用户行为数据源获取模块,用于获取社交网络中的用户关系和用户行为数据,将发文用户的粉丝作为备选用户,其特征在于,还包括属性提取模块、模型构建模块及预测分析模块,其中,所述属性提取模块分别从用户间兴趣差异、备选用户的活跃度以及发文用户的影响力三方面提取相关属性向量作为预测模型的输入;微博转发行为预测模型构建模块,用于对备选用户构建微博转发行为预测模型,转发行为主要受备选用户与其好友的兴趣差异τ、备选用户在文章发布时段的活跃度s和其好友的网络影响力r参数决定,并对以上模型参数进行拟合;预测分析模块用于将拟合后获得的参数和任一时刻t的用户发文情况进行备选用户是否会转发该条微博的预测。2.根据权利要求1所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述属性提取模块针对用户间兴趣差异,提取用户兴趣向量包括:利用用户的关注行为属性,获取每个用户的关注列表,定义用户v的兴趣向量为其中,ev,u表示用户v关注列表中的用户,u=1,2......|Ev|,|Ev|表示用户v关注列表中的用户总数。3.根据权利要求1或2所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述属性提取模块针对备选用户的活跃度,提取用户状态向量包括:利用用户的交互行为属性和时间属性,获取每个用户在一段时间内的用户发布微博活跃度及转发微博活跃度,定义用户v的活跃度状态向量为其中,表示用户v在时间片t上的发布微博活跃度,表示用户v在时间片t上的转发微博活跃度,和分别代表用户v在时间片t上的发布微博数、转发微博数以及用户v平均每天发布微博数。4.根据权利要求3所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述属性提取模块针对发文用户的影响力,提取用户特征向量包括:利用网络拓扑结构属性,获取每个用户节点的出度、入度和局部聚集系数,定义用户v的影响力特征向量为其中,dv,1表示用户v的粉丝数,dv,2表示用户v的好友数,表示用户v的局部聚集系数,Ngv是节点v的邻居节点集合,edgij是它的相邻结点之间的连接。5.根据权利要求1或2或4所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述微博转发行为预测模型从用户间兴趣差异、备选用户活跃度以及发文用户影响力三方面,对于用户间兴趣差异方面,从用户行为和用户关系信息中提取用户的兴趣向量,利用LDA模型训练所有用户,获取用户的兴趣主题分布;对于备选用户活跃度方面,从用户行为和时间信息中提取各个时间片上的用户的状态向量,针对用户状态向量中的元素...
【专利技术属性】
技术研发人员:柳靓云,肖云鹏,杜江,刘宴兵,张克毅,李茜曦,李晓娟,宋晨光,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。