一种基于好友圈子的动态微博转发行为预测系统及方法技术方案

技术编号:15392249 阅读:81 留言:0更新日期:2017-05-19 05:11
本发明专利技术请求保护一种基于好友圈子的动态微博转发行为预测系统及方法,属于社交网络信息分析领域。基于社交网络中用户关系以及用户行为数据,考虑兴趣差异、用户历史行为、网络结构等在推动网络信息传播中的作用,从用户兴趣、活跃度和影响力三个方面出发,利用LDA主题模型的基础思想和方法,对用户行为进行建模分析,得到关于用户行为的主题分布;使用高斯分布改进LDA,以发现用户的活跃度和影响力;同时,针对用户的活跃度随时间的变化,利用时间离散化及时间切片方法,提出一种改进的LDA动态微博转发行为预测模型并对模型进行拟合,输入数据到预测模型即可动态监测用户的活跃度,更准确的预测用户的转发行为并发现影响用户转发的关键因素。

A dynamic micro-blog forwarding behavior prediction system and method based on friend circle

The invention claims to protect a dynamic micro-blog forwarding behavior prediction system and method based on the circle of friends, belonging to the field of social network information analysis. The users in the social network and based on user behavior data, considering the interest difference, user behavior and network structure in the network to promote the role of information transmission, starting from the three aspects of user interest, activity and influence, basic thoughts and methods of using the LDA model, modeling and analysis of user behavior, a user the behavior of subject distribution; using Gauss distribution to improve LDA, to find the user's activity and influence; at the same time, the changes with time of the activity of users, using the time discretization and time slicing method, put forward a kind of improved micro-blog LDA dynamic forwarding behavior prediction model and the model is fit to the prediction of the input data dynamic monitoring of user model can predict the user's activity, the more accurate the forwarding behavior and find the effect of forwarding for key users Su.

【技术实现步骤摘要】
一种基于好友圈子的动态微博转发行为预测系统及方法
本专利技术涉及社交网络信息分析领域,主要涉及根据社交网络用户行为分析,构建一种动态微博转发行为预测模型。
技术介绍
随着WEB2.0理念的普及与相关技术的日益成熟,社交网站如Twitter、Facebook、新浪微博等对人们的生活产生了巨大影响。人们在社交网站中更新状态或发送广播,以此来展现自己的生活状态、发表感想或与朋友们分享信息。社交网站为用户相互交流、发表意见和观点提供了非常便利的平台。对社交网站的用户行为进行建模和预测对于安全、商业等多个领域具有十分重要的社会意义和应用价值,近年来逐渐得到研究者的重视。新浪微博是一款为大众提供娱乐休闲生活服务的信息分享和交流平台,于2009年8月14日开始内测。截至2014年6月底,我国微博用户规模为2.75亿,用户之间组成复杂的关注网络,平均每天发送微博近1亿条,信息沿着用户间的关注关系传播,形成传播扩散网络。用户转发是微博中最有效的信息传播机制,当前转发预测的研究主要集中在兴趣特征、用户影响力以及用户属性等对转发行为预测结果的影响。所使用的方法包括基于文本的分析、基于用户影响力的分析和基于网络结构的分析等。其中,基于文本的分析主要利用概率主题模型分析文本,根据文本主题与用户兴趣的相似度预测用户的转发行为。例如:XuningTang等人在《接下来谁将参与?预测黑色网络社区的参与》(WhowillbeParticipatingNext?PredictingtheParticipationofDarkWebCommunity)中构建了一个用户兴趣和话题检测模型(UTD)。在给定已有部分用户对某个帖子进行回复的条件下,UTD模型通过获取话题内容和发展趋势预测哪些用户会对新的帖子产生兴趣;基于用户影响力分析主要研究用户在社交网络中对于其他用户的影响力,并与影响用户转发、评论的行为因素相结合,从而达到预测用户转发概率的目的。例如:WengJ等人在《基于主题找到影响力用户》(TwitterRank:FindingTopic-sensitiveInfluentialTwitterers)中通过用户影响力评价,帮助用户迅速找出自己感兴趣的信息,从而解决了“微博网络中朋友过多所导致的信息过载问题”;基于网络结构的分析主要利用小世界理论、用户出入度等理论,构建因子图模型预测用户的转发行为。例如:JingZhang等人在《谁影响了你?通过社会影响力预测转发行为》(WhoInfluencedYou?PredictingRe-tweetviasocialInfluenceLocality)中研究了基于用户好友圈子,结合因子图模型和社会影响力分析的转发预测方法。用户的信息转发行为是多因素共同作用的结果,但上述现有技术未考虑到用户行为的复杂性,仅仅集中于一方面预测用户转发行为,预测结果并不准确,而且无法评估影响用户行为的各个特征的重要性。另外,当前的研究主要集中在网络静态特征对信息传播的影响,但却忽视了网络动态特性的重要作用,造成动态网络静态化问题。例如,用户活跃度具有动态特性,用户的活跃度随时间不断变化,其信息扩散速度和范围也将随之改变。因此,在网络静态特征的基础上,应充分考虑动态因素对信息传播的影响。由于社交网络中充斥着海量的信息,挖掘用户兴趣是提高信息转发预测效果的主要途径之一,利用LDA主题模型在大文本处理和特征降维方面的巨大优势,可以帮助用户迅速找出自己感兴趣的信息。本文重点针对网络动态特性、用户行为表征以及用户特征重要性评定等问题,引入并优化LDA主题模型,对用户行为进行建模分析,并采用时间离散化及时间切片方法,增强LDA模型对动态用户特征的处理能力,动态监测用户活跃度,提高转发预测的准确度。
技术实现思路
本专利技术针对现有技术存在的问题:针对信息传播中网络动态特性、用户行为表征以及用户特征重要性评定等问题,提出了一种有效估计消息是否能获得转发及其转发规模、及早发现可能引发大规模爆发的微博的基于好友圈子的动态微博转发行为预测系统及方法。本专利技术的技术方案如下:一种基于好友圈子的动态微博转发行为预测系统,包括用户行为数据源获取模块,用于获取社交网络中的用户关系和用户行为数据,将发文用户的粉丝作为备选用户,其还包括属性提取模块、模型构建模块及预测分析模块,其中,所述属性提取模块分别从用户间兴趣差异、备选用户的活跃度以及发文用户的影响力三方面提取相关属性向量作为预测模型的输入;微博转发行为预测模型构建模块,用于对备选用户构建微博转发行为预测模型,转发行为主要受备选用户与其好友的兴趣差异τ、备选用户在文章发布时段的活跃度s和其好友的网络影响力r参数决定,并对以上模型参数进行拟合;预测分析模块用于将拟合后获得的参数和任一时刻t的用户发文情况进行备选用户是否会转发该条微博的预测。进一步的,所述属性提取模块针对用户间兴趣差异,提取用户兴趣向量包括:利用用户的关注行为属性,获取每个用户的关注列表,定义用户v的兴趣向量为其中,ev,u表示用户v关注列表中的用户,u=1,2......|Ev|,|Ev|表示用户v关注列表中的用户总数。进一步的,所述属性提取模块针对备选用户的活跃度,提取用户状态向量包括:利用用户的交互行为属性和时间属性,获取每个用户在一段时间内的用户发布微博活跃度及转发微博活跃度,定义用户v的活跃度状态向量为其中,表示用户v在时间片t上的发布微博活跃度,表示用户v在时间片t上的转发微博活跃度,和分别代表用户v在时间片t上的发布微博数、转发微博数以及用户v平均每天发布微博数。进一步的,所述属性提取模块针对发文用户的影响力,提取用户特征向量包括:利用网络拓扑结构属性,获取每个用户节点的出度、入度和局部聚集系数,定义用户v的影响力特征向量为其中,dv,1表示用户v的粉丝数,dv,2表示用户v的好友数,表示用户v的局部聚集系数,Ngv是节点v的邻居节点集合,edgij是它的相邻结点之间的连接。进一步的,所述微博转发行为预测模型从用户间兴趣差异、备选用户活跃度以及发文用户影响力三方面,对于用户间兴趣差异方面,从用户行为和用户关系信息中提取用户的兴趣向量,利用LDA模型训练所有用户,获取用户的兴趣主题分布;对于备选用户活跃度方面,从用户行为和时间信息中提取各个时间片上的用户的状态向量,针对用户状态向量中的元素是连续值,使用高斯分布改进LDA,再利用改进的LDA模型训练所有用户,获取用户在各个时间片上的活跃状态分布;对于发文用户影响力方面,从网络结构信息中提取用户的特征向量,同上述用户状态向量一样,使用高斯分布改进LDA,再利用改进的LDA模型训练所有用户,获取用户的网络角色分布;最后根据用户间兴趣是否一致、备选用户在各个时间片上所处的活跃状态、发文用户的网络角色以及用户的历史转发数据训练整个预测模型,得到用户转发行为的多项分布。进一步的,所述微博转发行为预测模型获取用户的兴趣主题分布还包括:在用户关系网络的基础上再利用用户之间的交互行为,对用户的兴趣向量I(v)进行加权得到加权用户兴趣向量为其中,wv,n表示用户v发生第n次交互行为的交互对象,n=1,2......Nv,Nv为用户v交互总次数,再利用LDA模型训练所有用户,便可得到用户的兴本文档来自技高网
...
一种基于好友圈子的动态微博转发行为预测系统及方法

【技术保护点】
一种基于好友圈子的动态微博转发行为预测系统,包括用户行为数据源获取模块,用于获取社交网络中的用户关系和用户行为数据,将发文用户的粉丝作为备选用户,其特征在于,还包括属性提取模块、模型构建模块及预测分析模块,其中,所述属性提取模块分别从用户间兴趣差异、备选用户的活跃度以及发文用户的影响力三方面提取相关属性向量作为预测模型的输入;微博转发行为预测模型构建模块,用于对备选用户构建微博转发行为预测模型,转发行为主要受备选用户与其好友的兴趣差异τ、备选用户在文章发布时段的活跃度s和其好友的网络影响力r参数决定,并对以上模型参数进行拟合;预测分析模块用于将拟合后获得的参数和任一时刻t的用户发文情况进行备选用户是否会转发该条微博的预测。

【技术特征摘要】
1.一种基于好友圈子的动态微博转发行为预测系统,包括用户行为数据源获取模块,用于获取社交网络中的用户关系和用户行为数据,将发文用户的粉丝作为备选用户,其特征在于,还包括属性提取模块、模型构建模块及预测分析模块,其中,所述属性提取模块分别从用户间兴趣差异、备选用户的活跃度以及发文用户的影响力三方面提取相关属性向量作为预测模型的输入;微博转发行为预测模型构建模块,用于对备选用户构建微博转发行为预测模型,转发行为主要受备选用户与其好友的兴趣差异τ、备选用户在文章发布时段的活跃度s和其好友的网络影响力r参数决定,并对以上模型参数进行拟合;预测分析模块用于将拟合后获得的参数和任一时刻t的用户发文情况进行备选用户是否会转发该条微博的预测。2.根据权利要求1所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述属性提取模块针对用户间兴趣差异,提取用户兴趣向量包括:利用用户的关注行为属性,获取每个用户的关注列表,定义用户v的兴趣向量为其中,ev,u表示用户v关注列表中的用户,u=1,2......|Ev|,|Ev|表示用户v关注列表中的用户总数。3.根据权利要求1或2所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述属性提取模块针对备选用户的活跃度,提取用户状态向量包括:利用用户的交互行为属性和时间属性,获取每个用户在一段时间内的用户发布微博活跃度及转发微博活跃度,定义用户v的活跃度状态向量为其中,表示用户v在时间片t上的发布微博活跃度,表示用户v在时间片t上的转发微博活跃度,和分别代表用户v在时间片t上的发布微博数、转发微博数以及用户v平均每天发布微博数。4.根据权利要求3所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述属性提取模块针对发文用户的影响力,提取用户特征向量包括:利用网络拓扑结构属性,获取每个用户节点的出度、入度和局部聚集系数,定义用户v的影响力特征向量为其中,dv,1表示用户v的粉丝数,dv,2表示用户v的好友数,表示用户v的局部聚集系数,Ngv是节点v的邻居节点集合,edgij是它的相邻结点之间的连接。5.根据权利要求1或2或4所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述微博转发行为预测模型从用户间兴趣差异、备选用户活跃度以及发文用户影响力三方面,对于用户间兴趣差异方面,从用户行为和用户关系信息中提取用户的兴趣向量,利用LDA模型训练所有用户,获取用户的兴趣主题分布;对于备选用户活跃度方面,从用户行为和时间信息中提取各个时间片上的用户的状态向量,针对用户状态向量中的元素...

【专利技术属性】
技术研发人员:柳靓云肖云鹏杜江刘宴兵张克毅李茜曦李晓娟宋晨光
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1