一种基于有限节点驱动的微博社会网络信息推荐方法技术

技术编号:9381806 阅读:117 留言:0更新日期:2013-11-28 00:11
本发明专利技术公开了一种基于有限节点驱动的微博社会网络信息推荐方法,可以求得近似最优的驱动节点集合,使得推荐信息通过这些驱动节点集合驱动后,能够在微博网络中传播能达到近似最大的广度。其中,本发明专利技术综合考虑用户间的连接结构、用户对话题的兴趣分布以及用户的转发行为来选择近似最优的驱动用户节点的集合,通过该驱动节点集合进行发布的推荐信息或话题的信息传播广度近似最大。

【技术实现步骤摘要】
一种基于有限节点驱动的微博社会网络信息推荐方法
本专利技术属于在线社会网络
,涉及一种基于有限节点驱动的微博社会网络信息推荐方法。
技术介绍
近年来,微博、博客和论坛等新型网络应用服务的出现深刻改变了人们的信息交流方式,成为了人们获取、传播信息的重要平台。由此形成的在线社会网络(OnlineSocialNetworks,OSN)已经成为了当前研究的热点。微博是在线社会网络的典型代表之一,已成为一种重要的信息交流平台和公共话题传播平台。在线社会网络研究主要涉及网络结构和用户行为分析、信息传播建模以及内容推荐等。目前,内容推荐研究侧重于通过分析用户关注的内容将符合用户兴趣的内容直接推荐至用户,在电子商务系统和视频分享网站等领域得到广泛应用。采用的技术主要是协同过滤,即通过对用户的显式输入或隐式输入的历史数据收集并统计,预测与此用户兴趣相似的用户,并将相似用户感兴趣的对象或信息推荐给此用户。基于协同过滤的内容推荐研究主要考虑了内容的匹配程度。实际上,对于微博社会网络来说内容推荐还有另外一种类型:将内容推荐至多个用户节点,基于这些驱动节点及其粉丝的关注和转发来实现信息传播并将内容推荐至更多的用户。该问题的核心是:如何确定多个驱动用户节点,使得由这些节点联合驱动时话题的传播广度最大。信息传播受用户兴趣度、用户粉丝数、用户的转发行为等多种因素影响。以往研究表明,由于用户对话题存在不同喜好,同一节点对不同话题的传播能力有很大差异。此外,信息内容对相关用户的提及率也是影响该信息传播速度、规模以及范围的重要因素。
技术实现思路
本专利技术解决的问题在于提供一种基于有限节点驱动的微博社会网络信息推荐方法,使得推荐信息在微博网络中传播能达到近似最大的广度。本专利技术是通过以下技术方案来实现:一种基于有限节点驱动的微博社会网络信息推荐方法,包括以下操作:1)在微博社会网络中,构建以用户节点为顶点,顶点之间的边包括关注边和转发边的双边双权值网络,其中关注边和转发边分别有各自的权重;按照下式计算微博社会网络中节点的影响力IR,并选取C个影响力最大的节点构成候选节点集QC:其中,d为跳变概率,N为网络中的用户节点数,Bv,f和Bv,r分别为节点qv关注和转发过的节点集;ODf(qu)表示从节点qu发出的关注边数目,ODr(qu)表示从节点qu发出的转发边数目,α表示调节两类边的重要程度;wuv,f为关注边权值,wuv,r为转发边权值,等于节点qu转发节点qv话题的概率;wuv,f=Iv,Iv为节点qv对所推荐的信息或话题的兴趣度,Mv是节点qv的发帖总数,Muv,r是节点qv转发节点qu的帖子数量;2)对于候选节点集QC中的单个节点q,q∈QC,建立由q作为单一驱动节点时的推荐话题转发网络,并基于该网络计算单个节点驱动时的推荐信息或话题传播广度的期望值;3)计算候选节点集QC中个节点n个节点联合驱动下信息传播的广度的期望值,n<C,选取使得信息传播广度最大的n个用户节点,以所选择的n个用户节点作为驱动节点进行推荐信息或话题的传播。所述的兴趣度Iv通过LDA算法计算用户节点qv历史发帖内容和推荐信息的相似度,以所计算的结果作为qv对推荐话题的兴趣度。所述在步骤2)中,在构建推荐话题转发网络时以网络拓扑结构和用户转发行为基础进行构建,并用动态贝叶斯网络推理方法进行推理,从而计算以单个节点q为信息传播的驱动节点时,网络中的所有节点参与推荐信息或话题传播的概率,在所构建的网络中当某用户节点接收推荐信息或话题时,则该用户节点被激活并以概率p转发该信息或话题,通过计算网络中被激活用户的概率和数量来计算单个节点驱动时的信息传播广度的期望值。所述在构建的推荐话题转发网络中,每个节点qi对应一个二值随机变量Xi,其中Xi=1表示转发,Xi=0表示不转发;用户的转发行为用条件概率Pr(Xi|F(Xi))表示,其中F(Xi)为推荐信息或话题被节点qi转发过的用户节点状态;获知各节点转发信息的条件概率后,推理出每个节点转发信息的概率Pr(Xi)。所构建的推荐话题转发网络为动态贝叶斯网络,包括初始网B0和转移网B→,变量集表示t时刻的随机变量集,令初始网B0中的其它变量均为0;在t时刻上的联合概率分布Pr(Xt)为:其中,表示在动态贝叶斯网络中的父节点,随着t的增大,将收敛于Pr(Xi);选取预定义阈值δ,使得时停止计算;为节点转发推荐信息的条件概率Pr(Xi|pa(Xi)),在计算过程中不随t的变化而变化,则用户节点qi转发推荐话题的概率为并对条件概率进行如下分解:其中,为需要学习的参数,对于所有节点qi选取其中表示的个数,不受时间t影响,其中Xj∈F(Xi);而Pr(Xi|Xj)按下式进行计算:其中Mji,r为节点qi转发qj的帖子数,Mi为节点qi发表的帖子数。所述在进行步骤3)的计算时,采用贪婪策略:先选择候选节点集QC中对推荐话题传播广度最大的节点,通过该节点与其它节点之间的连接强度,选出第二个节点,使得两者联合传播广度最大;以此类推,最终得到n个节点。所述在进行步骤3)的计算时,n个节点联合驱动下信息传播的广度的期望值的计算为:任意两个节点qu和qv之间的连接强度定义为:其中,ku、kv为qu、qv的粉丝数目,ouv为qu、qv的公共粉丝数;而驱动节点集Q与单一驱动节点qv之间的连接强度为:其中|Q|为Q包含的节点数;当一个节点接收到推荐信息或话题时,认为其被激活,且其接收到推荐信息或话题的概率为激活概率;通过激活期望AE来度量单一节点qv的传播能力,即其中,为当qv为驱动节点时节点qk的激活概率;则节点集Q的联合激活期望JAE为:其中为给定点集Q时qk的激活概率;多个节点联合驱动话题传播的能力与各单节点的驱动能力的连接强度呈线性关系:Ea(Q)=Aw(Q′,qv)+BEa(qv)+b+ε(12)其中Q′为给定的驱动点集,Q={Q′,qv},A、B、b为待估参数,待估参数根据实际数据利用最小二乘算法进行估计,ε为随机噪声。进一步,基于贪婪算法的策略,依次选择驱动节点,最终得到次优解:a)初始化选择QC中驱动能力最大的节点qp∈QC放入QP,同时将它从候选节点集QC中删除,即QP←QP∪qp,QC←QC\qp;b)根据公式(10),计算点集QP与QC中各节点的连接强度,并选取使得公式(12)最大化的节点qp∈QC放入QP,即QP←QP∪qp,QC←QC\qp。重复步骤b),直到QP包含n个驱动节点。与现有技术相比,本专利技术具有以下有益的技术效果:本专利技术提供的基于有限节点驱动的微博社会网络信息推荐方法,可以求得近似最优的驱动节点集合,使得推荐信息通过这些驱动节点集合驱动后,能够在微博网络中传播能达到近似最大的广度。其中,本专利技术综合考虑用户间的连接结构、用户对话题的兴趣分布以及用户的转发行为来选择近似最优的驱动用户节点的集合,通过该驱动节点集合进行发布的推荐信息或话题的信息传播广度近似最大。进一步,本专利技术除了综合考虑了微博社会网络中用户的连接关系、用户转发行为和对话题的兴趣度等要素,设计合适的网络数学模型之外,还提出了改进的PageRank算法,并基于改进的PageRank算法并结合动态贝叶斯网络推理计算,准确地度量信息传播广度,在此基础上选本文档来自技高网...
一种基于有限节点驱动的微博社会网络信息推荐方法

【技术保护点】
一种基于有限节点驱动的微博社会网络信息推荐方法,其特征在于,包括以下操作:1)在微博社会网络中,构建以用户节点为顶点,顶点之间的边包括关注边和转发边的双边双权值网络,其中关注边和转发边分别有各自的权重;按照下式计算微博社会网络中节点的影响力IR,并选取C个影响力最大的节点构成候选节点集QC:IR(qv)=dN+(1-d)[Σqu∈Bv,ftu,fwuv,f+Σqu∈Bv,rtu,rwuv,r]其中,d为跳变概率,N为网络中的用户节点数,Bv,f和Bv,r分别为节点qv关注和转发过的节点集;tu,f=α·IR(qu)ODf(qu),tu,r=(1-α)·IR(qu)ODr(qu)ODf(qu)表示从节点qu发出的关注边数目,ODr(qu)表示从节点qu发出的转发边数目,α表示调节两类边的重要程度;wuv,f为关注边权值,wuv,r为转发边权值,等于节点qu转发节点qv话题的概率;wuv,f=Iv,wuv,r=Muv,rMvIv为节点qv对所推荐的信息或话题的兴趣度,Mv是节点qv的发帖总数,Muv,r是节点qv转发节点qu的帖子数量;2)对于候选节点集QC中的单个节点q,q∈QC,建立由q作为单一驱动节点时的推荐话题转发网络,并基于该网络计算单个节点驱动时的推荐信息或话题传播广度的期望值;3)计算候选节点集QC中个节点n个节点联合驱动下信息传播的广度的期望值,n...

【技术特征摘要】
1.一种基于有限节点驱动的微博社会网络信息推荐方法,其特征在于,包括以下操作:1)在微博社会网络中,构建以用户节点为顶点,顶点之间的边包括关注边和转发边的双边双权值网络,其中关注边和转发边分别有各自的权重;按照下式计算微博社会网络中节点的影响力IR,并选取C个影响力最大的节点构成候选节点集QC:其中,d为跳变概率,N为网络中的用户节点数,Bv,f和Bv,r分别为节点qv关注和转发过的节点集;ODf(qu)表示从节点qu发出的关注边数目,ODr(qu)表示从节点qu发出的转发边数目,α表示调节两类边的重要程度;wuv,f为关注边权值,用qv对推荐话题的兴趣度Iv来度量;wuv,r为转发边权值,wuv,r的值等于节点qu转发节点qv话题的概率;Iv为节点qv对所推荐的信息或话题的兴趣度,Mv是节点qv的发帖总数,Muv,r是节点qv转发节点qu的帖子数量;2)对于候选节点集QC中的单个节点q,q∈QC,建立由q作为单一驱动节点时的推荐话题转发网络,并基于该网络计算单个节点驱动时的推荐信息或话题传播广度的期望值;3)计算候选节点集QC中n个节点联合驱动下信息传播的广度的期望值,n<C,选取使得信息传播广度最大的n个用户节点,以所选择的n个用户节点作为驱动节点进行推荐信息或话题的传播;在步骤2)中,在构建推荐话题转发网络时以网络拓扑结构和用户转发行为为基础进行构建,并用动态贝叶斯网络推理方法进行推理,从而计算以单个节点q为信息传播的驱动节点时,网络中的所有节点参与推荐信息或话题传播的概率,在所构建的网络中当某用户节点接收推荐信息或话题时,则该用户节点被激活并以概率p转发该信息或话题,通过计算网络中被激活用户的概率和数量来计算单个节点驱动时的信息传播广度的期望值;在构建的推荐话题转发网络中,每个节点qi对应一个二值随机变量Xi,其中Xi=1表示转发,Xi=0表示不转发;用户的转发行为用条件概率Pr(Xi|F(Xi))表示,其中F(Xi)为推荐信息或话题被节点qi转发过的用户节点状态;获知各节点转发信息的条件概率后,推理出每个节点转发信息的概率Pr(Xi);所构建的推荐话题转发网络为动态贝叶斯网络,包括初始网B0和转移网B→,变量集表示t时刻的随机变量集,令初始网B0中的其它变量均为0;在t时刻上的联合概率分布Pr(Xt)为:其中,表示在动态贝叶斯网络中的父节点,随着t的增大,将收敛于Pr(Xi);选取预定义阈值δ,使得时停止计算;为节...

【专利技术属性】
技术研发人员:杜友田苏畅管晓宏吴陈鹤
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1