一种基于联合概率矩阵分解的微博关注推荐方法技术

技术编号:21432326 阅读:18 留言:0更新日期:2019-06-22 11:57
本发明专利技术公开了一种基于联合概率矩阵分解的微博关注推荐方法,包括步骤1、读取用户关系信息和用户交互行为信息;步骤2、由所述用户关系信息构建用户关系矩阵;步骤3、由所述用户交互行为信息构建长期影响力矩阵,将长期影响力矩阵作为用户影响力矩阵;步骤4、对用户关系矩阵和用户影响力矩阵进行联合概率矩阵分解,得到用户潜在特征矩阵和影响力潜在特征矩阵,对用户潜在特征矩阵和影响力潜在特征矩阵內积得到用户关系强度矩阵,根据用户关系强度矩阵提取用户关系强度列表,根据用户关系强度列表进行推荐。本发明专利技术考虑交互行为的时效性,能得到个性化的推荐结果,在一定程度上缓解了数据稀疏性问题,能够提供更好的推荐结果。

【技术实现步骤摘要】
一种基于联合概率矩阵分解的微博关注推荐方法
本专利技术涉及一种微博关注推荐方法,特别是涉及一种基于联合概率矩阵分解的微博关注推荐方法。
技术介绍
社交网络庞大的用户基数以及极快的增长速度,产生了海量的社交网络数据。截至2017年,新浪微博月活跃人数已接近3亿,每天产生超过一亿条微博,月增长用户超过2000万。如何有效利用这些数据为用户推荐好友,缓解信息过载,成为一个亟需解决的难题。现有技术已有将传统的推荐技术应用于社交网络推荐中。例如,从关联关系出发,假设存在关联关系的对象更容易受到同一用户关注,利用对象间的关联关系进行推荐。又如,将在线社交网络中存在着不同于直接连接的弱依赖关系,以及社交网络具有异质性,两者结合起来应用于社交网络关注推荐。也有技术方案通过挖掘社交关系,建立局部信任和全局信任,并利用信任的传播性质对信任关系进行建模,最后综合考虑相似关系和信任关系筛选邻居节点进行推荐。还有的方案考虑了用户之间的交互行为,通过用户间的关注关系强度、交互频率、个体兴趣计算用户之间的关联兴趣,并基于此产生推荐列表。但是上述方法仅考虑了用户之间的静态的关注关系和交互频率,并不能准确衡量用户之间的关系强度,导致推荐结果被接受概率低。
技术实现思路
针对上述现有技术的缺陷,本专利技术提供了一种基于联合概率矩阵分解的微博关注推荐方法,以缓解数据稀疏性问题,能够提供更好的推荐结果。本专利技术技术方案如下:一种基于联合概率矩阵分解的微博关注推荐方法,包括以下步骤:步骤1、读取用户关系信息和用户交互行为信息;步骤2、由所述用户关系信息构建用户关系矩阵;步骤3、由所述用户交互行为信息构建长期影响力矩阵,将长期影响力矩阵作为用户影响力矩阵;步骤4、对用户关系矩阵和用户影响力矩阵进行联合概率矩阵分解,得到用户潜在特征矩阵和影响力潜在特征矩阵,对用户潜在特征矩阵和影响力潜在特征矩阵內积得到用户关系强度矩阵,根据用户关系强度矩阵提取用户关系强度列表,根据用户关系强度列表进行推荐;所述用户关系矩阵为S(v)={(u1,w1),(u2,w2),...,(un,wn)},其中v,ui,i=1,2,...,n为用户,n为数据中与用户v相似的用户数目;wi,i=1,2,...,n为用户ui与v的关系相似度在v所有相似用户中的权重,其中Sim(ui,v)为用户ui与v的双向关系相似度的线性加权相似度,所述双向关系相似度为粉丝关系相似度和关注关系相似度;所述长期影响力矩阵基于公式更新,其中Inl表示更新后的长期影响力矩阵;Iol是更新前的长期影响力矩阵;In是基于最新的交互行为构建的影响力矩阵;N是矩阵中总的交互行为数目,所述Inl,Iol,In基于构建,TL表示矩阵构建时间点,t是当前的时间;t0是矩阵建立时的时间,hl0是半衰期的初始值,dacc表示模型建立后到当前所经历的时间,常量dw表示dacc对遗忘速度的影响程度,Action(u,v,s,i)=α1Like(u,v,s,i)+α2Retweet(u,v,s,i)+α3Comment(u,v,s,i),m为用户u所发微博的总数,t是矩阵建立时的时间,s是数据的获取的时间长度,α1,α2,α3为权重系数,Like(u,v,s,i)是用户v对u的第i条微博点赞,Retweet(u,v,s,i)是用户v对u的第i条微博转发,Comment(u,v,s,i)用户v对u的第i条微博评论。进一步的,所述步骤2中由所述用户关系信息构建用户关系矩阵后,判断用户v是否在线,如果用户在线进入步骤3’,如果用户不在线进入所述步骤3,所述步骤3’为由所述用户交互行为信息构建短期影响力矩阵,将短期影响力矩阵作为用户影响力矩阵,进入步骤4,所述短期影响力矩阵为TS表示矩阵构建时间点,Action(u,v,s,i)=α1Like(u,v,s,i)+α2Retweet(u,v,s,i)+α3Comment(u,v,s,i),m为用户u在时间s内所发微博的总数,t是矩阵建立时的时间,α1,α2,α3为权重系数,Like(u,v,s,i)是用户v对u的第i条微博点赞,Retweet(u,v,s,i)是用户v对u的第i条微博转发,Comment(u,v,s,i)用户v对u的第i条微博评论,t0是矩阵建立的初始时间;hl是影响力的半衰期。进一步的,所述时间s由以下公式确定MinDays,MaxDays,MinActionNums,MaxActionNums为常量,RAN是近期交互行为数目。进一步的,所述Sim(u,v)=λSimI(u,v)+(1-λ)SimO(u,v),其中SimI(u,v)是用户u与v的粉丝关系相似度;SimO(u,v)是用户u与v的关注关系相似度;NI(u)和NI(v)分别表示用户u与v的粉丝用户的集合;NO(u)和NO(v)分别表示用户u与v的关注用户的集合,λ是粉丝相似度的权值。进一步的,所述根据用户关系强度列表进行推荐是将用户关系强度列表中用户关系强度数值最大的前N个用户ui推荐给用户v。本专利技术所提供的技术方案的优点在于:引入遗忘函数来差异性地对待不同时间的交互行为,考虑交互行为的时效性建立了用户影响力模型,结合静态关注关系,并引入联合概率矩阵分解方法,从而得到个性化的推荐结果,在一定程度上缓解了数据稀疏性问题,能够提供更好的推荐结果。附图说明图1为本专利技术基于联合概率矩阵分解的微博关注推荐方法流程示意图。图2为UPMFF模型示意图。具体实施方式下面结合实施例对本专利技术作进一步说明,应理解这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围,在阅读了本专利技术之后,本领域技术人员对本专利技术的各种等同形式的修改均落于本申请所附权利要求所限定的范围内。请结合图1所示,实施例所涉及的基于联合概率矩阵分解的微博关注推荐方法是这样的:步骤1:读取用户关系信息和用户交互行为信息;步骤2:由所述用户关系信息构建用户关系矩阵,考虑节点共同邻居的数目,节点相似度正比于共同邻居数目。综合考虑节点出度相似度和入度相似度,对两种相似度的计算如下:其中SimI(u,v)是用户u与v的粉丝关系相似度;SimO(u,v)是用户u与v的关注关系相似度;NI(u)和NI(v)分别表示用户u与v的粉丝用户的集合;NO(u)和NO(v)分别表示用户u与v的关注用户的集合。使用双向关系线性加权来计算最终的关系相似度Sim(u,v)=λSimI(u,v)+(1-λ)SimO(u,v)λ是粉丝相似度的权值,在此基础上,引入用户相似度权重,其中Sim(ui,v)为用户ui与v的双向关系相似度的线性加权相似度,双向关系相似度为粉丝关系相似度和关注关系相似度,n为数据中与用户v相似的用户数目,最终用户v的用户关系矩阵为S(v)={(u1,w1),(u2,w2),...,(un,wn)}。判断用户v是否在线,如果用户在线,进入步骤3’,如果用户不在线,进入步骤3。步骤3’引入遗忘函数来差异性地对待不同时间的交互行为。定义遗忘函数如下:t是矩阵建立时的时间,t0是矩阵建立的初始时间,hl是影响力的半衰期,是影响力衰退到初始值一半时所用的时间。当t=t0时,F(t)=1;当t-t0=hl时,F(t)=1/2。短期影响力模型指定了一个大小为S的时间窗口,覆盖了用于建模的本文档来自技高网...

【技术保护点】
1.一种基于联合概率矩阵分解的微博关注推荐方法,其特征在于,包括以下步骤:步骤1、读取用户关系信息和用户交互行为信息;步骤2、由所述用户关系信息构建用户关系矩阵;步骤3、由所述用户交互行为信息构建长期影响力矩阵,将长期影响力矩阵作为用户影响力矩阵;步骤4、对用户关系矩阵和用户影响力矩阵进行联合概率矩阵分解,得到用户潜在特征矩阵和影响力潜在特征矩阵,对用户潜在特征矩阵和影响力潜在特征矩阵內积得到用户关系强度矩阵,根据用户关系强度矩阵提取用户关系强度列表,根据用户关系强度列表进行推荐;所述用户关系矩阵为S(v)={(u1,w1),(u2,w2),...,(un,wn)},其中v,ui,i=1,2,...,n为用户,n为数据中与用户v相似的用户数目;wi,i=1,2,...,n为用户ui与v的关系相似度在v所有相似用户中的权重,

【技术特征摘要】
1.一种基于联合概率矩阵分解的微博关注推荐方法,其特征在于,包括以下步骤:步骤1、读取用户关系信息和用户交互行为信息;步骤2、由所述用户关系信息构建用户关系矩阵;步骤3、由所述用户交互行为信息构建长期影响力矩阵,将长期影响力矩阵作为用户影响力矩阵;步骤4、对用户关系矩阵和用户影响力矩阵进行联合概率矩阵分解,得到用户潜在特征矩阵和影响力潜在特征矩阵,对用户潜在特征矩阵和影响力潜在特征矩阵內积得到用户关系强度矩阵,根据用户关系强度矩阵提取用户关系强度列表,根据用户关系强度列表进行推荐;所述用户关系矩阵为S(v)={(u1,w1),(u2,w2),...,(un,wn)},其中v,ui,i=1,2,...,n为用户,n为数据中与用户v相似的用户数目;wi,i=1,2,...,n为用户ui与v的关系相似度在v所有相似用户中的权重,其中Sim(ui,v)为用户ui与v的双向关系相似度的线性加权相似度,所述双向关系相似度为粉丝关系相似度和关注关系相似度;所述长期影响力矩阵基于公式更新,其中Inl表示更新后的长期影响力矩阵;Iol是更新前的长期影响力矩阵;In是基于最新的交互行为构建的影响力矩阵;N是矩阵中总的交互行为数目,所述Inl,Iol,In基于构建,TL表示矩阵构建时间点,t是当前的时间;t0是矩阵建立时的时间,hl0是半衰期的初始值,dacc表示模型建立后到当前所经历的时间,常量dw表示dacc对遗忘速度的影响程度,Action(u,v,s,i)=α1Like(u,v,s,i)+α2Retweet(u,v,s,i)+α3Comment(u,v,s,i),m为用户u所发微博的总数,t是矩阵建立时的时间,s是数据的获取的时间长度,α1,α2,α3为权重系数,Like(u,v,s,i)是用户v对u的第i条微博点赞,Retweet(u,v,s,i)是用户v对u的第i条微博转发,Co...

【专利技术属性】
技术研发人员:张明新熊孝全
申请(专利权)人:常熟理工学院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1