基于改进版PageRank以及综合影响力的推荐方法技术

技术编号:20221848 阅读:43 留言:0更新日期:2019-01-28 20:19
本发明专利技术公开了一种基于有向图改进版PageRank以及综合评定微博影响力的用户推荐方法,包括如下步骤:(1)Python爬虫爬取新浪微博数据集;(2)通过数据集在关注关系与交互关系的基础上建立有向图模型;(3)加入综合指标评定矩阵,得到加权概率转移矩阵;(4)马尔科夫迭代收敛得到最终PR值并进行Top‑N推荐。与传统方法相比,本发明专利技术所述方法可以有效避免仅通过关注关系建模,或者评判指标太过单一造成的局限性以及不准确性,实现了在数据范围里更精确且可信度更高的影响力用户的确定。

【技术实现步骤摘要】
基于改进版PageRank以及综合影响力的推荐方法
本专利技术属于社交媒体用户推荐
,具体涉及到一种基于有向图改进版PageRank以及综合评定微博影响力的用户推荐方法。
技术介绍
微博已经成为时下最流行的大众化信息传播媒介,通过微博平台用户可以轻易地完成各类信息的获取、生产、分享和传播。微博的另一大魅力是可以在这个虚拟网络中认识更多的朋友,以新浪微博为例,用户可以通过“你可能感兴趣的人”这个模块中由系统推荐的用户,找到志趣相投的人。但是其实现有微博并没有很好地推荐给用户真正有微博影响力的用户,推荐的用户大多都是推销或微商,人们不太会真正下手点关注。另外,传统的研究微博用户影响力的算法通常采用PageRank算法,然而该算法最原先是用于通过网页的链入链出来判断网页是否重要,应用到社交关系中基本上所有的研究都只局限于人与人之间的关注关系,其实并不全面,因为社交关系中除了关注,还存在交互关系。我们可以理解为,除了A关注B能表示出B对A有影响力,然而其实如果A转发了很多C的微博,但并没有关注C,我们这里就不能否认C对A同样也有影响力。且PageRank中设定转到每页面的概率是平均的,本文档来自技高网...

【技术保护点】
1.一种基于有向图改进版PageRank以及综合评定微博影响力的用户推荐方法,包括如下步骤:(1)Python爬虫爬取新浪微博数据集;(2)通过数据集在关注关系与交互关系的基础上建立有向图模型;(3)加入综合指标评定矩阵,得到加权概率转移矩阵;(4)马尔科夫迭代收敛得到最终PR值并进行Top‑N推荐。

【技术特征摘要】
1.一种基于有向图改进版PageRank以及综合评定微博影响力的用户推荐方法,包括如下步骤:(1)Python爬虫爬取新浪微博数据集;(2)通过数据集在关注关系与交互关系的基础上建立有向图模型;(3)加入综合指标评定矩阵,得到加权概率转移矩阵;(4)马尔科夫迭代收敛得到最终PR值并进行Top-N推荐。2.如权利要求1所述的基于有向图改进版PageRank以及综合评定微博影响力的用户推荐方法,其特征在于:所述步骤(1)具体如下:Python爬虫爬取新浪微博上2000个左右用户及其衍生的几十万粉丝以及关注用户数据集,爬取四张数据表:①User_info表、②Follows表、③Followers、④Retweets。3.如权利要求2所述的基于有向图改进版PageRank以及综合评定微博影响力的用户推荐方法,其特征在于:所述步骤(2)具体如下:设用户i关注人数为Fi,设转发微博条数为Ti,则通过皮尔逊相关系数来计算关注与转发之间的相关性RFT:设关注权值为WF,则转发权值WT=WF×RFT;研究用户i影响力时,设用户m全部转发的微博数为Tm,转发用户i的微博数为Tmi,则依次根据皮尔逊算出所有其他用户与用户i的微博转发相关性Rmit;则用户m转发用户i的微博时的权值为Wmit=Rmit×WT,即用户i对用户m的影响力即两者之和Influenceim=Wmit+WF,而用户i的总影响力就为与其有关的用户m1、用户m2…用户mn之和,即其他用户依次类推;将Influenceim类比到不同的两个用户之间,列出转移矩阵,每行...

【专利技术属性】
技术研发人员:黄彬彬何馥芸沈艳婷杨泽彬
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1