The invention discloses a high precision micro-blog forward prediction method, which belongs to the field of micro-blog prediction and data mining technology, it mainly includes the following steps: the micro-blog user relationship corresponding to the depth of excavation after the establishment of micro-blog user relationship network; then according to the weight of micro-blog users relationship calculation of each user, then to the micro-blog micro-blog forward prediction. The invention uses a weighted directed network to describe different micro-blog users forwarding possibilities, through the establishment of forwarding relationship directed graph network, calculate the corresponding number of forwarding and followers for forwarding the proportion of the total, and give the corresponding weights to depict different probability of forwarding, so as to improve the prediction of forwarding micro-blog. The prediction accuracy, especially for the micro-blog two layer forwarding forwarding network, the prediction accuracy has been greatly improved.
【技术实现步骤摘要】
一种高精度微博转发预测方法
本专利技术涉及微博预测和数据挖掘领域,具体是一种高精度微博转发预测方法。
技术介绍
微博是一种基于用户关系的实时信息交流、分享、传播的社交平台,与Facebook、Twitter等社交网络一样影响了人类的生活交流方式。在微博平台上,随着用户数量以亿万级为单位数量的增加,大量的图片、文本等海量信息的背后反映的是人们的生活想法、知识和有趣的事情。微博的出现除了产生有益影响,也带来了很多问题,例如不良言论的无约束传播等严重破坏了社会生活风气。所以,对微博用户的活动状态进行预测,对于政府、企事业单位、个人都有重要的意义。在现有的微博转发预测解决方案中,公开号为CN105550275A的中国专利公开了一种微博转发量预测方法,用于解决现有技术中对微博转发量预测的方法准确性较低的问题,该方法包括:获取训练微博数据和待预测微博数据;根据训练微博的转发量,将训练微博划分为对应的类别;提取训练微博特征,包括转发网络特征、内容特征和时序特征;建立所述微博特征和转发量类别之间的多分类模型;提取待预测微博特征,根据所述的待预测微博特征,基于多分类模型,预测待预测微博的转发量类别。本专利技术在微博内容特征和时序特征的基础上,加入多种转发网络特征,综合利用三类特征来预测转发量,提高了预测的准确性。该专利技术通过训练微博数据并提取特征、建立模型的方法在一定程度上提高了微博转发预测的准确度,但是对于多级层的微博转发关系网,无法做到精确预测其中的级层转发情况,而且运算成本较高。公开号为CN103984701A的中国专利公开了一种微博转发量预测模型生成方法及微博转发 ...
【技术保护点】
一种高精度微博转发预测方法,其特征在于,它包括以下步骤:S1:根据微博用户的转发关系建立有向图网络;S2:统计待测微博用户发布的微博被转发的总数N,以及待测微博用户对应的各个关注者转发的数量n
【技术特征摘要】
1.一种高精度微博转发预测方法,其特征在于,它包括以下步骤:S1:根据微博用户的转发关系建立有向图网络;S2:统计待测微博用户发布的微博被转发的总数N,以及待测微博用户对应的各个关注者转发的数量n1,n2,n3…ni,计算对应的每条有向边的初始权重为S3:统计有向网络中节点个数M,并给予每个节点1/M的权重;S4:更新每个节点的权重,首先以发布微博的用户为节点,把当前节点的权重根据相应有向边的权重分配到直接关注该微博的节点上;S5:重复执行S4步骤,直到每个节点的权重收敛;S6:完成发布微博的用户和第一批关注者的节点权重更新以后,依次更新剩下的各批关注者的节点的权重;S7:获取待测微博的第一批关注者的权重w1,w2,…wn;S8:根据需要设定权重阈值Q1,判断第一批关注者的权重w1,w2,…wn是否超过阈值Q1,如果超过,则保留;如果没有超过,则去除;如果都不超过,则去掉topK个权重值后作为下一个阶段的传播预测;S9:重复步骤S8,根据需要设定一个关注者个数阈值Q2,直到关注者的权重都小于Q1且关注者的个数都小于Q2时,停止预测。2.根据权利要求1所述的一种高精度微博转发预测方法,其特征在于:所述的步骤S6能够设置迭代次数直到满足实际...
【专利技术属性】
技术研发人员:陈雁,郭培伦,葛忆,李平,胡栋,朱婷婷,
申请(专利权)人:西南石油大学,四川数智汇通数据有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。