一种微博转发量预测方法技术

技术编号:13234410 阅读:76 留言:0更新日期:2016-05-14 21:57
本发明专利技术提供一种微博转发量预测方法,用于解决现有技术中对微博转发量预测的方法准确性较低的问题,该方法包括:获取训练微博数据和待预测微博数据;根据训练微博的转发量,将训练微博划分为对应的类别;提取训练微博特征,包括转发网络特征、内容特征和时序特征;建立所述微博特征和转发量类别之间的多分类模型;提取待预测微博特征,根据所述的待预测微博特征,基于多分类模型,预测待预测微博的转发量类别。本发明专利技术在微博内容特征和时序特征的基础上,加入多种转发网络特征,综合利用三类特征来预测转发量,提高了预测的准确性。

【技术实现步骤摘要】

本专利技术属于数据挖掘中的流行趋势预测
,特别涉及一种微博转发量预测 方法。
技术介绍
微博是一种通过关注机制分享简短实时信息的广播式的社交网络平台。当一个微 博用户发布一条信息后,该信息会被推送给该用户的所有粉丝,这些粉丝可以选择是否转 发该信息,如果转发,该信息会进一步被推送给这些粉丝的粉丝。通过用户转发,信息可以 在微博网络中迅速传播。 自2009年在国内发布以来,微博以其简单、便捷、即时等特点,迅速成为了人们日 常生活中获取与分享信息的重要网络平台。截至2014年9月,微博日活跃用户已达到7660万 人,月活跃用户达到1.67亿人。用户规模的迅速扩张,带来了发博量的爆发式增长。面对海 量微博,及时准确地预测微博最终的转发量,对内容推荐、广告营销以及舆情监控等具有重 要意义。 目前微博转发量预测方法主要有两类。一类是事先定义好特征集合(如发布者粉 丝数,是否为认证用户,内容长度等),然后从训练数据中抽取微博的这些特征,用来训练回 归模型或分类模型,最后对于待预测微博,同样抽取这些特征,将其输入到回归模型或分类 模型中,得到待预测微博最终的转发量或转发量范围。本文档来自技高网...

【技术保护点】
一种微博转发量预测方法,其特征是步骤如下:步骤1获取训练数据和待预测微博数据根据微博用户id和他们之间的关注关系可以构造一个用户关注网络G,构造方法为:若用户A关注了用户B,则在G中构造一条由有向边A|B;将用户数据按比例划分为训练数据和待预测数据,训练数据包括多条已知发布后tr时刻转发量的原始微博以及其发布后到ti时刻之间的所有转发微博,将微博发布48小时后的转发量视为其最终转发量,利用其发布后前1小时内的转发信息预测其最终转发量,即将tr和ti分别设为48小时和1小时,预测集中的待预测微博包括原始微博以及其发布后到ti时刻之间的所有转发微博;步骤2对训练集微博的转发量进行分类根据转发量阈值...

【技术特征摘要】

【专利技术属性】
技术研发人员:尚明生李锴张航
申请(专利权)人:中国科学院重庆绿色智能技术研究院
类型:发明
国别省市:重庆;85

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1