一种增量抓取微博信息的方法技术

技术编号:9336285 阅读:490 留言:0更新日期:2013-11-13 15:40
本发明专利技术涉及一种增量抓取微博信息的方法,包括初次微博数据抓取和增量抓取截止到上次抓取时间的新增的微博数据,属于智能信息处理技术。现有技术中,对于海量微博信息的采集工作不能做到增量式抓取,常出现微博信息被重复多次抓取的情况。本发明专利技术所述的方法针对抓取微博信息的实际应用,通过合理的接入微博平台API,从而实现了一个实用的增量抓取微博算法。采用本发明专利技术所述的方法,能够明显提高微博信息的抓取的准确性与全面性,大大增强其实用性。本方法可广泛地应用于舆情分析与监控。

【技术实现步骤摘要】

【技术保护点】
本专利技术方法涉及一个微博种子用户uid_list,该种子用户uid_list表示为需要抓取的微博用户ID的集合。

【技术特征摘要】

【专利技术属性】
技术研发人员:倪志豪梁循曹润李亚平余力梁霞
申请(专利权)人:中国人民大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1