用于微博的舆情监控方法和装置制造方法及图纸

技术编号:10166490 阅读:135 留言:0更新日期:2014-07-02 01:21
本发明专利技术提供了一种用于微博的舆情监控方法,包括:确定被监控微博的源博主;从源博主出发深度优先遍历被监控微博的转发博主;获取转发博主的粉丝数及其关于被监控微博的转发次数;根据其粉丝数和转发次数设置转发博主的重要度。本发明专利技术还提供了一种用于微博的舆情监控装置,包括:确定模块,用于确定被监控微博的源博主;遍历模块,用于从源博主出发深度优先遍历被监控微博的转发博主;获取模块,用于获取转发博主的粉丝数及其关于被监控微博的转发次数;设置模块,用于根据其粉丝数和转发次数设置转发博主的重要度。本发明专利技术降低了舆情分析的难度,提高了舆情分析准确率。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种用于微博的舆情监控方法,包括:确定被监控微博的源博主;从源博主出发深度优先遍历被监控微博的转发博主;获取转发博主的粉丝数及其关于被监控微博的转发次数;根据其粉丝数和转发次数设置转发博主的重要度。本专利技术还提供了一种用于微博的舆情监控装置,包括:确定模块,用于确定被监控微博的源博主;遍历模块,用于从源博主出发深度优先遍历被监控微博的转发博主;获取模块,用于获取转发博主的粉丝数及其关于被监控微博的转发次数;设置模块,用于根据其粉丝数和转发次数设置转发博主的重要度。本专利技术降低了舆情分析的难度,提高了舆情分析准确率。【专利说明】用于微博的舆情监控方法和装置
本专利技术涉及舆情监控领域,具体而言,涉及用于微博的舆情监控方法和装置。
技术介绍
在门户网站上,每天的微博数据量达到几百万到几千万条,各种微博数据纷繁芜杂,而一个网络舆情事件从源头到大爆发只经历比较短的一段时间,虽具有一定的时效性,但是其影响力是非常大的,微博在某种程度上正在影响着社会政治经济的变革,鉴此,对微博的监控成为网络舆情检测和研究相当重要的一部分,但是如何从现有的大量微博数据中,提取出有价值的数据,指导研究人员对舆情事件的研究,成为迫在眉睫的事情。现有软件对网页数据或者开放平台返回的数据抓取后统一入库后分析。分析者对数据库中的大量数据进行关联,从中取得人物关系和微博转发关系,数据库庞大,无用的数据占的比例太高,有用的信息比例小,增加了分析的难度。
技术实现思路
本专利技术旨在提供用于微博的舆情监控方法和装置,以解决上述的问题。在本专利技术的实施例中,提供了一种用于微博的舆情监控方法,包括:确定被监控微博的源博主;从源博主出发深度优先遍历被监控微博的转发博主;获取转发博主的粉丝数及其关于被监控微博的转发次数;根据其粉丝数和转发次数设置转发博主的重要度。在本专利技术的实施例中,提供了一种用于微博的舆情监控装置,包括:确定模块,用于确定被监控微博的源博主;遍历模块,用于从源博主出发深度优先遍历被监控微博的转发博主;获取模块,用于获取转发博主的粉丝数及其关于被监控微博的转发次数;设置模块,用于根据其粉丝数和转发次数设置转发博主的重要度。本专利技术上述实施例的用于微博的舆情监控方法和装置因为确定了微博转发过程中的重点博主,所以减少了监控量,显著地减少了监控数据,降低了舆情分析的难度,提高了舆情分析准确率。【专利附图】【附图说明】此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1示出了示出了根据本专利技术实施例的用于微博的舆情监控方法的流程图;图2示出了根据本专利技术实施例的用于微博的舆情监控装置的示意图。【具体实施方式】下面将参考附图并结合实施例,来详细说明本专利技术。图1示出了示出了根据本专利技术实施例的用于微博的舆情监控方法的流程图,包括:步骤S10,确定被监控微博的源博主;步骤S20,从源博主出发深度优先遍历被监控微博的转发博主;步骤S30,获取转发博主的粉丝数及其关于被监控微博的转发次数;步骤S40,根据其粉丝数和转发次数设置转发博主的重要度。专利技术人对微博这种自媒体经过分析后发现,一个网络舆情事件从源头然后到大量传播然要经过若干个人的转播和评论。如果在传播途径中,信息经过某一个人时,发生了扩散,那么定义这个博主对于信息传播有贡献,在某一网络事件传播途径中必定有一部分博主对这条信息产生了非常重要的作用,如果只对这部分发挥重要作用的博主进行分析,即可对整个网络舆情事件进行分析。现有技术对网页数据或者开放平台返回的数据抓取后统一入库后分析,而本方法却从这些数据中确定转发博主的重要度,从而可以只对重要的博主的微博数据进行分析,所以减少了监控量,显著地减少了监控数据,降低了舆情分析的难度,提高了舆情分析准确率。优选地,通过被监控微博的转发路径上溯到源博主。通过转发路径尽可能地向上追溯到顶层的源博主,如果源头中断,只追溯到一个或多个顶层的博主,则可以将这一个或多个顶层的博主分别作为源博主来进行后续的遍历分析。优选地,从源博主出发深度优先遍历被监控微博的转发博主包括:从当前的转发博主的微博空间中找到被监控微博;获取被监控微博的转发列表;遍历转发列表上的所有转发博主。从纵向上看,整个遍历是深度遍历,而对当前层次,遍历转发列表上的所有转发博主,这相当于广度遍历。整个遍历过程是标准的算法语言,这里不再赘述。转发列表是微博传播轨迹的核心组成部分,整个传播轨迹的构成也就是通过转发列表实现的,假设有一条微博原始微博A,当微博B,C,D转发了 A时,微博A的转发列表是B-C-D ;如若E,F转发了 B,那么B的转发列表是E-F,那么从A开始就形成了若干条传播轨迹,其中两条就是A-B-E和A-B-F。该优选实施例利用深度优先搜索算法,首先在一个舆情事件中,可以选择一条被广泛转播的微博。获取到这一条微博数据的转发列表,把这个列表加入到一个集合中,然后通过转发的微博得到相应的博主,然后通过博主的名字利用广度优先算法获得此博主发布的微博信息,并取得原始微博在此博主下的再次被转发列表和转发次数,这样就能通过递归获取到与原始微博相关的博主和转发信息。优选地,根据其粉丝数和转发次数设置转发博主的重要度包括:设置Weight =a *nFllower+i3 *nRetweet ;其中,weight代表重要度,nFllower代表粉丝数,α代表nFllower的预设权重,nRetweet代表转发次数,β代表nRetweet的预设权重。α和β可以由用户人为地来设置,从而确定粉丝数的重要程度和转发次数的重要程度,以更好地满足用户的个性化需求。例如设置α =0.2, β =0.8,说明在一条微博的转发过程中,再次转发的次数越多,此博主的影响力越大,nRetweet 一般是一个比nFllower小的数值,只有粉丝列表中某个人多次转发同一条微博时nRetweet才有可能大于nFllower。优选地,本方法还包括:确定其重要度大于预设值的转发博主;将确定的转发博主设置为重点博主。例如,取前1/3的人作为此次传播中的重点博主。本方法在微博检测方面主要集中发现重点博主,得到重点博主的微博关系群体,和对一个事件的传播扩散途径进行检测。本优选实施例研究发现围绕着重点博主和传播路线采集下来的微博数据会比广泛采集的更有价值,更有利于研究。图2示出了根据本专利技术实施例的用于微博的舆情监控装置的示意图,包括:确定模块10,用于确定被监控微博的源博主;遍历模块20,用于从源博主出发深度优先遍历被监控微博的转发博主;获取模块30,用于获取转发博主的粉丝数及其关于被监控微博的转发次数;设置模块40,用于根据其粉丝数和转发次数设置转发博主的重要度。本装置降低了舆情分析的难度,提高了舆情分析准确率。优选地,确定模块通过被监控微博的转发路径上溯到源博主。优选地,遍历模块包括:查找模块,用于从当前的转发博主的微博空间中找到被监控微博;列表模块,用于获取被监控微博的转发列表;列表遍历模块,用于遍历转发列表上的所有转发博主。优选地,设置模块设置Weight= a *nFllower+β *nRetweet ;其中,weight本文档来自技高网...

【技术保护点】
一种用于微博的舆情监控方法,其特征在于,包括:确定被监控微博的源博主;从所述源博主出发深度优先遍历所述被监控微博的转发博主;获取所述转发博主的粉丝数及其关于所述被监控微博的转发次数;根据其所述粉丝数和所述转发次数设置所述转发博主的重要度。

【技术特征摘要】

【专利技术属性】
技术研发人员:宋毅强梁肖于晓明杨建武
申请(专利权)人:北大方正集团有限公司北京大学北京北大方正电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1