一种微博传播影响面的管理系统及方法技术方案

技术编号:8453320 阅读:184 留言:0更新日期:2013-03-21 18:26
本发明专利技术公开了一种微博传播影响面的管理系统及方法,其管理系统包括分析模块、监控模块及中央处理模块。分析模块包括数据采集单元及数据处理单元,数据采集单元将目标数据采集汇总后输送给数据处理单元,数据处理单元对单个转发者i的粉丝数求和后对第i个转发者的第j个粉丝的关注人进行全集函数分析,再进行粉丝抽样,在基于概率和统计学原理的基础上结合抽样方式,计算出目标微博传播影响面数据,再将此数据输送给中央处理模块;中央处理模块接收到数据后将其与预设的阈值比较,并将比较结果输送给监控模块;若小于阈值,则监控模块无动作;若大于等于阈值,则监控模块在后台管理桌面告警,并将其设为热点博文。本发明专利技术统计结果精确率高,且无须去重。

【技术实现步骤摘要】

本专利技术涉及一种舆情监控数据系统,特别涉及。
技术介绍
随着W eb2. O技术及相关互联网应用的不断普及,微博等新媒体已经成为网络舆情的重要舆论场。微博具有用户基数大、传播速度快、信息上载方便等特点,已经成为我国舆情爆发的主要策源地和传播媒介,如病毒般蔓延至互联网、企业、个人生活的每个角落。如何针对微博所具有的海量非结构化文本数据、大用户数和实时性强的特点,研究有效的微博舆情监管软件平台,成了当务之急。在微博社区内,如果博主B关注A,称B是A的粉丝,A所发每一篇微博都会出现B的主页,即能影响到B。如果C是B的粉丝,而B又转发了 A的微博,则A的这篇微博也能影响到C。每篇微博能影响到的总人数我们称之为“微博传播影响面”。普通的微博传播影响面计算公式为X = f In^fin2+. . . +f inn其中X为目标微博传播影响面,fin, (I < i < η)为第i个转发者的粉丝数,目标微博博主也计为转发者之一。上述算法存在两个问题1.同一博主多次转发导致转发者重复计算2.不同博主拥有相同粉丝导致粉丝数重复计算第一个问题较易解决,只需对转发者进行去重即可。但第二个问题基本无解。首先因为很多微博达人的粉丝动辄上百万、千万,去重工作消耗极大;其次各微博平台只提供最多5000粉丝信息查询接口,从而使得去重工作无法彻底实施。
技术实现思路
针对现有技术存在的问题,本专利技术旨在基于概率和统计学原理,结合抽样方式,提供一种无须人工去重的用于舆情监控系统的微博传播影响面的统计方法。本专利技术第一方面提供一种微博传播影响面的管理系统,包括分析模块、监控模块及中央处理模块。所述分析模块包括数据采集单元及数据处理单元,所述数据采集单元将目标数据采集汇总后输送给所述数据处理单元,数据处理单元根据预设的算法计算得出目标微博的传播影响面并将此数据输送给中央处理模块;中央处理模块接收到目标微博的传播影响面数据后将其与预设的阈值比较,并将比较结果输送给监控模块;若小于所述阈值,则所述监控模块无动作;若大于等于所述阈值,则所述监控模块在后台管理桌面告警,并将其设为热点博文。进一步地,所述数据处理单元采用以下算法计算出目标微博的传播影响面手= ··..+产其中,X为目标微博传播影响面;k为非重复转发者的数量;fini为第i个转发者的粉丝数,I < i < k,Fi由下述计算公式得出权利要求1.一种微博传播影响面的管理系统,其特征在于,包括分析模块、监控模块及中央处理模块,其中, 所述分析模块包括数据采集单元及数据处理单元,所述数据采集单元将目标数据采集汇总后输送给所述数据处理单元,数据处理单元根据预设的算法计算得出目标微博的传播影响面并将此数据输送给中央处理模块; 中央处理模块接收到目标微博的传播影响面数据后将其与预设的阈值比较,并将比较结果输送给监控模块; 若小于所述阈值,则所述监控模块无动作;若大于等于所述阈值,则所述监控模块在后台管理桌面告警,并将其设为热点博文。2.根据权利要求I所述的微博传播影响面的管理系统,其特征在于,所述数据处理单元采用以下算法计算出目标微博的传播影响面3.一种微博传播影响面的管理方法,包括如权利要求I及权利要求2所述的管理系统,其特征在于,具体包括以下步骤 Si:数据采集单元统计包含目标微博博主的目标微博的转发者,过滤掉重复的转发者,得出非重复转发者集合R和总转发数k后将数据输送给数据分析单元; .52:所述数据分析单元获取k个转发者的粉丝数后求得HnJfin2+. . . +fink ; .53:再设定一个抽样数m,获取k个转发者的前m个粉丝的关注人集,得出fou (i, j)(I < j < m); . 54:对步骤S3的结果求并集,得到U全文摘要本专利技术公开了,其管理系统包括分析模块、监控模块及中央处理模块。分析模块包括数据采集单元及数据处理单元,数据采集单元将目标数据采集汇总后输送给数据处理单元,数据处理单元对单个转发者i的粉丝数求和后对第i个转发者的第j个粉丝的关注人进行全集函数分析,再进行粉丝抽样,在基于概率和统计学原理的基础上结合抽样方式,计算出目标微博传播影响面数据,再将此数据输送给中央处理模块;中央处理模块接收到数据后将其与预设的阈值比较,并将比较结果输送给监控模块;若小于阈值,则监控模块无动作;若大于等于阈值,则监控模块在后台管理桌面告警,并将其设为热点博文。本专利技术统计结果精确率高,且无须去重。文档编号G06Q10/00GK102982381SQ20121051655公开日2013年3月20日 申请日期2012年12月6日 优先权日2012年12月6日专利技术者黄三伟, 陈海文, 彭坤, 曾锐, 阙学文 申请人:湖南蚁坊软件有限公司本文档来自技高网...

【技术保护点】
一种微博传播影响面的管理系统,其特征在于,包括分析模块、监控模块及中央处理模块,其中,所述分析模块包括数据采集单元及数据处理单元,所述数据采集单元将目标数据采集汇总后输送给所述数据处理单元,数据处理单元根据预设的算法计算得出目标微博的传播影响面并将此数据输送给中央处理模块;中央处理模块接收到目标微博的传播影响面数据后将其与预设的阈值比较,并将比较结果输送给监控模块;若小于所述阈值,则所述监控模块无动作;若大于等于所述阈值,则所述监控模块在后台管理桌面告警,并将其设为热点博文。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄三伟陈海文彭坤曾锐阙学文
申请(专利权)人:湖南蚁坊软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1