一种微博事件传播分析算法制造技术

技术编号:12476762 阅读:51 留言:0更新日期:2015-12-10 12:49
一种微博事件传播分析算法,所述算法步骤包括:1指定多个同类事件为一个事件组N;2抽取事件组中的单一事件M,获得该事件的原始微博信息;3通过M中的微博传播情况、博主权重获得M中关键传播作用的微博;4对M中的关键微博执行基于转发关系的传播分析,从而获得M事件中的事件传播情况的主要传播分支;5根据步骤3和4,获得M事件中关键微博节点、关键传播人、次级微博节点、主要传播过程;6重复步骤2至步骤5,直到N中的事件全部遍历结束;7对N中所有事件的关键微博节点、关键传播人、次级微博节点、次级传播人、主要传播过程的子集依据其具体事件的微博传播数量权重进行迭代;8获得特定事件的通用传播途径及传播过程。

【技术实现步骤摘要】

本专利技术涉及一种算法,具体来说涉及。
技术介绍
事件信息在微博中的传播,一直都是新型媒体传播中的重要研究课题,由于微博信息出现的实时性、现场性与传播的虚拟性、无地域限制等特征,目前,对微博中事件的传播进行分析,往往需要耗费比较大的人力以及比较长的时间。
技术实现思路
本专利技术所要解决的技术问题在于克服上述现有技术中存在的缺陷,而提供,基于单一微博事件传播分析的特定种类的微博传播情况分析。通过对单一事件中的微博进行传播分析,获得传播中的关键阶段和次级节点,从而形成传播节点子集,在此基础上,进行微博博主关系加权和多个事件传播节点子集迭代,从而获得特定事件的微博传播过程与路径。为实现上述目的,本专利技术提供,所述算法步骤包括:(I)指定多个同类事件为一个事件组N ;(2)抽取事件组中的单一事件M,并获得该事件的原始微博信息;(3)通过M中的微博传播情况、博主权重等因素,获得M中起到关键传播作用的微博;(4)对M中的关键微博执行基于转发关系的传播分析,从而获得在M事件中的事件传播情况的主要传播分支的细节因素;(5)根据步骤3和4,获得M事件中的关键微博节点、关键传播人、次级微博节点、次级传播人、主要传播过程等情况;(6)重复步骤2至步骤5,直到N中的事件全部遍历结束;(7)对N中的所有事件的关键微博节点、关键传播人、次级微博节点、次级传播人、主要传播过程的子集依据其具体事件的微博传播数量权重进行迭代;(8)获得特定事件的通用传播途径及传播过程。优选地,所述微博事件传播分析算法还包括:分析模块、监控模块及中央处理模块,其中,所述分析模块包括数据采集单元及数据处理单元,所述数据采集单元将目标数据采集汇总后输送给所述数据处理单元,数据处理单元根据预设的算法计算得出目标微博的传播影响面并将此数据输送给中央处理模块;中央处理模块接收到目标微博的传播影响面数据后将其与预设的阈值比较,并将比较结果输送给监控模块;若小于所述阈值,则所述监控模块无动作;若大于等于所述阈值,则所述监控模块在后台管理桌面告警,并将其设为热点博文。优选地,所述数据处理单元采用以下算法计算出目标微博的传播影响面:其中,X为目标微博传播影响面;k为非重复转发者的数量,fini为第i个转发者的粉丝数,I < i < k,Ei由下述计算公式得出:其中,R表示包含目标微博博主的非重复转发者的集合,fout(i, j)表示第i个转发者的第j个粉丝的关注人全集函数,I < j < m, m为粉丝抽样数。优选地,所述的管理系统,其特征在于,具体包括以下步骤:S1:数据采集单元统计包含目标微博博主的目标微博的转发者,过滤掉重复的转发者,得出非重复转发者集合R和总转发数k后将数据输送给数据分析单元;S2:所述数据分析单元获取k个转发者的粉丝数后求得finl+fin2+...+fink ;S3:再设定一个抽样数m,获取k个转发者的前m个粉丝的关注人集,得出fou(i,j) (I < j < m);S4:对步骤S3的结果求并集,得到S5:根据步骤 S1、S4 的结果,求得 F1+F2+...+Fk ;S6:根据步骤S2、S5的结果,求得目标微博传播影响面S7:将X与预设的阈值的比较,若X小于所述阈值,则所述监控模块无动作;若大于等于所述阈值,则所述监控模块在后台管理桌面告警,并将其设为热点博文。本专利技术提供了,基于单一微博事件传播分析的特定种类的微博传播情况分析。通过对单一事件中的微博进行传播分析,获得传播中的关键阶段和次级节点,从而形成传播节点子集,在此基础上,进行微博博主关系加权和多个事件传播节点子集迭代,从而获得特定事件的微博传播过程与路径。【具体实施方式】:下面对专利技术的实施例进一步详述。,所述算法步骤包括:(I)指定多个同类事件为一个事件组N ;(2)抽取事件组中的单一事件M,并获得该事件的原始微博信息;(3)通过M中的微博传播情况、博主权重等因素,获得M中起到关键传播作用的微博;(4)对M中的关键微博执行基于转发关系的传播分析,从而获得在M事件中的事件传播情况的主要传播分支的细节因素;(5)根据步骤3和4,获得M事件中的关键微博节点、关键传播人、次级微博节点、次级传播人、主要传播过程等情况;(6)重复步骤2至步骤5,直到N中的事件全部遍历结束;(7)对N中的所有事件的关键微博节点、关键传播人、次级微博节点、次级传播人、主要传播过程的子集依据其具体事件的微博传播数量权重进行迭代;(8)获得特定事件的通用传播途径及传播过程。所述微博事件传播分析算法还包括:分析模块、监控模块及中央处理模块,其中,所述分析模块包括数据采集单元及数据处理单元,所述数据采集单元将目标数据采集汇总后输送给所述数据处理单元,数据处理单元根据预设的算法计算得出目标微博的传播影响面并将此数据输送给中央处理模块;中央处理模块接收到目标微博的传播影响面数据后将其与预设的阈值比较,并将比较结果输送给监控模块;若小于所述阈值,则所述监控模块无动作;若大于等于所述阈值,则所述监控模块在后台管理桌面告警,并将其设为热点博文。所述数据处理单元采用以下算法计算出目标微博的传播影响面其中,X为目标微博传播影响面;k为非重复转发者的数量;fini为第i个转发者的粉丝数,I < i < k,Ei由下述计算公式得出:其中,R表示包含目标微博博主的非重复转发者的集合,fout(i, j)表示第i个转发者的第j个粉丝的关注人全集函数,I ^ j ^ m, m为粉丝抽样数。所述的管理系统,其特征在于,具体包括以下步骤:S1:数据采集单元统计包含目标微博博主的目标微博的转发者,过滤掉重复的转发者,得出非重复转发者集合R和总转发数k后将数据输送给数据分析单元;S2:所述数据分析单元获取k个转发者的粉丝数后求得finl+fin2+...+fink ;S3:再设定一个抽样数m,获取k个转发者的前m个粉丝的关注人集,得出fou(i,j) (I < j < m);S4:对步骤S3的结果求并集,得到S5:根据步骤 S1、S4 的结果,求得 F1+F2+...+Fk ;S6:根据步骤S2、S5的结果,求得目标微博传播影响面S7:将X与预设的阈值的比较,若X小于所述阈值,则所述监控模块无动作;若大于等于所述阈值,则所述监控模块在后台管理桌面告警,并将其设为热点博文。以上对本专利技术的实施例进行了详细说明,但所述内容仅为本专利技术的较佳实施例,不能被认为用于限定本专利技术的实施范围。凡依本专利技术申请范围所作的均等变化与改进等,均应仍归属于本专利技术的专利涵盖范围之内。【主权项】1.,所述算法步骤包括: (1)指定多个同类事件为一个事件组N; (2)抽取事件组中的单一事件M,并获得该事件的原始微博信息; (3)通过M中的微博传播情况、博主权重等因素,获得M中起到关键传播作用的微博; (4)对M中的关键微博执行基于转发关系的传播分析,从而获得在M事件中的事件传播情况的主要传播分支的细节因素; (5)根据步骤3和4,获得M事件中的关键微博节点、关键传播人、次级微博节点、次级传播人、主要传播过程等情况; (6)重复步骤2至步骤5,直到N中的事件全部遍历结束; (7)对N中的所有事件的关本文档来自技高网...

【技术保护点】
一种微博事件传播分析算法,所述算法步骤包括:(1)指定多个同类事件为一个事件组N;(2)抽取事件组中的单一事件M,并获得该事件的原始微博信息;(3)通过M中的微博传播情况、博主权重等因素,获得M中起到关键传播作用的微博;(4)对M中的关键微博执行基于转发关系的传播分析,从而获得在M事件中的事件传播情况的主要传播分支的细节因素;(5)根据步骤3和4,获得M事件中的关键微博节点、关键传播人、次级微博节点、次级传播人、主要传播过程等情况;(6)重复步骤2至步骤5,直到N中的事件全部遍历结束;(7)对N中的所有事件的关键微博节点、关键传播人、次级微博节点、次级传播人、主要传播过程的子集依据其具体事件的微博传播数量权重进行迭代;(8)获得特定事件的通用传播途径及传播过程。

【技术特征摘要】

【专利技术属性】
技术研发人员:吕永强
申请(专利权)人:广州市邦富软件有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1