【技术实现步骤摘要】
一种节点与社区相结合的多级传播分析方法、分析系统
[0001]本专利技术属于网络数据多级传播分析
,尤其涉及一种节点与社区相结合的多级传播分析方法、分析系统。
技术介绍
[0002]多级传播即为n级传播,一般包括信息和影响的传播,指信息和影响经由大大小小的中介,抵达一般受众。当前的多级传播分析工具,一般是嵌入在舆情分析系统中,作为一个辅助性质的分析模块存在,而不是一个独立的舆情分析产品。
[0003]现有的多级传播分析工具主要集中于在复杂社交网络中根据节点性质(如度中心性、介数中心性、接近中心性)或基于随机游走的指标(如PageRank指标)发现关键影响节点,以及针对传播路径展开深度与广度层面的分析。多级传播网络构造方法多以用户为基础节点形成用户传播网络图。
[0004]通过上述分析,现有技术存在的问题及缺陷为:
[0005](1)现有多级传播分析工具的点面维度相对割裂,缺乏综合性的分析方法。比如关键影响节点识别,多级传播分析工具即使在全局传播网络视图下识别出了关键影响节点,也少有对关键影响节点 ...
【技术保护点】
【技术特征摘要】
1.一种节点与社区相结合的多级传播分析方法,其特征在于,该方法包括以下步骤:S1,多级传播网络构造:分别以用户和贴文为节点,转发、评论、回复关系为边,构造有向的用户多级传播连通图和有向的贴文多级传播连通图;S2,疑似异常图与异常节点识别:通过计算连通图量化指标,根据指标阈值,识别疑似异常图与异常节点;S3,去噪:基于步骤S2的结果,移除疑似异常图和异常节点,得到去噪后的用户多级传播连通图和贴文多级传播连通图;S4,连通图点边属性赋值:为节点赋予聚类系数、立场倾向、核心桥梁系数属性,为边赋予同向/异向边二元数值、立场强度差值属性;S5,紧密社群与核心桥梁节点识别:结合聚类系数、核心桥梁系数、社区算法,发现核心节点的影响集群和桥梁节点的沟通集群;S6,同立场传播集群与立场转变关键节点识别:根据节点立场倾向和对立节点集,发现同立场传播集群与立场转变关键节点;S7,煽动性节点与受影响集群识别:根据煽动性与跟风性系数、同/异向边属性,发现煽动性节点与受影响集群;S8,爆发集群与爆发节点识别:根据传播路径和传播子树的传播速度,发现爆发节点与爆发集群;S9,交叉分析:通过对比步骤S5、步骤S6、步骤S7、步骤S8所得到的关键节点和关联集群,发现相互重合的关键节点账号、以及上述关键节点账号的关联集群和作用途径。2.根据权利要求1所述的节点与社区相结合的多级传播分析方法,其特征在于,在步骤S1中,所述有向的用户多级传播连通图是以用户为节点,原发节点为原发用户,转发、评论、回复关系为边形成的;所述有向的贴文多级传播连通图是以贴文为节点,原发节点为原发贴文,转发、评论、回复关系为边形成的。3.根据权利要求1所述的节点与社区相结合的多级传播分析方法,其特征在于,在步骤S2中,所述通过计算连通图量化指标,根据指标阈值,识别疑似异常图与异常节点具体包括:对每个贴文多级传播连通图,计算平均每个账号发布贴文数量、每个账号单位时间内发布频率、原创转发之比指标;平均每个账号发布贴文数量=post_n/account_n,其中,account_n为账号数量,post_n为发布贴文总数量;每个账号单位时间内发布频率=post_n/t,其中,t为观察周期;原创转发之比=original_n/retweet_n,其中,original_n为原创数量,retweet_n为转发数量;对每个指标赋予初始权重,之后计算综合指标,根据初始阈值,识别出疑似异常图和其中节点,再通过事后验证的方式调整权重和阈值。4.根据权利要求1所述的节点与社区相结合的多级传播分析方法,其特征在于,在步骤S4中,所述为节点赋予聚类系数、立场倾向、核心桥梁系数属性,为边赋予同向/异向边二元数值、立场强度差值属性具体包括:
对用户多级传播连通图,为图中节点赋予聚类系数;对贴文多级传播连通图,为图中节点赋予立场倾向、核心桥梁系数,为图中边赋予同向/异向边二元数值、边关联节点的立场强度差值,计算方式如下:对于任一两个节点n
i
、n
j
,以及它们之间边e
ij
,node
i
的立场为S
i
,node
i
的立场为S
j
,若节点S
i
、节点S
j
同为正或同为负,则e
ij
为同向边,赋值为1,否则e
ij
为异向边,赋值为0;节点n
i
与节点n
j
的立场强度差值diffS
ij
=|S
i
‑
S
j
|。5.根据权利要求1所述的节点与社区相结合的多级传播分析方法,其特征在于,在步骤S5中,所述紧密社群与核心桥梁节点识别...
【专利技术属性】
技术研发人员:黄音莅,沈宜,贾宇,冯碧怡,杨凤,
申请(专利权)人:深圳市网联安瑞网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。