一种基于社区划分的社交网络多源谣言溯源方法及系统技术方案

技术编号:22534732 阅读:21 留言:0更新日期:2019-11-13 10:57
本发明专利技术涉及一种基于社区划分的社交网络多源谣言溯源方法及系统,属于社交网络分析技术领域,解决了现有技术溯源率较低、错误距离较大等问题。首先进行基于拓扑势的社区划分,得到有重合区域的多个社区,每个社区内的节点构成一个子网络,保存每个社区内节点的数量及名称;然后在每一子网络上运用单源谣言溯源方法,计算每一社区中的每个节点作为源节点的可能性;选择各社区中作为源节点可能性最大的节点,得到多源节点。实现了社交网络中感染部分多源节点的寻找,溯源率高,错误距离小。

A tracing method and system of social network multi-source rumor based on community Division

The invention relates to a social network multi-source rumor Traceability Method and system based on community division, belonging to the technical field of social network analysis, which solves the problems of low traceability rate, large error distance and the like in the prior art. Firstly, the community is divided based on the topological potential, and multiple communities with overlapping areas are obtained. Each node in each community forms a sub network, and the number and name of each node in each community are saved. Then, on each sub network, the single source rumor tracing method is used to calculate the possibility of each node in each community as the source node, and the possibility of each community as the source node is selected. The largest node, get multiple source nodes. It realizes the search of infected multi-source nodes in social networks, with high traceability rate and small error distance.

【技术实现步骤摘要】
一种基于社区划分的社交网络多源谣言溯源方法及系统
本专利技术涉及社交网络技术分析
,尤其涉及一种基于社区划分的社交网络多源谣言溯源方法及系统。
技术介绍
溯源是社交网络的一项重要研究内容,在寻找谣言传播源、推断传染病起源等方面有着非常重要的意义和作用。多源谣言溯源方法大致可以分为两类:基于聚类的方法和基于邻接矩阵的方法。基于聚类的方法出发点是为了将不同感染源感染区域分开,在感染区域内进行溯源,这样处理将多源降低为单源,大大降低了溯源难度,但目前这类方法假定各感染区域互不相交,很难区分位于不同感染区域重合部分的节点;另外,传统的单源溯源方法,假设感染网络中所有节点先验估计值相同,缺乏合理性。基于邻接矩阵的方法一般计算简单,复杂度较低,但需要知道源节点数量,在现实生活中很难实现;此类方法从整体出发寻找多个源节点,但忽略了各个源节点覆盖问题。综上所述,现有的多源谣言溯源方法存在以下不足:溯源率较低、错误距离较大。
技术实现思路
鉴于上述的分析,本专利技术实施例旨在提供一种基于社区划分的社交网络多源谣言溯源方法及系统,用以解决现有的多源谣言溯源方法存在的溯源率较低、错误距离较大等问题。本专利技术的目的主要是通过以下技术方案实现的:一种基于社区划分的社交网络多源谣言溯源方法,包括以下步骤:根据给定社交网络的感染部分进行基于拓扑势的社区划分,得到有重合区域的多个社区,每个社区内的节点构成一个子网络,保存每个社区内节点的数量及名称;根据社区划分后得到的每一个子网络的节点数量及名称,在每一子网络上运用单源谣言溯源方法,计算每一社区中的每个节点作为源节点的可能性;选择各社区中作为源节点可能性最大的节点,得到多源节点。在上述方案的基础上,本专利技术还做了如下改进:进一步,所述单源谣言溯源方法包括:计算子网络中每个节点作为源节点的先验估计值及后验估计值;基于所述先验估计值及后验估计值计算得到该子网络中的每个节点作为源节点的可能性。进一步,所述节点先验估计值的计算公式为:其中,P(v)为子网络中任意节点ν作为源节点的先验估计值;vni为节点ν邻居中被感染数量;vn为节点ν邻居数量;N代表子网络节点数量。进一步,所述节点后验估计值的计算公式为:其中,R(v)为子网络中任意节点v作为源的后验估计值;GI是子网络;u是GI的某个节点;Tuv代表GI中以节点u为源,向远离ν节点方向感染的节点数量;N代表子网络节点数量。进一步,所述计算子网络中的每个节点作为源节点的可能性计算公式为:np(v)=P(v)R(v)其中,v为该子网络中任意节点,np(v)是节点v为源节点的可能性;P(v)是v为源节点的先验估计值;R(v)是v为源节点的后验估计值。另一方面,本专利技术实施例提供了一种基于社区划分的社交网络多源谣言溯源系统,包括社区划分模块、源节点计算模块和源节点选择模块;所述社区划分模块,用于根据给定社交网络的感染部分进行基于拓扑势的社区划分,得到有重合区域的多个社区,每个社区内的节点构成一个子网络,保存每个社区内节点的数量及名称;所述源节点计算模块,用于根据社区划分后得到的每一个子网络的节点数量及名称,在每一子网络上运用单源谣言溯源方法,计算每一社区中的每个节点作为源节点的可能性;所述源节点选择模块,用于选择各社区中作为源节点可能性最大的节点,得到多源节点。进一步,所述源节点计算模块包括节点先验估计值计算模块、节点后验估计值计算模块和源节点计算子模块;所述节点先验估计值计算模块,用于计算子网络中每个节点作为源节点的先验估计值;所述节点后验估计值计算模块,用于计算子网络中每个节点作为源节点的后验估计值;所述源节点计算子模块,用于根据先验估计值及后验估计值计算得到该子网络中的每个节点作为源节点的可能性。进一步,所述节点先验估计值计算模块根据以下公式得到先验估计值:其中,P(v)为子网络中任意节点ν作为源节点的先验估计值;vni为节点ν邻居中被感染数量;vn为节点ν邻居数量;N代表子网络节点数量。进一步,所述节点后验估计值计算模块根据以下公式得到后验估计值:其中,R(ν)为子网络中任意节点v作为源的后验估计值;GI是子网络;u是GI的某个节点;Tuv代表GI中以节点u为源,向远离ν节点方向感染的节点数量;N代表子网络节点数量。进一步,所述源节点计算子模块根据以下公式计算子网络中的每个节点作为源节点的可能性:np(v)=P(v)R(v)其中,v为该子网络中任意节点,np(v)是节点v为源节点的可能性;P(v)是v为源节点的先验估计值;R(v)是v为源节点的后验估计值。与现有技术相比,本专利技术至少可实现如下有益效果之一:1、在计算源节点可能性时,不仅考虑了后验估计值,还考虑了先验估计值,在节点先验估计值的计算过程中既考虑了感染节点,又兼顾了未感染节点,溯源率高,错误距离小;2、在基于拓扑势的社区划分过程中,考虑了节点质量的差异性,利用了拓扑势场的拓扑结构,根据节点在拓扑势场中的位置进行社区发现,使得社区划分的结果更准确,效率更高;3、通过将多源溯源转化为单源溯源,溯源方法的复杂度降低,且不需要知道源节点的数量及其他先验条件,所受限制少;4、在社区划分过程中,考虑到社区重叠,解决了不同源节点感染区域重合问题,划分效果好,提高了系统的精确度。本专利技术中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。附图说明附图仅用于示出具体实施例的目的,而并不认为是对本专利技术的限制,在整个附图中,相同的参考符号表示相同的部件。图1为一个实施例中一种基于社区划分的社交网络多源谣言溯源方法流程示意图;图2为另一个实施例中一种基于社区划分的社交网络多源谣言溯源系统结构示意图;图3为另一个实施例中Wiki-Rate网络中源节点数量为2的错误距离示意图;图4为另一个实施例中Ca-Astroph网络中源节点数量为2的错误距离示意图。图5为另一个实施例中Hamstersterfull网络中源节点数量为2的错误距离示意图。图6为另一个实施例中Wiki-Rate网络中源节点数量为3的错误距离示意图。图7为另一个实施例中Ca-Astroph网络中源节点数量为3的错误距离示意图。图8为另一个实施例中Hamstersterfull网络中源节点数量为3的错误距离示意图。附图标记:200-基于拓扑势社区划分模块;210-拓扑势场建立子模块;211-节点质量获取单元;212-拓扑势值获取单元;220-搜索子模块;221-代表节点判断单元;222-峰位节点判断单元;223-比较单元;230-扩展子模块;240-归属确定子模块;241-谷位判断单元;242-斜坡位判断单元;243-边缘位判断单元;300-源节点计算模块;310-节点先验估计值计算子模块;320-节点后验估计值计算子模块;330-源节点计算子模块;400-源节点选择模块。具体实施方式下面结合附图来具体描述本专利技术的优选实施例,其中,附图构成本申请一部分,并与本专利技术的实施例一起用于阐释本专利技术的原理,并非用于限定本专利技术的范围。本专利技术的一个具体实施例,公开本文档来自技高网...

【技术保护点】
1.一种基于社区划分的社交网络多源谣言溯源方法,其特征在于,包括以下步骤:根据给定社交网络的感染部分进行基于拓扑势的社区划分,得到有重合区域的多个社区,每个社区内的节点构成一个子网络,保存每个社区内节点的数量及名称;根据社区划分后得到的每一个子网络的节点数量及名称,在每一子网络上运用单源谣言溯源方法,计算每一社区中的每个节点作为源节点的可能性;选择各社区中作为源节点可能性最大的节点,得到多源节点。

【技术特征摘要】
1.一种基于社区划分的社交网络多源谣言溯源方法,其特征在于,包括以下步骤:根据给定社交网络的感染部分进行基于拓扑势的社区划分,得到有重合区域的多个社区,每个社区内的节点构成一个子网络,保存每个社区内节点的数量及名称;根据社区划分后得到的每一个子网络的节点数量及名称,在每一子网络上运用单源谣言溯源方法,计算每一社区中的每个节点作为源节点的可能性;选择各社区中作为源节点可能性最大的节点,得到多源节点。2.根据权利要求1所述的基于社区划分的社交网络多源谣言溯源方法,其特征在于,所述单源谣言溯源方法包括:计算子网络中每个节点作为源节点的先验估计值及后验估计值;基于所述先验估计值及后验估计值计算得到该子网络中的每个节点作为源节点的可能性。3.根据权利要求2所述的基于社区划分的社交网络多源谣言溯源方法,其特征在于,所述节点先验估计值的计算公式为:其中,P(v)为子网络中任意节点ν作为源节点的先验估计值;vni为节点ν邻居中被感染数量;vn为节点ν邻居数量;N代表子网络节点数量。4.根据权利要求2所述的基于社区划分的社交网络多源谣言溯源方法,其特征在于,所述节点后验估计值的计算公式为:其中,R(ν)为子网络中任意节点v作为源的后验估计值;GI是子网络;u是GI的某个节点;Tuv代表GI中以节点u为源,向远离ν节点方向感染的节点数量;N代表子网络节点数量。5.根据权利要求2所述的基于社区划分的社交网络多源谣言溯源方法,其特征在于,所述计算子网络中的每个节点作为源节点的可能性计算公式为:np(v)=P(v)R(v)其中,v为该子网络中任意节点,np(v)是节点v为源节点的可能性;P(v)是v为源节点的先验估计值;R(v)是v为源节点的后验估计值。6.一种基于社区划分的社交网络多源谣言溯源系统,其特征在于,包括社区划分模块、源节点计算模块和源节点选择模块;所述社区划分模块,用于根据给定社交网络的感染部分进行基于拓扑势的...

【专利技术属性】
技术研发人员:王志晓杨小冬芮晓彬孙成成于欢
申请(专利权)人:中国矿业大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1