一种基于差分预解集的网络信息扩散源头推断方法技术

技术编号：22242486 阅读：52 留言：0更新日期：2019-10-09 21:55

本发明专利技术提供一种基于差分预解集的网络信息扩散源头推断方法，属于信息技术处理领域，用G＝(V，E)表示网络节点之间的连接关系，其中V表示网络节点集，E表示网络边集，从中选取差分预解集S，建立扩散源特征，收集级联信息，判断指标集合的模|Ic|的大小，如果大于预设值，则提取级联C的特征向量，对每个节点v∈V的扩散源特征进行调整，对所有的节点v∈V逐一计算范数，找到范数最小的那个节点推断为源头。本方法能够主动地对数据来源进行优化选取，提高输入数据的质量，大幅提升源头推断的精度。

An Inference Method of Network Information Diffusion Source Based on Differential Precomposition Set

全部详细技术资料下载

【技术实现步骤摘要】
一种基于差分预解集的网络信息扩散源头推断方法
本专利技术涉及信息技术处理领域，具体涉及一种基于差分预解集的网络信息扩散源头推断方法。
技术介绍
复杂网络的一个重要特点是信息可以进行级联传播，实现信息的快速、爆炸式扩散。网络信息扩散源头推断(以下简称为“源头推断”)旨在根据已观测到的部分扩散级联信息(如参与该信息扩散的部分节点信息及其参与时间等等)，推测出扩散的初始节点，即找出扩散最初是由谁发起的。该技术可广泛应用于舆情对抗、隐患排除等方面，如社交网络上的谣言散布者发现、计算机网络中的木马扩散源头检测、人群之间传染病的传播源头推断等等。现有的源头推断方法通常是在一定的随机动力模型假设下进行的。这里最为广泛采用的模型为SI模型、SIS模型和SIR模型[1]，其中S代表susceptible易感状态，I代表infected被感染状态，R代表recovered免疫状态。代表性源头推断方法如下：·基于中心性度量的启发式算法[2]。这类方法选取具有较高中心性度量的节点作为源头节点。这里最有代表性的中心性度量为紧密度中心性，其直观想法是一个节点到所有感染节点的距离之和越小，那么这个节点越有可能是扩散源头。这类方法都是启发式的，而且并不考虑节点的参与扩散的时间等信息。·基于最大似然的优化方法[3]。该方法将源点推断问题定义为寻找使得观测到的部分扩散级联发生的可能性最大的那个节点，并将该节点视为源头节点。该方法利用的是极大似然的基本思想，为源头推断问题提供了一个基准的优化框架。方法[3]利用指数分布的无记忆性与树结构的无环性，将上述优化问题转化为生成路径的计数问题。此外，蒙...

【技术保护点】
1.一种基于差分预解集的网络信息扩散源头推断方法，包括以下步骤：用G＝(V，E)表示网络节点之间的连接关系，其中V表示网络节点集，E表示网络边集；从G中选取一个子集作为差分预解集S，该S：＝{s1，...，sK}为G中入度最高的前K个节点；根据差分预解集S估计每个节点v∈V到S中所有节点的扩散时间t(v，sk)，其中k＝1，2，...K，根据该扩散时间建立扩散源特征

【技术特征摘要】
1.一种基于差分预解集的网络信息扩散源头推断方法，包括以下步骤：用G＝(V，E)表示网络节点之间的连接关系，其中V表示网络节点集，E表示网络边集；从G中选取一个子集作为差分预解集S，该S：＝{s1，...，sK}为G中入度最高的前K个节点；根据差分预解集S估计每个节点v∈V到S中所有节点的扩散时间t(v，sk)，其中k＝1，2，...K，根据该扩散时间建立扩散源特征对于一阶级联每个数据Cl∈C表示为ul为Cl的发起节点，为Cl的发起时间，vl为ul的一阶子节点，表示节点vl参与到Cl的时间，表示节点vl没有参与级联Cl或者参与了但没有被观测到；通过差分预解集S来收集级联信息其中表示节点sk参与到级联C的时间，表示节点sk没有参与级联C；判断指标集合的模|Ic|的大小，如果大于预设值，则提取级联C的特征向量其中1≤k1＜k2＜…＜kl≤K；根据指标集合Ic的信息对每个节点v∈V的扩散源特征进行调整，调整后的扩散源特征对所有的节点v∈V逐一计算范数||h′(v)-h((C)||2，找到范数最小的那个节点推断为源头。2.如权利要求1所述的方法，其特征在于，利用扩散模型估计节点v到S中所有节点的扩散时间t(v，sk)，该扩散模型为：信息沿E中每条有向边e＝(...

【专利技术属性】
技术研发人员：周川，胡玥，谭建龙，郭莉，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人