一种基于多样性的动态影响力传播种子最小化方法技术

技术编号：36525096 阅读：16 留言：0更新日期：2023-02-01 16:03

本发明专利技术公开了一种基于多样性的动态影响力传播种子最小化方法，基于一个双向自适应贪婪算法的框架，采用基于鞅的影响力最大化算法(IMM)和基于鞅的多样性影响力最大化算法(DIMM)实现，算法核心是使用一种随机产生反向影响草图(RI

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多样性的动态影响力传播种子最小化方法

[0001]本专利技术涉及信息传播领域，尤其涉及一种基于多样性的动态影响力传播种子最小化方法，该方法立足于多轮信息传播的环境，分析在此情况下信息在社交网络中的传播特性以及影响力的子模与超模特性，最终解决实际场景中的成本与时间最小化问题，解决如何以最小的成本在最少时间内使得影响力传播达到特定阈值的问题。
[0002]本专利技术主要适用于金融风控、市场营销、欺诈检测等领域。

技术介绍

[0003]随着社交网络应用微信、钉钉等的不断流行，信息在社交网络上的流通变得更加频繁与便捷，这使得信息的流通成为越来越重要的资源。在社交网络中，每个人蕴含的价值已经远远超过了其本身，还包含了其向周围人群的信息扩散能力。病毒营销由此成为至关重要的产品营销以及理念推广手段，病毒营销假设如果部分特殊的用户接收了相关的信息，则可以很大概率认为整个网络中的大部分用户也会接收到这样的信息。也就是说，病毒式营销的选择的初始目标是一组通过口碑效应对其社交网络影响较大的个人，而目的是利用其在社交网络上的巨大影响力使营销信息扩散到更大的人群之中。在病毒营销活动中，种子用户的选择是和成本直接挂钩的，因此在成本敏感的情况下，目的是尽可能最小化种子集合数量以及尽可能最大化影响力传播。更具体地说，当种子集合选择出后，需要对每个种子进行专门地处理，比如在病毒营销中对选中的用户进行付费推广，因此，更小的种子集合，所带来的成本降低是显著的。
[0004]对于大多数模型来说，影响力最大化问题的最优解都是NP/>‑
hard的。常用的启发式方法能识别社交网络中有影响力的节点，包括选择度数较高的个体，即所谓的度中心性启发式，或选择与网络其他部分平均距离较短的个体，即所谓的距离中心性启发式。但通常，这些启发式算法不能提供有效性的保证。除此之外，部分算法基于单调性和子模性，使用贪心算法为影响力最大化算法提供了近似比为(1
‑
1/e)的近似最优解，其中e为欧拉数，此外在具体的计算过程中，需要采用Martingales来计算影响力扩散度的近似解。但是，目前常用的相关技术主要存在着以下不足：
[0005]1)不能有效考虑到种子多样化问题，即种子在多个社区上影响力扩散的加权求和情况，因此不能考虑最终激活的节点在所有可能实现的社区中的分布。
[0006]2)实际应用策略往往仅基于模型选择，缺乏递归选择
‑
观察
‑
选择过程，即没有采取更有效的动态策略。

技术实现思路

[0007]本专利技术目的在于针对现有技术的不足，提出了一种基于多样性的动态影响力传播种子最小化方法，在考虑多轮信息传播环境的基础上，探索与理解整个信息传播的过程，包括其起源、级联、终止，分析传播随时间轮次不同的演化进程，进而设计了更加合理高效的方法，以最大化的减少达成特定影响力覆盖所需的成本与时间。在种子集合最小化算法的
基础上，考虑多轮传播和社区对影响力传播的影响，保证影响力传播的多样性和动态性。
[0008]本专利技术的目的是通过以下技术方案来实现的：一种基于多样性的动态影响力传播种子最小化方法，该方法包括以下步骤：
[0009](1)获取包括节点集V和有向边集E的社交网络G，其中社交网络G表示为一个机构，节点集V表示机构中员工的集合，有向边集E为员工间电子邮件的发送关系，即如果员工i向员工j发送了至少一封电子邮件，则社交网络G中存在一条边(i，j)，员工隶属的机构部门定义为节点所属的社区；具体影响力传播过程为：给定节点集假设在t0时刻所有S内节点均被激活，并且如果在t
i
时刻激活了节点u，则u会在t
i+1
时刻以概率p
uv
激活其所有邻居，用V
i
表示第i
‑
1轮之后依然未被激活的节点子集，G
i
是由V
i
连接的子图，将G
i
称为第i剩余图，S
i
是第i轮策略选择为种子的节点集，表示第i轮中所有可能实现的集合；
[0010](2)通过基于鞅的影响力最大化算法选择近似最大化函数的边际增益期望节点；依据社交网络G的各边活动概率随机生成G
i
剩余图的一个实例g，g是从中随机抽取的实例，表示影响力传播样本空间的集合，随机均匀地选择一组m
c
个节点集合u，在g上执行反向深度优先搜索，该搜索从U中的节点为起始节点并遍历节点的每条输入边，将反向DFS期间的所有节点插入g
U
，生成一组随机的反向影响草图RI
‑
sketch，基于错误阈值迭代的寻找近似最大化函数的边际增益期望节点，每次迭代时反向影响草图RI
‑
sketch大小加倍；
[0011](3)通过基于鞅的多样性影响力最大化算法选择近似最大化函数的多样性增益期望节点；采用步骤(2)同样的方式生成一组随机的反向影响草图RI
‑
sketch，基于错误阈值迭代的寻找近似最大化函数的多样性增益期望节点，每次迭代时反向影响草图RI
‑
sketch大小加倍；
[0012](4)基于边际增益期望节点和多样性增益期望节点，计算期望边际影响力以及多样性的增益，通过双自适应贪心算法求解自适应多样性种子最小化问题，得到最小种子集。
[0013]进一步地，影响力函数σ(S)如下：
[0014][0015]其中表示期望，Pr(g)是实例g发生的概率，Ig(S)表示在g实例上影响力传播结束时的活跃节点数量。
[0016]进一步地，多样性函数D(S)如下：
[0017][0018]其中d为加权函数，表示图的社区划分，同时满足条件其中n
i
表示社区C
i
中的节点数，假定每个节点只属于一个社区。
[0019]进一步地，自适应多样性种子最小化问题目标是找到策略π能最小化满足影响覆盖条件和多样性覆盖条件所需的最小种子集S，即使得σ(S)≥η
σ
且D(S)≥
η
D
，其中η
σ
，η
D
∈[0，1]，分别表示影响力覆盖阈值和多样性覆盖阈值，|S(π，g)|表示策略π能选择出的种子节点数量。
[0020]进一步地，所述双自适应贪心算法迭代的进行如下过程：
[0021]1)选择能最大化函数边际增益期望的节点；
[0022]2)监视新受影响的节点；
[0023]3)更新相应的种子集信息；
[0024]4)当两个覆盖条件都被满足时，迭代停止。
[0025]本专利技术的有益效果：本专利技术可以最大化的减少达成特定影响力覆盖所需的成本与时间，考虑了多轮传播和社区对影响力传播的影响，保证影响力传播的多样性和动态性。
附图说明
[0026]图1为本专利技术方法流程图；
[0027]图2为本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多样性的动态影响力传播种子最小化方法，其特征在于，该方法包括以下步骤：(1)获取包括节点集V和有向边集E的社交网络G，其中社交网络G表示为一个机构，节点集V表示机构中员工的集合，有向边集E为员工间电子邮件的发送关系，即如果员工i向员工j发送了至少一封电子邮件，则社交网络G中存在一条边(i,j)，员工隶属的机构部门定义为节点所属的社区；具体影响力传播过程为：给定节点集假设在t0时刻所有S内节点均被激活，并且如果在t
i
时刻激活了节点u，则u会在t
i+1
时刻以概率p
uv
激活其所有邻居，用V
i
表示第i
‑
1轮之后依然未被激活的节点子集，G
i
是由V
i
连接的子图，将G
i
称为第i剩余图，S
i
是第i轮策略选择为种子的节点集，表示第i轮中所有可能实现的集合；(2)通过基于鞅的影响力最大化算法选择近似最大化函数的边际增益期望节点；依据机构员工构成的社交网络G的各边活动概率随机生成G
i
剩余图的一个实例g，g是从中随机抽取的实例，表示影响力传播样本空间的集合，随机均匀地选择一组包含m
c
个员工的节点集合U，在g上执行反向深度优先搜索，该搜索从U中的节点为起始节点并遍历节点的每条输入边，将反向DFS期间的所有节点插入g
U
，生成一组随机的反向影响草图RI
‑
sketch，基于根据经验选定的错误阈值迭代的寻找近似最大化函数的边际增益期望节点，每次迭代时反向影响草图RI
‑
sketch大小加倍；(3)通过基于鞅的多样性影响力最大化算法选择近似最大化函数的多样性增益期望节...

【专利技术属性】
技术研发人员：王霄阳，史麒豪，王新宇，王灿，罗进开，冯雁，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人