一种基于随机游走的种子节点确定方法及系统技术方案

技术编号:24252346 阅读:79 留言:0更新日期:2020-05-22 23:59
本申请公开了一种基于随机游走的种子节点确定方法及系统,该方法包括:首先根据网络中的原始数据获取网络结构和节点近邻信息,其次根据这些信息确定种子节点的需求数量和随机游走参数,然后从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k个种子节点,最后利用k个种子节点组成种子节点集合。该系统包括:网络结构和节点近邻信息确定模块、参数确定模块、随机游走模块和种子节点结合获取模块。通过本申请,能够降低两个节点的网络范围重合的概率,有效提高对影响力最大节点判断的准确性。

A seed node determination method and system based on random walk

【技术实现步骤摘要】
一种基于随机游走的种子节点确定方法及系统
本申请涉及互联网和人工智能算法
,特别是涉及一种基于随机游走的种子节点确定方法及系统。
技术介绍
在互联网和人工智能算法领域,通常需要研究信息传播过程中的影响力传播,影响力传播主要包括三个方面:影响力传播模型、影响力传播学习和影响力传播优化。为提供这三个方面研究结果的准确性,通常需要确定种子节点,也就是确定影响力最大的节点或者影响力最大的节点的集合。目前,种子节点的确定方法通常是:利用随机游走的方法。游走者从某一个节点开始,按照概率游走至下一个节点,并不断重复该过程。具体地,首先确定随机游走的起始节点,然后从该起始节点开启游走过程,并在整个游走过程中实时记录拥有邻居节点较多的节点,直到游走达到预设的步数为止。然而目前种子节点的确定方法中,由于游走过程中起始节点是确定的,后续的游走过程都是以该起始节点开启,这种游走方式下,可能出现两个节点的网络范围相似的情况,从而导致在选择关键传播点时出现传播范围重叠的问题,进而导致对影响力最大节点的判断不够准确。
技术实现思路
本申请提供了一种基于随机游走的种子节点确定方法及系统,以解决现有技术中种子节点的确定方法中容易出现传播范围重叠,导致对影响力最大节点判断不够准确的问题。为了解决上述技术问题,本申请实施例公开了如下技术方案:一种基于随机游走的种子节点确定方法,所述方法应用于信息传播的网络中,所述方法包括:根据网络中的原始数据,获取网络结构及节点近邻信息;根据所述网络结构和节点近邻信息,确定种子节点的需求数量k和随机游走参数,所述随机游走参数包括:随机游走的步数t和在每个节点处随机游走的次数m,其中,m、t以及k均为自然数,k≥2;从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点;利用k个种子节点组成种子节点集合。可选地,所述同时从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点的方法,包括:同时从当前网络中的每个节点出发,第一次进行m次t步随机游走;记录任一节点随机游走的路径;针对每个节点,统计包含所述节点的所有路径的数量;确定包含路径数量最多的节点,定义为当前网络的第一种子节点;同时从当前网络中的每个节点出发,第二次进行m次t步随机游走;移除所有包含所述第一种子节点的路径;在移除所有包含所述第一种子节点的路径剩余路径中,确定包含路径数量最多的节点,定义为当前网络的第二种子节点;重新同时从当前网络中的每个节点出发,第三次进行m次t步随机游走,直到确定第k种子节点。可选地,所述同时从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点的方法,包括:同时从当前网络中的每个节点出发,第一次进行m次t步随机游走;记录任一节点随机游走的路径;针对每个节点,统计包含所述节点的所有路径的数量;确定包含路径数量最多的节点,定义为当前网络的第一种子节点;移除所有包含所述第一种子节点的路径;在移除所有包含所述第一种子节点的路径剩余路径中,确定包含路径数量最多的节点,定义为当前网络的第二种子节点;返回重新移除所有包含所述第二种子节点的路径,直到确定第k种子节点。可选地,所述节点包括:激活状态节点和未激活状态节点。可选地,所述随机游走参数根据网络类型确定。一种基于随机游走的种子节点确定系统,所述系统包括:网络结构和节点近邻信息确定模块,用于根据网络中的原始数据,获取网络结构及节点近邻信息;参数确定模块,用于根据所述网络结构和节点近邻信息,确定种子节点的需求数量k和随机游走参数,所述随机游走参数包括:随机游走的步数t和在每个节点处随机游走的次数m,其中,m、t以及k均为自然数,k≥2;随机游走模块,用于从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点;种子节点结合获取模块,用于利用k个种子节点组成种子节点集合。可选地,所述随机游走模块包括:游走单元,用于同时从当前网络中的每个节点出发,进行m次t步随机游走;路径记录单元,用于记录任一节点随机游走的路径;统计单元,用于针对每个节点,统计包含所述节点的所有路径的数量;第一种子节点确定单元,用于确定包含路径数量最多的节点,定义为当前网络的第一种子节点;所述游走单元,还用于同时从当前网络中的每个节点出发,第二次进行m次t步随机游走;移除单元,用于移除所有包含所述第一种子节点的路径;第二种子节点确定单元,用于在移除所有包含所述第一种子节点的路径剩余路径中,确定包含路径数量最多的节点,定义为当前网络的第二种子节点;第一循环单元,用于重新启动游走单元。可选地,所述随机游走模块包括:游走单元,用于同时从当前网络中的每个节点出发,第一次进行m次t步随机游走;路径记录单元,用于记录任一节点随机游走的路径;统计单元,用于针对每个节点,统计包含所述节点的所有路径的数量;第一种子节点确定单元,用于确定包含路径数量最多的节点,定义为当前网络的第一种子节点;移除单元,用于移除所有包含所述第一种子节点的路径;第二种子节点确定单元,用于在移除所有包含所述第一种子节点的路径剩余路径中,确定包含路径数量最多的节点,定义为当前网络的第二种子节点;第二循环单元,用于重新启动移除单元。可选地,所述节点包括:激活状态节点和未激活状态节点。。本申请的实施例提供的技术方案可以包括以下有益效果:本申请提供一种基于随机游走的种子节点确定方法,该方法首先根据网络中的原始数据获取网络结构和节点近邻信息,其次根据这些信息确定种子节点的需求数量和随机游走参数,然后从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k个种子节点,最后利用k个种子节点组成种子节点集合。本实施例确定种子节点的方法中,从当前网络中的每个节点出发进行随走游走,而不是固定某一个节点作为起始节点,因此,所采用的随机游走方法获取的种子节点路径更多,从而能够在更大范围内获取到影响力较大的种子节点,使得所确定的种子节点更加准确。而且,由于本实施例中从每个节点分别出发进行随机游走,产生两个节点的网络范围重合的概率大大降低,进而提高对影响力最大节点判断的准确性。另外,本实施例中从当前网络中确定第一种子节点之后,会移除所有包含第一种子节点的路径,再从当前网络的每个节点出发进行随机游走,确定下一个种子节点路径,由于确定一个种子节点后即删除该节点下的所有路径,因此,这种方法能够进一步降低两个节点的网络范围重合的概率,进而提高对影响力最大节点判断的准确性。本申请还提供一种基于随机游走的种子节点确定系统,该系统主要包括:网络结构和节点近邻信息确定模块、参数确定模块、随机游走模块和种子节点结合获取模本文档来自技高网...

【技术保护点】
1.一种基于随机游走的种子节点确定方法,其特征在于,所述方法应用于信息传播的网络中,所述方法包括:/n根据网络中的原始数据,获取网络结构及节点近邻信息;/n根据所述网络结构和节点近邻信息,确定种子节点的需求数量k和随机游走参数,所述随机游走参数包括:随机游走的步数t和在每个节点处随机游走的次数m,其中,m、t以及k均为自然数,k≥2;/n从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点;/n利用k个种子节点组成种子节点集合。/n

【技术特征摘要】
1.一种基于随机游走的种子节点确定方法,其特征在于,所述方法应用于信息传播的网络中,所述方法包括:
根据网络中的原始数据,获取网络结构及节点近邻信息;
根据所述网络结构和节点近邻信息,确定种子节点的需求数量k和随机游走参数,所述随机游走参数包括:随机游走的步数t和在每个节点处随机游走的次数m,其中,m、t以及k均为自然数,k≥2;
从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点;
利用k个种子节点组成种子节点集合。


2.根据权利要求1所述的一种基于随机游走的种子节点确定方法,其特征在于,所述同时从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点的方法,包括:
同时从当前网络中的每个节点出发,第一次进行m次t步随机游走;
记录任一节点随机游走的路径;
针对每个节点,统计包含所述节点的所有路径的数量;
确定包含路径数量最多的节点,定义为当前网络的第一种子节点;
同时从当前网络中的每个节点出发,第二次进行m次t步随机游走;
移除所有包含所述第一种子节点的路径;
在移除所有包含所述第一种子节点的路径剩余路径中,确定包含路径数量最多的节点,定义为当前网络的第二种子节点;
重新同时从当前网络中的每个节点出发,第三次进行m次t步随机游走,直到确定第k种子节点。


3.根据权利要求1所述的一种基于随机游走的种子节点确定方法,其特征在于,所述同时从当前网络中的每个节点出发进行随机游走,依次获取第一种子节点直到第k种子节点的方法,包括:
同时从当前网络中的每个节点出发,第一次进行m次t步随机游走;
记录任一节点随机游走的路径;
针对每个节点,统计包含所述节点的所有路径的数量;
确定包含路径数量最多的节点,定义为当前网络的第一种子节点;
移除所有包含所述第一种子节点的路径;
在移除所有包含所述第一种子节点的路径剩余路径中,确定包含路径数量最多的节点,定义为当前网络的第二种子节点;
返回重新移除所有包含所述第二种子节点的路径,直到确定第k种子节点。


4.根据权利要求1所述的一种基于随机游走的种子节点确定方法,其特征在于,所述节点包括:激活状态节点和未激活状态节点。


5.根据权利要求1-4中任一所述的一种基于随机游走的种子节点确定方法,其特征在于,所述随机游走参数...

【专利技术属性】
技术研发人员:张灿宿栋栋刘伟
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1