The invention provides a social network node mining method based on greedy subgraph. Firstly, based on the node degree of this important attributes based on aggregation coefficient of local topological structure to estimate the potential node influence, according to the impact of potential rank and join the seed node and the candidate set, through the overall evaluation of the sorting of network and choose the node specific threshold highest seed nodes join the candidate set. At the completion of a set of candidate selection, through the linear threshold model improved performance for the spread of corruption influence core strategy for the graph nodes in the set of real simulation, selection of incremental impact range of maximum node is added to the final node mining result set, and dynamic correction candidate at each step is completed the propagation in the collection node repeat, the candidate set modification process and simulate the transmission process until it reaches the expected size of the set of nodes mining results, finally obtained the ideal node mining effect.
【技术实现步骤摘要】
基于贪心子图的社会网络节点挖掘方法
本专利技术涉及的是一种社会网络节点挖掘方法。
技术介绍
社会网络中的节点挖掘方法主要分为启发类方法和贪心类方法。前者主要是根据社会网络节点自身属性或者网络自身拓扑结构来衡量网络中各个节点的重要程度,如度中心性算法,由于其计算节点的重要性时仅考虑节点的邻居拓扑结构,虽然其计算速度快,但是精确度欠佳;又如接近中心性算法和中介中心性算法,由于其计算时涉及到整个网络拓扑,所以其算法效率很低。而后者则是通过传播模型对于每一个节点进行传播模拟,进而通过其传播范围的大小来计算节点的重要程度,该类算法由于结合了传播模型进行真实传播,算法效率低下,导致了其不适用于大型社会网络。
技术实现思路
本专利技术的目的在于提供一种能够解决现有的社会网络影响力节点挖掘方法中启发类方法在节点挖掘效果上不理想及贪心类方法在算法复杂度上极高这两个问题的基于贪心子图的社会网络节点挖掘方法。本专利技术的目的是这样实现的:步骤一:输入社会网络图,根据邻居子图节点影响潜力算法得出每个节点的影响潜力,把节点按照其影响潜力递减的顺序排序,并选出个影响潜力最大的节点添加到候选集合C1中;步骤二:根据僵尸节点的定义,抽取社会网络图中符合条件的节点组成集合,并按照“僵尸节点”的本身特异性阈值从高到低排序,从排名中选取前个节点加入到候选集合C2中;步骤三:对于从候选集合C1中和候选集合C2中共抽取k个节点组成的集合C3,通过改进影响力的线性阈值模型表现为爬山贪婪算法进行传播激活尝试,初始时节点挖掘结果集S为空集,此时对集合C3中的每个节点进行传播模拟,选取激活范围最大的节点加入集 ...
【技术保护点】
一种基于贪心子图的社会网络节点挖掘方法,其特征是:步骤一:输入社会网络图,根据邻居子图节点影响潜力算法得出每个节点的影响潜力,把节点按照其影响潜力递减的顺序排序,并选出
【技术特征摘要】
1.一种基于贪心子图的社会网络节点挖掘方法,其特征是:步骤一:输入社会网络图,根据邻居子图节点影响潜力算法得出每个节点的影响潜力,把节点按照其影响潜力递减的顺序排序,并选出个影响潜力最大的节点添加到候选集合C1中;步骤二:根据僵尸节点的定义,抽取社会网络图中符合条件的节点组成集合,并按照“僵尸节点”的本身特异性阈值从高到低排序,从排名中选取前个节点加入到候选集合C2中;步骤三:对于从候选集合C1中和候选集合C2中共抽取k个节点组成的集合C3,通过改进影响力的线性阈值模型表现为爬山贪婪算法进行传播激活尝试,初始时节点挖掘结果集S为空集,此时对集合C3中的每个节点进行传播模拟,选取激活范围最大的节点加入集合S中,完成第一个节点的选择,同时对每一个被激活的节点进行标记,下一次传播时默认为已激活节点不进行计算,每一次计算之后,剔除该社会网络图中被激活节点,抽取子图进行下一次传播;步骤四:通过步骤三的传播后对集合C3以被标记为传播过程中的已激活节点的节点进行剔除,此时C3中节点个数变少,重复步骤1和步骤2的节点选取过程,再次选取k个节点填充集合C3;步骤五:重复步骤三的激活传播过程,直至节点挖掘结果集S达到规模k,结束。2.根据权利要求1所述的基于贪心子图的社会网络节点挖掘方法,其特征是节点的影响潜力的估计公式为:
【专利技术属性】
技术研发人员:王红滨,印桂生,王念滨,周连科,张载熙,冯梦园,侯莎,张玉鹏,刘红丽,兰方合,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:黑龙江,23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。