一种获取L个具有最佳传播影响力用户的方法和装置制造方法及图纸

技术编号:14620324 阅读:69 留言:0更新日期:2017-02-10 11:56
本发明专利技术公开了一种获取L个具有最佳传播影响力用户的方法和装置,用于同时获取到多个具有最佳传播影响力的用户,提高信息的传播效率。在本发明专利技术提供的方法中,从网络信息数据库中获取拓扑网络的结构数据,根据拓扑网络的结构数据将拓扑网络表示为无向图,按照预置的重复次数t对无向图进行t次的节点赋值处理,其中,每一次的节点赋值处理都包括:对无向图进行边渗流处理,以及边渗流处理之后进行的资源值分配处理,对无向图进行t次的节点赋值处理之后,将无向图中所有节点按照各个节点得到的总资源值从大到小排序,排序中的前L个节点所对应的用户作为需要获取的L个具有最佳传播影响力的用户。

【技术实现步骤摘要】

本专利技术涉及计算机
,具体涉及一种获取L个具有最佳传播影响力用户的方法和装置
技术介绍
社交网络的发展对人类生活有着极大影响,无论是交友,工作还是购物,人们已经习惯依赖社交网络来获取信息。具有高影响力的用户在社交网络中可以作为信息传播源头,促进社交网络上有效信息的传播。为了让信息在网络中传播得更快,范围更广,关键就在于寻找到最具有传播影响力的节点。由于网络中总用户数量巨大,网络结构复杂,网络中大部分节点的传播能力极为有限,寻找有高传播影响力的用户一直是一大挑战。并且,随着社交网络规模的进一步扩大,在网络中只寻找一个最有影响力的用户作为传播源时,传播的效率比较低下,此时就需要寻找多个用户同时作为信息源,即网络的多源传播问题。多个用户作为信息源进行传播时,他们的传播范围并不是单个节点传播的简单叠加,实证研究发现,一般情况下多个高影响力的用户的传播范围会有一定程度的重合,即多个高影响力用户的传播效果会小于这些用户分别单独传播的效果之和,如何精确选择一批传播过程中互不重叠的高影响力用户是一个热点问题。本专利技术主要用于在网络中寻找L个具有最佳传播影响力的用户。目前现有技术中寻找最佳传播影响力用户的方法有度中心性(DegreeCentrrality),介数中心性(BetweennessCentrality),接近中性(ClosenessCentrality)等方法。度中心性方法认为拥有最大度的节点同时也具有较大的传播影响力,即该方法认为与一个节点相关联的边的条数最大该节点就具有最佳传播影响力。介数中心性方法认为网络中所有节点对的最短路径中(一般情况下一对节点之间存在多条最短路径),经过一个节点的最短路径数越多,这个节点对信息传播的控制力就越大,这个节点的影响力就越巨大。接近中心性方法认为一个节点与网络中其他节点的平均距离越小,该节点的信息到达其他节点就越快,影响力也就越大。然而这些方法都是离散地计算某一个节点的影响力值,虽然能够用于区分将一个节点作为传播源头时,哪一个节点的传播更快、范围更广,但是如果是选取多个具有影响力的节点同时作为传播源头时,这些节点的传播范围很可能出现很多重合区域,从而整体传播效果不佳。本专利技术的专利技术人在实现本专利技术的过程中发现,上述寻找最佳传播影响力用户的方法仅能用于网络中寻找单一的最佳传播影响力用户,但是信息在网络中的传播不能仅仅依赖于一个节点,而是需要同时寻找一群具有最佳传播影响力的用户,而现有的上述方法无法适用于同时寻找多个具有最佳传播影响力的用户。
技术实现思路
本专利技术的目的在于提供一种获取L个具有最佳传播影响力用户的方法和装置,用于同时获取到多个具有最佳传播影响力的用户,提高信息的传播效率。为了达到上述目的,本专利技术采用这样的如下技术方案:一方面,本专利技术提供一种获取L个具有最佳传播影响力用户的方法,包括:从网络信息数据库中获取拓扑网络的结构数据,所述结构数据包括:用户集、所述用户集中不同用户之间的关联关系,所述用户集中包括至少N个用户,所述N为非零的自然数;根据所述拓扑网络的结构数据将所述拓扑网络表示为无向图,所述无向图包括:N个节点和所述N个节点之间连接两个节点的连边,所述无向图中包括的每一个节点唯一地对应于所述用户集的一个用户,所述无向图中存在关联关系的两个用户对应的节点之间用一条边相连;按照预置的重复次数t对所述无向图进行t次的节点赋值处理,其中,每一次的节点赋值处理都包括:对所述无向图进行边渗流处理,以及边渗流处理之后进行的资源值分配处理,其中,所述边渗流处理包括:对所述无向图中的每条连边以1-pc的概率进行删除、以pc的概率继续保留,删除连边完成后的无向图得到m个连通子图,所述pc为根据所述拓扑网络的结构数据预先确定的渗流阈值,所述m为非零的自然数,所述资源值分配处理包括:将所述m个连通子图按其包含的节点数目从大到小排列,将每个连通子图中的节点按度值降序排列,将L个单位的资源值依次分配给完成节点数目排列和度值排列后的m个连通子图内的节点,直至将所述L个单位的资源值分配完毕为止,其中在每一次的节点赋值处理过程中所述m个连通子图内的一个节点只能分配到一个单位的资源,所述L为预置的需要获取到具有最佳传播影响力的用户个数;对所述无向图进行t次的节点赋值处理之后,将所述无向图中所有节点按照各个节点得到的总资源值从大到小排序,排序中的前L个节点所对应的用户作为需要获取的L个具有最佳传播影响力的用户。另一方面,本专利技术提供一种获取L个具有最佳传播影响力用户的装置,包括:结构数据获取模块,用于从网络信息数据库中获取拓扑网络的结构数据,所述结构数据包括:用户集、所述用户集中不同用户之间的关联关系,所述用户集中包括至少N个用户,所述N为非零的自然数;无向图获取模块,用于根据所述拓扑网络的结构数据将所述拓扑网络表示为无向图,所述无向图包括:N个节点和所述N个节点之间连接两个节点的连边,所述无向图中包括的每一个节点唯一地对应于所述用户集的一个用户,所述无向图中存在关联关系的两个用户对应的节点之间用一条边相连;节点赋值模块,用于按照预置的重复次数t对所述无向图进行t次的节点赋值处理,其中,每一次的节点赋值处理都包括:对所述无向图进行边渗流处理,以及边渗流处理之后进行的资源值分配处理,其中,所述边渗流处理包括:对所述无向图中的每条连边以1-pc的概率进行删除、以pc的概率继续保留,删除连边完成后的无向图得到m个连通子图,所述pc为根据所述拓扑网络的结构数据预先确定的渗流阈值,所述资源值分配处理包括:将所述m个连通子图按其包含的节点数目从大到小排列,将每个连通子图中的节点按度值降序排列,将L个单位的资源值依次分配给完成节点数目排列和度值排列后的m个连通子图内的节点,直至将所述L个单位的资源值分配完毕为止,其中在每一次的节点赋值处理过程中所述m个连通子图内的一个节点只能分配到一个单位的资源,所述L为预置的需要获取到具有最佳传播影响力的用户个数;最佳传播影响力用户确定模块,用于对所述无向图进行t次的节点赋值处理之后,将所述无向图中所有节点按照各个节点得到的总资源值从大到小排序,排序中的前L个节点所对应的用户作为需要获取的L个具有最佳传播影响力的用户。采用上述技术方案后,本专利技术提供的技术方案将有如下优点:首先从网络信息数据库中获取拓扑网络的结构数据,然后根据拓扑网络的结构数据将拓扑网络表示为无向图,接下来按照预置的重复次数t对无向图进行t次的节点赋值处理,其中,每一次的节点赋值处理都包本文档来自技高网
...

【技术保护点】
一种获取L个具有最佳传播影响力用户的方法,其特征在于,包括:从网络信息数据库中获取拓扑网络的结构数据,所述结构数据包括:用户集、所述用户集中不同用户之间的关联关系,所述用户集中包括至少N个用户,所述N为非零的自然数;根据所述拓扑网络的结构数据将所述拓扑网络表示为无向图,所述无向图包括:N个节点和所述N个节点之间连接两个节点的连边,所述无向图中包括的每一个节点唯一地对应于所述用户集的一个用户,所述无向图中存在关联关系的两个用户对应的节点之间用一条边相连;按照预置的重复次数t对所述无向图进行t次的节点赋值处理,其中,每一次的节点赋值处理都包括:对所述无向图进行边渗流处理,以及边渗流处理之后进行的资源值分配处理,其中,所述边渗流处理包括:对所述无向图中的每条连边以1-pc的概率进行删除、以pc的概率继续保留,删除连边完成后的无向图会形成m个连通子图,所述pc为根据所述拓扑网络的结构数据预先确定的渗流阈值,所述m为非零的自然数,所述资源值分配处理包括:将所述m个连通子图按其包含的节点数目从大到小排列,将每个连通子图中的节点按度值降序排列,将L个单位的资源值依次分配给完成节点数目排列和度值排列后的m个连通子图内的节点,直至将所述L个单位的资源值分配完毕为止,其中在每一次的节点赋值处理过程中所述m个连通子图内的一个节点只能分配到一个单位的资源,所述L为预置的需要获取到具有最佳传播影响力的用户个数;对所述无向图进行t次的节点赋值处理之后,将所述无向图中所有节点按照各个节点得到的总资源值从大到小排序,排序中的前L个节点所对应的用户作为需要获取的L个具有最佳传播影响力的用户。...

【技术特征摘要】
1.一种获取L个具有最佳传播影响力用户的方法,其特征在于,包括:
从网络信息数据库中获取拓扑网络的结构数据,所述结构数据包括:用户集、所述用户
集中不同用户之间的关联关系,所述用户集中包括至少N个用户,所述N为非零的自然数;
根据所述拓扑网络的结构数据将所述拓扑网络表示为无向图,所述无向图包括:N个节
点和所述N个节点之间连接两个节点的连边,所述无向图中包括的每一个节点唯一地对应
于所述用户集的一个用户,所述无向图中存在关联关系的两个用户对应的节点之间用一条
边相连;
按照预置的重复次数t对所述无向图进行t次的节点赋值处理,其中,每一次的节点赋
值处理都包括:对所述无向图进行边渗流处理,以及边渗流处理之后进行的资源值分配处
理,其中,所述边渗流处理包括:对所述无向图中的每条连边以1-pc的概率进行删除、以pc的概率继续保留,删除连边完成后的无向图会形成m个连通子图,所述pc为根据所述拓扑网
络的结构数据预先确定的渗流阈值,所述m为非零的自然数,所述资源值分配处理包括:将
所述m个连通子图按其包含的节点数目从大到小排列,将每个连通子图中的节点按度值降
序排列,将L个单位的资源值依次分配给完成节点数目排列和度值排列后的m个连通子图内
的节点,直至将所述L个单位的资源值分配完毕为止,其中在每一次的节点赋值处理过程中
所述m个连通子图内的一个节点只能分配到一个单位的资源,所述L为预置的需要获取到具
有最佳传播影响力的用户个数;
对所述无向图进行t次的节点赋值处理之后,将所述无向图中所有节点按照各个节点
得到的总资源值从大到小排序,排序中的前L个节点所对应的用户作为需要获取的L个具有
最佳传播影响力的用户。
2.根据权利要求1所述的一种获取L个具有最佳传播影响力用户的方法,其特征在于,
所述将L个单位的资源值依次分配给完成节点数目排列和度值排列后的m个连通子图内的
节点,直至将所述L个单位的资源值分配完毕为止,包括:
判断所述L是否小于或等于所述m;
若L≤m,从所述m个连通子图中获取到包括节点个数最多的L个连通子图,将所述L个单
位的资源值分别分配给所述L个连通子图中的每个连通子图内度的取值最大的节点;
若L>m,设L=k×m+n,所述k为非零自然数,所述n为自然数,且所述n小于所述m,将k
×m个单位的资源值分别分配给所述m个连通子图中的每个连通子图内度的取值为前k个最
大的节点,从所述m个连通子图中获取到包括节点个数最多的n个连通子图,将n个单位的资
源值分别分配给所述n个连通子图中的每个连通子图内度的取值为第k+1个最大的节点。
3.根据权利要求1所述的一种获取L个具有最佳传播影响力用户的方法,其特征在于,
所述方法还包括:
在每完成一次的节点赋值处理之后,计算所述无向图中的每个节点得到的资源值,并
对所述无向图中的每个节点得到的总资源值进行累计。
4.根据权利要求1所述的一种获取L个具有最佳传播影响力用户的方法,其特征在于,
所述渗流阈值pc通过如下方式确定:
设概率值,对所述概率p设置多个不同的概率值,对于每一个概率p,都执行如下步骤a
和步骤b:
步骤a、对所述无向图中的每条连边以的概率删除、以p的概率继续保留,删除连边之后
的无向图得到一个连通子图集合,所述连通子图集合包含多个连通子图,每个连通子图包
括:多个节点及节点间的连边,计算所述连通子图集合中每个连通子图包含的节点数;
步骤b、多次执行步骤a,计算通过多次执行步骤a得到的多个连通子图集合中节点个数
为第二个最多的连通子图的平均节点数;
在对所述无向图按照不同的概率p执行的步骤a和步骤b之后,得到每一个概率p对应的
节点个数为第二个最多的连通子图的平均节点数,将所述平均节点数最多时对应的概率p
作为所述无向图的渗流阈值pc。
5.根据权利要求1所述的一种获取L个具有最佳传播影响力用户的方法,其特征在于,
所述重复次数t的取值根据所述无向图中包括的节点个数确定,若所述无向图中包括的节
点个数越多,所述t的取值越大,若所述无向图中包括的节点个数越少,所述t的取值越小。
6.一种获取L个具有最佳传播影响力用户的装置,其特征在于,包括:
结构数据获取模块,用于从网络...

【专利技术属性】
技术研发人员:吕琳媛胡延庆任晓龙苟尤钊纪圣塨
申请(专利权)人:杭州师范大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1