当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于社区检索的影响力社区搜索方法和系统技术方案

技术编号:21952644 阅读:16 留言:0更新日期:2019-08-24 17:47
本发明专利技术公开了一种基于社区检索的影响力社区搜索方法,通过启发式方法设置权重的初始阈值对网络进行筛选生成子图从而减小其规模达到减少计算成本的目的;在子图的基础上通过生成树判断关键节点的连通性,从而统计社区数量;对于不满足查询条件的阈值,对其进行增量迭代直至其满足查询条件;最后根据查询条件渐进的输出影响力最大社区,避免了重复的枚举社区数目。本发明专利技术弥补了现有社区检索技术方面的不足,但保留了其优势,使得社区检索技术变得完美:第一,通过渐进的输出结果有效地减少了重复计算,节省了计算成本;第二,充分考虑了相同权重节点对社区检索的影响,在不影响其检索性能的同时打破了权重的限制条件,扩大了其使用范围。

An Influential Community Search Method and System Based on Community Retrieval

【技术实现步骤摘要】
一种基于社区检索的影响力社区搜索方法和系统
本专利技术属于社交网络
,更具体地,涉及一种基于社区检索的影响力社区搜索方法和系统。
技术介绍
在当今的社交网络中,常常需要使用社区搜索从社交网络的海量数据中搜索具有影响力的社区,通过影响力社区搜索的过程,能够发现社交网络中具有重要影响力的核心节点和核心社区,用于企业商业营销、广告定向投放、言论渠道推荐、舆情监控等诸多领域。目前主流的影响力社区搜索方法有两种,第一种是基于索引的影响力社区搜索方法,其通过基于深度优先搜索方法预先计算所有的k-影响力社区,并将所有的社区组织成树形的索引结构,最终对索引进行查询得到输出结果;但是,这种方法也存在一些问题:首先,虽然该方法的搜索效率较高,但该方法是将所有社区都一一计算出来之后再查找前r个社区,从而浪费了部分计算资源;其次,维护索引需要一定的空间资源,从而导致该方法并不适合较大规模的社交网络;第二种是渐进式影响力社区优化方法,其根据网络中节点的权值大小对网络进行筛选,通过对得到的子图进行计算并根据查询条件渐进地输出结果,并通过筛选减小网络的规模,从而提高其搜索效率;但这种方法的缺陷在于,其正常工作的约束条件是网络中每个节点的影响力都是不相等的,而现实世界中节点影响力相等的情况是不可避免的,因此,这一约束条件限制了该方法的应用。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于社区检索的影响力社区搜索方法和系统,其目的在于,解决现有基于索引的社区搜索方法中存在的浪费计算资源、并不适合大规模社交网络的技术问题,以及现有渐进式影响力社区优化方法中由于存在约束条件所导致的应用性差的技术问题。为实现上述目的,按照本专利技术的一个方面,提供了一种基于社区检索的影响力社区搜索方法,包括以下步骤:(1)获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;(2)从步骤(1)获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;(3)根据步骤(2)的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于步骤(2)的排列结果中排在第(k+r)位的影响力值;(4)针对步骤(3)更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;(5)针对步骤(4)中更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和步骤(3)更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有候选节点构成该关键节点对应的候选节点集合;(6)获取步骤(5)中得到的关键节点集合以及该关键节点集合中关键节点的数量m,判断步骤(5)获取的更新后的关键节点集合中关键节点的数量m是否大于或等于需要搜索的社区数量r,如果是则进入步骤(8),否则进入步骤(7);(7)将阈值t的值更新为其当前值的2/3,并返回步骤(3);(8)对步骤(5)更新后的关键节点集合中所有关键节点对应的候选节点集合进行处理,从而得到步骤(1)中社交网络拓扑图中的前r个影响力社区,过程结束。优选地,步骤(2)步骤中第i个节点Pi的影响力值PageRank(Pi)是采用以下公式获得:其中,N表示社交网络拓扑图中节点的总数,d表示阻尼系数,其取值为0.85,M(Pi)表示第i个节点pi的所有邻居节点的集合,L(Pj)表示第i个节点Pj的邻居个数。优选地,步骤(4)包括以下子步骤:(4-1)根据步骤(3)更新后的社交网络拓扑图中各个节点的影响力值,获取最小影响力值对应的节点作为关键节点;(4-2)针对步骤(4-1)中得到的关键节点,判断其数量是否为1,若为1,则过程结束,否则根据步骤(3)更新后的社交网络拓扑图判断这些节点之间的连通性,将彼此连通的节点合并为一个节点,从而完成对关键节点的更新;优选地,步骤(5)包括以下子步骤:(5-1)获取步骤(4)更新后的关键节点,并将其放入关键节点集合;(5-2)在步骤(3)更新后的社交网络拓扑图中将该关键节点以及和它相连的边删除,从而得到二次更新后的社交网络拓扑图;(5-3)从二次更新后的社交网络拓扑图中选择节点,获取其邻居个数,并判断其邻居的数量是否小于k,如果是则进入步骤(5-4),否则转入步骤(5-5);(5-4)将该节点放入关键节点对应的候选节点集合,并从二次更新后的社交网络拓扑图中将该节点以及和它相连的边删除;(5-5)重复上述步骤(5-1)至(5-4),直到二次更新后的社交网络拓扑图中的所有节点均被处理完毕为止。优选地,步骤(8)包括以下子步骤:(8-1)获取步骤(5)中得到的关键节点集合和关键节点集合中每个关键节点对应的候选点集合;(8-2)选取关键节点集合中的一个节点和该节点对应的候选点集合,将这些节点在步骤(1)的社交网络拓扑图中对应的诱导子图作为影响力社区;(8-3)从关键节点集合中删除该节点并删除该节点对应的候选节点集合;(8-4)针对关键节点集合和对应候选集合中的剩余节点重复上述(8-1)至(8-3),直到两个集合都为空为止。按照本专利技术的另一方面,提供了一种基于社区检索的影响力社区搜索系统,包括:第一模块,用于获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;第二模块,用于从第一模块获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;第三模块,用于根据第二模块的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于第二模块的排列结果中排在第(k+r)位的影响力值;第四模块,用于针对第三模块更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;第五模块,用于针对第四模块更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和第三模块更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有候选节点构成该关键节点对应的候选节点集合;第六模块,用于获取第五模块得到的关键节点集合以及该关键节点集合中关键节点的数量m,判断m是否大于或等于需要搜索的社区数量r,如果是则进入第八模块,否则进入第七模块;第七模块,用于将阈值t的值更新为其当前值的2/3,并返回第三模块;第八模块,用于对第五模块更新后的关键节点集合中所有关键节点对应的候选节点集合进行处理,从而得到第一模块中社交网络拓扑图中的前r个影响力社区,过程结束。总体而言,通过本专利技术所构思本文档来自技高网...

【技术保护点】
1.一种基于社区检索的影响力社区搜索方法,其特征在于,包括以下步骤:(1)获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;(2)从步骤(1)获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;(3)根据步骤(2)的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于步骤(2)的排列结果中排在第(k+r)位的影响力值;(4)针对步骤(3)更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;(5)针对步骤(4)中更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和步骤(3)更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有候选节点构成该关键节点对应的候选节点集合;(6)获取步骤(5)中得到的关键节点集合以及该关键节点集合中关键节点的数量m,判断步骤(5)获取的更新后的关键节点集合中关键节点的数量m是否大于或等于需要搜索的社区数量r,如果是则进入步骤(8),否则进入步骤(7);(7)将阈值t的值更新为其当前值的2/3,并返回步骤(3);(8)对步骤(5)更新后的关键节点集合中所有关键节点对应的候选节点集合进行处理,从而得到步骤(1)中社交网络拓扑图中的前r个影响力社区,过程结束。...

【技术特征摘要】
1.一种基于社区检索的影响力社区搜索方法,其特征在于,包括以下步骤:(1)获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;(2)从步骤(1)获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;(3)根据步骤(2)的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于步骤(2)的排列结果中排在第(k+r)位的影响力值;(4)针对步骤(3)更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;(5)针对步骤(4)中更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和步骤(3)更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有候选节点构成该关键节点对应的候选节点集合;(6)获取步骤(5)中得到的关键节点集合以及该关键节点集合中关键节点的数量m,判断步骤(5)获取的更新后的关键节点集合中关键节点的数量m是否大于或等于需要搜索的社区数量r,如果是则进入步骤(8),否则进入步骤(7);(7)将阈值t的值更新为其当前值的2/3,并返回步骤(3);(8)对步骤(5)更新后的关键节点集合中所有关键节点对应的候选节点集合进行处理,从而得到步骤(1)中社交网络拓扑图中的前r个影响力社区,过程结束。2.根据权利要求1所述的影响力社区搜索方法,其特征在于,步骤(2)步骤中第i个节点Pi的影响力值PageRank(Pi)是采用以下公式获得:其中,N表示社交网络拓扑图中节点的总数,d表示阻尼系数,其取值为0.85,M(Pi)表示第i个节点pi的所有邻居节点的集合,L(Pj)表示第i个节点Pj的邻居个数。3.根据权利要求1所述的影响力社区搜索方法,其特征在于,步骤(4)包括以下子步骤:(4-1)根据步骤(3)更新后的社交网络拓扑图中各个节点的影响力值,获取最小影响力值对应的节点作为关键节点;(4-2)针对步骤(4-1)中得到的关键节点,判断其数量是否为1,若为1,则过程结束,否则根据步骤(3)更新后的社交网络拓扑图判断这些节点之间的连通性,将彼此连通的节点合并为一个节点,从而完成对关键节点的更新;4.根据权利要求1所述的影响力社区搜索方法,其特征在于,步骤(5)包括以下子步骤:(5-1)获取步骤(4)更新后的关键节点,并将其放入关键节点集合;(5-2)在步骤(3)更新后的社交网络拓扑图...

【专利技术属性】
技术研发人员:周旭罗文晟曾一夫陈建国姜文君李肯立李克勤
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1