【技术实现步骤摘要】
一种基于社区检索的影响力社区搜索方法和系统
本专利技术属于社交网络
,更具体地,涉及一种基于社区检索的影响力社区搜索方法和系统。
技术介绍
在当今的社交网络中,常常需要使用社区搜索从社交网络的海量数据中搜索具有影响力的社区,通过影响力社区搜索的过程,能够发现社交网络中具有重要影响力的核心节点和核心社区,用于企业商业营销、广告定向投放、言论渠道推荐、舆情监控等诸多领域。目前主流的影响力社区搜索方法有两种,第一种是基于索引的影响力社区搜索方法,其通过基于深度优先搜索方法预先计算所有的k-影响力社区,并将所有的社区组织成树形的索引结构,最终对索引进行查询得到输出结果;但是,这种方法也存在一些问题:首先,虽然该方法的搜索效率较高,但该方法是将所有社区都一一计算出来之后再查找前r个社区,从而浪费了部分计算资源;其次,维护索引需要一定的空间资源,从而导致该方法并不适合较大规模的社交网络;第二种是渐进式影响力社区优化方法,其根据网络中节点的权值大小对网络进行筛选,通过对得到的子图进行计算并根据查询条件渐进地输出结果,并通过筛选减小网络的规模,从而提高其搜索效率;但这种方法的缺陷在于,其正常工作的约束条件是网络中每个节点的影响力都是不相等的,而现实世界中节点影响力相等的情况是不可避免的,因此,这一约束条件限制了该方法的应用。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于社区检索的影响力社区搜索方法和系统,其目的在于,解决现有基于索引的社区搜索方法中存在的浪费计算资源、并不适合大规模社交网络的技术问题,以及现有渐进式影响力社区优化方法中由于存在 ...
【技术保护点】
1.一种基于社区检索的影响力社区搜索方法,其特征在于,包括以下步骤:(1)获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;(2)从步骤(1)获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;(3)根据步骤(2)的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于步骤(2)的排列结果中排在第(k+r)位的影响力值;(4)针对步骤(3)更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;(5)针对步骤(4)中更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和步骤(3)更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有 ...
【技术特征摘要】
1.一种基于社区检索的影响力社区搜索方法,其特征在于,包括以下步骤:(1)获取社交网络拓扑图、需要搜索的社区数量r、以及社区中节点邻居个数的约束值k,该社交网络拓扑图中的每个节点代表一个用户实体,每条边代表两个用户实体之间的社交关系;(2)从步骤(1)获取的社交网络拓扑图中确定每个节点的邻居个数和影响力值,从社区网络拓扑图中将邻居个数小于k的节点、以及与该节点相连的所有边删除,并将剩余的所有节点按照影响力值从大到小的顺序进行排列;(3)根据步骤(2)的排列结果从社交网络拓扑图中删除影响力值小于阈值t的节点,从而形成更新后的社交网络拓扑图,其中阈值t的大小等于步骤(2)的排列结果中排在第(k+r)位的影响力值;(4)针对步骤(3)更新后的社交网络拓扑图,根据其中各个节点的邻居个数和影响力值确定关键节点,选择其中影响力值相同的关键节点,并根据更新后的社交网络拓扑图对选择的关键节点进行更新;(5)针对步骤(4)中更新后的关键节点,所有关键节点构成关键节点集合,根据集合中的每一个关键节点和步骤(3)更新后的社交网络拓扑图中剩余节点的邻居个数确定该关键节点对应的候选节点,每一个关键节点对应的所有候选节点构成该关键节点对应的候选节点集合;(6)获取步骤(5)中得到的关键节点集合以及该关键节点集合中关键节点的数量m,判断步骤(5)获取的更新后的关键节点集合中关键节点的数量m是否大于或等于需要搜索的社区数量r,如果是则进入步骤(8),否则进入步骤(7);(7)将阈值t的值更新为其当前值的2/3,并返回步骤(3);(8)对步骤(5)更新后的关键节点集合中所有关键节点对应的候选节点集合进行处理,从而得到步骤(1)中社交网络拓扑图中的前r个影响力社区,过程结束。2.根据权利要求1所述的影响力社区搜索方法,其特征在于,步骤(2)步骤中第i个节点Pi的影响力值PageRank(Pi)是采用以下公式获得:其中,N表示社交网络拓扑图中节点的总数,d表示阻尼系数,其取值为0.85,M(Pi)表示第i个节点pi的所有邻居节点的集合,L(Pj)表示第i个节点Pj的邻居个数。3.根据权利要求1所述的影响力社区搜索方法,其特征在于,步骤(4)包括以下子步骤:(4-1)根据步骤(3)更新后的社交网络拓扑图中各个节点的影响力值,获取最小影响力值对应的节点作为关键节点;(4-2)针对步骤(4-1)中得到的关键节点,判断其数量是否为1,若为1,则过程结束,否则根据步骤(3)更新后的社交网络拓扑图判断这些节点之间的连通性,将彼此连通的节点合并为一个节点,从而完成对关键节点的更新;4.根据权利要求1所述的影响力社区搜索方法,其特征在于,步骤(5)包括以下子步骤:(5-1)获取步骤(4)更新后的关键节点,并将其放入关键节点集合;(5-2)在步骤(3)更新后的社交网络拓扑图...
【专利技术属性】
技术研发人员:周旭,罗文晟,曾一夫,陈建国,姜文君,李肯立,李克勤,
申请(专利权)人:湖南大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。