【技术实现步骤摘要】
一种基于二部图的社区搜索方法、装置以及处理设备
[0001]本申请涉及社交领域,具体涉及一种基于二部图的社区搜索方法、装置以及处理设备。
技术介绍
[0002]社区搜索,可以理解为,在社交网络中,检索包含指定对象的社区的大数据挖掘方法的统称。
[0003]在实际操作中,具体可以引入二部图来实现社区的搜索处理,二部图社区的搜索方法,以电影爱好者的社区为例,输入为指定对象以及参数α、β,参数α为用户层顶点的度,参数β为电影层顶点的度,可以通俗理解为,要求输出社区中,每个用户至少要对α部电影评分,每个电影至少要被β个用户评分,输出为一个包含指定对象的连通子图,该社区包含指定对象,满足参数α、β的要求,且在此基础上尽可能剥离了权重低的边(即评分低的评价)。
[0004]然而在现有的相关技术的研究过程中,专利技术人发现,现有二部图社区搜索方法,其找到的仅是结构紧密且边权重高的社区,在使用输出社区进行相关应用时发现,存在社区抓取不精确的情况。
技术实现思路
[0005]本申请提供了一种基于二部图的社区搜索 ...
【技术保护点】
【技术特征摘要】
1.一种基于二部图的社区搜索方法,其特征在于,所述方法包括:获取目标社交网络的初始社交网络社区,其中,所述初始社交网络以二部图G(V=(U,L),E,A)的数据类型配置,V为所述初始社交网络数据中包含的节点集,U为节点集V中U层节点集,L为节点集V中L层节点集,所述U层节点集与所述L层节点集中的节点间均无连边关系,E为所述二部图G(V=(U,L),E,A)中的边集,A为所述二部图G(V=(U,L),E,A)的属性集;根据目标用户节点所带属性集A
Q
,从初始社交网络社区剥离出由至少含有一个所述目标用户节点所带属性的顶点与顶点所带的边构成的属性相关社区G*;在所述属性相关社区G*的基础上,以结构紧密社区模型N为基础,查询所述目标用户节点为中心的紧密的属性相关的社区A
α,β
;在二部图社区A
α,β
的基础上,重复删除属性得分最低的顶点,并维持社区紧密度,直到删除顶点后无法维持社区紧密度,此时恢复被删除的顶点,得到二部图社区A
α,β
(q);在所述二部图社区A
α,β
(q)的基础上,以权值为基础,查询所述目标用户节点为中心的高权重二部图社区,并维持社区结构紧密度,得到二部图社区H。2.根据权利要求1所述的方法,其特征在于,所述根据目标用户节点所带属性集A
Q
,从初始社交网络社区剥离出由至少含有一个所述目标用户节点所带属性的顶点与顶点所带的边构成的属性相关社区G*,包括:遍历所述二部图G(V=(U,L),E,A)的每个节点u的每个属性A
i
(u);依次比较所述节点u的每个属性A
i
(u)与所述目标用户节点所带属性集A
Q
内的每个属性,若至少有一次相同,则将对应的节点及其所带的边加入所述属性相关社区G*。3.根据权利要求1所述的方法,其特征在于,所述在所述属性相关社区G*的基础上,以结构紧密社区模型N为基础,查询目标用户节点为中心的紧密的属性相关的社区A
α,β
,包括:遍历所述属性相关社区G*的每个U层节点的度是否大于α;若是,遍历当前U层节点连边的另一边的L层顶点的度是否大于β;若是,则将当前连边及其两边顶点加入到空的二部图社区K;遍历完毕后,在所述二部图社区K中以查询所述目标用户节点出发进行广度优先搜索,并将搜索结果作为查询所述目标用户节点为中心的紧密的属性相关的社区A
α,β
。4.根据权利要求1所述的方法,其特征在于,所述在二部图社区A
α,β
的基础上,重复删除属性得分最低的顶点,并维持社区紧密度,直到删除顶点后无法维持社区紧密度,此时恢复被删除的顶点,得到二部图社区A
α,β
(q),包括:遍历所述二部图社区A
α,β
中每个节点u的每个属性A
i
(u);比较所述节点u的每个属性A
i
(u)与所述目标用户节点所带属性集A
Q
内的每个属性,每带有一个A
Q
内属性,则属性得分+1;遍历完毕后,循环删除所述二部图社区A
α,β
中属性得分最低的顶点及其所带的边,每次删除都检查顶点所带的边的另一边的顶点的度,是否依然大于α或β;若否,则所述另一边顶点及其所带的边也删除;当某个顶点及其所带的边被删除,使得查询顶点的度小于α时,将当前迭代过程中被删除的顶点及其所带的边恢复,循环结束;遍历所述二部图社区A
α,β
的每个U层...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。