【技术实现步骤摘要】
社群发现方法、装置、电子设备和存储介质
[0001]本公开涉及人工智能
,具体为深度学习
,尤其涉及社群发现方法、装置、电子设备和存储介质。
技术介绍
[0002]网络在我们的生活中无处不在,比如生物网络、社交网络、通信网络、知识图谱等。网络中的社群发现是一个广泛研究的问题,其目标是将网络中的节点分组,使得组内紧密连接,组间稀疏连接。社群发现对于理解复杂网络有重要的作用,同时具有广阔的应用场景,如市场营销细分,犯罪侦查,推荐系统等。
[0003]由于现实世界中的社群结构通常是以重叠的方式存在,即社群间有交叉,一个节点可能属于多个社群,因此解决重叠的社群发现问题,对于理解和分析真实的复杂网络具有重要意义。
技术实现思路
[0004]本公开提供了一种社群发现方法、装置、电子设备和存储介质。
[0005]根据本公开的一方面,提供了一种社群发现方法,所述方法包括:获取待处理的图数据,其中,所述图数据中包括多个节点以及节点之间的连接边;根据所述图数据,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,其中,所述目标社群中包括所述查询节点,及多个所述节点中除所述查询节点外的至少一个其它节点;重复执行确定所述查询节点及对所述查询节点进行社群搜索的过程,直至各所述节点均已确定所属社群。
[0006]根据本公开的另一方面,提供了一种用于社群发现的模型训练方法,所述方法包括:获取训练图数据,所述训练图数据包括多个样本节点以及样本节点之间的连接 ...
【技术保护点】
【技术特征摘要】
1.一种社群发现方法,包括:获取待处理的图数据,其中,所述图数据中包括多个节点以及节点之间的连接边;根据所述图数据,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,其中,所述目标社群中包括所述查询节点,及多个所述节点中除所述查询节点外的至少一个其它节点;重复执行确定所述查询节点及对所述查询节点进行社群搜索的过程,直至各所述节点均已确定所属社群。2.根据权利要求1所述的方法,其中,所述从多个所述节点中确定查询节点,包括:确定多个所述节点分别对应的重要度;从多个所述节点中,获取未确定所属社群的第一节点;将所述第一节点中对应的重要度最高的节点,作为所述查询节点。3.根据权利要求1或2所述的方法,其中,所述根据所述图数据,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,包括:将所述图数据输入社群搜索模型,以通过所述社群搜索模型,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群。4.根据权利要求3所述的方法,其中,所述社群搜索模型包括图神经网络和强化学习网络;所述将所述图数据输入社群搜索模型,以通过社群搜索模型,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,包括:将所述图数据输入所述图神经网络,以获取多个所述节点分别对应的表达向量;将多个所述节点分别对应的表达向量输入所述强化学习网络,以通过所述强化学习网络,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群。5.根据权利要求4所述的方法,其中,所述对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,包括:将所述查询节点加入第一社群;根据所述第一社群中包含的节点对应的表达向量及多个第一节点分别对应的表达向量,通过所述强化学习网络,确定多个所述第一节点分别加入所述第一社群后,所述第一社群的预测质量,其中,所述第一节点,为多个所述节点中,除所述第一社群包含节点之外的其它节点;将多个所述第一节点中的目标节点加入所述第一社群,以更新所述第一社群;其中,所述目标节点,为多个所述第一节点中,加入所述第一社群后使得所述第一社群的预测质量最高的第一节点;重复执行更新所述第一社群的过程,直至更新后的所述第一社群满足预设终止条件,并将结束更新时所得到的第一社群作为所述目标社群。6.根据权利要求5所述的方法,其中,所述预设终止条件,包括以下条件中的至少一个:更新后的所述第一社群中各所述节点的度至少为预设值、更新后的所述第一社群中包含的节点个数达到预设数量。7.一种用于社群发现的模型训练方法,包括:获取训练图数据,所述训练图数据包括多个样本节点以及样本节点之间的连接边;
将所述训练图数据输入初始社群搜索模型,以通过所述初始社群搜索模型,从多个所述样本节点中确定查询样本节点,并对所述查询样本节点进行社群搜索,以确定所述查询样本节点所属的样本社群,以及在社群搜索过程中,调整所述初始社群搜索模型的模型参数;其中,所述样本社群,包括所述查询样本节点,及多个所述样本节点中除所述查询样本节点外的至少一个其它样本节点;重复执行确定所述查询样本节点及调整所述模型参数的过程,直至各所述样本节点均已确定所属样本社群,得到用于社群发现的目标社群搜索模型。8.根据权利要求7所述的方法,其中,所述初始社群搜索模型包括图神经网络和强化学习网络;所述将所述训练图数据输入初始社群搜索模型,以通过所述初始社群搜索模型,从多个所述样本节点中确定查询样本节点,并对所述查询样本节点进行社群搜索,以确定所述查询样本节点所属的样本社群,以及在社群搜索过程中,调整所述初始社群搜索模型的模型参数,包括:将所述训练图数据输入所述图神经网络,以获取多个所述样本节点分别对应的表达向量;将多个所述样本节点分别对应的表达向量输入所述强化学习网络,以通过所述强化学习网络,从多个所述样本节点中确定查询样本节点,并对所述查询样本节点进行社群搜索,以确定所述查询样本节点所属的样本社群,以及在社群搜索过程中,调整所述图神经网络和所述强化学习网络的模型参数。9.根据权利要求8所述的方法,其中,所述在社群搜索过程中,调整所述图神经网络和所述强化学习网络的模型参数,包括:获取第一样本社群的第一真实质量,其中,所述第一样本社群包括样本查询节点;根据第一样本社群中包含的样本节点对应的表达向量及第一目标样本节点对应的表达向量,通过所述强化学习网络,确定所述第一目标样本节点加入所述第一样本社群后,所述第一样本社群的第一预测质量;所述第一目标样本节点,为多个第一样本节点中,加入所述第一样本社群后使得所述第一样本社群的预测质量最高的第一样本节点;所述第一样本节点,为多个所述样本节点中,除所述第一样本社群包含样本节点之外的其它样本节点;获取第二样本社群的第二真实质量,其中,所述第二样本社群至少包括所述样本查询节点及所述第一目标样本节点;根据所述第二样本社群中包含的样本节点对应的表达向量及第二目标样本节点对应的表达向量,通过所述强化学习网络,确定所述第二目标样本节点加入所述第二样本社群后,所述第二样本社群的第二预测质量;其中,所述第二目标样本节点,为多个所述第二样本节点中,加入所述第二样本社群后使得所述第二样本社群的预测质量最高的第二样本节点,所述第二样本节点,为多个所述样本节点中,除所述第二样本社群包含样本节点之外的其它样本节点;根据所述第一真实质量、所述第二真实质量、所述第一预测质量、所述第一预测质量,确定损失值;根据所述损失值对所述图神经网络和所述强化学习网络的模型参数进行调整。10.一种社群发现装置,包括:
第一获取模块,用于获取待处理的图数据,其中,所述图数据中包括多个节点以及节点之间的连接边;第一处理模块,用于根据所述图数据,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,其中,所述目标社群中包括所述查询节点,及多个所述节点中除所述查询节点外的至...
【专利技术属性】
技术研发人员:董政,王鹏,宋欣,祝恒书,姚开春,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。