社群发现方法、装置、电子设备和存储介质制造方法及图纸

技术编号:33386614 阅读:39 留言:0更新日期:2022-05-11 23:01
本公开提供了一种社群发现方法、装置、电子设备和存储介质,涉及人工智能技术领域,具体为深度学习技术领域。具体实现方案为:获取待处理的图数据,其中,所述图数据中包括多个节点以及节点之间的连接边;根据所述图数据,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,其中,所述目标社群中包括所述查询节点,及多个所述节点中除所述查询节点外的至少一个其它节点;重复执行确定所述查询节点及对所述查询节点进行社群搜索的过程,直至各所述节点均已确定所属社群。由此,解决了重叠的社群发现问题。社群发现问题。社群发现问题。

【技术实现步骤摘要】
社群发现方法、装置、电子设备和存储介质


[0001]本公开涉及人工智能
,具体为深度学习
,尤其涉及社群发现方法、装置、电子设备和存储介质。

技术介绍

[0002]网络在我们的生活中无处不在,比如生物网络、社交网络、通信网络、知识图谱等。网络中的社群发现是一个广泛研究的问题,其目标是将网络中的节点分组,使得组内紧密连接,组间稀疏连接。社群发现对于理解复杂网络有重要的作用,同时具有广阔的应用场景,如市场营销细分,犯罪侦查,推荐系统等。
[0003]由于现实世界中的社群结构通常是以重叠的方式存在,即社群间有交叉,一个节点可能属于多个社群,因此解决重叠的社群发现问题,对于理解和分析真实的复杂网络具有重要意义。

技术实现思路

[0004]本公开提供了一种社群发现方法、装置、电子设备和存储介质。
[0005]根据本公开的一方面,提供了一种社群发现方法,所述方法包括:获取待处理的图数据,其中,所述图数据中包括多个节点以及节点之间的连接边;根据所述图数据,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,其中,所述目标社群中包括所述查询节点,及多个所述节点中除所述查询节点外的至少一个其它节点;重复执行确定所述查询节点及对所述查询节点进行社群搜索的过程,直至各所述节点均已确定所属社群。
[0006]根据本公开的另一方面,提供了一种用于社群发现的模型训练方法,所述方法包括:获取训练图数据,所述训练图数据包括多个样本节点以及样本节点之间的连接边;将所述训练图数据输入初始社群搜索模型,以通过所述初始社群搜索模型,从多个所述样本节点中确定查询样本节点,并对所述查询样本节点进行社群搜索,以确定所述查询样本节点所属的样本社群,以及在社群搜索过程中,调整所述初始社群搜索模型的模型参数;其中,所述样本社群,包括所述查询样本节点,及多个所述样本节点中除所述查询样本节点外的至少一个其它样本节点;重复执行确定所述查询样本节点及调整所述模型参数的过程,直至各所述样本节点均已确定所属样本社群,得到用于社群发现的目标社群搜索模型。
[0007]根据本公开的另一方面,提供了一种社群发现装置,所述装置包括:第一获取模块,用于获取待处理的图数据,其中,所述图数据中包括多个节点以及节点之间的连接边;第一处理模块,用于根据所述图数据,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,其中,所述目标社群中包括所述查询节点,及多个所述节点中除所述查询节点外的至少一个其它节点;以及重复执行确定所述查询节点及对所述查询节点进行社群搜索的过程,直至各所述节点均已确定所属社群。
[0008]根据本公开的另一方面,提供了一种用于社群发现的模型训练装置,所述装置包
括:第二获取模块,用于获取训练图数据,所述训练图数据包括多个样本节点以及样本节点之间的连接边;第二处理模块,用于将所述训练图数据输入初始社群搜索模型,以通过所述初始社群搜索模型,从多个所述样本节点中确定查询样本节点,并对所述查询样本节点进行社群搜索,以确定所述查询样本节点所属的样本社群,以及在社群搜索过程中,调整所述初始社群搜索模型的模型参数;其中,所述样本社群,包括所述查询样本节点,及多个所述样本节点中除所述查询样本节点外的至少一个其它样本节点;以及重复执行确定所述查询样本节点及调整所述模型参数的过程,直至各所述样本节点均已确定所属样本社群,得到用于社群发现的目标社群搜索模型。
[0009]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的社群发现方法,或者执行本公开的用于社群发现的模型训练方法。
[0010]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的社群发现方法,或者执行本公开实施例公开的用于社群发现的模型训练方法。
[0011]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开的社群发现方法的步骤,或者实现本公开的用于社群发现的模型训练方法的步骤。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1是根据本公开第一实施例的社群发现方法的流程示意图;
[0015]图2是根据本公开第二实施例的社群发现方法的流程示意图;
[0016]图3是根据本公开第三实施例的社群发现方法的流程示意图;
[0017]图4是根据本公开第四实施例的用于社群发现的模型训练方法的流程示意图;
[0018]图5是根据本公开第五实施例的用于社群发现的模型训练方法的流程示意图;
[0019]图6是根据本公开第六实施例的社群发现装置的结构示意图;
[0020]图7是根据本公开第七实施例的用于社群发现的模型训练装置的结构示意图;
[0021]图8是用来实现本公开实施例的社群发现方法或用于社群发现的模型训练方法的电子设备的框图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]由于现实世界中的社群结构通常是以重叠的方式存在,即社群间有交叉,一个节
点可能属于多个社群,因此解决重叠的社群发现问题,对于理解和分析真实的复杂网络具有重要意义。
[0024]本公开提供一种社群发现方法和用于社群发现的模型训练方法,其中社群发现方法,通过获取待处理的图数据,其中,图数据中包括多个节点以及节点之间的连接边,根据图数据,从多个节点中确定查询节点,并对查询节点进行社群搜索,以确定查询节点所属的目标社群,其中,目标社群中包括查询节点,及多个节点中除查询节点外的至少一个其它节点,重复执行确定查询节点及对查询节点进行社群搜索的过程,直至各节点均已确定所属社群,由于在对查询节点进行社群搜索时,可以将已经确定过所属社群的节点加入到查询节点所属的目标社群中,从而各节点可以不仅属于一个社群,解决了重叠的社群发现问题。
[0025]本公开提供的社群发现方法、用于社群发现的模型训练方法、装置、电子设备、非瞬时计算机可读存储介质以及计算机程序产品,涉及人工智能
,具体为深度学习

[0026]其本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种社群发现方法,包括:获取待处理的图数据,其中,所述图数据中包括多个节点以及节点之间的连接边;根据所述图数据,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,其中,所述目标社群中包括所述查询节点,及多个所述节点中除所述查询节点外的至少一个其它节点;重复执行确定所述查询节点及对所述查询节点进行社群搜索的过程,直至各所述节点均已确定所属社群。2.根据权利要求1所述的方法,其中,所述从多个所述节点中确定查询节点,包括:确定多个所述节点分别对应的重要度;从多个所述节点中,获取未确定所属社群的第一节点;将所述第一节点中对应的重要度最高的节点,作为所述查询节点。3.根据权利要求1或2所述的方法,其中,所述根据所述图数据,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,包括:将所述图数据输入社群搜索模型,以通过所述社群搜索模型,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群。4.根据权利要求3所述的方法,其中,所述社群搜索模型包括图神经网络和强化学习网络;所述将所述图数据输入社群搜索模型,以通过社群搜索模型,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,包括:将所述图数据输入所述图神经网络,以获取多个所述节点分别对应的表达向量;将多个所述节点分别对应的表达向量输入所述强化学习网络,以通过所述强化学习网络,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群。5.根据权利要求4所述的方法,其中,所述对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,包括:将所述查询节点加入第一社群;根据所述第一社群中包含的节点对应的表达向量及多个第一节点分别对应的表达向量,通过所述强化学习网络,确定多个所述第一节点分别加入所述第一社群后,所述第一社群的预测质量,其中,所述第一节点,为多个所述节点中,除所述第一社群包含节点之外的其它节点;将多个所述第一节点中的目标节点加入所述第一社群,以更新所述第一社群;其中,所述目标节点,为多个所述第一节点中,加入所述第一社群后使得所述第一社群的预测质量最高的第一节点;重复执行更新所述第一社群的过程,直至更新后的所述第一社群满足预设终止条件,并将结束更新时所得到的第一社群作为所述目标社群。6.根据权利要求5所述的方法,其中,所述预设终止条件,包括以下条件中的至少一个:更新后的所述第一社群中各所述节点的度至少为预设值、更新后的所述第一社群中包含的节点个数达到预设数量。7.一种用于社群发现的模型训练方法,包括:获取训练图数据,所述训练图数据包括多个样本节点以及样本节点之间的连接边;
将所述训练图数据输入初始社群搜索模型,以通过所述初始社群搜索模型,从多个所述样本节点中确定查询样本节点,并对所述查询样本节点进行社群搜索,以确定所述查询样本节点所属的样本社群,以及在社群搜索过程中,调整所述初始社群搜索模型的模型参数;其中,所述样本社群,包括所述查询样本节点,及多个所述样本节点中除所述查询样本节点外的至少一个其它样本节点;重复执行确定所述查询样本节点及调整所述模型参数的过程,直至各所述样本节点均已确定所属样本社群,得到用于社群发现的目标社群搜索模型。8.根据权利要求7所述的方法,其中,所述初始社群搜索模型包括图神经网络和强化学习网络;所述将所述训练图数据输入初始社群搜索模型,以通过所述初始社群搜索模型,从多个所述样本节点中确定查询样本节点,并对所述查询样本节点进行社群搜索,以确定所述查询样本节点所属的样本社群,以及在社群搜索过程中,调整所述初始社群搜索模型的模型参数,包括:将所述训练图数据输入所述图神经网络,以获取多个所述样本节点分别对应的表达向量;将多个所述样本节点分别对应的表达向量输入所述强化学习网络,以通过所述强化学习网络,从多个所述样本节点中确定查询样本节点,并对所述查询样本节点进行社群搜索,以确定所述查询样本节点所属的样本社群,以及在社群搜索过程中,调整所述图神经网络和所述强化学习网络的模型参数。9.根据权利要求8所述的方法,其中,所述在社群搜索过程中,调整所述图神经网络和所述强化学习网络的模型参数,包括:获取第一样本社群的第一真实质量,其中,所述第一样本社群包括样本查询节点;根据第一样本社群中包含的样本节点对应的表达向量及第一目标样本节点对应的表达向量,通过所述强化学习网络,确定所述第一目标样本节点加入所述第一样本社群后,所述第一样本社群的第一预测质量;所述第一目标样本节点,为多个第一样本节点中,加入所述第一样本社群后使得所述第一样本社群的预测质量最高的第一样本节点;所述第一样本节点,为多个所述样本节点中,除所述第一样本社群包含样本节点之外的其它样本节点;获取第二样本社群的第二真实质量,其中,所述第二样本社群至少包括所述样本查询节点及所述第一目标样本节点;根据所述第二样本社群中包含的样本节点对应的表达向量及第二目标样本节点对应的表达向量,通过所述强化学习网络,确定所述第二目标样本节点加入所述第二样本社群后,所述第二样本社群的第二预测质量;其中,所述第二目标样本节点,为多个所述第二样本节点中,加入所述第二样本社群后使得所述第二样本社群的预测质量最高的第二样本节点,所述第二样本节点,为多个所述样本节点中,除所述第二样本社群包含样本节点之外的其它样本节点;根据所述第一真实质量、所述第二真实质量、所述第一预测质量、所述第一预测质量,确定损失值;根据所述损失值对所述图神经网络和所述强化学习网络的模型参数进行调整。10.一种社群发现装置,包括:
第一获取模块,用于获取待处理的图数据,其中,所述图数据中包括多个节点以及节点之间的连接边;第一处理模块,用于根据所述图数据,从多个所述节点中确定查询节点,并对所述查询节点进行社群搜索,以确定所述查询节点所属的目标社群,其中,所述目标社群中包括所述查询节点,及多个所述节点中除所述查询节点外的至...

【专利技术属性】
技术研发人员:董政王鹏宋欣祝恒书姚开春
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1