频繁子图挖掘方法、装置、设备及存储介质制造方法及图纸

技术编号:40940233 阅读:12 留言:0更新日期:2024-04-18 14:57
本申请提供一种频繁子图挖掘方法、装置、设备及存储介质,涉及大数据领域。该方法包括:通过以下步骤:对待处理图数据集进行分区处理,确定各个分区图数据集;下发每一分区图数据集至对应的子设备中;其中,子设备用于计算确定对应的分区图数据集的同构子图;接收各个子设备发送的每一分区图数据集的同构子图,并根据各个分区图数据集的同构子图,确定待处理数据集的频繁子图。该方法通信代价小,避免了产生通信瓶颈,提高了频繁子图挖掘效率。

【技术实现步骤摘要】

本申请涉及大数据领域,尤其涉及一种频繁子图挖掘方法、装置、设备及存储介质


技术介绍

1、目前,随着互联网的蓬勃发展,网络的规模在不断的扩大,图数据规模不断变大,频繁子图挖掘给单机存储和计算能力都带来了严峻考验。

2、现有技术中,使用集中式频繁子图挖掘算法进行频繁子图挖掘,例如,关联规则算法(apriori)和关联分析算法(fp-growth)。

3、然而现有技术中,在大型图数据处理过程中,集中式频繁子图挖掘算法随着支持度的减小,在时间或空间上代价逐渐增长,使得挖掘效率较低。


技术实现思路

1、本申请提供一种频繁子图挖掘方法、装置、设备及存储介质,用以解决频繁子图挖掘效率较低技术问题。

2、第一方面,本申请提供一种频繁子图挖掘方法,包括:

3、对待处理图数据集进行分区处理,确定各个分区图数据集;其中,每一分区图数据集中包括至少一个标签图,各个分区图数据集之间的标签图不存在交叉;

4、下发每一分区图数据集至对应的子设备中;其中,子设备用于计算确定对应的本文档来自技高网...

【技术保护点】

1.一种频繁子图挖掘方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,接收各个子设备发送的每一分区图数据集的同构子图,并根据各个分区图数据集的同构子图,确定所述待处理数据集的频繁子图,包括:

3.根据权利要求2所述的方法,其特征在于,确定各个第一同构子图中所述待处理图数据集的第一频繁子图,包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,根据各个子设备的计算时长,对各个子设备进行负载均衡处理,包括:

6.根据权利要求5所述的方法,其特征在于,根...

【技术特征摘要】

1.一种频繁子图挖掘方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,接收各个子设备发送的每一分区图数据集的同构子图,并根据各个分区图数据集的同构子图,确定所述待处理数据集的频繁子图,包括:

3.根据权利要求2所述的方法,其特征在于,确定各个第一同构子图中所述待处理图数据集的第一频繁子图,包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,根据各个子设备的计算时长,对各个子设备进行负载均衡处理,包括:

6.根据权利要求5所述的方法,其特征在于,根据各个第一类别子设备的计算时长以及各个第二类别子设备的计算时长,对各个第一类别设备对应的分区图数据集进行删减处理,并对各个第二类别设备对应的分区图数据集进行增加处理,包括:

...

【专利技术属性】
技术研发人员:王童童任政周文泽赵叶红
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1