System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 频繁子图挖掘方法、装置、设备及存储介质制造方法及图纸_技高网

频繁子图挖掘方法、装置、设备及存储介质制造方法及图纸

技术编号:40940233 阅读:2 留言:0更新日期:2024-04-18 14:57
本申请提供一种频繁子图挖掘方法、装置、设备及存储介质,涉及大数据领域。该方法包括:通过以下步骤:对待处理图数据集进行分区处理,确定各个分区图数据集;下发每一分区图数据集至对应的子设备中;其中,子设备用于计算确定对应的分区图数据集的同构子图;接收各个子设备发送的每一分区图数据集的同构子图,并根据各个分区图数据集的同构子图,确定待处理数据集的频繁子图。该方法通信代价小,避免了产生通信瓶颈,提高了频繁子图挖掘效率。

【技术实现步骤摘要】

本申请涉及大数据领域,尤其涉及一种频繁子图挖掘方法、装置、设备及存储介质


技术介绍

1、目前,随着互联网的蓬勃发展,网络的规模在不断的扩大,图数据规模不断变大,频繁子图挖掘给单机存储和计算能力都带来了严峻考验。

2、现有技术中,使用集中式频繁子图挖掘算法进行频繁子图挖掘,例如,关联规则算法(apriori)和关联分析算法(fp-growth)。

3、然而现有技术中,在大型图数据处理过程中,集中式频繁子图挖掘算法随着支持度的减小,在时间或空间上代价逐渐增长,使得挖掘效率较低。


技术实现思路

1、本申请提供一种频繁子图挖掘方法、装置、设备及存储介质,用以解决频繁子图挖掘效率较低技术问题。

2、第一方面,本申请提供一种频繁子图挖掘方法,包括:

3、对待处理图数据集进行分区处理,确定各个分区图数据集;其中,每一分区图数据集中包括至少一个标签图,各个分区图数据集之间的标签图不存在交叉;

4、下发每一分区图数据集至对应的子设备中;其中,子设备用于计算确定对应的分区图数据集的同构子图;

5、接收各个子设备发送的每一分区图数据集的同构子图,并根据各个分区图数据集的同构子图,确定所述待处理数据集的频繁子图。

6、第二方面,本申请提供一种频繁子图挖掘装置,包括:

7、第一处理单元,用于对待处理图数据集进行分区处理,确定各个分区图数据集;其中,每一分区图数据集中包括至少一个标签图,各个分区图数据集之间的标签图不存在交叉;

8、发送单元,用于下发每一分区图数据集至对应的子设备中;其中,子设备用于计算确定对应的分区图数据集的同构子图;

9、第二处理单元,用于接收各个子设备发送的每一分区图数据集的同构子图,并根据各个分区图数据集的同构子图,确定所述待处理数据集的频繁子图。

10、第三方面,本申请提供一种电子设备,包括存储器和处理器;

11、所述存储器,用于存储计算机执行指令;

12、所述处理器,用于读取所述存储器存储的计算机执行指令,并根据所述存储器中的计算机执行指令执行如第一方面所述的种频繁子图挖掘方法。

13、第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面所述的种频繁子图挖掘方法。

14、第五方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面所述的种频繁子图挖掘方法。

15、本申请提供的频繁子图挖掘方法、装置、设备及存储介质,通过以下步骤:对待处理图数据集进行分区处理,确定各个分区图数据集;下发每一分区图数据集至对应的子设备中;其中,子设备用于计算确定对应的分区图数据集的同构子图;接收各个子设备发送的每一分区图数据集的同构子图,并根据各个分区图数据集的同构子图,确定待处理数据集的频繁子图。该方法通信代价小,避免了产生通信瓶颈,提高了频繁子图挖掘效率。

本文档来自技高网...

【技术保护点】

1.一种频繁子图挖掘方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,接收各个子设备发送的每一分区图数据集的同构子图,并根据各个分区图数据集的同构子图,确定所述待处理数据集的频繁子图,包括:

3.根据权利要求2所述的方法,其特征在于,确定各个第一同构子图中所述待处理图数据集的第一频繁子图,包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,根据各个子设备的计算时长,对各个子设备进行负载均衡处理,包括:

6.根据权利要求5所述的方法,其特征在于,根据各个第一类别子设备的计算时长以及各个第二类别子设备的计算时长,对各个第一类别设备对应的分区图数据集进行删减处理,并对各个第二类别设备对应的分区图数据集进行增加处理,包括:

7.根据权利要求6所述的方法,其特征在于,根据所述第一序列和所述第二序列,对所述第一序列中的第一类别设备和所述第二序列中的第二类别设备进行两两设备之间的子图移动处理,包括:

8.根据权利要求4-7中任一项所述的方法,其特征在于,获取每一子设备的计算时长,包括:

9.一种频繁子图挖掘装置,其特征在于,所述装置包括:

10.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至8任一项所述的频繁子图挖掘方法。

12.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现如权利要求1至8中任一项所述的频繁子图挖掘方法。

...

【技术特征摘要】

1.一种频繁子图挖掘方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,接收各个子设备发送的每一分区图数据集的同构子图,并根据各个分区图数据集的同构子图,确定所述待处理数据集的频繁子图,包括:

3.根据权利要求2所述的方法,其特征在于,确定各个第一同构子图中所述待处理图数据集的第一频繁子图,包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,根据各个子设备的计算时长,对各个子设备进行负载均衡处理,包括:

6.根据权利要求5所述的方法,其特征在于,根据各个第一类别子设备的计算时长以及各个第二类别子设备的计算时长,对各个第一类别设备对应的分区图数据集进行删减处理,并对各个第二类别设备对应的分区图数据集进行增加处理,包括:

...

【专利技术属性】
技术研发人员:王童童任政周文泽赵叶红
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1