一种基于标签特性的图数据划分方法、装置、电子设备及存储介质制造方法及图纸

技术编号:45084226 阅读:10 留言:0更新日期:2025-04-25 18:22
本申请公开了一种基于标签特性的图数据划分方法、装置、电子设备及存储介质,该方法包括:提取出图形数据中N个弱连通分量;其中,一个弱连通分量包括图形数据中实体对象之间的一种描述性标签,所述N为大于1的整数;计算所述N个弱连通分量中任一的第一弱连通分量在M个预设分区的聚类系数与最小非零特征值;其中,所述聚类系数用于表征所述第一弱连通分量在所述M个预设分区各自的标签密度,所述最小非零特征值用于表征所述第一弱连通分量在所述M个预设分区各自的连通性;其中,所述M为大于0的整数;根据所述M个预设分区各自的聚类系数与最小非零特征值,在所述M个预设分区中确定出所述第一弱连通分量的目标分区。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种基于标签特性的图数据划分方法、装置、电子设备及存储介质


技术介绍

1、图形数据作为一种描述实体之间复杂关系的结构,在许多领域起着至关重要的作用。图形数据由顶点(vertices , v)和边(edeges, e)组成;其中,顶点表示实体,边表示这些实体之间的连接或关系,两者都有各种类型的实体或标签(l)。图形数据可被广泛应用于各个领域,如生物分子研究、社交网络设计和知识图谱生成。

2、随着图形数据规模的增加,集中式图形数据管理的性能瓶颈问题日益突出,例如,内存不足、计算资源要求高等。为了提高图形数据的处理效率,可采用图数据划分算法将一个庞大的图形数据集划分不同的节点(分区)进行管理,以降低复杂性并提高效率。

3、现有的图形数据划分方式是尽量减少边和点的切割,或最大限度地提高分割内结构的紧密性。然而,在针对多标签图形数据的场景下,上述方式很难避免跨分区的同标签查询连接,导致在没有分区间连接的情况下,无法对存在相同标签的图形数据进行独立的查询,降低了图形数据的处理效率。

/>

技术本文档来自技高网...

【技术保护点】

1.一种基于标签特性的图数据划分方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述根据所述M个预设分区各自的聚类系数与最小非零特征值,在所述M个预设分区中确定出所述第一弱连通分量的目标分区,包括:

3.如权利要求2所述的方法,其特征在于,所述计算所述M个预设分区各自的负载均衡系数,包括:

4.如权利要求2所述的方法,其特征在于,所述负载均衡系数满足以下表达式:

5.如权利要求1所述的方法,其特征在于,所述最小非零特征值是采用Lanczos算法计算的。

6.一种基于标签特性的图形数据划分装置,其特征在于,包括:...

【技术特征摘要】

1.一种基于标签特性的图数据划分方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述根据所述m个预设分区各自的聚类系数与最小非零特征值,在所述m个预设分区中确定出所述第一弱连通分量的目标分区,包括:

3.如权利要求2所述的方法,其特征在于,所述计算所述m个预设分区各自的负载均衡系数,包括:

4.如权利要求2所述的方法,其特征在于,所述负载均衡系数满足以下表达式:

5.如权利要求1所述的方法,其特征在于,所述最小非...

【专利技术属性】
技术研发人员:黄宏斌李瞻哲葛宁超李璇肖开明张航
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1