【技术实现步骤摘要】
本申请涉及数据处理,尤其涉及一种基于标签特性的图数据划分方法、装置、电子设备及存储介质。
技术介绍
1、图形数据作为一种描述实体之间复杂关系的结构,在许多领域起着至关重要的作用。图形数据由顶点(vertices , v)和边(edeges, e)组成;其中,顶点表示实体,边表示这些实体之间的连接或关系,两者都有各种类型的实体或标签(l)。图形数据可被广泛应用于各个领域,如生物分子研究、社交网络设计和知识图谱生成。
2、随着图形数据规模的增加,集中式图形数据管理的性能瓶颈问题日益突出,例如,内存不足、计算资源要求高等。为了提高图形数据的处理效率,可采用图数据划分算法将一个庞大的图形数据集划分不同的节点(分区)进行管理,以降低复杂性并提高效率。
3、现有的图形数据划分方式是尽量减少边和点的切割,或最大限度地提高分割内结构的紧密性。然而,在针对多标签图形数据的场景下,上述方式很难避免跨分区的同标签查询连接,导致在没有分区间连接的情况下,无法对存在相同标签的图形数据进行独立的查询,降低了图形数据的处理效率。
/>技术本文档来自技高网...
【技术保护点】
1.一种基于标签特性的图数据划分方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述根据所述M个预设分区各自的聚类系数与最小非零特征值,在所述M个预设分区中确定出所述第一弱连通分量的目标分区,包括:
3.如权利要求2所述的方法,其特征在于,所述计算所述M个预设分区各自的负载均衡系数,包括:
4.如权利要求2所述的方法,其特征在于,所述负载均衡系数满足以下表达式:
5.如权利要求1所述的方法,其特征在于,所述最小非零特征值是采用Lanczos算法计算的。
6.一种基于标签特性的图形数据划分装置
...【技术特征摘要】
1.一种基于标签特性的图数据划分方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述根据所述m个预设分区各自的聚类系数与最小非零特征值,在所述m个预设分区中确定出所述第一弱连通分量的目标分区,包括:
3.如权利要求2所述的方法,其特征在于,所述计算所述m个预设分区各自的负载均衡系数,包括:
4.如权利要求2所述的方法,其特征在于,所述负载均衡系数满足以下表达式:
5.如权利要求1所述的方法,其特征在于,所述最小非...
【专利技术属性】
技术研发人员:黄宏斌,李瞻哲,葛宁超,李璇,肖开明,张航,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。