【技术实现步骤摘要】
基于图剖分的分布式图数据库的存储与查询方法
[0001]本专利技术涉及分布式存储
,尤其涉及一种基于图剖分的分布式图数据库的存储与查询方法。
技术介绍
[0002]图结构数据存储是基于实体和关系的数据结构的数据存储体系,在知识图谱、社交关系、金融风控等领域的数据存储技术中广泛应用。图结构数据存储主要有关系型数据库、单机图数据库、分布式图数据库等方案。其中,关系型存储图结构数据需要建立一个关系模型,基于这种的关系模型来记录实体A和B的上下游关系,并通过JOIN操作来完成各种查询场景,但使用JOIN操作查询效率低,且关系型数据库的结构设计对反向查询并不友好,不利于查询实体的上游节点。而对于单机图数据库,通过对顶点和边的建模很好地解决了图结构数据的存储和查询问题,在查询语句的开发效率和查询性能上都有较大提升,但亿级数据量超出了单机承受极限,并且单机图数据库缺乏数据扩展能力。分布式图数据库通过集群的部署方式将顶点和边的数据部署在不同的服务器上,以此将大规模数据转换为更小规模的数据进行分散存储,并设计分布式的查询算法实现不同的服 ...
【技术保护点】
【技术特征摘要】
1.一种基于图剖分的分布式图数据库的存储方法,其特征在于,包括:获取原始图数据库的结构数据;基于最小割边原则,将所述原始图数据库的结构数据剖分为多个子图;计算每个子图的大小;基于所述子图的大小,将不同子图所对应的结构数据写入不同的分布式存储节点。2.根据权利要求1所述的基于图剖分的分布式图数据库的存储方法,其特征在于,所述获取原始图数据库的结构数据,包括:获取所述结构数据所包含的节点、边以及边的权值。3.根据权利要求2所述的基于图剖分的分布式图数据库的存储方法,其特征在于,所述计算每个子图的大小,包括:统计当前子图中的节点数量和边数量;将所述节点数量和边数量进行求和,作为当前子图的大小。4.根据权利要求2所述的基于图剖分的分布式图数据库的存储方法,其特征在于,所述节点为实体,所述边为实体间的关系。5.根据权利要求4所述的基于图剖分的分布式图数据库的存储方法,其特征在于,还包括:当需要写入新的节点时,根据所述新的节点的属性或类型确定其所属子图,将所述新的节点写入所属子图所对应的存储节点;当需要写入新的关系时,根据与所述新的关系相关联的节点的属性,判断其所属子图,将所述新的关系写入所属子图所对应的存储节点。6.一种基于图剖分的分布式图数据库的查询方法,其特征在于,包括:接收对原始图数据库的查询请求,所述原始图数据库是根据权利要求1
‑
5任一所述的方法存储的;基于所述查询请求的结构数据,确定所述结构数据的所属子图;将所述查询请求重定向到存储所属子图的分布式存储节点。7.一种基于图剖分的分布式存储服务器,其特征在于,包括:获取单...
【专利技术属性】
技术研发人员:孙会峰,邢婷,冷小萱,魏小敏,
申请(专利权)人:北京智源人工智能研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。