【技术实现步骤摘要】
节点分析方法、装置、设备及存储介质
本专利技术实施例涉及数据库
,尤其涉及节点分析方法、装置、设备及存储介质。
技术介绍
图数据库是NoSQL数据库的一种类型,它应用图形理论存储实体之间的关系信息。最常见的例子,就是社会网络中人与人之间的关系。例如JanusGraph是一个可扩展的图数据库,可以把包含数千亿个节点和边的图存储在多机集群上,使用模块化接口来做数据持久化、索引和客户端访问。ApacheHBase是它支持的一种典型后端存储系统。图数据库中一般存在一些超级节点,超级节点是指拥有的边数对整个网络的边数占比很高的节点。图数据库对与上述超级节点有关的增删改操作效率很差,查询过程中遇到超级节点也会使查询结果爆炸导致图遍历不能继续进行,因此识别出图数据库中的超级节点是非常有必要的。在数据量非常大时,采用传统的图遍历方式来发现超级节点不仅效率较低,也会对图数据库正常服务产生较大的压力,甚至无法计算并得到全部超级节点。
技术实现思路
本专利技术实施例提供了节点分析方法、装置、设备及存储介质 ...
【技术保护点】
1.一种节点分析方法,其特征在于,包括:/n获取图数据库的节点信息和边信息;/n基于所述节点信息和所述边信息确定与节点关联的边;/n针对每个节点,统计与节点关联的边数量;/n在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点。/n
【技术特征摘要】 【专利技术属性】
1.一种节点分析方法,其特征在于,包括:
获取图数据库的节点信息和边信息;
基于所述节点信息和所述边信息确定与节点关联的边;
针对每个节点,统计与节点关联的边数量;
在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点。
2.根据权利要求1所述的方法,其特征在于,获取图数据库的节点信息和边信息,包括:
加载所述图数据库的元数据文件;
读取并解析所述图数据库的原始记录;
从所述原始记录中获取图数据库的节点信息和边信息。
3.根据权利要求1所述的方法,其特征在于,统计与节点关联的边数量,包括:
统计与所述节点关联的边的总数量;
相应的,在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点,包括:
在所述与节点关联的边总数量大于第一预设阈值时,确定所述节点是超级节点。
4.根据权利要求1所述的方法,其特征在于,统计与节点关联的边数量,包括:
获取与所述节点关联的边类型;
统计所述边类型分别对应的边数量;
相应的,在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点,包括:
在任意一个所述边类型对应的边数量超过该边类型对应的第二预设阈值时,确定所述节点标识对应的节点是超级节点。
5.根据权利要求1所述的方法,其特征在于,获取图数据库的节点标识和边标识之前,还包括:
技术研发人员:李艳红,冯宇波,张俊杰,毛勇岗,
申请(专利权)人:北京锐安科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。