节点分析方法、装置、设备及存储介质制造方法及图纸

技术编号:27975524 阅读:28 留言:0更新日期:2021-04-06 14:09
本发明专利技术公开了一种节点分析方法、装置、设备及存储介质中,所述节点分析方法包括:获取图数据库的节点信息和边信息,基于节点信息和边信息确定与节点关联的边,针对每个节点,统计与节点关联的边数量,在与节点关联的边数量大于预设阈值时,确定节点是超级节点。本实施例中,通过节点和边的关联关系,确定每个节点拥有的边数量,进而根据边数量确定超级节点,不需要对图数据库中的每个节点进行遍历,提高查找超级节点的效率,减少节点查找对图数据库正常服务时的压力。

【技术实现步骤摘要】
节点分析方法、装置、设备及存储介质
本专利技术实施例涉及数据库
,尤其涉及节点分析方法、装置、设备及存储介质。
技术介绍
图数据库是NoSQL数据库的一种类型,它应用图形理论存储实体之间的关系信息。最常见的例子,就是社会网络中人与人之间的关系。例如JanusGraph是一个可扩展的图数据库,可以把包含数千亿个节点和边的图存储在多机集群上,使用模块化接口来做数据持久化、索引和客户端访问。ApacheHBase是它支持的一种典型后端存储系统。图数据库中一般存在一些超级节点,超级节点是指拥有的边数对整个网络的边数占比很高的节点。图数据库对与上述超级节点有关的增删改操作效率很差,查询过程中遇到超级节点也会使查询结果爆炸导致图遍历不能继续进行,因此识别出图数据库中的超级节点是非常有必要的。在数据量非常大时,采用传统的图遍历方式来发现超级节点不仅效率较低,也会对图数据库正常服务产生较大的压力,甚至无法计算并得到全部超级节点。
技术实现思路
本专利技术实施例提供了节点分析方法、装置、设备及存储介质,提高查找超级节点的效率,减少节点查找对图数据库正常服务时的压力。第一方面,本专利技术实施例提供了一种节点分析方法,包括:获取图数据库的节点信息和边信息;基于所述节点信息和所述边信息确定与节点关联的边;针对每个节点,统计与节点关联的边数量,在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点。进一步的,获取图数据库的节点信息和边信息,包括:加载所述图数据库的元数据文件;读取并解析所述图数据库的原始记录;从所述原始记录中获取图数据库的节点信息和边信息。进一步的,统计与节点关联的边数量,包括:统计与所述节点关联的边的总数量;相应的,在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点,包括:在所述与节点关联的边总数量大于第一预设阈值时,确定所述节点是超级节点。进一步的,统计与节点关联的边数量,包括:获取与所述节点关联的边类型;统计所述边类型分别对应的边数量;相应的,在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点,包括:在任意一个所述边类型对应的边数量超过该边类型对应的第二预设阈值时,确定所述节点标识对应的节点是超级节点。进一步的,获取图数据库的节点标识和边标识之前,还包括:加载所述图数据库的配置信息;通过所述配置信息初始化所述图数库管理接口;通过所述图数库管理接口连接所述所述图数库。其中,所述配置信息包括:所述图数据库后端存储系统主机名、端口号、表名称和所述预设阈值。进一步的,确定所述节点是超级节点之后,还包括:按照边数量由大到小的顺序,将所有超级节点进行排序;将排序后的所有超级节点对应的节点信息、边信息和边数量发送至预设文件中。第二方面,本专利技术实施例还提供了一种节点分析装置,包括:信息获取模块,用于获取图数据库的节点信息和边信息;关联边确定模块,用于基于所述节点信息和所述边信息确定与节点关联的边;边数量统计模块,用于针对每个节点,统计与节点关联的边数量,超级节点确定模块,用于在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点。第三方面,本专利技术实施例还提供了一种节点分析设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述第一方面中提供的节点分析方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有一个或多个计算机程序,该程序被处理器执行时实现如上述第一方面中提供的节点分析方法。上述实施例提供的节点分析方法、装置、设备及存储介质中,所述节点分析方法包括:获取图数据库的节点信息和边信息,基于节点信息和边信息确定与节点关联的边,针对每个节点,统计与节点关联的边数量,在与节点关联的边数量大于预设阈值时,确定节点是超级节点。本实施例中,通过节点和边的关联关系,确定每个节点拥有的边数量,进而根据边数量确定超级节点,不需要对图数据库中的每个节点进行遍历,提高查找超级节点的效率,减少节点查找对图数据库正常服务时的压力。附图说明图1为本专利技术实施例提供的节点分析方法的流程图;图2为本专利技术实施例提供的一种基于HBase存储的图数据库超级节点分析方法的流程图;图3为本专利技术实施例提供的一种基于HBase存储的图数据库元数据处理过程的流程图;图4为本专利技术实施例提供的一种基于HBase存储的图数据库超级节点分析处理过程的流程图;图5为本专利技术实施例提供的一种基于HBase存储的图数据库超级节点分析系统的结构示意图;图6为本专利技术实施例提供的节点分析装置的结构示意图;图7为本专利技术实施例提供的一种设备的硬件结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。图1为本专利技术实施例提供的节点分析方法的流程图,该方法适用于在图数据库中查找超级节点的情况,该方法可以由节点分析装置执行,该装置可以由硬件和/或软件实现。该节点分析装置可以是两个或多个物理实体构成,也可以是一个物理实体构成,并一般集成在计算机设备中。需要说明的是,本实施例所提供的节点分析方法具体可以在计算机设备上使用,并可认为具体由集成在计算机设备上的节点分析装置执行,其中,计算机设备具体可以是包括了处理器、存储器、输入装置和输出装置的计算机设备。如笔记本电脑、台式计算机、平板电脑、智能终端等。具体的,如图1所示,本专利技术实施例提供的节点分析方法,具体包括如下操作:S11、获取图数据库的节点信息和边信息。其中,上述节点信息可以是包括节点ID,节点标签和节点属性等信息。边信息可以是包括边标签,边属性,边连接的相关源节点ID,边连接的相关目标节点ID等信息。其中,图数据库是NoSQL数据库的一种类型,它应用图形理论存储实体之间的关系信息。本实施例中的图数据库优选为JanusGraph数据库,其中,JanusGraph数据库是一个可扩展的图数据库,可以把包含数千亿个节点和边的图存储在多机集群上,使用模块化接口来做数据持久化、索引和客户端访问。在一个实施方式中,获取图数据库的节点信息和边信息,包括:加载所述图数据库的元数据文件,读取并解析所述图数据库的原始记录,从所述原始记录中获取图数据库的节点信息和边信息。在一个实施方式中,获取图数据库的节点标识和边标识之前,还包括:加载所述图数据库的配置信息;通过所述配置信息初始化所述图数库管理接口;通过所述图数库管理接口连接所述所述图数库。其中,所本文档来自技高网...

【技术保护点】
1.一种节点分析方法,其特征在于,包括:/n获取图数据库的节点信息和边信息;/n基于所述节点信息和所述边信息确定与节点关联的边;/n针对每个节点,统计与节点关联的边数量;/n在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点。/n

【技术特征摘要】
1.一种节点分析方法,其特征在于,包括:
获取图数据库的节点信息和边信息;
基于所述节点信息和所述边信息确定与节点关联的边;
针对每个节点,统计与节点关联的边数量;
在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点。


2.根据权利要求1所述的方法,其特征在于,获取图数据库的节点信息和边信息,包括:
加载所述图数据库的元数据文件;
读取并解析所述图数据库的原始记录;
从所述原始记录中获取图数据库的节点信息和边信息。


3.根据权利要求1所述的方法,其特征在于,统计与节点关联的边数量,包括:
统计与所述节点关联的边的总数量;
相应的,在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点,包括:
在所述与节点关联的边总数量大于第一预设阈值时,确定所述节点是超级节点。


4.根据权利要求1所述的方法,其特征在于,统计与节点关联的边数量,包括:
获取与所述节点关联的边类型;
统计所述边类型分别对应的边数量;
相应的,在所述与节点关联的边数量大于预设阈值时,确定所述节点是超级节点,包括:
在任意一个所述边类型对应的边数量超过该边类型对应的第二预设阈值时,确定所述节点标识对应的节点是超级节点。


5.根据权利要求1所述的方法,其特征在于,获取图数据库的节点标识和边标识之前,还包括:

【专利技术属性】
技术研发人员:李艳红冯宇波张俊杰毛勇岗
申请(专利权)人:北京锐安科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1