数据查询方法、装置及电子设备制造方法及图纸

技术编号:35016762 阅读:14 留言:0更新日期:2022-09-21 15:21
本公开关于一种数据查询方法、装置及电子设备。应用于图数据库,所述方法包括:响应于针对图数据库的查询请求,确定所述查询请求指定的查询数据对应在所述图数据库中的数据节点,并以所述数据节点为起始节点执行以下遍历查询:遍历所述图数据库中与所述起始节点关联的出度边,并从所述出度边中筛选出第一数量的出度边;其中,所述出度边表示所述图数据库中从所述起始节点出发指向其他数据节点的有向边;将筛选出的出度边指向的目的数据节点确定为新的起始节点,重复执行上述遍历查询,直到确定出的新的起始节点没有关联的出度边时结束遍历查询;将所述遍历查询过程中确定的所述目的数据节点对应的数据返回给发起所述查询请求的请求方。求的请求方。求的请求方。

【技术实现步骤摘要】
数据查询方法、装置及电子设备


[0001]本公开涉及计算机
,尤其涉及一种数据查询方法、装置及电子设备。

技术介绍

[0002]图数据库是一种针对海量的图网络结构形式的数据(也称图数据)存储和遍历查询而设计的数据库。
[0003]在实际应用中大规模的图数据通常遵循幂律分布,超级节点关联的出度边或入度边的规模可能超过百万、甚至千万级别。这样的情况下,响应查询请求以在图数据库中进行遍历查询时,需要进行多跳遍历,而每跳遍历的结果数量也将成指数增加,从而导致爆炸性结果。假设图数据中节点的出度边的数量平均为100条,那么经过3跳遍历的结果将达到100万条。此时对图数据库的I/O、CPU、网络带宽等资源将消耗巨大,导致查询耗时大幅上升。
[0004]因此,如何降低图数据库进行遍历查询的耗时成为亟待解决的问题。

技术实现思路

[0005]本公开提供一种数据查询方法、装置及电子设备,以至少解决相关技术中存在图数据库进行遍历查询的耗时较长的问题。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种数据查询方法,应用于图数据库,所述方法包括:响应于针对图数据库的查询请求,确定所述查询请求指定的查询数据对应在所述图数据库中的数据节点,并以所述数据节点为起始节点执行以下遍历查询:遍历所述图数据库中与所述起始节点关联的出度边,并从所述出度边中筛选出第一数量的出度边;其中,所述出度边表示所述图数据库中从所述起始节点出发指向其他数据节点的有向边;将筛选出的出度边指向的目的数据节点确定为新的起始节点,重复执行上述遍历查询,直到确定出的新的起始节点没有关联的出度边时结束遍历查询;将所述遍历查询过程中确定的所述目的数据节点对应的数据返回给发起所述查询请求的请求方。
[0006]可选的,在所述将筛选出的出度边指向的目的数据节点确定为新的起始节点之前,还包括:从所述第一数量的出度边中,筛选出第二数量的目标出度边;所述将筛选出的出度边指向的目的数据节点确定为新的起始节点,包括:将筛选出的所述目标出度边指向的目的数据节点确定为新的起始节点。
[0007]可选的,所述图数据库中的出度边具有时间属性,所述时间属性表示所述出度边指向的其他数据节点存储到所述图数据库中的存储时刻;所述遍历所述图数据库中与所述起始节点关联的出度边,包括:根据所述查询请求指定的时间范围,遍历所述图数据库中与所述起始节点关联、
并且时间属性位于所述时间范围内的出度边。
[0008]可选的,所述从所述出度边中筛选出第一数量的出度边,包括:获取与所述起始节点关联的各个出度边的特征值;其中,所述特征值用于表征出度边指向的目的数据节点的重要程度;基于所述特征值,从与所述起始节点关联的各个出度边中确定出所述第一数量的出度边。
[0009]可选的,所述基于所述特征值,从与所述起始节点关联的各个出度边中确定出所述第一数量的出度边,包括:基于所述特征值的大小,对与所述起始节点关联的各个出度边进行排序,从大到小依次获取第一数量的出度边。
[0010]可选的,所述获取与所述起始节点关联的各个出度边的特征值,包括:获取各个出度边对应的权重属性;其中,所述权重属性包括出度边指向的目的数据节点的入度边的数量,所述入度边表示所述图数据库中从其他数据节点出发指向所述目的数据节点的有向边;基于所述出度边指向的目的数据节点的入度边的数量,计算出度边的特征值;其中,所述入度边的数量与所述特征值成正相关关系。
[0011]可选的,所述基于所述出度边指向的目的数据节点的入度边的数量,计算出度边的特征值,包括:基于加权随机采样算法,为各个出度边生成对应的随机数;根据各个出度边指向的目的数据节点的入度边的数量和各个出度边的随机数,计算各个出度边的特征值。
[0012]根据本公开实施例的第二方面,提供一种数据查询装置,应用于图数据库,包括:响应单元,被配置为执行响应于针对图数据库的查询请求,确定所述查询请求指定的查询数据对应在所述图数据库中的数据节点,并以所述数据节点为起始节点执行以下遍历查询:遍历单元,被配置为执行遍历所述图数据库中与所述起始节点关联的出度边,并从所述出度边中筛选出第一数量的出度边;其中,所述出度边表示所述图数据库中从所述起始节点出发指向其他数据节点的有向边;循环单元,被配置为执行将筛选出的出度边指向的目的数据节点确定为新的起始节点,重复执行上述遍历查询,直到确定出的新的起始节点没有关联的出度边时结束遍历查询;返回单元,被配置为执行将所述遍历查询过程中确定的所述目的数据节点对应的数据返回给发起所述查询请求的请求方。
[0013]可选的,在所述循环单元之前,还包括:筛选单元,被配置为执行从所述第一数量的出度边中,筛选出第二数量的目标出度边;所述循环单元,进一步被配置为执行将筛选出的所述目标出度边指向的目的数据节点确定为新的起始节点。
[0014]可选的,所述图数据库中的出度边具有时间属性,所述时间属性表示所述出度边
指向的其他数据节点存储到所述图数据库中的存储时刻;所述遍历单元中遍历所述图数据库中与所述起始节点关联的出度边,进一步包括:根据所述查询请求指定的时间范围,遍历所述图数据库中与所述起始节点关联、并且时间属性位于所述时间范围内的出度边。
[0015]可选的,所述遍历单元中从所述出度边中筛选出第一数量的出度边,进一步包括:获取子单元,被配置为执行获取与所述起始节点关联的各个出度边的特征值;其中,所述特征值用于表征出度边指向的目的数据节点的重要程度;确定子单元,被配置为执行基于所述特征值,从与所述起始节点关联的各个出度边中确定出所述第一数量的出度边。
[0016]可选的,所述确定子单元,进一步被配置为执行基于所述特征值的大小,对与所述起始节点关联的各个出度边进行排序,从大到小依次获取第一数量的出度边。
[0017]可选的,所述获取子单元,进一步被配置为执行获取各个出度边对应的权重属性;其中,所述权重属性包括出度边指向的目的数据节点的入度边的数量,所述入度边表示所述图数据库中从其他数据节点出发指向所述目的数据节点的有向边;基于所述出度边指向的目的数据节点的入度边的数量,计算出度边的特征值;其中,所述入度边的数量与所述特征值成正相关关系。
[0018]可选的,所述获取子单元中基于所述出度边指向的目的数据节点的入度边的数量,计算出度边的特征值,进一步包括:基于加权随机采样算法,为各个出度边生成对应的随机数;根据各个出度边指向的目的数据节点的入度边的数量和各个出度边的随机数,计算各个出度边的特征值。
[0019]根据本公开实施例的第三方面,一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现前述任一项所述的数据查询方法。
[0020]根据本公开实施例的第四方面,一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行前述任一项所述的数据查询方法。
[0021]根据本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据查询方法,其特征在于,应用于图数据库,所述方法包括:响应于针对图数据库的查询请求,确定所述查询请求指定的查询数据对应在所述图数据库中的数据节点,并以所述数据节点为起始节点执行以下遍历查询:遍历所述图数据库中与所述起始节点关联的出度边,并从所述出度边中筛选出第一数量的出度边;其中,所述出度边表示所述图数据库中从所述起始节点出发指向其他数据节点的有向边;将筛选出的出度边指向的目的数据节点确定为新的起始节点,重复执行上述遍历查询,直到确定出的新的起始节点没有关联的出度边时结束遍历查询;将所述遍历查询过程中确定的所述目的数据节点对应的数据返回给发起所述查询请求的请求方。2.根据权利要求1所述的方法,其特征在于,在所述将筛选出的出度边指向的目的数据节点确定为新的起始节点之前,还包括:从所述第一数量的出度边中,筛选出第二数量的目标出度边;所述将筛选出的出度边指向的目的数据节点确定为新的起始节点,包括:将筛选出的所述目标出度边指向的目的数据节点确定为新的起始节点。3.根据权利要求1所述的方法,其特征在于,所述图数据库中的出度边具有时间属性,所述时间属性表示所述出度边指向的其他数据节点存储到所述图数据库中的存储时刻;所述遍历所述图数据库中与所述起始节点关联的出度边,包括:根据所述查询请求指定的时间范围,遍历所述图数据库中与所述起始节点关联、并且时间属性位于所述时间范围内的出度边。4.根据权利要求1所述的方法,其特征在于,所述从所述出度边中筛选出第一数量的出度边,包括:获取与所述起始节点关联的各个出度边的特征值;其中,所述特征值用于表征出度边指向的目的数据节点的重要程度;基于所述特征值,从与所述起始节点关联的各个出度边中确定出所述第一数量的出度边。5.根据权利要求4所述的方法,其特征在于,所述基于所述特征值,从与所述起始节点关联的各个出度边中确定出所述第一数量的出度边,包括:基于所述特征值的大小,对与所述起始节点关联的各个出度边进行排序,从大到小依次获取第一数量的出度边。6.根据权利要求4所述的方法,其特征在于,所述获取与所述起始节点关联的各个出度边的特征值,包括:获取各个出度边对应的权重属性;其中,所述权重属性包括出度边指向的目的数据节点的入度边的数量,所述入度边表示所述图数据库中从其他数据节点出发指向所述目的数据节点的有向边;基于所述出度边指向的目的数据节点的入度边的数量,计算出度边的特征值;其中,所述入度边的数量与所述特征值成正相关关系。7.根据权利要求6所述的方法,其特征在于,所述基于所述出度边指向的目的数据节点的入度边的数量,计算出度边的特征值,包括:
基于加权随机采样算法,为各个出度边生成对应的随机数;根据各个出度边指向的目的数据节点的入度边的数量和各个出度边的随机数,计算各个出度边的特征值。8.一种数据查询装置,其特征在于,应用于图数据库,包括:响应单元,被配置为执行响应于针对图数据库的查询请求,确定所述查询请求指定的查询数据对应在所述图数据库中的数据节点,并以所述数据节点为起始节点执行以下遍历查询:遍历单元,被配置为执行遍历所述图数据库中与所述起始节点关联的出度边,并从所述出度边中筛选出第一数量的出...

【专利技术属性】
技术研发人员:倪雯
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1