数据查询方法、装置、计算设备及存储介质制造方法及图纸

技术编号:28787383 阅读:17 留言:0更新日期:2021-06-09 11:22
提供了一种数据查询方法、装置、计算设备及存储介质。方法可以包括:将包括多个数据的数据集加载到分布式计算引擎的内存中;对多个数据进行分区,使得多个数据被分布到分布式计算引擎的内存的多个分区中;为每一个分区建立到图数据库的连接;通过多个分区中的每一个分区到图数据库的连接,针对多个分区中的多个数据,在图数据库中执行查询;以及将查询结果存储到目标数据库中。储到目标数据库中。储到目标数据库中。

【技术实现步骤摘要】
数据查询方法、装置、计算设备及存储介质


[0001]本公开涉及数据处理
,特别是涉及一种数据查询方法、装置、计算设备及存储介质。

技术介绍

[0002]图数据库(Graph Database,GDB)是一种以图结构进行语义查询,并使用顶点、边与属性来表示和存储数据的数据库。图数据库可以存储知识图谱,并且可以从图数据库中查询所需的知识。
[0003]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0004]在针对图数据库的数据查询时,尤其是在存在大量数据的应用场景下,会导致处理效率低下,难以满足业务需求。提供一种缓解、减轻或甚至消除上述问题中的一个或多个的机制将是有利的。
[0005]根据本公开的一方面,提供了一种数据查询方法,包括:将包括多个数据的数据集加载到分布式计算引擎的内存中;对多个数据进行分区,使得多个数据被分布到分布式计算引擎的内存的多个分区中;为每一个分区建立到图数据库的连接;通过多个分区中的每一个分区到图数据库的连接,针对多个分区中的多个数据,在图数据库中执行查询;以及将查询结果存储到目标数据库中。
[0006]根据本公开的另一方面,提供了一种数据查询装置,包括:数据加载单元,被配置成将包括多个数据的数据集加载到分布式计算引擎的内存中;数据分区单元,被配置成对多个数据进行分区,使得多个数据被分布到分布式计算引擎的内存的多个分区中;连接建立单元,被配置成为每一个分区建立到图数据库的连接;数据查询单元,被配置成通过多个分区中的每一个分区到图数据库的连接,针对多个分区中的多个数据,在图数据库中执行查询;以及结果存储单元,被配置成将查询结果存储到目标数据库中。
[0007]根据本公开的又另一方面,提供了一种计算设备,包括:存储器、处理器以及存储在存储器上的计算机程序,处理器被配置为执行计算机程序以实现根据本公开的实施例的数据查询方法的步骤
[0008]根据本公开的又另一方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现根据本公开的实施例的数据查询方法的步骤
[0009]根据本公开的再另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现根据本公开的实施例的数据查询方法的步骤。
[0010]根据在下文中所描述的实施例,本公开的这些和其它方面将是清楚明白的,并且将参考在下文中所描述的实施例而被阐明。
附图说明
[0011]在下面结合附图对于示例性实施例的描述中,本公开的更多细节、特征和优点被公开,在附图中:
[0012]图1是图示出根据示例性实施例的可以在其中实施本文描述的各种方法的示例系统的示意图;
[0013]图2是图示出根据示例性实施例的数据查询方法的流程图;
[0014]图3是根据本公开的示例性实施例的数据查询方法的数据流示意图;
[0015]图4是根据本公开的另一示例性实施例的数据查询方法的流程图;
[0016]图5是根据本公开的示例性实施例的数据查询方法的配置方法的流程图;
[0017]图6是图示出根据示例性实施例的数据查询装置的示意性框图;
[0018]图7是图示出能够应用于示例性实施例的示例性计算机设备的框图。
具体实施方式
[0019]在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
[0020]在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。如本文使用的,术语“多个”意指两个或更多,并且术语“基于”应解释为“至少部分地基于”。此外,术语“和/或”以及
“……
中的至少一个”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
[0021]下面结合附图详细描述本公开的示例性实施例。
[0022]图1是图示出根据示例性实施例的可以在其中实施本文描述的各种方法的示例系统100的示意图。
[0023]参考图1,该系统100包括客户端设备110、服务器120、以及将客户端设备110与服务器120通信地耦合的网络130。
[0024]客户端设备110包括显示器114和可经由显示器114显示的客户端应用(APP)112。客户端应用112可以为运行前需要下载和安装的应用程序或者作为轻量化应用程序的小程序(liteapp)。在客户端应用112为运行前需要下载和安装的应用程序的情况下,客户端应用112可以被预先安装在客户端设备110上并被激活。在客户端应用112为小程序的情况下,用户102可以通过在宿主应用中搜索客户端应用112(例如,通过客户端应用112的名称等)或扫描客户端应用112的图形码(例如,条形码、二维码等)等方式,在客户端设备110上直接运行客户端应用112,而无需安装客户端应用112。在一些实施例中,客户端设备110可以是任何类型的移动计算机设备,包括移动计算机、移动电话、可穿戴式计算机设备(例如智能手表、头戴式设备,包括智能眼镜,等)或其他类型的移动设备。在一些实施例中,客户端设备110可以替换地是固定式计算机设备,例如台式机、服务器计算机或其他类型的固定式计算机设备。
[0025]服务器120典型地为由互联网服务提供商(ISP)或互联网内容提供商(ICP)部署的
服务器。服务器120可以代表单台服务器、多台服务器的集群、分布式系统、或者提供基础云服务(诸如云数据库、云计算、云存储、云通信)的云服务器。将理解的是,虽然图1中示出服务器120与仅一个客户端设备110通信,但是服务器120可以同时为多个客户端设备提供后台服务。
[0026]网络130的示例包括局域网(LAN)、广域网(WAN)、个域网(PAN)、和/或诸如互联网之类的通信网络的组合。网络130可以是有线或无线网络。在一些实施例中,使用包括超文本标记语言(HTML)、可扩展标记语言(XML)等的技术和/或格式来处理通过网络130交换的数据。此外,还可以使用诸如安全套接字层(SSL)、传输层安全(TLS)、虚拟专用网络(VPN)、网际协议安全(IPsec)等加密技术来加密所有或者一些链路。在一些实施例中,还可以使用定制和/或专用数据通信技术来取代或者补充上述数据通信技术。
[0027]为了本公开实施例的目的,在图1的示例中,客户端应用112可以为数据处理应用程序,包括数据查询应用程序或数据库管理应用程序,该数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据查询方法,包括:将包括多个数据的数据集加载到分布式计算引擎的内存中;对所述多个数据进行分区,使得所述多个数据被分布到所述分布式计算引擎的内存的多个分区中;为每一个分区建立到图数据库的连接;通过所述多个分区中的每一个分区到所述图数据库的连接,针对所述多个分区中的多个数据,在所述图数据库中执行查询;以及将查询结果存储到目标数据库中。2.根据权利要求1所述的方法,其中,针对所述多个分区中的所述多个数据,在所述图数据库中执行的查询是并行查询。3.根据权利要求1所述的方法,其中,为每一个分区建立到图数据库的连接包括:在每一个分区中建立到所述图数据库的连接实例,其中,每个连接实例能够调用所述图数据库的查询接口;并且其中,针对所述多个分区中的所述多个数据,在所述图数据库中执行查询包括:通过在每一个分区中建立的连接实例调用所述图数据库的查询接口,以从所述图数据库中查询与所述分区中的数据相关联的信息作为针对所述分区的查询结果。4.根据权利要求3所述的方法,还包括:在每一个分区中建立到所述目标数据库的连接,并且其中,将查询结果存储到目标数据库中包括:将与每一个分区中的数据相关联的信息作为针对所述分区的查询结果保存到所述分区中;以及通过所述分区到所述目标数据库的连接,将针对所述分区的查询结果存储到所述目标数据库中。5.根据权利要求4所述的方法,其中,在每一个分区中建立到所述目标数据库的连接发生在针对所述多个分区中的所述多个数据在所述图数据库中执行查询之前。6.根据权利要求4所述的方法,其中,在将与每一个分区中的数据相关联的信息作为针对所述分区的查询结果保存到所述分区中之后,所述方法还包括:在所述分布式计算引擎的主节点中,对针对所述多个分区的多个查询结果进行汇总计算;在所述主节点中建立到所述目标数据库的连接;以及通过所述主节点到所述目标数据库的连接,将汇总计算的结果存储到所述目标数据库中。7.根据权利要求6所述的方法,其中,对针对所述多个分区的多个查询结果进行汇总计算包括:对所述多个查询结果进行统计分析。8.根据权利要求6所述的方法,其中,对针对所述多个分区的多个查询结果进行汇总计算包括:对所述多个查询结果进行业务指标分析。9.根据权利要求1所述的方法,其中,对所述多个数据进行分区使得所述多个数据被分布到所述分布式计算引擎...

【专利技术属性】
技术研发人员:王海霖陈先华张灵星
申请(专利权)人:北京中经惠众科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1