【技术实现步骤摘要】
数据查询的方法及分布式联邦分析的方法
[0001]本公开涉及人工智能
,尤其涉及云计算、大数据
,可应用于智能云场景。
技术介绍
[0002]随着大数据技术的发展,以及传统数据库技术的进一步演进,企业在数据架构上的选择越来越多。目前一个企业中的数据通常存储在多个数据源,对于业务复杂的企业,数据源甚至数十个到上百个。对于数据的查询、挖掘分析,往往需要横跨多个业务系统,这时就需要具有联邦查询能力的分布式计算引擎,利用多个并行的节点从不同数据源中获取数据进行联邦分析。
技术实现思路
[0003]本公开提供了一种数据查询的方法及分布式联邦分析的方法。
[0004]根据本公开的一方面,提供了一种数据查询的方法,应用于分布式系统的工作节点,包括:
[0005]确定当前查询指令对应的目标数据源,其中,目标数据源中存储的目标属性数据被划分为多个区间;以及
[0006]在确定多个区间中的第一区间整体位于当前查询指令的数据查询范围且存在对应的目标缓存的情况下,根据当前查询指令和目标缓存,确定第一查询结果。
[0007]根据本公开的另一方面,提供了一种分布式联邦分析的方法,应用于分布式系统的调度节点,包括:
[0008]根据用户查询指令,从分布式系统中确定多个工作节点;
[0009]将用户查询指令拆分成的多个当前查询指令,一一对应的发送至多个工作节点,其中,多个工作节点根据本公开任一实施例的方法,基于多个当前查询指令执行数据查询;以及
[0010]根据多个 ...
【技术保护点】
【技术特征摘要】
1.一种数据查询的方法,应用于分布式系统的工作节点,包括:确定当前查询指令对应的目标数据源,其中,所述目标数据源中存储的目标属性数据被划分为多个区间;以及在确定所述多个区间中的第一区间整体位于所述当前查询指令的数据查询范围且存在对应的目标缓存的情况下,根据所述当前查询指令和所述目标缓存,确定第一查询结果。2.根据权利要求1所述的方法,其中,所述在确定所述多个区间中的第一区间整体位于所述当前查询指令的数据查询范围且存在对应的目标缓存的情况下,根据所述当前查询指令和所述目标缓存,确定第一查询结果,包括:确定所述多个区间中整体位于所述当前查询指令的数据查询范围的目标区间;在确定所述目标区间存在对应的目标缓存的情况下,将所述目标区间确定为第一区间;根据所述当前查询指令,基于所述目标缓存中存储的所述第一区间对应的目标属性数据,和/或,所述第一区间对应的历史查询指令的查询结果,确定第一查询结果。3.根据权利要求2所述的方法,其中,所述确定所述多个区间中整体位于所述当前查询指令的数据查询范围的目标区间,包括:将所述当前查询指令的数据查询范围与所述多个区间中的每个区间的首端数据和尾端数据进行比较,确定整体位于所述当前查询指令的数据查询范围中的目标区间。4.根据权利要求1至3任一项所述的方法,还包括:在确定所述多个区间中的第二区间的部分区间位于所述数据查询范围的情况下,根据所述当前查询指令,基于所述部分区间对应的目标属性数据,确定第二查询结果;根据所述第一查询结果和所述第二查询结果,确定所述当前查询指令的总查询结果。5.根据权利要求1至3任一项所述的方法,还包括:在确定所述多个区间中的第三区间整体位于所述当前查询指令的数据查询范围且不存在对应的目标缓存的情况下,根据所述当前查询指令,基于所述第三区间对应的目标属性数据,确定第三查询结果;根据所述第一查询结果和所述第三查询结果,确定所述当前查询指令的总查询结果。6.根据权利要求1至3任一项所述的方法,还包括:在确定所述多个区间中的第二区间的部分区间位于所述数据查询范围的情况下,根据所述当前查询指令,基于所述部分区间对应的目标属性数据,确定第二查询结果;在确定所述多个区间中的第三区间整体位于所述当前查询指令的数据查询范围且不存在对应的目标缓存的情况下,根据所述当前查询指令,基于所述第三区间对应的目标属性数据,确定第三查询结果;根据所述第一查询结果、所述第二查询结果和所述第三查询结果,确定所述当前查询指令的总查询结果。7.根据权利要求4所述的方法,其中,所述在确定所述多个区间中的第二区间的部分区间位于所述数据查询范围的情况下,根据所述当前查询指令,基于所述部分区间对应的目标属性数据,确定第二查询结果,包括:将所述当前查询指令的数据查询范围与所述多个区间中的每个区间的首端数据和尾端数据进行比较,确定整体不位于所述当前查询指令的数据查询范围中的第四区间和部分
区间位于所述数据查询范围的第二区间;根据所述第一区间和所述第四区间,将第一数据查询任务更新为第二数据查询任务,其中,所述第一数据查询任务用于查询所述目标数据源中存储的全部的目标属性数据和/或所述目标数据源中与所述全部的目标属性数据的关联数据;所述第二数据查询任务用于仅查询所述部分区间对应的目标属性数据;根据所述第二数据查询任务,获取所述部分区间对应的目标属性数据;根据所述当前查询指令,基于所述部分区间对应的目标属性数据,确定第二查询结果。8.根据权利要求5所述的方法,其中,所述在确定所述多个区间中的第三区间整体位于所述当前查询指令的数据查询范围且不存在对应的目标缓存的情况下,根据所述当前查询指令,基于所述第三区间对应的目标属性数据,确定第三查询结果,包括:将所述当前查询指令的数据查询范围与所述多个区间中的每个区间的首端数据和尾端数据进行比较,确定整体不位于所述当前查询指令的数据查询范围中的第四区间和整体位于所述数据查询范围且不存在对应的目标缓存的第三区间;根据所述第一区间和所述第四区间,将第一数据查询任务更新为第三数据查询任务,其中,所述第一数据查询任务用于查询所述目标数据源中存储的全部的目标属性数据和/或所述目标数据源中与所述全部的目标属性数据的关联数据;所述第三数据查询任务用于仅查询所述第三区间对应的目标属性数据;根据所述第三数据查询任务,获取所述第三区间对应的目标属性数据;根据所述当前查询指令,基于所述第三区间对应的目标属性数据,确定第三查询结果。9.根据权利要求5所述的方法,还包括:将所述第三查询结果和/或所述第三区间对应的目标属性数据,存入预设缓存。10.一种分布式联邦分析的方法,应用于分布式系统的调度节点,包括:根据用户查询指令,从所述分布式系统中确定多个工作节点;将所述用户查询指令拆分成的多个当前查询指令,一一对应的发送至所述多个工作节点,其中,所述多个工作节点根据权利要求1至9中任一项所述的方法,基于所述多个当前查询指令执行数据查询;以及根据所述多个工作节点反馈的查询结果,确定所述用户查询指令的联邦分析查询结果。11.一种数据查询的装置,应用于分布式系统的工作节点,包括:第一确定模块,用于确定当前查询指令对应的目标数据源,其中,所述目标数据源中存储的目标属性数据被划分为多个区间;以及第二确定模块,用于在确定所述多个区间中的第一区间整体位于所述当前查询指令的数据查询...
【专利技术属性】
技术研发人员:张奇伟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。