一种抽样查询的方法和装置制造方法及图纸

技术编号:18860537 阅读:23 留言:0更新日期:2018-09-05 14:10
本申请提供了一种抽样查询的方法和装置。该方法包括:获取查询条件;根据抽样查询比例,从M个索引分区中确定N个目标索引分区,以使得N与M的比值与该抽样查询比例对应,其中,该M个索引分区为根据该查询条件确定的待查询索引分区,M为大于1的整数,N为大于或等于1的整数,并且,N小于M;根据该查询条件在该N个目标索引分区中查询数据,并根据查询到的数据生成查询结果,该查询结果包括以下至少一项:该M个索引分区中满足该查询条件的数据的数量、该N个目标索引分区中满足该查询条件的数据;反馈该查询结果。这样,能够有效减少反馈查询结果的响应时延,提高用户体验。

Method and device for sampling inquiry

The application provides a method and device for sampling inquiries. The method includes: obtaining the query condition; determining N target index partitions from M index partitions according to the sample query ratio, so that the ratio of N to M corresponds to the sample query ratio. The M index partitions are the index partitions to be queried according to the query condition, M is an integer greater than 1, N is greater than or equal. The query result includes at least one item: the number of data satisfying the query condition in the M index partitions, the number of data satisfying the query condition in the N target index partitions, and the number of data satisfying the query condition in the N target index partitions. Conditional data; feedback the result of the query. In this way, the response latency of feedback query results can be effectively reduced and user experience improved.

【技术实现步骤摘要】
一种抽样查询的方法和装置
本申请涉及存储领域,更具体地,涉及存储领域中一种抽样查询的方法和装置。
技术介绍
在存储系统中,通过索引可以快速地查找数据。在分布式系统中,可以基于数据生成用于查询数据的索引信息。为了提升系统的读写性能,可以将索引信息分别存储至多个索引分区,这样,服务器在接收到客户端发送的查询请求后,可以同时在多个索引分区中查询满足该查询条件的数据,最后将多个索引分区中所有满足该查询条件的数据反馈给客户端。但是,当查询涉及的查询结果中的内容较多,并且,用户不需要关注所有能够满足查询条件的数据,这种查询方式的响应较长,影响用户体验。因此,亟需提供一种技术,能够提高用户体验。
技术实现思路
本申请提供一种抽样查询的方法和装置,能够有效减少反馈查询结果的响应时延,提高用户体验。第一方面,提供了一种抽样查询的方法,该方法包括:获取查询条件;根据抽样查询比例,从M个索引分区中确定N个目标索引分区,以使得N与M的比值与所述抽样查询比例对应,其中,所述M个索引分区为根据所述查询条件确定的待查询索引分区,M为大于1的整数,N为大于或等于1的整数,并且,N小于M;根据所述查询条件在所述N个目标索引分区中查询数据,并根据查询到的数据生成查询结果,所述查询结果包括以下至少一项:所述M个索引分区中满足所述查询条件的数据的数量、所述N个目标索引分区中满足所述查询条件的数据;反馈所述查询结果。因此,本申请实施例提供的抽样查询的方法,一方面,通过抽样查询比例从基于查询条件确定的M个索引分区中确定部分索引分区(即,N个目标索引分区),进而可以仅在该N个目标索引分区中进行数据查询,生成包括该M个索引分区中满足该查询条件的数据的数量和该目标索引分区中满足所述查询条件的数据中的至少一项的查询结果,避免了现有技术中由于必须在该M个索引分区的查询结果响应后才反馈查询结果而导致的响应时延较长的问题,有效的减少了反馈查询结果的响应时延,提高了用户体验;另一方面,通过在该M个索引分区中的N个目标索引分区中进行数据查询,相比于现有技术中必须在该M个索引分区进行数据查询,本申请实施例占用了较少的计算资源,这样,可以使得设备在该M个索引分区中的其他索引分区中针对其他查询条件进行数据查询,增加了查询并发度。在一种可选的设计中,所述根据查询到的数据生成查询结果,包括:确定从所述N个目标索引分区中查询到的数据的数量;根据确定的数据的数量和所述抽样查询比例,估算所述M个索引分区中满足所述查询条件的数据的数量,所述查询结果包括所述M个索引分区中满足所述查询条件的数据的数量。在一种可选的设计中,所述方法还包括:获取所述M个索引分区所属的M个计算节点的负载信息,所述负载信息记录计算节点的负载;以及,所述根据抽样查询比例,从M个索引分区中确定N个目标索引分区,包括:根据所述M个计算节点的负载信息,从所述M个计算节点中选择负载最小的N个目标计算节点,所述N个目标计算节点对应的索引分区为所述N个目标索引分区。因此,本申请实施例提供的抽样查询的方法,通过抽样查询比例和对应于查询条件的计算节点的负载信息,将负载最小的N个目标计算节点中的索引分区确定为N个目标索引分区,可以使得包括该N个目标计算节点在内的计算节点的负载比较均衡,并且,通过该N个目标索引分区进行数据查询,也能更进一步提高查询速度。在一种可选的设计中,在所述根据查询到的数据生成查询结果之前,所述方法还包括:计算基于所述查询条件进行数据查询过程中消耗的计算资源的资源消耗值;在所述N个目标计算节点的负载中加上所述资源消耗值,得到所述N个目标计算节点的更新的负载信息。因此,本申请实施例提供的抽样查询的方法,设备在根据查询到的数据生成查询结果之前,通过在N个目标计算节点的负载中加上查询条件的资源消耗值,生成N个目标计算节点的更新的负载信息,可以使得设备为后续的其他查询条件选择目标索引分区时提供真实有效的数据,从而尽可能使得计算节点的负载趋于均匀化,有利于减少响应时延。在一种可选的设计中,所述计算基于所述查询条件进行数据查询过程中消耗的计算资源的资源消耗值,包括:将所述查询条件分解为至少一个分词,所述至少一个分词中的每个分词对应一个查询节点;计算每个所述查询节点的资源消耗值;对所述至少一个分词对应的所有查询节点的资源消耗值进行求和,得到所述查询条件的资源消耗值。在一种可选的设计中,在所述根据查询到的数据生成查询结果之后,所述方法还包括:在所述N个目标计算节点的更新的负载信息所指示的负载中减去所述资源消耗值。因此,本申请实施例提供的抽样查询的方法,设备在根据查询到的数据生成查询结果之后,通过在N个目标计算节点的负载中减去查询条件的资源消耗值,以释放计算资源,可以使得设备为后续的其他查询条件选择目标索引分区时提供真实有效的数据,从而尽可能使得计算节点的负载趋于均匀化,有利于减少响应时延。在一种可选的设计中,所述查询条件包括所述抽样查询比例。第二方面,提供了一种抽样查询的装置,用于执行第一方面或第一方面的任意可能的实现方式中的方法。具体地,该装置包括用于执行第一方面或第一方面的任意可能的实现方式中的方法的单元。第三方面,提供了一种抽样查询的设备,所述设备包括处理器和存储器;所述存储器用于存储计算机执行指令,所述处理器和所述存储器之间通过内部连接通路互相通信。当所述设备运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述设备执行第一方面或第一方面的任意可能的实现方式中的各个过程。第四方面,提供了一种计算机存储介质,所述计算机存储介质包括计算机执行指令,当计算机的处理器执行所述计算机执行指令时,所述计算机执行上述第一方面或第一方面的任意可能的实现方式中的各个过程。第五方面,提供了一种芯片,所述芯片包括处理器和存储器,所述处理器用于执行所述存储器存储的指令,当所述指令被执行时,所述处理器可以实现第一方面或第一方面的任意可能的实现方式中的各个过程。附图说明图1是适用于本申请实施例的数据存储系统的示意图。图2是现有技术中基于查询条件在多个索引分区中查询数据的示意图。图3是根据本申请实施例的抽样查询的方法的示意性流程图。图4是根据本申请实施例的抽样查询的装置的示意性框图。图5是根据本申请实施例的抽样查询的装置的示意性结构图。图6是根据本申请实施例的芯片的示意性结构图。具体实施方式下面将结合附图,对本申请中的技术方案进行描述。图1所示为适用于本申请实施例的数据存储系统的示意图。该数据存储系统100包括终端设备110和抽样查询的设备120,该终端设备可以通过有线或无线网络与设备120连接。终端设备110具有请求数据查询功能。具体而言,该终端设备110中可以安装具有能够请求数据查询功能的客户端,例如,该客户端可以为浏览器。该终端设备110可以是手机、平板电脑、电子阅读器、个人计算机、车载设备、可穿戴设备等设备。可选地,该终端设备110具有请求数据存储功能。抽样查询的设备120具有数据查询功能可以基于来自终端设备110发送的查询请求进行数据查询。该抽样查询的设备120可以为计算设备、存储设备或服务器等用于查询数据的设备。可选地,该抽样查询的设备120具有数据存储功能,该抽样查询的设备120中设置的数据库用于存储数据。可本文档来自技高网...

【技术保护点】
1.一种抽样查询的方法,其特征在于,所述方法包括:获取查询条件;根据抽样查询比例,从M个索引分区中确定N个目标索引分区,以使得N与M的比值与所述抽样查询比例对应,其中,所述M个索引分区为根据所述查询条件确定的待查询索引分区,M为大于1的整数,N为大于或等于1的整数,并且,N小于M;根据所述查询条件在所述N个目标索引分区中查询数据,并根据查询到的数据生成查询结果,所述查询结果包括以下至少一项:所述M个索引分区中满足所述查询条件的数据的数量、所述N个目标索引分区中满足所述查询条件的数据;反馈所述查询结果。

【技术特征摘要】
1.一种抽样查询的方法,其特征在于,所述方法包括:获取查询条件;根据抽样查询比例,从M个索引分区中确定N个目标索引分区,以使得N与M的比值与所述抽样查询比例对应,其中,所述M个索引分区为根据所述查询条件确定的待查询索引分区,M为大于1的整数,N为大于或等于1的整数,并且,N小于M;根据所述查询条件在所述N个目标索引分区中查询数据,并根据查询到的数据生成查询结果,所述查询结果包括以下至少一项:所述M个索引分区中满足所述查询条件的数据的数量、所述N个目标索引分区中满足所述查询条件的数据;反馈所述查询结果。2.根据权利要求1所述的方法,其特征在于,所述根据查询到的数据生成查询结果,包括:确定从所述N个目标索引分区中查询到的数据的数量;根据确定的数据的数量和所述抽样查询比例,估算所述M个索引分区中满足所述查询条件的数据的数量,所述查询结果包括所述M个索引分区中满足所述查询条件的数据的数量。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:获取所述M个索引分区所属的M个计算节点的负载信息,所述负载信息记录计算节点的负载;以及,所述根据抽样查询比例,从M个索引分区中确定N个目标索引分区,包括:根据所述M个计算节点的负载信息,从所述M个计算节点中选择负载最小的N个目标计算节点,所述N个目标计算节点对应的索引分区为所述N个目标索引分区。4.根据权利要求3所述的方法,其特征在于,在所述根据查询到的数据生成查询结果之前,所述方法还包括:计算基于所述查询条件进行数据查询过程中消耗的计算资源的资源消耗值;在所述N个目标计算节点的负载中加上所述资源消耗值,得到所述N个目标计算节点的更新的负载信息。5.根据权利要求4所述的方法,其特征在于,所述计算基于所述查询条件进行数据查询过程中消耗的计算资源的资源消耗值,包括:将所述查询条件分解为至少一个分词,所述至少一个分词中的每个分词对应一个查询节点;计算每个所述查询节点的资源消耗值;对所述至少一个分词对应的所有查询节点的资源消耗值进行求和,得到所述查询条件的资源消耗值。6.根据权利要求4或5所述的方法,其特征在于,在所述根据查询到的数据生成查询结果之后,所述方法还包括:在所述N个目标计算节点的更新的负载信息所指示的负载中减去所述资源消耗值。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述查询条件包括所述抽样查询比例。8.一种抽样查询的装置,其特征在于,所述装置包括处理单元,所述处理单元用于:获取查询条件;根据抽样查询比例,从M个索引分区中确定...

【专利技术属性】
技术研发人员:毕杰山钟超强
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1