数据查询方法、查询引擎、设备、介质和程序产品技术

技术编号:46484967 阅读:4 留言:0更新日期:2025-09-26 19:06
本发明专利技术实施例提供一种数据查询方法、查询引擎、设备、介质和程序产品,该方法包括:响应查询请求,以确定该查询请求对应的待查询数据,此待查询数据可以以文件系统和/或数据库系统的数据组织方式进行存储。然后,再根据此待查询数据的数据组织方式,确定该待查询数据的统计信息,进一步根据此统计信息确定不同查询策略各自的执行代价。再根据执行代价确定待查询数据的目标查询策略。最终,按照此目标查询策略实现查询请求的响应。可见,上述查询方法中,对于确定查询策略所使用的统计信息,可以采用与数据组织形式对应的方式来确定。也即是上述方法提供了一种通用的统计信息获取流程,使用该流程可以对具有不同数据组织方式的数据实现查询。

【技术实现步骤摘要】

本专利技术涉及数据查询,尤其涉及一种数据查询方法、查询引擎、设备、介质和程序产品


技术介绍

1、大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合。在实际中出现了多种用于存储大数据的存储系统,比如数据湖、数据仓库、湖仓一体等等。并且上述系统中存储的数据可以有不同的来源,也即是数据可以以不同的数据组织形式存储在存储系统中。其中,数据的常见来源可以包括文件系统、数据库系统等等。在实际中,可以借助湖上数据的统计信息实现对湖上数据的查询。

2、基于上述描述,如何实现对存储系统中不同数据组织形式的数据进行查询就成为一个亟待解决的问题。


技术实现思路

1、有鉴于此,本专利技术实施例提供一种数据查询方法、查询引擎、设备、介质和程序产品,用以实现对存储系统中不同组织形式的数据的查询。

2、第一方面,本专利技术实施例提供一种数据查询方法,包括:

3、响应于查询请求,确定所述查询请求对应的待查询数据,所述待查询数据包括以文件系统和/或数据库系统的数据组织方式进行存储的数据;本文档来自技高网...

【技术保护点】

1.一种数据查询方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述待查询数据存储在数据湖中;所述确定所述查询请求对应的待查询数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述待查询数据的数据组织方式,确定所述待查询数据的统计信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述确定所述原始数据的第一统计信息,包括:

5.根据权利要求4所述的方法,其特征在于,所述确定所述原始数据的数据总量,包括:

6.根据权利要求4所述的方法,其特征在于,所述确定所述过滤后数据的第二统计信息,包括:<...

【技术特征摘要】

1.一种数据查询方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述待查询数据存储在数据湖中;所述确定所述查询请求对应的待查询数据,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述待查询数据的数据组织方式,确定所述待查询数据的统计信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述确定所述原始数据的第一统计信息,包括:

5.根据权利要求4所述的方法,其特征在于,所述确定所述原始数据的数据总量,包括:

6.根据权利要求4所述的方法,其特征在于,所述确定所述过滤后数据的第二统计信息,包括:

7.根据权利要求6所述的方法,其特征在于,所述从所述所述原始数据中抽取出样本数据,包括:

8.根据权利要求7所述的方案,其特征在于,所述方法还包括:

9.根据权利要求3所述的方法,其特征在于,所述原始数据包括所述数据库系统中存储的数据表;

10.根据权利要求2所述的方法,其特征在于,所述查询条件包括不同逻...

【专利技术属性】
技术研发人员:张佳豪郭泽晖
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1