【技术实现步骤摘要】
本专利技术涉及数据查询,尤其涉及一种数据查询方法、查询引擎、设备、介质和程序产品。
技术介绍
1、大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合。在实际中出现了多种用于存储大数据的存储系统,比如数据湖、数据仓库、湖仓一体等等。并且上述系统中存储的数据可以有不同的来源,也即是数据可以以不同的数据组织形式存储在存储系统中。其中,数据的常见来源可以包括文件系统、数据库系统等等。在实际中,可以借助湖上数据的统计信息实现对湖上数据的查询。
2、基于上述描述,如何实现对存储系统中不同数据组织形式的数据进行查询就成为一个亟待解决的问题。
技术实现思路
1、有鉴于此,本专利技术实施例提供一种数据查询方法、查询引擎、设备、介质和程序产品,用以实现对存储系统中不同组织形式的数据的查询。
2、第一方面,本专利技术实施例提供一种数据查询方法,包括:
3、响应于查询请求,确定所述查询请求对应的待查询数据,所述待查询数据包括以文件系统和/或数据库系统的数据组织
...【技术保护点】
1.一种数据查询方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述待查询数据存储在数据湖中;所述确定所述查询请求对应的待查询数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述待查询数据的数据组织方式,确定所述待查询数据的统计信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述确定所述原始数据的第一统计信息,包括:
5.根据权利要求4所述的方法,其特征在于,所述确定所述原始数据的数据总量,包括:
6.根据权利要求4所述的方法,其特征在于,所述确定所述过滤后数据的第
...【技术特征摘要】
1.一种数据查询方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述待查询数据存储在数据湖中;所述确定所述查询请求对应的待查询数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述待查询数据的数据组织方式,确定所述待查询数据的统计信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述确定所述原始数据的第一统计信息,包括:
5.根据权利要求4所述的方法,其特征在于,所述确定所述原始数据的数据总量,包括:
6.根据权利要求4所述的方法,其特征在于,所述确定所述过滤后数据的第二统计信息,包括:
7.根据权利要求6所述的方法,其特征在于,所述从所述所述原始数据中抽取出样本数据,包括:
8.根据权利要求7所述的方案,其特征在于,所述方法还包括:
9.根据权利要求3所述的方法,其特征在于,所述原始数据包括所述数据库系统中存储的数据表;
10.根据权利要求2所述的方法,其特征在于,所述查询条件包括不同逻...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。