一种数据查询方法及装置制造方法及图纸

技术编号：36158660 阅读：54 留言：0更新日期：2022-12-31 20:05

本发明专利技术实施例涉及一种数据查询方法及装置。所述方法通过接收用户的查询请求，对查询请求进行解析得到查询语句；根据查询语句确定优化规则，并按照优化规则筛选出数据仓库中的数据及对应的文件，对被筛选出的数据进行记录，将数据记录转换为N维数据；根据查询语句确定降维策略，并根据降维策略对N维数据进行数据降维处理，得到与所述数据记录对应的一维数据表示；根据一维数据表示对被筛选出的文件进行合并，并构建索引；基于索引在合并后的文件中读取查询请求对应的目标数据。其利用数据跳过加速查询技术，在不影响数据读取速度的情况下重组数据来提升查询性能。下重组数据来提升查询性能。下重组数据来提升查询性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据查询方法及装置

[0001]本申请涉及计算机
，具体涉及一种数据查询方法及装置。

技术介绍

[0002]在数据仓库中，数据的读取速度和查询性能是衡量数据仓库优越性的关键权衡因素。一般情况下，数量合理的小文件可以通过提高并行性，加速数据读取，但小文件数量过多，会导致查询性能很差。在数据读取时，数据通常基于分区或者数据到达时间位于同一个文件内。对于大多数查询引擎而言，频繁查询的数据位于同一位置时，往往会获得优秀的查询性能。但是即便如此，数据分布的不均衡性仍然会对数据查询性能造成很大影响，当每个文件的上界和下界的范围很大时，仍然需要扫描所有文件或者所有的分区。

技术实现思路

[0003]鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据查询方法及装置。
[0004]第一方面，本专利技术实施例提供了一种数据查询方法，所述方法包括以下步骤：
[0005]接收用户的查询请求，对查询请求进行解析得到查询语句；其中，所述查询语句包含与优化规则对应的第一关键词，与降维策略对应的第二关键词；
[0006]根据查询语句确定优化规则，并按照优化规则筛选出数据仓库中的数据及对应的文件，对被筛选出的数据进行记录，将数据记录转换为N维数据；
[0007]根据查询语句确定降维策略，并根据降维策略对N维数据进行数据降维处理，得到与所述数据记录对应的一维数据表示；
[0008]根据一维数据表示对被筛选出的文件进行合并，并构建索引；
[0...

【技术保护点】

【技术特征摘要】
1.一种数据查询方法，其特征在于，包括：接收用户的查询请求，对查询请求进行解析得到查询语句；其中，所述查询语句包含与优化规则对应的第一关键词，与降维策略对应的第二关键词；根据查询语句确定优化规则，并按照优化规则筛选出数据仓库中的数据及对应的文件，对被筛选出的数据进行记录，将数据记录转换为N维数据；根据查询语句确定降维策略，并根据降维策略对N维数据进行数据降维处理，得到与所述数据记录对应的一维数据表示；根据一维数据表示对被筛选出的文件进行合并，并构建索引；基于索引在合并后的文件中读取查询请求对应的目标数据。2.根据权利要求1所述的方法，其特征在于：所述优化规则包括谓词下推。3.根据权利要求1所述的方法，其特征在于，所述根据降维策略对N维数据进行数据降维处理，得到与所述数据记录对应的一维数据表示，包括：基于希尔伯特曲线，将N维数据转换成与所述数据记录对应的一维数据表示。4.根据权利要求1所述的方法，其特征在于，所述根据降维策略对N维数据进行数据降维处理，得到与所述数据记录对应的一维数据表示，包括：基于Z
‑
Order曲线，将N维数据转换成与所述数据记录对应的一维数据表示。5.根据权利要求1至4任一项所述的方法，其特征在于，所述根据一维数据表示对被筛选出的文件进行合并，并构建索引之前，还包括：将所述数据仓库的隔离级别设置为快照隔离。6.一种数据查询装置，其特征在于，包括：解析模块，用于接收用户的查询请求，对...

【专利技术属性】
技术研发人员：王玲，何海锋，吴海强，曾启彦，廖梓鸿，
申请(专利权)人：广州点金石信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人