列式文件查询方法、装置、设备及存储介质制造方法及图纸

技术编号:37962473 阅读:8 留言:0更新日期:2023-06-30 09:37
本发明专利技术属于计算机技术领域,公开了一种列式文件查询方法、装置、设备及存储介质。本发明专利技术通过在接收到数据查询语句时,对数据查询语句进行解析,获得目标列式文件集及若干个查询条件;将若干个查询条件分为优化查询条件及标准查询条件;根据优化查询条件及目标列式文件集对应的字典数据对目标列式文件集中的列式文件进行过滤,获得目标文件子集;根据标准查询条件对目标文件子集进行文件筛选,获得数据查询语句对应的目标列式文件。由于结合字典数据及优化查询条件快速过滤了目标列式文件集中大量不满足优化查询条件的列式文件,减少了需要与后续标准查询条件进行匹配的列式文件的数量,从而提高了对列式文件的查询效率。从而提高了对列式文件的查询效率。从而提高了对列式文件的查询效率。

【技术实现步骤摘要】
列式文件查询方法、装置、设备及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种列式文件查询方法、装置、设备及存储介质。

技术介绍

[0002]目前,高压缩比和高读取效率的列式文件被很多大数据项目使用,列式文件中本身具有列的索引统计信息(记录数、最大值、最小值、是否有空值、求和),且在一些字符类型的字段上,虽然也有字典数据,但是,此处的字典数据是为了提供高压缩比而存在的,并不能起到提高查询效率的作用,由此导致对列式文件进行查询时若查询条件中包含字符类型的查询条件,则会导致查询速度缓慢,查询效率低。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供一种列式文件查询方法、装置、设备及存储介质,旨在解决如何提高查询列式文件时的查询效率的技术问题。
[0005]为实现上述目的,本专利技术提供了一种列式文件查询方法,所述方法包括以下步骤:
[0006]在接收到数据查询语句时,对所述数据查询语句进行解析,获得目标列式文件集及若干个查询条件;
[0007]将所述若干个查询条件分为优化查询条件及标准查询条件;
[0008]根据所述优化查询条件及所述目标列式文件集对应的字典数据对所述目标列式文件集中的列式文件进行过滤,获得目标文件子集;
[0009]根据所述标准查询条件对所述目标文件子集进行文件筛选,获得所述数据查询语句对应的目标列式文件。
[0010]可选的,所述在接收到数据查询语句时,对所述数据查询语句进行解析,获得目标列式文件集及若干个查询条件的步骤之前,还包括:
[0011]在接收到文件存储请求时,根据所述文件存储请求确定待存储文件及目标文件空间;
[0012]对所述待存储文件进行解析,获取所述待存储文件中的数据存储字段;
[0013]从所述数据存储字段中选取预设优化字段;
[0014]根据所述预设优化字段及所述预设优化字段对应的待存储数据生成所述待存储文件对应的字典数据;
[0015]将所述字典数据存储至预设数据库,并将所述待存储文件存储至所述目标文件空间。
[0016]可选的,所述根据所述预设优化字段及所述预设优化字段对应的待存储数据生成所述待存储文件对应的字典数据的步骤,包括:
[0017]获取所述预设优化字段对应的待存储数据;
[0018]计算所述待存储数据对应的数据布隆值;
[0019]根据所述预设优化字段及所述数据布隆值生成所述待存储文件对应的字典数据。
[0020]可选的,所述根据所述优化查询条件及所述目标列式文件集对应的字典数据对所述目标列式文件集中的列式文件进行过滤,获得目标文件子集的步骤,包括:
[0021]根据所述优化查询条件构建文件过滤规则;
[0022]获取所述目标列式文件集中各列式文件对应的字典数据;
[0023]将所述目标列式文件集中所述字典数据不满足所述文件过滤规则的列式文件过滤,获得目标文件子集。
[0024]可选的,所述根据所述优化查询条件构建文件过滤规则的步骤,包括:
[0025]生成所述优化查询条件对应的布隆查询条件;
[0026]根据所述布隆查询条件构建文件过滤规则。
[0027]可选的,所述生成所述优化查询条件对应的布隆查询条件的步骤,包括:
[0028]获取所述优化查询条件对应的条件查询值及条件查询字段;
[0029]通过预设布隆算法计算所述条件查询值对应的布隆查询值;
[0030]根据所述布隆查询值及所述条件查询字段生成布隆查询条件。
[0031]可选的,所述将所述目标列式文件集中所述字典数据不满足所述文件过滤规则的列式文件过滤,获得目标文件子集的步骤,包括:
[0032]将所述目标列式文件集中所述字典数据不满足所述文件过滤规则的列式文件过滤,获得中间文件子集;
[0033]根据所述优化查询条件对所述中间文件子集进行二次文件过滤,获得目标文件子集。
[0034]可选的,所述在接收到数据查询语句时,对所述数据查询语句进行解析,获得目标列式文件集及若干个查询条件的步骤,包括:
[0035]在接收到数据查询语句时,对所述数据查询语句进行解析,获得目标空间标识及若干个查询条件;
[0036]根据所述目标空间标识确定目标查询空间,并根据所述目标查询空间中存储的列式文件构建目标列式文件集。
[0037]可选的,所述根据所述目标空间标识确定目标查询空间,并根据所述目标查询空间中存储的列式文件构建目标列式文件集的步骤之前,还包括:
[0038]获取所述数据查询语句对应的语句发送用户;
[0039]获取所述语句发送用户对应的空间访问权限;
[0040]根据所述空间访问权限确定所述语句发送用户是否具备访问所述目标查询空间的权限;
[0041]若是,则执行所述根据所述目标空间标识确定目标查询空间,并根据所述目标查询空间中存储的列式文件构建目标列式文件集的步骤。
[0042]可选的,所述根据所述标准查询条件对所述目标文件子集进行文件筛选,获得所述数据查询语句对应的目标列式文件的步骤之前,还包括:
[0043]获取所述标准查询条件与所述优化查询条件对应的逻辑关联类型;
[0044]若所述逻辑关联类型为交集类型,则执行所述根据所述标准查询条件对所述目标文件子集进行文件筛选,获得所述数据查询语句对应的目标列式文件的步骤。
[0045]可选的,所述获取所述标准查询条件与所述优化查询条件对应的逻辑关联类型的步骤之后,还包括:
[0046]若所述逻辑关联类型不为并集类型,则根据所述标准查询条件对所述目标列式文件集中的列式文件进行过滤,获得第二目标文件子集;
[0047]将所述目标文件子集与所述第二目标文件子集进行聚合,获得所述数据查询语句对应的目标列式文件。
[0048]可选的,所述将所述若干个查询条件分为优化查询条件及标准查询条件的步骤,包括:
[0049]获取各查询条件对应的查询字段类型及查询匹配类型;
[0050]将所述查询字段类型为预设字段类型,且所述查询匹配类型为完全匹配类型的查询条件作为优化查询条件;
[0051]将所述若干个查询条件中剩余的查询条件作为标准查询条件。
[0052]此外,为实现上述目的,本专利技术还提出一种列式文件查询装置,所述列式文件查询装置包括以下模块:
[0053]信息接收模块,用于在接收到数据查询语句时,对所述数据查询语句进行解析,获得目标列式文件集及若干个查询条件;
[0054]条件区分模块,用于将所述若干个查询条件分为优化查询条件及标准查询条件;
[0055]文件过滤模块,用于根据所述优化查询条件及所述目标列式文件集对应的字典数据对所述目标列式文件集中的列式文件进行过滤,获得目标文件子集;...

【技术保护点】

【技术特征摘要】
1.一种列式文件查询方法,其特征在于,所述列式文件查询方法包括以下步骤:在接收到数据查询语句时,对所述数据查询语句进行解析,获得目标列式文件集及若干个查询条件;将所述若干个查询条件分为优化查询条件及标准查询条件;根据所述优化查询条件及所述目标列式文件集对应的字典数据对所述目标列式文件集中的列式文件进行过滤,获得目标文件子集;根据所述标准查询条件对所述目标文件子集进行文件筛选,获得所述数据查询语句对应的目标列式文件。2.如权利要求1所述的列式文件查询方法,其特征在于,所述在接收到数据查询语句时,对所述数据查询语句进行解析,获得目标列式文件集及若干个查询条件的步骤之前,还包括:在接收到文件存储请求时,根据所述文件存储请求确定待存储文件及目标文件空间;对所述待存储文件进行解析,获取所述待存储文件中的数据存储字段;从所述数据存储字段中选取预设优化字段;根据所述预设优化字段及所述预设优化字段对应的待存储数据生成所述待存储文件对应的字典数据;将所述字典数据存储至预设数据库,并将所述待存储文件存储至所述目标文件空间。3.如权利要求2所述的列式文件查询方法,其特征在于,所述根据所述预设优化字段及所述预设优化字段对应的待存储数据生成所述待存储文件对应的字典数据的步骤,包括:获取所述预设优化字段对应的待存储数据;计算所述待存储数据对应的数据布隆值;根据所述预设优化字段及所述数据布隆值生成所述待存储文件对应的字典数据。4.如权利要求1所述的列式文件查询方法,其特征在于,所述根据所述优化查询条件及所述目标列式文件集对应的字典数据对所述目标列式文件集中的列式文件进行过滤,获得目标文件子集的步骤,包括:根据所述优化查询条件构建文件过滤规则;获取所述目标列式文件集中各列式文件对应的字典数据;将所述目标列式文件集中所述字典数据不满足所述文件过滤规则的列式文件过滤,获得目标文件子集。5.如权利要求4所述的列式文件查询方法,其特征在于,所述根据所述优化查询条件构建文件过滤...

【专利技术属性】
技术研发人员:苏军
申请(专利权)人:三六零数字安全科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1