基于大数据的查询方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：19821841 阅读：17 留言：0更新日期：2018-12-19 14:43

本申请涉及一种基于大数据的查询方法、装置、计算机设备和存储介质。所述方法包括：接收终端上传的查询请求；查询请求携带了查询条件，查询条件所针对的查询数据存储于计算机节点集群；响应于查询请求，确定查询条件的复杂度；当复杂度低于预设阈值时，调用查询引擎Presto，根据查询条件在计算机节点集群中查询相应的目标数据；当复杂度高于预设阈值时，调用查询引擎Hive，根据查询条件在计算机节点集群中查询相应的目标数据；获取查询到的目标数据，将目标数据发送至终端进行展示。采用本方法能够在大数据查询过程中自适应选择相应查询引擎。

全部详细技术资料下载

【技术实现步骤摘要】
基于大数据的查询方法、装置、计算机设备和存储介质
本申请涉及计算机
，特别是涉及一种基于大数据的查询方法、装置、计算机设备和存储介质。
技术介绍
随着大数据技术的发展，出现了多种基于大数据的查询引擎。比如，查询引擎Hive和查询引擎Presto。在传统方式中，只采用单一的查询引擎。而单一的查询引擎存在各自的弊端。查询引擎Hive在查询过程中需要执行多次磁盘的读写，每次对磁盘的读写都会产生延时。而查询引擎Presto是基于内存的分布式实时查询引擎，无法执行需要对多个数据表进行连接操作的查询。由此使得大数据查询的过程中存在查询延时长或查询数据量受限的问题。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够在大数据查询过程中能够自适应选择相应查询引擎的基于大数据的查询方法、装置、计算机设备和存储介质。一种基于大数据的查询方法，所述方法包括：接收终端上传的查询请求；所述查询请求携带了查询条件，所述查询条件所针对的查询数据存储于计算机节点集群；响应于所述查询请求，确定所述查询条件的复杂度；当所述复杂度低于预设阈值时，调用查询引擎Presto，根据所述查询条件在所述计算机节点集群中查询相应的目标数据；当所述复杂度高于预设阈值时，调用查询引擎Hive，根据所述查询条件在所述计算机节点集群中查询到所述相应的目标数据；获取查询到的所述目标数据，将所述目标数据发送至所述终端进行展示。在其中一个实施例中，所述查询请求还携带了用户账号，在所述确定所述查询条件的复杂度之前，还包括：确定所述用户账号在分布式文件系统中所属的集群账号；所述分布式文件系统与所述计算机节点集群相...

【技术保护点】
1.一种基于大数据的查询方法，所述方法包括：接收终端上传的查询请求；所述查询请求携带了查询条件，所述查询条件所针对的查询数据存储于计算机节点集群；响应于所述查询请求，确定所述查询条件的复杂度；当所述复杂度低于预设阈值时，调用查询引擎Presto，根据所述查询条件在所述计算机节点集群中查询相应的目标数据；当所述复杂度高于预设阈值时，调用查询引擎Hive，根据所述查询条件在所述计算机节点集群中查询相应的目标数据；获取查询到的所述目标数据，将所述目标数据发送至所述终端进行展示。

【技术特征摘要】
1.一种基于大数据的查询方法，所述方法包括：接收终端上传的查询请求；所述查询请求携带了查询条件，所述查询条件所针对的查询数据存储于计算机节点集群；响应于所述查询请求，确定所述查询条件的复杂度；当所述复杂度低于预设阈值时，调用查询引擎Presto，根据所述查询条件在所述计算机节点集群中查询相应的目标数据；当所述复杂度高于预设阈值时，调用查询引擎Hive，根据所述查询条件在所述计算机节点集群中查询相应的目标数据；获取查询到的所述目标数据，将所述目标数据发送至所述终端进行展示。2.根据权利要求1所述的方法，其特征在于，所述查询请求还携带了用户账号，在所述确定所述查询条件的复杂度之前，还包括：确定所述用户账号在分布式文件系统中所属的集群账号；所述分布式文件系统与所述计算机节点集群相对应；确定与所述集群账号对应的用户角色；获取与所述用户角色对应的角色权限；所述角色权限与可访问数据相对应；当检测到所述可访问数据包含所述查询数据时，执行所述确定所述查询条件的复杂度的步骤。3.根据权利要求1所述的方法，其特征在于，所述确定所述查询条件的复杂度，包括：统计所述查询条件所针对的查询数据的数据量；提取所述查询条件中的起始时间和截止时间；根据所述起始时间和所述截止时间进行计算，得到所述查询条件所针对的查询数据对应的时间区间；根据所述数据量和所述时间区间，计算所述查询条件的复杂度。4.根据权利要求1所述的方法，其特征在于，在所述响应于所述查询请求，确定所述查询条件的复杂度之前，所述方法还包括：检测所述查询条件中是否包含用户自定义函数；当所述查询条件中包含用户自定义函数时，提取所述用户自定义函数的自定义函数名；拉取所述查询引擎Presto支持的第一函数名列表，和所述查询引擎Hive支持的第二函数名列表；将所述自定义函数名分别与所述第一函数名列表和所述第二函数名列表进行匹配；当所述自定义函数名仅与第二函数名列表匹配时，调用查询引擎Hive，根据所述查询条件在所述计算机节点集群中查询相应的目标数据。5.根据权利要求1至4任意一项所述的方法，其特征在于，所述调用查询引擎Presto，根据所述查询条件在所述计算机节点集群中查询相应的目标数据，包括：调用查询引擎Presto将所述查询条件进行解析，得...

【专利技术属性】
技术研发人员：王玉，黄奉线，
申请(专利权)人：康键信息技术深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人