【技术实现步骤摘要】
一种数据查询方法、装置及设备
本申请涉及互联网
,尤其涉及一种数据查询方法、装置及设备。
技术介绍
数据湖分析(DataLakeAnalytics)用于为用户提供无服务器化(Serverless)的查询分析服务,能够对海量的数据进行任意维度的分析和查询,数据湖分析支持高并发、低延时(毫秒级响应)、实时在线分析、海量数据查询等功能。目前,针对文本分析、内容过滤、内容拦截等需求,数据湖分析系统可以进行如下服务:接收用户输入的SQL(StructuredQueryLanguage,结构化查询语言)语句,这个SQL语句可以携带多个关键字。查询数据库的目标字段(如微博、博客、商品详情信息等)是否存在所述多个关键字,如目标字段的每行数据是否存在所述多个关键字,并根据查询结果进行处理。在上述方式中,查询操作的计算复杂度与每行数据的内容成正比,与关键字的数量成正比,与目标字段的行数成正比,如果每行数据的内容比较多,或者关键字比较多,或者目标字段的行数比较多,则查询操作需要消耗很长时间,计算复杂度比较高,而且,查询操作的工作量非常大,需要使用大量资源。
技术实现思路
本申请提供一种数据查询方法,所述方法包括:获取数据请求,所述数据请求包括多个关键字;根据所述多个关键字生成数据结构,为所述数据结构分配索引标识;根据所述数据请求生成执行计划,所述执行计划包括所述索引标识;将所述执行计划发送给计算节点,以使所述计算节点获取所述执行计划中的索引标识对应的数据结构,并查询 ...
【技术保护点】
1.一种数据查询方法,其特征在于,所述方法包括:/n获取数据请求,所述数据请求包括多个关键字;/n根据所述多个关键字生成数据结构,为所述数据结构分配索引标识;/n根据所述数据请求生成执行计划,所述执行计划包括所述索引标识;/n将所述执行计划发送给计算节点,以使所述计算节点获取所述执行计划中的索引标识对应的数据结构,并查询是否存在与所述数据结构对应的数据。/n
【技术特征摘要】
1.一种数据查询方法,其特征在于,所述方法包括:
获取数据请求,所述数据请求包括多个关键字;
根据所述多个关键字生成数据结构,为所述数据结构分配索引标识;
根据所述数据请求生成执行计划,所述执行计划包括所述索引标识;
将所述执行计划发送给计算节点,以使所述计算节点获取所述执行计划中的索引标识对应的数据结构,并查询是否存在与所述数据结构对应的数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个关键字生成数据结构,为所述数据结构分配索引标识之后,所述方法还包括:
建立所述数据结构与所述索引标识的映射关系;
在指定存储位置存储所述映射关系,以使所述计算节点从所述指定存储位置的映射关系中获取所述执行计划中的索引标识对应的数据结构;
或者,将所述映射关系发送给所述计算节点,以使所述计算节点从自身的映射关系中获取所述执行计划中的索引标识对应的数据结构。
3.根据权利要求2所述的方法,其特征在于,
所述建立所述数据结构与所述索引标识的映射关系,包括:
在数据请求的上下文中建立所述数据结构与所述索引标识的映射关系。
4.根据权利要求1所述的方法,其特征在于,
所述根据所述多个关键字生成数据结构,包括:
基于特定算法,生成包括所述多个关键字的数据结构。
5.根据权利要求4所述的方法,其特征在于,
所述数据结构包括多模式匹配的数据结构;其中,所述多模式匹配的数据结构包括:字典树结构,或者,AC自动机结构,或者,双数组字典树结构。
6.一种数据查询方法,其特征在于,所述方法包括:
获取执行计划;其中,所述执行计划包括数据结构的索引标识,所述数据结构是根据数据请求包括的多个关键字生成的;
获取所述执行计划中的所述索引标识对应的数据结构;
查询是否存在与所述数据结构对应的数据。
7.根据权利要求6所述的方法,其特征在于,
所述获取所述执行计划中的所述索引标识对应的数据结构,包括:
若前端节点将映射关系存储在指定存储位置,则从所述指定存储位置的映射关系中,获取与所述索引标识对应的数据结构;或者,
若前端节点将映射关系发送给计算节点,则从所述计算节点本地存储的映射关系中,获取与所述索引标识对应的数据结构;
其中,所述映射关系为数据结构与索引标识的映射关系。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
启动多个实体,针对所述多个实体中的实体,获取所述执行计划中的所述索引标识对应的数据结构,并查询是否存在与所述数据结构对应的数据;
其中,所述实体包括:进程、或者线程、或者容器、或者虚拟机。
9.根据权利要求6所述的方法,其特征在于,所述执行计划还包括目标字段信息,所述查询是否存在与所述数据结构对应的数据,包括:
从所述数据库中确定与所述目标字段信息对应的目标字段;针对所述目标字段的数据行,查询所述数据行是否存在与所述数据结构对应的数据。
10.根据权利要求6所述的方法,其特征在于,所述执行计划还包括查询类型,所述查询是否存在与所述数据结构对应的数据,包括:
若所述查询类型是和类型,当数据行中包括与所述数据结构的所有关键字匹配的数据时,确定所述数据行存在与所述数据结构对应的数据;或者,
若所述查询类型是或类型,当数据行中包括与所述数据结构的任一关键字匹配的数据时,确定所述数据行存在与所述数据结构对应的数据。
11.根据权利要求6-10任一所述的方法,其特征在于,
所述数据结构包括多模式匹配的数据结构;其中,所述多模式匹配的数据结构包括:字典树结构,或者,AC自动机结构,或者,双数组字典树结构。
12.一种数据查询方法,其特征在于,所述方法包括:
获取数据请求,所述数据请求包括多个关键字;
根据所述多个关键字生成数据结构,为所述数据结构分配索引标识;
根据所述数据请求生成执行计划,所述执行计划包括所述索引标识;
针对待处理的执行计划,获取所述执行计划中的所述索引标识对应的数据结...
【专利技术属性】
技术研发人员:王烨,周祥,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。