The invention discloses a method and device for querying data, the method comprises: receiving the specified data source data query; determine the data query request is hit a hot data source; the data source contains from hot hot data of the specified data source is extracted, the hot data according to a plurality of data query request is determined; if the request hit a hot data source in the data query, executing the data in the data source of the popular hit query request and return the corresponding query results. By reducing the amount of data needed for data query, this technology greatly improves the efficiency of data query under the premise of ensuring the quality of data query.
【技术实现步骤摘要】
一种数据查询方法和装置
本专利技术涉及数据查询
,具体涉及一种数据查询方法和装置。
技术介绍
在大数据场景下如何实现高效的数据查询是一个受到广泛关注的问题,针对该问题也有了一些解决方案,例如有的数据查询系统偏重解决高并发问题,有的数据查询系统偏重于降低查询延迟,但普遍来说,无论是哪种数据查询系统,所离不开的基础是数据源,而大数据场景下的数据源中存储着的海量数据是数据查询中绕不开的一个阻碍。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的数据查询方法和装置。依据本专利技术的一个方面,提供了一种数据查询方法,包括:接收对指定数据源的数据查询请求;判断该数据查询请求是否命中一个热门数据源;所述热门数据源包含从所述指定数据源中提取出的热门数据,所述热门数据是根据多个数据查询请求确定的;若该数据查询请求命中一个热门数据源,则在命中的热门数据源中执行所述数据查询请求,并返回相应的查询结果。可选地,该方法还包括:对接收到的数据查询请求进行记录;对各数据源,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合;从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源。可选地,所述从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合包括:对各数据查询请求,分别从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;对提取出的所有数据维度集合数量进行统计,将统计数量不小于预设阈值的数据维度集合作为热门数据维度集合。可选地,所述从各数据源中分别提取出各热门数据维度集合下的数据 ...
【技术保护点】
一种数据查询方法,其中,该方法包括:接收对指定数据源的数据查询请求;判断该数据查询请求是否命中一个热门数据源;所述热门数据源包含从所述指定数据源中提取出的热门数据,所述热门数据是根据多个数据查询请求确定的;若该数据查询请求命中一个热门数据源,则在命中的热门数据源中执行所述数据查询请求,并返回相应的查询结果。
【技术特征摘要】
1.一种数据查询方法,其中,该方法包括:接收对指定数据源的数据查询请求;判断该数据查询请求是否命中一个热门数据源;所述热门数据源包含从所述指定数据源中提取出的热门数据,所述热门数据是根据多个数据查询请求确定的;若该数据查询请求命中一个热门数据源,则在命中的热门数据源中执行所述数据查询请求,并返回相应的查询结果。2.如权利要求1所述的方法,其中,该方法还包括:对接收到的数据查询请求进行记录;对各数据源,从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合;从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源。3.如权利要求2所述的方法,其中,所述从记录的数据查询请求中分析出该数据源的至少一个热门数据维度集合包括:对各数据查询请求,分别从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;对提取出的所有数据维度集合数量进行统计,将统计数量不小于预设阈值的数据维度集合作为热门数据维度集合。4.如权利要求2所述的方法,其中,所述从各数据源中分别提取出各热门数据维度集合下的数据作为热门数据,并对应保存为热门数据源包括:按各热门数据维度集合中的数据维度,在各数据源中分别提取出相应数据维度下的数据作为热门数据;将一个热门数据维度集合对应的热门数据按数据维度进行列式存储,得到一个热门数据源;将各热门数据源所对应的热门数据集合保存到索引信息中。5.如权利要求4所述的方法,其中,所述判断该数据查询请求是否命中一个热门数据源包括:从该数据查询请求中提取出包含至少一个数据维度的数据维度集合;查询所述索引信息,判断该提取出的数据维度集合是否是任一个热门数据维度集合的子集;若是,则判断该数据查询请求命中与该热门数据维...
【专利技术属性】
技术研发人员:倪传蕾,马庆祥,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。